(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111359394.6
(22)申请日 2021.11.11
(71)申请人 北京道口金 科科技有限公司
地址 100000 北京市西城区西直门外大街
辛137号B厅125室
(72)发明人 冷宇 孔祥永 王浩 袁伟 蔡明
(74)专利代理 机构 北京代代志同知识产权代理
事务所(普通 合伙) 16004
代理人 祗志洁
(51)Int.Cl.
G06F 17/18(2006.01)
G06N 20/00(2019.01)
G06Q 40/00(2012.01)
(54)发明名称
一种预测企业财务数据模型构建方法及构
建装置
(57)摘要
本发明提供了一种预测企业财务数据模型
构建方法及构建装置, 属于数据信息处理技术领
域。 本发明装置包括预测目标及原始特征输入模
块, 衍生特征生成模块, 样 本数据提取模块, 模型
输入特征确定模块, 企业财务数据预测模型构建
模块以及预测模块。 本发明方法包括: 确定预测
目标以及影响因素; 选取样本企业, 采集企业历
史财务数据, 衍生新特征, 提取特征数据集; 对预
测目标以及影响因素进行相关分析筛选模型输
入特征; 构建企业财务数据模型并训练, 利用训
练好的模型进行预测。 本发明填补了目前企业财
务数据预测模型领域的空白, 降低了人力成本,
提高了预测数据的获取效率, 为后续财务管理和
生成经营提供了客观数据基础。
权利要求书2页 说明书6页 附图1页
CN 114048436 A
2022.02.15
CN 114048436 A
1.一种预测企业财务数据模型的构建方法, 其特 征在于, 包括如下步骤:
步骤1: 确定企业财务数据的预测目标以及各目标的影响因素;
所述的企业财务数据的预测目标包括: 营业收入, 利润总额, 净利润, 所得税, 总资产,
以及销售量;
步骤2: 针对不同行业不同规模企业选取样本企业, 采集样本企业的历史财务数据, 并
对数据预 处理; 预处理包括: 为采集的财务数据设置企业所属行业和规模的标签, 相同标签
的数据分为一组; 将步骤1获得的所有影响因素作为原始特征, 根据原始特征衍生新特征,
提取原始特征数据集和衍 生特征数据集;
步骤3: 针对不同行业不同规模企业, 对企业财务数据的预测目标向量与各特征, 利用
回归分析计算相关系 数, 根据相关系 数阈值进行特征筛选, 并由原始特征数据集和 衍生特
征数据集生成训练样本集;
步骤4: 针对不同行业不同规模企业, 采用回归预测模型构建企业财务数据预测模型,
模型的输入是 所筛选出的特 征值, 输出为所述企业财务数据的预测目标;
其中, 所述模型在训练时, 采用如下分位对数损失函数Ly(y,yp)来进行模型优化;
其中, y、 yp分别代表样本真实值和预测值; yi、
分别表示第i个样本的真实值和预测
值; i=1,2, …n, n为样本数量; γ表示分位数值;
表示高估情况,
表示低估情
况, 所述分位对数损失函数将两种情况分开并赋予不同系 数; 分位数值γ依据不同行业不
同规模企业的样本数据训练为 不同的值;
步骤5: 针对不同行业不同规模企业, 分别利用对应标签的训练样本集对所述企业财务
数据预测模型进行训练, 利用训练好的模型进行对目标企业的财务数据进行 预测。
2.根据权利要求1所述的方法, 其特征在于, 所述的步骤2中, 采集的财务数据包括企业
的工商变更信息、 违法涉诉信息、 欠税欠 薪信息、 经营异常信息、 税务申报信息、 发票交易信
息及企业舆情信息 。
3.一种预测企业财务数据模型的构建装置, 其特 征在于, 包括:
预测目标及原始特征输入模块, 用于确定企业财务数据的预测目标以及各目标的影响
因素, 其中, 企业财务数据的预测目标包括营业收入、 利润总额、 净利润、 所得税、 总资产以
及销售量; 影响因素为原 始特征;
衍生特征生成模块, 用于根据原 始特征衍生新特征;
样本数据提取模块, 对不同行业不同规模企业选取样本企业, 采集样本企业的历史财
务数据, 并设置企业所属行业和规模的标签, 将相同标签的数据分为一组; 根据原始特征与
衍生特征生成原 始特征数据集和衍 生特征数据集;
模型输入特征确定模块, 针对不同行业不同规模企业, 对企业财务数据的预测目标向
量与每个原始特征或每个衍生特征利用回归分析计算相关系数, 根据相关系数阈值进 行特
征筛选, 并由原 始特征数据集和衍 生特征数据集生成训练样本集;
企业财务数据预测模型构建模块, 针对不同行业不同规模企业, 构建回归预测模型, 模
型的输入是模型输入特征确定模块对应输出 的特征, 输出为企业财务数据的预测目标; 针权 利 要 求 书 1/2 页
2
CN 114048436 A
2对不同行业不同规模企业, 利用对应的训练样本集对所述模型进行训练, 输出训练好的模
型;
在训练时, 采用如下分位对数损失函数Ly(y,yp)来进行模型优化;
其中, y、 yp分别代表样本真实值和预测值; yi、
分别表示第i个样本的真实值和预测
值; i=1,2,…n, n为样本数量; γ表 示分位数值; 分位数值γ依据不同行业不同规模企业的
样本数据训练为 不同的值;
所述预测模块利用训练好的模型对输入的目标企业的财务数据进行 预测。权 利 要 求 书 2/2 页
3
CN 114048436 A
3
专利 一种预测企业财务数据模型构建方法及构建装置
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 19:01:10上传分享