(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111326988.7
(22)申请日 2021.11.10
(71)申请人 建信金融科技有限责任公司
地址 200120 上海市浦东 新区中国(上海)
自由贸易试验区银城路99号12层、 15
层
(72)发明人 周玮理
(74)专利代理 机构 北京品源专利代理有限公司
11332
代理人 王风茹
(51)Int.Cl.
G06Q 40/02(2012.01)
G06K 9/62(2022.01)
G06N 20/00(2019.01)
(54)发明名称
基于金融风险的阈值模型建立方法、 装置、
设备和介质
(57)摘要
本发明实施例公开了一种基于金融风险的
阈值模型建立方法、 装置、 设备和介质, 涉及金融
风险管理的技术领域。 该方法包括: 对不同的金
融机构进行分组, 以确定为至少两组金融机构;
根据反欺诈模型对每组金融机构的历史损失数
据中的异质性数据进行剔除, 形成至少两组样本
损失数据; 根据每组样本损失数据分别选取阈值
模型的阈值, 以建立每组金融机构 对应的阈值模
型。 可以根据每组金融机构 对应的样本损失数据
的极值规模区间进行阈值选择, 从而可以减小每
组金融机构对应的阈值模型的阈值偏差, 而且,
可以避免异质性数据在大于阈值时用于阈值模
型的建立, 提高了阈值模型的稳定性, 减小了阈
值模型的模型风险。
权利要求书2页 说明书13页 附图6页
CN 114092222 A
2022.02.25
CN 114092222 A
1.一种基于金融风险的阈值模型建立方法, 其特 征在于, 包括:
对不同的金融机构进行分组, 以确定为至少两组金融机构;
根据反欺诈模型对每组金融机构的历史损失数据中的异质性数据进行剔除, 形成至少
两组样本损失数据;
根据每组所述样本损失数据分别选取阈值模型的阈值, 以建立每组金融机构对应的阈
值模型。
2.根据权利要求1所述的基于金融风险的阈值模型建立方法, 其特征在于, 对不同的金
融机构进行分组, 包括:
选取所述金融机构的至少两个维度的属性数据; 其中, 所述金融机构的属性数据包括
下述至少两项: 工商信息数据、 财务报表数据、 信贷数据、 风险指标 数据和金融产品数据;
针对所述金融机构每个维度的属性数据, 按照第 一时间切片计算该维度的属性数据的
波动程度 表征参数, 形成属性数据样本集; 其中, 所述金融机构属性数据的波动程度的表征
参数包括下述至少一项: 标准差、 波动率、 变异系数、 最大值、 最小值、 平均值、 同比、 环比和
同一表征参数的数值 排序;
根据所述属性数据样本集基于设定聚类算法进行聚类, 并根据聚类结果对所述金融机
构进行分组。
3.根据权利要求2所述的基于金融风险的阈值模型建立方法, 其特征在于, 所述设定聚
类算法为K ‑means算法。
4.根据权利要求2所述的基于金融风险的阈值模型建立方法, 其特征在于, 根据 所述属
性数据样本集基于设定聚类算法进行聚类, 并根据聚类结果对所述金融机构进行分组, 包
括:
选取所述属性数据样本集中的k个样本作为初始中心点;
根据所述属性数据样本集中的数据点到所述初始中心点的欧式距离进行分组;
根据每组的中心点更新所述初始中心点进行迭代, 直至每组的中心点不变, 并确定每
组内的样本作为 一组所述金融机构。
5.根据权利要求2所述的基于金融风险的阈值模型建立方法, 其特征在于, 所述第 一时
间切片的切分单位包括 年、 季和月中的至少一种。
6.根据权利要1所述的基于金融风险的阈值模型建立方法, 其特征在于, 根据反欺诈模
型对每组金融机构的历史损失数据中的异质性数据进行剔除, 包括:
根据所述反欺诈模型识别每组所述金融机构的欺诈客户;
确定所述欺诈客户对所述金融机构形成的历史损失数据为所述异质性数据;
在所述金融机构的历史损失数据中剔除所述异质性数据。
7.根据权利要求1所述的基于金融风险的阈值模型建立方法, 其特征在于, 在根据反欺
诈模型对每组金融机构的历史损失数据中的异质性数据进行剔除之前, 还 包括:
根据所述金融机构的客户数据建立反欺诈模型。
8.根据权利要求7所述的基于金融风险的阈值模型建立方法, 其特征在于, 根据 所述金
融机构的客户数据建立反欺诈模型, 包括:
根据所述金融机构客户的资金流网络计算网络参数; 其中, 所述客户包括历史欺诈客
户和历史非欺诈客户, 所述网络参数包括下述至少一项: 中介度、 定点度、 介数和平均距离;权 利 要 求 书 1/2 页
2
CN 114092222 A
2根据所述网络参数和所述客户的至少两个维度的属性数据形成数据集; 其中, 所述客
户的属性数据包括下述至少两项: 工商信息数据, 税务数据, 财务报表数据, 担 保数据, 多头
借贷数据, 复杂网络指标和金融产品数据;
根据所述数据集建立反欺诈模型。
9.根据权利要求8所述的基于金融风险的阈值模型建立方法, 其特征在于, 根据 所述网
络参数和所述 客户的至少两个维度的属性数据形成数据集, 包括:
选取所述客户的至少两个维度的属性数据;
根据所述客户每个维度的属性数据, 按照第 二时间切片计算该维度的属性数据的波动
程度表征参数; 其中, 所述客户属性数据的波动程度的表征参数包括下述至少一项: 标准
差、 波动率、 变异系数、 最大值、 最小值、 平均值、 同比、 环比和同一表征参数的数值 排序;
根据所述网络参数、 所述客户的至少两个维度的属性数据和每个维度的属性数据的波
动程度表征参数 形成所述数据集。
10.根据权利要求9所述的基于金融风险的阈值模型建立方法, 其特征在于, 所述第二
时间切片包括 年、 季、 月和周中的至少一个。
11.根据权利要求8 或9所述的基于金融风险的阈值模型建立方法, 其特征在于, 根据 所
述数据集建立反欺诈模型, 包括:
选取部分所述数据集作为训练集; 其中, 所述训练集占据所述数据集的比例大于五分
之三且小于五分之四;
选取所述数据集中的变量作为解释变量, 欺诈客户对应的第 一变量以及非欺诈客户对
应的第二变量作为被解释 变量, 根据机器学习算法采用所述训练集中的数据完成模型的训
练, 建立所述反欺诈模型。
12.根据权利要求11所述的基于金融风险的阈值模型建立方法, 其特征在于, 在根据 所
述数据集建立反欺诈模型之后, 还 包括:
选取另一部分所述数据集作为验证集; 其中, 所述验证集和所述训练集的和为所述数
据集;
根据所述验证集对所述反欺诈模型进行验证。
13.一种基于金融风险的阈值模型建立装置, 其特 征在于, 包括:
分组模块, 用于对不同的金融机构进行分组, 以确定为至少两组金融机构;
数据剔除模块, 用于根据反欺诈模型对每组金融机构的历史损失数据中的异质性数据
进行剔除, 形成至少两组样本损失数据;
阈值模型建立模块, 用于根据每组所述样本损 失数据分别选取阈值模型的阈值, 以建
立每组金融机构对应的阈值模型。
14.一种设备, 其特 征在于, 所述设备包括:
一个或多个处 理器;
存储装置, 用于存 储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行, 使得所述一个或多个处理器实
现如权利要求1 ‑12中任一所述的基于金融风险的阈值模型建立方法。
15.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器
执行时实现如权利要求1 ‑12中任一所述的基于金融风险的阈值模型建立方法。权 利 要 求 书 2/2 页
3
CN 114092222 A
3
专利 基于金融风险的阈值模型建立方法、装置、设备和介质
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 19:02:23上传分享