(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111249432.2
(22)申请日 2021.10.26
(71)申请人 度小满科技(北京)有限公司
地址 100193 北京市海淀区西北旺东路10
号院西区4 号楼6层6 06室
(72)发明人 胡汤楠 严澄 杨青
(74)专利代理 机构 北京集佳知识产权代理有限
公司 11227
代理人 耿苑
(51)Int.Cl.
G06Q 40/02(2012.01)
G06Q 10/06(2012.01)
G06N 20/00(2019.01)
(54)发明名称
模型训练及逾期风险预测方法、 装置、 设备
和介质
(57)摘要
本申请提供了一种模型训练方法及逾期风
险预测方法、 装置、 设备和介质, 在该模 型训练方
法中, 获得多份信贷样本; 利用多份信贷样本及
信贷样本标注的信贷风险标签训练出综合信贷
风险模型; 确定多份信贷样本各自归属的信贷样
本群; 如信贷样本群属于低样本数的信贷样本
群, 利用综合信贷风险模型确定信贷样本群中各
信贷样本的信贷逾期评分, 基于信贷样本中各信
贷样本的信贷特征数据、 信贷逾期评分以及信贷
风险标签训练第二模型, 得到适用于信贷样本群
的子信贷风险模型; 其中, 信贷样本群的子信贷
风险模型用于预测信贷特征数据与信贷样本群
匹配的用户存在信贷逾期风险的评分。 本申请的
方案可以提高模型 预测信贷逾期风险的准确度。
权利要求书2页 说明书10页 附图3页
CN 113962800 A
2022.01.21
CN 113962800 A
1.一种模型训练方法, 其特 征在于, 包括:
获得多份信贷样本, 所述信贷样本包括存在借贷行为的信贷用户关联的信贷特征数
据, 所述信贷样本标注有信贷风险标签, 所述信贷风险标签用于表征所述信贷样本对应的
用户是否存在信贷逾期的风险;
利用所述多份信贷样本以及所述信贷样本标注的信贷风险标签训练第 一模型, 得到训
练出的综合信贷风险模型;
确定所述多份信贷样本各自归属的信贷样本群, 得到至少一个信贷样本群, 所述信贷
样本群中包括信贷特征数据的种类相同的至少一个信贷样本, 且所述至少一个信贷样本中
指定类别的信贷特 征数据相同;
如基于所述信贷样本群中信贷样本数量确定出所述信贷样本群属于低样本数的信贷
样本群, 利用所述综合信贷风险模型分别确定所述信贷样本群中各信贷样本对应的信贷逾
期评分, 基于所述信贷样本中各信贷样本的信贷特征数据、 信贷逾期评分以及信贷风险标
签训练第二模型, 得到适用于所述信贷样本群的子信贷风险模型;
其中, 所述信贷样本群的子信贷风险模型用于预测信贷特征数据与 所述信贷样本群匹
配的用户存在信贷逾期风险的评分。
2.根据权利要求1所述的方法, 其特 征在于, 还 包括:
如基于所述信贷样本群中信贷样本数量确定出所述信贷样本群不属于低样本数的信
贷样本群, 基于所述信贷样本群中各信贷样本的信贷 特征数据以及信贷风险标签训练第三
模型, 得到适用于所述信贷样本群的子信贷风险模型。
3.根据权利要求1所述的方法, 其特征在于, 所述确定所述多份信贷样本各自归属的信
贷样本群, 包括:
基于所述信贷样本 中表征信贷业务场景的信贷特征数据, 将所述多份信贷样本划归到
至少一个信贷样本群, 每 个信贷样本群中表征信贷业 务场景的信贷特 征数据相同。
4.根据权利要求1所述的方法, 其特征在于, 所述基于所述信贷样本 中各信贷样本的信
贷特征数据、 信贷逾期评分以及信贷风险标签训练第二模型, 包括:
确定所述信贷样本群的信贷样本具有的特殊信贷特征数据, 所述特殊信贷特征数据为
所述信贷样本群之外的其 他信贷样本群中的信贷样本不具有的信贷特 征数据;
至少基于所述信贷样本群中各信贷样本的特殊信贷特征数据、 信贷逾期评分以及信贷
风险标签训练第二模型。
5.根据权利要求1所述的方法, 其特征在于, 所述基于所述信贷样本群中信贷样本数量
确定出所述信贷样本群属于低样本数的信贷样本群, 包括:
如所述信贷样本群中信贷样本数量与所述多份信贷样本对应的总数量的比值小于设
定比值, 确定所述信贷样本群属于低样本数的信贷样本群。
6.一种逾期风险预测方法, 其特 征在于, 包括:
获得待预测的目标用户的目标信贷特 征数据;
从多个信贷样本群中, 确定所述目标信贷特征数据匹配的目标信贷样本群, 所述信贷
样本群为基于 权利要求1至 5任意一项所述的模型训练方法确定出的;
基于所述目标信贷样本群适用的子信贷风险模型以及所述目标信贷特征数据, 确定所
述目标用户存在信贷逾期风险的风险评 分, 所述目标信贷样本群适用的子信贷风险模型为权 利 要 求 书 1/2 页
2
CN 113962800 A
2基于权利要求1至 5任意一项所述的模型训练方法训练得到的。
7.一种模型训练装置, 其特 征在于, 包括:
样本获得单元, 用于获得多份信贷样本, 所述信贷样本包括存在借贷行为的信贷用户
关联的信贷特征数据, 所述信贷样本标注有信贷风险标签, 所述信贷风险标签用于表征所
述信贷样本对应的用户是否存在信贷逾期的风险;
第一模型训练单元, 用于利用所述多份信贷样本以及所述信贷样本标注的信贷风险标
签训练第一模型, 得到训练出的综合信贷风险模型;
群分类单元, 用于确定所述多份信贷样本各自归属的信贷样本群, 得到至少一个信贷
样本群, 所述信贷样本群中包括信贷特征数据的种类相同的至少一个信贷样本, 且所述至
少一个信贷样本中指定类别的信贷特 征数据相同;
第二模型训练单元, 用于如基于所述信贷样本群中信贷样本数量确定出所述信贷样本
群属于低样本数的信贷样本群, 利用所述综合信贷风险模型分别确定所述信贷样本群中各
信贷样本对应的信贷逾期评分, 基于所述信贷样本中各信贷样本的信贷特征数据、 信贷逾
期评分以及信贷风险标签训练第二模型, 得到适用于所述信贷样本群的子信贷风险模型;
其中, 所述信贷样本群的子信贷风险模型用于预测信贷特征数据与所述信贷样本群匹配的
用户存在信贷逾期风险的评分。
8.一种逾期风险预测装置, 其特 征在于, 包括:
数据获得 单元, 用于获得待预测的目标用户的目标信贷特 征数据;
群确定单元, 用于从多个信贷样本群中, 确定所述目标信贷特征数据匹配的目标信贷
样本群, 所述信贷样本群为基于 权利要求1至 5任意一项所述的模型训练方法确定出的;
风险预测单元, 用于基于所述目标信贷样本群适用的子信贷风险模型以及所述目标信
贷特征数据, 确定所述 目标用户存在信贷逾期风险的风险评分, 所述 目标信贷样本群适用
的子信贷风险模型为基于 权利要求1至 5任意一项所述的模型训练方法训练得到的。
9.一种电子设备, 其特 征在于, 包括存 储器和处 理器;
其中, 所述存 储器用于存 储程序;
所述处理器用于执行所述程序, 所述程序被执行时, 具体用于实现如权利要求1至5任
意一项所述的模型训练方法, 或者如权利要求6所述的逾期风险预测方法。
10.一种存储介质, 其特征在于, 用于存储程序, 所述程序被执行时, 用于实现如权利要
求1至5任意一项所述的模型训练方法, 或者如权利要求6所述的逾期风险预测方法。权 利 要 求 书 2/2 页
3
CN 113962800 A
3
专利 模型训练及逾期风险预测方法、装置、设备和介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 19:03:00上传分享