说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111263464.8 (22)申请日 2021.10.28 (71)申请人 平安医疗健康管理股份有限公司 地址 200001 上海市黄浦区北京东路6 66号 H区(东座)12G室 (72)发明人 谷志广  (74)专利代理 机构 北京中强智尚知识产权代理 有限公司 1 1448 代理人 贾依娇 (51)Int.Cl. G06Q 10/06(2012.01) G06Q 40/08(2012.01) G06N 20/00(2019.01) (54)发明名称 基于机器学习的数据风险评估方法及装置 (57)摘要 本发明涉及人工智能技术领域, 揭露一种基 于机器学习的数据风险评估方法, 包括: 获取不 包含历史健康标签信息的目标保险数据; 响应于 目标保险数据的风险评估指令, 使用预先设置的 风险字段从所述目标保险数据中提取风险字段 相应的字段属性; 利用决策树算法从风险字段中 选取目标风险字段, 并结合目标风险字段相应的 字段属性输入至预先构建的风险评估模型中进 行预测, 得到目标风险字段在不同风险规则条件 上的映射关系; 根据所述目标风险字段在不同风 险规则条件 上的映射关系, 评估目标保险数据的 风险概率。 本发 明能够利用风险评估模型快速筛 查风险数据, 提高数据风险评估的准确率和分析 效率。 权利要求书2页 说明书11页 附图4页 CN 113971527 A 2022.01.25 CN 113971527 A 1.一种基于 机器学习的数据风险评估方法, 其特 征在于, 所述方法包括: 获取不包 含历史健康标签信息的目标保险数据; 响应于目标保险数据的风险评估指令, 使用预先设置的风险字段从所述目标保险数据 中提取风险字段相应的字段属性; 利用决策树算法从风险字段中选取目标风险字段, 并结合目标风险字段相应的字段属 性输入至预先构建的风险评估模型中进行预测, 得到目标风险字段在不同风险规则条件上 的映射关系; 根据所述目标风险字段在不同风险规则条件上的映射关系, 评估目标保险数据的风险 概率。 2.根据权利要求1所述的方法, 其特征在于, 所述获取不包含历史健康标签信 息的目标 保险数据, 具体包括: 通过将各个医疗数据平台接入服务端, 由所述服务端向各个医疗数据平台发起查询请 求, 所述查询请求中携带有用户标识, 所述医疗数据平台预先针对健康数据整理有与用户 标识相匹配的历史健康标签信息; 根据各个医疗数据平台反馈的查询请求结果, 确定用户标识是否存在对应的历史健康 标签信息; 从保险数据集中筛 选出不含历史健康标签信息的目标保险数据。 3.根据权利要求1所述的方法, 其特征在于, 所述使用预先设置的风险字段从所述目标 保险数据中提取风险字段相应的字段属性, 具体包括: 基于历史理赔数据统计信 息结合模型特征工程经验, 针对所述目标保险数据 预先设置 风险字段; 从所述目标保险数据中提取风险字段相应的字段属性。 4.根据权利要求3所述的方法, 其特征在于, 所述风险字段至少包括系统字段、 开发衍 生字段和设计字段, 所述基于历史理赔数据 统计信息结合模型特征工程经验, 针对所述 目 标保险数据预 先设置风险字段, 具体包括: 基于历史理赔数据统计信 息结合模型特征工程经验, 分别将 从所述目标保险数据中直 接获取到的字段信息作为系统字段, 将通过所述目标保险数据推算得到的字段信息作为开 发衍生字段, 将针对所述目标保险数据额外 定义的字段信息作为设计字段。 5.根据权利要求1 ‑4中任一项所述的方法, 其特征在于, 在所述响应于目标保险数据的 风险评估指令, 使用预先设置的风险字段从所述目标保险数据中提取风险字段相应的字段 属性之前, 所述方法还 包括: 基于不包含历史健康标签信 息的样本保险数据, 利用决策树算法选取的目标风险字段 与相应的字段属 性输入至决策树网络模型中进行训练, 构建风险评估模型, 构建风险评估 模型; 所述利用决策树算法选取的目标风险字段与相应的字段属性输入至决策树网络模型 中进行训练, 构建风险评估 模型, 构建风险评估 模型, 具体包括: 利用决策树算法自带模型特征重要属性的筛选功能对每个风险字段进行评估, 选取对 模型结果有贡献的目标风险字段; 将所述目标风险字段形成特征向量输入至决策树网络模型中进行训练, 提取风险字段权 利 要 求 书 1/2 页 2 CN 113971527 A 2在不同风险规则条件上的映射关系; 根据所述 风险字段在不同风险规则条件上的映射关系, 构建风险评估 模型。 6.根据权利要求5所述的方法, 其特征在于, 所述将所述目标风险字段形成特征向量输 入至决策树网络模型中进行训练, 提取风险字段在不同风险规则条件上 的映射关系, 具体 包括: 将所述目标风险字段形成特征向量输入至决策树网络模型中进行训练, 并使用决策树 网络模型中节点判断风险字段 是否达到节点设置的风险规则条件; 若是, 则更新 风险字段在相应节点上的权 重; 通过汇总决策树中节点上的权 重, 提取风险字段在不同风险规则条件上的映射关系。 7.根据权利要求5所述的方法, 其特征在于, 在所述根据 所述风险字段在不同节点上的 映射关系, 构建风险评估 模型之前, 所述方法还 包括: 预先设置表征模型训练效果的目标函数, 通过对所述目标函数求导得到的梯度值, 对 训练过程中的决策树网络模型进行 更新。 8.一种基于 机器学习的数据风险评估 装置, 其特 征在于, 所述装置包括: 获取单元, 用于获取不包 含历史健康标签信息的目标保险数据; 提取单元, 用于响应于目标保险数据的风险评估指令, 使用预先设置的风险字段从所 述目标保险数据中提取风险字段相应的字段属性; 预测单元, 用于利用决策树算法从风险字段中选取目标风险字段, 并结合目标风险字 段相应的字段属性输入至预先构建的风险评估模型中进行预测, 得到目标风险字段在不同 风险规则条件上的映射关系; 评估单元, 用于根据所述目标风险字段在不同风险规则条件上的映射关系, 评估目标 保险数据的风险概 率。 9.一种计算机设备, 包括存储器和处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处 理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。 10.一种计算机存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被处 理器执行时实现权利要求1至7中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 113971527 A 3

.PDF文档 专利 基于机器学习的数据风险评估方法及装置

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于机器学习的数据风险评估方法及装置 第 1 页 专利 基于机器学习的数据风险评估方法及装置 第 2 页 专利 基于机器学习的数据风险评估方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:02:02上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。