说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210178807.9 (22)申请日 2022.02.25 (71)申请人 山东大学 地址 250199 山东省济南市历城区山大南 路27号 (72)发明人 李玉军 郭润东 贲晛烨 胡伟凤  赵思文 刘保臣  (74)专利代理 机构 济南金迪知识产权代理有限 公司 37219 代理人 杨树云 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/279(2020.01) G06F 40/284(2020.01) G06F 16/35(2019.01)G06N 3/04(2006.01) G06Q 50/18(2012.01) (54)发明名称 一种基于相关图信息进行因果推断的案由 认定方法及系统 (57)摘要 本发明提供了一种基于相关图信息进行因 果推断的案由认定方法及系统, 所述方法包括, 获取案件的事实描述; 根据案件的事实描述构建 因果图; 利用GFCI算法对构建的因果图进行因果 发现并采样得到因果子图; 对采样得到的因果子 图去噪后添加至loss中, 得到案由认定结果; 其 中, 构建因果图包括利用KeyBERT算法获取案件 的关键字, 并对案件的关键字进行聚类。 本发明 提出了使用因果图进行因果推断的方法来进行 案由认定, 这样充分的利用了案件事实描述中的 非结构化信息, 更好的分辨出不同案件的相似性 和差异性, 有效解决了类案不同判的情况, 提高 了案由认定的准确度, 同时模型参数量更少, 训 练速度快, 便 于部署并且可以快速实现。 权利要求书2页 说明书9页 附图2页 CN 114429140 A 2022.05.03 CN 114429140 A 1.一种基于相关图信息进行因果推断的案由认定方法, 其特 征在于, 包括: 获取案件的事实描述, 包括案件主体、 案件情节和案件结果; 根据案件的事实描述抽取关键信息; 利用GFCI算法构建因果图并采样得到因果子图, 包括通过KeyBERT算法获取案件的关 键字, 并对案件的关键 字进行聚类; 对因果子图的边进行因果强度的估计, 并结合BIC算法得到因果图的因果强度, 得到判 决结果; 利用因果图的因果强度构造辅助loss, 提升BiLSTM ‑Att模型性能, 得到训练好的 BiLSTM‑Att模型; 对待认定的案件, 获取案件的事实描述, 输入至训练好的BiLSTM ‑Att模型中, 得到案由 认定结果。 2.根据权利要求1所述的一种基于相关图信息进行因果推断的案由认定方法, 其特征 在于, 所述通过KeyBERT算法获取案件的关键字, 包括使用BERT提取文档嵌入以获得文档级 向量表述, 并为 N‑garm词提取词向量, 利用余弦相似度来找到与文档最相似的单词。 3.根据权利要求1所述的一种基于相关图信息进行因果推断的案由认定方法, 其特征 在于, 所述对案件的关键字进 行聚类, 包括将案件的关键字 分为K组, 并随机选取K个对象作 为初始的聚类中心, 再通过计算每个对 象与各个聚类中心的距离, 将每个对 象分配给距离 其最近的聚类中心。 4.根据权利要求1所述的一种基于相关图信息进行因果推断的案由认定方法, 其特征 在于, 所述构建因果图, 还 包括通过因果推断, 判断是否建立 边以及边的类型。 5.根据权利要求1所述的一种基于相关图信息进行因果推断的案由认定方法, 其特征 在于, 对因果子图的边进行因果强度的估计, 并结合BIC算法得到因果图的因果强度, 得到 判决结果, 包括: 利用ATE对因果子图的边进行因果强度的估计, 得到 使用BIC对每 个因果子图进行质量的评估, 得到BIC(Gq,X); 计算总的因果强度 将每个因果子图的质量BIC(Gq,X)以及 相结合得到: 其中, Yi表示案由ci被提交, 代表在因果字图Gq中的因果强度, 如果Tj→Yi在图Gq中 不存在则为0; 通过总的因果强度计算每个案由的得分, 将得分送到随机森林模型中判断该因果图对 应的到底是哪一类案由。 6.根据权利要求1所述的一种基于相关图信息进行因果推断的案由认定方法, 其特征 在于, 通过总的因果强度计算每 个案由的得分, 包括: 对于 案由Yi来说, 其得分S(Yi)为: 权 利 要 求 书 1/2 页 2 CN 114429140 A 2其中τ(Tj)表示在这个案件中存在Tj, 而Tr(Yi)是Yi的处理集合。 7.根据权利要求1所述的一种基于相关图信息进行因果推断的案由认定方法, 其特征 在于, 所述利用因果图的因果强度构造辅助loss, 提升BiLSTM ‑Att模型性能, 得到训练好的 BiLSTM‑Att模型, 包括: 将得到的案件的事实描述进行词嵌入embed ding; 将embedding的结果输入到Bi LSTM中; 在计算loss阶段, 引入辅助 loss, 通过利用之前得到的因果子图所对应的因果强度, 将 其引入以辅助at tention部分, 计算公式为: L=Lcross+α Lcons; 其中ai是每个词在attention中的权重, gi是因果强度的归一化的值, Lcross则是交叉熵 loss的值。 8.一种基于相关图信息进行因果推断的案由认定系统, 其特 征在于, 包括: 数据获取模块, 被 配置为, 获取案件的事实描述, 包括案件主体、 案件情节和案件结果; 关键信息抽取模块, 被配置为, 通过KeyBERT算法获取案件 的关键字, 并对案件 的关键 字进行聚类; 采样模块, 被 配置为, 利用GFCI 算法构建因果图并采样得到因果子图; 降噪模块, 被配置为, 利用因果图的因果强度构造辅助loss, 提升BiLSTM ‑Att模型性 能, 得到训练好的Bi LSTM‑Att模型; 案由认定模块, 被配置为, 对待认定的案件, 获取案件的事实描述, 输入至训练好的 BiLSTM‑Att模型中, 得到 案由认定结果。 9.一种计算机可读存储介质, 其中存储有多条指令, 其特征在于, 所述指令适于由终端 设备的处理器加载并执行权利要求 1‑7任一所述的一种基于相关图信息进行 因果推断的案 由认定方法。 10.一种终端设备, 包括处理器和计算机可读存储介质, 处理器用于实现各指令; 计算 机可读存储介质用于存储多条指令, 其特征在于, 所述指令适于由处理器加载并执行权利 要求1‑7任一所述的一种基于相关图信息进行因果推断的案由认定方法。权 利 要 求 书 2/2 页 3 CN 114429140 A 3

PDF文档 专利 一种基于相关图信息进行因果推断的案由认定方法及系统

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于相关图信息进行因果推断的案由认定方法及系统 第 1 页 专利 一种基于相关图信息进行因果推断的案由认定方法及系统 第 2 页 专利 一种基于相关图信息进行因果推断的案由认定方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:26上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。