说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111312687.9 (22)申请日 2021.11.08 (71)申请人 中国人民解 放军总医院 地址 100853 北京市海淀区复兴 路28号 (72)发明人 刘晓莉 张政波 周飞虎 刘超  毛智  (74)专利代理 机构 北京京万通知识产权代理有 限公司 1 1440 代理人 齐晓静 (51)Int.Cl. G16H 50/20(2018.01) G06N 20/00(2019.01) (54)发明名称 基于可解释机器学习模 型的严重AKI早期风 险评估模型、 装置及其 开发方法 (57)摘要 本申请提出一种基于可解释机器学习模型 的严重AKI早期风险评估模型、 其装置、 以及其 建 立方法, 在数据集构建中, 基于多个大型的电子 健康档案 数据集, 根据研究方案完成对人群的挑 选、 研究变量的纳入以及正负样本集的构建; 在 数据处理中, 进行数据的提取与预处理, 并基于 机器学习模型的开发而完成统计特征数据集的 构建; 在模型构建与评价中, 基于所述统计特征 数据集, 进行模型的构建与训练, 并进一步基于 制定的9项指标和3种方式对模型的性能进行评 估, 得到训练和校准好的预测模型; 在模型应用 中, 基于训练好的预测模型, 针对不同应用场景 进行模型的迁移与训练和再次校准。 权利要求书4页 说明书24页 附图11页 CN 114023441 A 2022.02.08 CN 114023441 A 1.一种基于可解释机器学习模型的严重AKI早期风险评估模型, 其为基于融合SHAP方 法的LightGBM模型; 所述模型 具有多个特征, 其中按照其重要性前20个特 征为: 观测窗口为12小时内后6小时的尿量总和/kg/h、 12小时内尿量总和/kg/h、 BMI、 当前时 刻平均动脉压、 年龄、 当前时刻收缩压、 尿素氮/肌酐、 在观测窗口内 吸入氧浓度的变化量最 大值、 性别、 观测窗口为12小时内前6小时的尿量总和/kg/h、 观测窗口内尿量总和、 观测窗 口内体温的最低值、 观测窗口内PH的最低值、 当前时刻是否使用利尿剂、 体重、 观测窗口内 eGFR最小值、 观测窗口内动脉血二氧化碳分压变化的最大值、 是否有高血压、 观测窗口内平 均动脉压变化的斜 率、 观测窗口内血 氧分压变化的最大值; 所述模型根据待预测患者疾病风险的健康数据中提取的与所述多个特征中的至少一 些相对应的输入 特征, 每小时动态评估 该待预测患者未来2 4小时内发生严重AKI的风险, 并 对推理过程进行解释。 2.根据权利要求1所述的基于可解释机器学习模型的严重AKI早期风险评估模型, 其特 征在于: 进一 步包括数据处 理模块; 所述待预测患 者的健康数据由数据处理模块进行处理, 提取出与所述多个特征中的至 少一些相对应的输入特 征。 3.一种基于可解释机器学习模型的严重AKI早期风险评估装置, 其包括计算单元, 所述 计算单元执行权利要求1 ‑2中任一项所述的基于可解释机器学习模型的严重AKI早期风险 评估模型, 所述模型采用其所融合的S HAP方法获得所述待 预测患者的风险因素排名和 动态 的评估各个因素对于严重AKI发生的重要程度。 4.根据权利要求3所述的基于可解释机器学习模型的严重AKI早期风险评估装置, 其特 征在于: 该装置实时自动从医院信息系统调取所需的个人信息、 实验室检查信息、 生命体征信 息、 治疗信息和尿量, 并利用所述基于可解释机器学习模型的严重AKI早期风险评估模型获 得每小时严重AKI未来发生 风险的动态评估结果和重要风险因素的动态变化过程; 该装置自动 地并行计算整个病区患 者的发病风险, 并将风险值超过医生设定 阈值的患 者信息推送给责任医生和护士, 以尽早 地对患者病情进行评估和调整 治疗方案 。 5.一种基于可解释机器学习模型的严重AKI早期风险评估模型的开发方法, 其包括: 数 据集构建、 数据处 理、 模型构建与评价、 模型应用; 在数据集构建中, 基于多个大型的 电子健康档案数据集, 根据研究方案完成对人群的 挑选、 研究变量的纳入以及正负 样本集的构建; 在数据处理中, 进行数据的提取与预处理, 并基于机器学习模型的开发而完成统计特 征数据集的构建; 在模型构建与评价中, 基于所述统计特征数据集, 进行模型的构建与训练, 并进一步基 于制定的9项指标和3种方式对 模型的性能进行评估, 得到训练和校准 好的预测模型; 在模型应用中, 基于训练好的预测模型, 针对不同应用场景进行模型的迁移与训练和 再次校准。 6.根据权利要求5所述的基于可解释机器学习模型的严重AKI早期风险评估模型的开 发方法, 其特 征在于: 所述多个大 型的电子健康档案数据集包括:权 利 要 求 书 1/4 页 2 CN 114023441 A 2BIDMIC 2001‑2016、 BIDMIC  2017‑2019、 eICU ‑CRD、 Ams‑UMC、 PLAGH。 7.根据权利要求6所述的基于可解释机器学习模型的严重AKI早期风险评估模型的开 发方法, 其特 征在于: 对人群的挑选原则为: (1)纳入年龄处于18岁至90岁的重症监护室(ICU)住院患者; (2)排除第二次及之后进入医院和进入ICU接受治疗的患者; (3)排除ICU住院时长小于1 天或超过120天的患者; (4)排除ICU期间测量肌酐次数低于 两次的患者; (5)排除入院肌酐值高于4mg/dl的患者; (6)排除已是终末期肾病的患者; (7)排除在ICU期间最初6小时需要 进行透析或者肾移植治疗的患者; (8)排除入ICU的12小时内发生AKI  2或3期的患者。 8.根据权利要求7所述的基于可解释机器学习模型的严重AKI早期风险评估模型的开 发方法, 其特 征在于: 在研究变量的纳入中, 确定五类 研究变量, 分为静态特 征和动态特 征; 包括: 个人信息, 为静态特征, 其包括: 入院类型、 年龄、 BMI指数、 种族、 入重症监护室类型、 性 别、 身高、 体重、 入院是否有高血压病史、 入院是否有糖尿病病史、 入院是否有心力衰竭病 史; 生命体征, 为动态特征, 包括: 心率、 平均动脉压、 呼吸速率、 收缩压、 休克指数、 血氧饱 和度、 体温; 实验室检查, 为动态特征, 其包括: 碱性磷酸酶、 碱性磷酸酶是否测量、 谷丙转氨酶、 谷 丙转氨酶是否测量、 谷草转氨酶、 谷草转氨酶是否测量、 阴离子隙、 碱剩余、 碳酸氢盐、 胆红 素、 胆红素是否测量、 血尿素氮与肌酐比值、 血尿素氮、 血钙、 氯化物、 肌酐、 eGRF、 吸入氧浓 度、 吸入氧浓度是否标记、 血葡萄糖、 红细胞压积、 血 红蛋白、 国际标准化比值、 乳酸、 乳酸是 否测量、 淋巴细胞、 淋巴细胞是否测量、 镁、 中性粒细胞、 中性粒细胞是否测量、 动脉血二氧 化碳分压、 氧合指数、 氧合指数是否测量、 血氧分压、 ph值、 血小板、 钾、 凝血酶原时间、 凝血 激活酶时间、 血钠、 白细胞计数; 治疗信息, 为动态特征, 其包括: 是否使用多巴酚丁胺、 是否使用多巴胺、 是否使用肾上 腺素、 是否使用去甲肾上腺素、 是否进行机 械通气、 是否使用利尿剂。 尿量, 为动态特 征, 其包括: 每次的排尿量。 9.根据权利要求8所述的基于可解释机器学习模型的严重AKI早期风险评估模型的开 发方法, 其特 征在于: 进行数据的提取与预处 理包括: 数据清洗, 将所述多个大型的 电子健康档案数据集的相同变量进行命名的统一、 单位 变换统一、 去除生理范围允许之外的异常值、 抽取研究数据段为住ICU期间的数据; 数据采样, 所有动态采集数据均以入ICU时间作为起点, 单位为小时进行对齐, 若出现 多个值则取均值/最近时刻时; 数据插值, 缺少比例≤30%插入人群中位数, 否则 需要加入该特征对应的标志特征标 识是否测量0 /1, 对于吸入氧浓度的缺失值在没有 进行机械通气的时间段内插 入21%;权 利 要 求 书 2/4 页 3 CN 114023441 A 3

.PDF文档 专利 基于可解释机器学习模型的严重AKI早期风险评估模型、装置及其开发方法

文档预览
中文文档 40 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共40页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于可解释机器学习模型的严重AKI早期风险评估模型、装置及其开发方法 第 1 页 专利 基于可解释机器学习模型的严重AKI早期风险评估模型、装置及其开发方法 第 2 页 专利 基于可解释机器学习模型的严重AKI早期风险评估模型、装置及其开发方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:01:42上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。