(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111383046.2
(22)申请日 2021.11.22
(71)申请人 广东工业大 学
地址 510000 广东省广州市东 风东路729号
(72)发明人 袁正强 苏奎 袁倩 杨明慧
孙健武
(74)专利代理 机构 广州三环 专利商标代理有限
公司 44202
代理人 许羽冬 郭浩辉
(51)Int.Cl.
G16H 50/20(2018.01)
G16H 50/30(2018.01)
G16H 50/70(2018.01)
G06N 20/00(2019.01)
(54)发明名称
一种骨关节炎病情预测方法、 系统、 计算机
设备及介质
(57)摘要
本发明提供了一种骨关节炎病情预测方法、
系统、 计算机设备及介质, 所述方法包括获取骨
关节炎数据集, 并将所述骨关节炎数据集按照预
设比例划分为训练集、 验证集和测试集; 所述骨
关节炎数据集包括临床样本数据和x射线关节间
隙宽度数据; 根据所述训练集和验证集, 从不同
的机器学习模型中确定最优骨关节炎病情预测
模型; 根据所述测试集和最优骨关节炎病情预测
模型, 得到对应的骨关节炎病情预测结果及影 响
因素。 本发 明在弥补现有技术的不足且为临床医
生对骨关节炎患者病情的评估诊断提供便利的
同时, 有效提高预测结果的精准性, 进一步提升
对骨关节炎的发病预测、 治疗指导和治疗效果跟
踪的应用价 值。
权利要求书3页 说明书16页 附图7页
CN 114023444 A
2022.02.08
CN 114023444 A
1.一种骨关节炎病情预测方法, 其特 征在于, 所述方法包括以下步骤:
获取骨关节炎数据集, 并将所述骨关节炎数据集按照预设比例划分为训练集、 验证集
和测试集; 所述骨关节炎数据集包括临床 样本数据和x射线关节间隙宽度数据;
根据所述训练集和验证集, 从不同的机器学习模型中确定最优骨关节炎病情预测模
型;
根据所述测试集和最优骨 关节炎病情预测模型, 得到对应的骨关节炎病情预测结果及
影响因素。
2.如权利要求1所述的骨 关节炎的病情预测方法, 其特征在于, 所述获取骨 关节炎数据
集, 并将所述骨关节炎数据集按照预设比例划分为训练集、 验证集和 测试集的步骤 包括:
筛选所述骨关节炎数据集中疾病无关特征变量, 并将所述疾病无关特征变量删除, 得
到第一骨关节炎数据集;
将所述第一骨关节炎数据集中的离散特征变量采用one ‑hot编码处理为对应的特征数
值向量, 并采用所述特征数值向量替换对应的所述离散特征变量, 得到第二骨关节炎数据
集;
查找所述第 二骨关节炎数据集中的数据缺失样本, 并对所述数据缺失样本进行填充处
理, 得到第三骨关节炎数据集;
将所述第三骨 关节炎数据集中连续特征变量进行标准化处理, 得到第四骨 关节炎数据
集;
将所述第四骨 关节炎数据集中同一样本ID对应的临床样本数据和x射线关节间隙宽度
数据进行合并, 得到第五骨关节炎数据集;
根据所述第五骨关节炎数据集, 获取对应的骨关节炎病情评分统计分布, 并根据所述
骨关节炎病情评分统计分布, 对所述第 五骨关节炎数据集进行扩充, 得到第六骨关节炎数
据集;
获取所述第六骨关节炎数据 集内各个特征变量与对应Kellgren ‑Lawrence分级评分的
皮尔森相关系 数, 并将所述皮尔森相关系 数大于预设相关度阈值的特征变量删除, 得到第
七骨关节炎数据集;
将所述第七骨关节炎数据集按照所述预设比例划分为训练集、 验证集和 测试集。
3.如权利要求2所述的骨 关节炎的病情预测方法, 其特征在于, 所述查找所述第 二骨关
节炎数据集中的数据缺失样本, 并对所述数据缺失样本进行填充处理, 得到第三骨关节炎
数据集的步骤 包括:
判断所述数据缺失样本的数据缺失率是否大于预设缺失率阈值, 若大于, 则将对应的
所述数据缺失样本删除, 反之, 则将所述数据缺失样本的对应的缺失特征变量采用数据完
整样本对应特 征变量的均值进行填充。
4.如权利要求2所述的骨 关节炎的病情预测方法, 其特征在于, 所述根据 所述第五骨关
节炎数据集, 获取对应的骨关节炎病情评分统计分布, 并根据所述骨关节炎病情评分统计
分布, 对所述第五骨关节炎数据集进行扩充, 得到第六骨关节炎数据集的步骤 包括:
根据所述第五骨关节炎数据集中x射线关节间隙宽度数据对应 的Kellgren ‑Lawrence
分级评分, 统计所述骨关节炎病情评分统计分布;
根据所述骨 关节炎病情评分统计分布, 判断所述第五骨关节炎数据集内的各个等级的权 利 要 求 书 1/3 页
2
CN 114023444 A
2Kellgren‑Lawrence分级评分是否分布均匀;
若所述第五骨关节炎数据集内的各个等级的Kellgren ‑Lawrence分级评分分布不均
匀, 则对所述骨关节炎病情评分统计分布中Kellgren ‑Lawrence分级评分占比最少的样本
数据进行SMOTE上采样, 得到所述第六骨关节炎数据集。
5.如权利要求1所述的骨 关节炎的病情预测方法, 其特征在于, 所述机器学习 模型包括
逻辑回归、 支持向量机、 决策树和XGBo ost;
所述根据 所述训练集和验证集, 从不同的机器学习 模型中确定最优骨关节炎病情预测
模型的步骤 包括:
预先建立各个机器学习模型, 并采用所述训练集分别对各个机器学习模型进行训练,
更新各个机器学习模型的模型参数;
采用所述验证集对已更新模型参数的各个机器学习 模型进行训练, 更新各个机器学习
模型的模型超参数, 得到对应的骨关节炎病情预测模型及MSE指标值;
比较各个骨关节炎病情预测模型对应的MSE指标值, 并将最小MSE指标值对应的骨关节
炎病情预测模型确定为所述 最优骨关节炎病情预测模型。
6.如权利要求1所述的骨 关节炎的病情预测方法, 其特征在于, 所述影响因素包括关键
风险特征变量和潜在风险特 征变量;
所述根据 所述测试集和最优骨 关节炎病情预测模型, 得到对应的骨 关节炎病情预测结
果及影响因素的步骤 包括:
将所述测试集输入所述最优骨 关节炎病情预测模型, 得到对应的骨 关节炎病情预测结
果、 以及所述测试集内各个特 征变量对所述骨关节炎病情预测结果的特 征贡献度得分;
将各个特征贡献度得分按降序进行排列, 得到对应的预测结果贡献度排名, 并自上而
下筛选出第一预设数目的特 征贡献度得分;
获取与所述第一预设数目的特征贡献度得分对应的特征变量作为风险特征变量, 并按
照特征贡献度得分由高到低从所述风险特征变量中筛选出第二预设数目的特征变量作为
待分析风险特 征变量;
根据所述待分析风险特 征变量, 确定所述关键风险特 征变量和潜在风险特 征变量。
7.如权利要求6所述的骨 关节炎的病情预测方法, 其特征在于, 所述根据 所述待分析风
险特征变量, 确定所述关键风险特 征变量和潜在风险特 征变量的步骤 包括:
获取各个待分析风险特征变量与对应Kellgren ‑Lawrence分级评分的皮尔森相关系
数, 并对所述皮尔森相关系 数按照降序进行排列, 得到各个待分析风险特征变量对应的相
关系数排名;
判断各个待分析风险特征变量的相关系数排名和预测结果贡献度排名是否均在预设
排名范围内;
若各个待分析风险特征变量的相关系数排名和预测结果贡献度排名均在预设排名范
围内, 则判定所述待分析风险特征变量为所述关键风险特征变量, 反之, 则判定所述待分析
风险特征变量为所述潜在风险特 征变量。
8.一种骨关节炎病情预测系统, 其特 征在于, 所述系统包括:
数据获取模块, 用于获取骨关节炎数据集, 并将所述骨关节炎数据集按照预设比例划
分为训练集、 验证集和测试集; 所述骨关节炎数据集包括临床样本数据和x射线关节间隙宽权 利 要 求 书 2/3 页
3
CN 114023444 A
3
专利 一种骨关节炎病情预测方法、系统、计算机设备及介质
文档预览
中文文档
27 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 19:01:12上传分享