专利 机器学习模型的训练方法、装置、电子设备和存储介质

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111308594.9 (22)申请日 2021.11.05 (71)申请人中信百信银行股份有限公司地址 100020 北京市朝阳区安定路5号院3 号楼8层 (72)发明人吴雨霏　 (74)专利代理机构北京植德律师事务所 1 1780 代理人唐华东 (51)Int.Cl. G06N 3/02(2006.01) G06N 20/00(2019.01) G06K 9/62(2022.01) G06F 16/332(2019.01) (54)发明名称机器学习模型的训练方法、装置、电子设备和存储介质 (57)摘要本公开提供一种机器学习模型的训练方法、装置、电子设备和存储介质。该方法包括：利用第一数据集进行机器学习训练，得到第一模型；利用第二数据集的子集对第一模型进行更新，得到第二模型；根据第二模型在第一数据集上的预测结果，从第二数据集的子集中筛选出目标数据；将目标数据由第二数据集转移至第一数据集，得到更新后的第一数据集；利用更新后的第一数据集对第二模型进行更新，得到目标模型。该方法能够实现同特征但是数据量数据分布不一致的迁移训练。权利要求书2页说明书9页附图4页 CN 114091645 A 2022.02.25 CN 114091645 A 1.一种机器学习模型的训练方法，包括：利用第一数据集进行机器学习训练，得到第一模型，其中，所述第一数据集中的第一数据具有相应的标注标签；利用第二数据集的子集对所述第一模型进行更新，得到第二模型，其中，所述第二数据集的子集中的第二数据具有通过所述第一模型获得的预测标签；根据所述第二模型在所述第一数据集上的预测结果，从所述第二数据集的子集中筛选出目标数据；将所述目标数据由所述第二数据集转移至所述第一数据集，得到更新后的第一数据集；利用所述更新后的第一数据集对所述第二模型进行更新，得到目标模型。 2.根据权利要求1所述的方法，其中，所述方法还包括：将所述目标模型作为新的所述第一模型，重复执行从对所述第一模型进行更新至得到目标模型的处理过程，直至达到预设的停止条件。 3.根据权利要求1所述的方法，其中，所述利用第二数据集的子集对所述第一模型进行更新，得到第二模型，包括：将所述第二数据集中的所述第二数据输入所述第一模型，得到所述第二数据的预测标签以及相应的预测概率；基于所述第二数据对应的所述预测概率，对所述第二数据集中的所述第二数据进行筛选，得到所述第二数据集的子集；利用所述第二数据集的子集对所述第一模型进行机器学习训练，得到所述第二模型。 4.根据权利要求3所述的方法，其中，所述基于所述第二数据对应的所述预测概率，对所述第二数据集中的所述第二数据进行筛选，得到所述第二数据集的子集，包括：选取所述第二数据集中预测概率大于第一阈值的全体第二数据，以及在预测概率大于第二阈值并且小于或者等于所述第一阈值的第二数据中进行随机抽取，以得到所述第二数据集的子集，其中，所述第一阈值大于所述第二阈值。 5.根据权利要求1所述的方法，其中，所述根据所述第二模型在所述第一数据集上的预测结果，从所述第二数据集的子集中筛选出目标数据，包括：将所述第一数据集中的第一数据输入所述第二模型，得到所述第一数据的预测标签；根据所述第一数据的预测标签和标注标签，得到所述第一数据集的预测标签对应的分类指标；基于所述分类指标对所述第一数据集的预测标签进行筛选，得到目标预测标签；将所述第二数据集的子集中与所述目标预测标签对应的第二数据确定为所述目标数据。 6.根据权利要求5所述的方法，其中，所述基于所述分类指标包括精确率、召回率和/或精确率和召回率的调和平均数。 7.根据权利要求5所述的方法，其中，所述基于所述分类指标对所述第一数据集的预测标签进行筛选，得到目标预测标签，包括：将所述第一数据集的预测标签对应的分类指标与预设分类指标进行比较，并且将分类指标优于所述预设分类指标的预测标签确定为所述目标预测标签。权　利　要　求　书 1/2 页 2 CN 114091645 A 28.一种机器学习模型的训练装置，包括：第一训练单元，用于利用第一数据集进行机器学习训练，得到第一模型，其中，所述第一数据集中的第一数据具有相应的标注标签；第二训练单元，用于利用第二数据集的子集对所述第一模型进行更新，得到第二模型，其中，所述第二数据集的子集中的第二数据具有通过所述第一模型获得的预测标签；筛选单元，用于根据所述第二模型在所述第一数据集上的预测结果，从所述第二数据集的子集中筛选出目标数据；转移单元，用于将所述目标数据由所述第二数据集转移至所述第一数据集，得到更新后的第一数据集；第三训练单元，用于利用所述更新后的第一数据集对所述第二模型进行更新，得到目标模型。 9.一种电子设备，包括：一个或多个处理器；存储装置，其上存储有一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1 ‑7中任一项所述的方法。 10.一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序被一个或多个处理器执行时实现如权利要求1 ‑7中任一项所述的方法。权　利　要　求　书 2/2 页 3 CN 114091645 A 3

专利 机器学习模型的训练方法、装置、电子设备和存储介质

专利机器学习模型的训练方法、装置、电子设备和存储介质