专利 对机器学习模型训练的方法和装置

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111340905.X (22)申请日 2021.11.12 (71)申请人北京三快在线科技有限公司地址 100080 北京市海淀区北四环西路9号 2106-030 (72)发明人姜仟艺　宋祺　张睿　 (74)专利代理机构北京三高永信知识产权代理有限责任公司 1 1138 代理人谢冬寒 (51)Int.Cl. G06N 20/00(2019.01) G06K 9/62(2022.01) (54)发明名称对机器学习模型训练的方法和装置 (57)摘要本申请公开了一种对机器学习模型训练的方法和装置，属于人工智能领域。所述方法包括：获取第一样本图像、第二样本图像和所述第二样本图像对应的基准识别结果；对所述第一样本图像进行图像变化处理得到第三样本图像；基于待训练的图像字符识别模型和所述第一样本图像，确定第一识别结果，基于所述待训练的图像字符识别模型和所述第二样本图像，确定第二识别结果，基于所述待训练的图像字符识别模型和所述第三样本图像，确定第三识别结果；基于所述第一识别结果、所述第二识别结果、所述第三识别结果和所述基准识别结果，对所述待训练的图像字符识别模型进行参数调整。采用本申请，可以减少标注样本数据耗费的大量人力和时间。权利要求书2页说明书8页附图6页 CN 113988316 A 2022.01.28 CN 113988316 A 1.一种对机器学习模型训练的方法，其特征在于，所述方法包括：获取第一样本图像、第二样本图像和所述第二样本图像对应的基准识别结果；对所述第一样本图像进行图像变化处理得到第三样本图像；基于待训练的图像字符识别模型和所述第一样本图像，确定第一识别结果，基于所述待训练的图像字符识别模型和所述第二样本图像，确定第二识别结果，基于所述待训练的图像字符识别模型和所述第三样本图像，确定第三识别结果；基于所述第一识别结果、所述第二识别结果、所述第三识别结果和所述基准识别结果，对所述待训练的图像字符识别模型进行参数调整。 2.根据权利要求1所述的方法，其特征在于，所述基于所述第一识别结果、所述第二识别结果、所述第三识别结果和所述基准识别结果，对所述待训练的图像字符识别模型进行参数调整，包括：基于所述第二识别结果和所述基准识别结果确定第一损失值，基于所述第三识别结果和所述第一识别结果确定第二损失值；基于所述第一损失值和所述第二损失值，对所述待训练的图像字符识别模型进行参数调整。 3.根据权利要求2所述的方法，其特征在于，所述基于所述第一损失值和所述第二损失值，对所述待训练的图像字符识别模型进行参数调整，包括：基于第一权重值和第二权重值，对所述第一损失值和所述第二损失值进行加权求和处理得到第三损失值；基于所述第三损失值，对所述待训练的图像字符识别模型进行参数调整。 4.根据权利要求3所述的方法，其特征在于，所述第一权重值小于所述第二权重值。 5.根据权利要求1所述的方法，其特征在于，所述基于待训练的图像字符识别模型和所述第一样本图像，确定第一识别结果，包括：获取在所述图像字符识别模型的历史训练过程中记录的至少一组模型参数；基于待训练的图像字符识别模型和所述至少一组模型参数对应的图像字符识别模型，分别对所述第一样本图像进行字符识别，得到多个待选识别结果和每个待选识别结果中每个字符对应的置信度；基于所述多个待选识别结果和每个待选识别结果中每个字符对应的置信度，在所述多个待选识别结果中选取第一识别结果。 6.根据权利要求5所述的方法，其特征在于，所述基于所述多个待选识别结果和每个待选识别结果中每个字符对应的置信度，在所述多个待选识别结果中选取第一识别结果，包括：在所述多个待选识别结果中，确定出现次数满足目标条件的目标待选识别结果，如果所述目标待选识别结果对应的最低的置信度大于置信度阈值，则将所述目标待选识别结果确定为第一识别结果。 7.根据权利要求6所述的方法，其特征在于，所述确定出现次数满足目标条件的目标待选识别结果，包括：确定出现次数大于次数阈值的目标待选识别结果；或者，确定出现次数大于其他待选识别结果出现次数的目标待选识别结果；或者，权　利　要　求　书 1/2 页 2 CN 113988316 A 2确定出现次数在待选识别结果总数中占比大于比例阈值的目标待选识别结果。 8.一种对机器学习模型训练的装置，其特征在于，所述装置包括：获取模块，用于获取第一样本图像、第二样本图像和所述第二样本图像对应的基准识别结果；处理模块，用于对所述第一样本图像进行图像变化处理得到第三样本图像；确定模块，用于基于待训练的图像字符识别模型和所述第一样本图像，确定第一识别结果，基于所述待训练的图像字符识别模型和所述第二样本图像，确定第二识别结果，基于所述待训练的图像字符识别模型和所述第三样本图像，确定第三识别结果；调参模块，用于基于所述第一识别结果、所述第二识别结果、所述第三识别结果和所述基准识别结果，对所述待训练的图像字符识别模型进行参数调整。 9.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现如权利要求1至权利要求7任一项所述的对机器学习模型训练的方法所执行的操作。 10.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令，所述至少一条指令由处理器加载并执行以实现如权利要求1至权利要求7任一项所述的对机器学习模型训练的方法所执行的操作。 11.一种计算机程序产品，其特征在于，所述计算机程序产品中包括至少一条指令，所述至少一条指令由处理器加载并执行以实现如权利要求1至权利要求7任一项所述的对机器学习模型训练的方法所执行的操作。权　利　要　求　书 2/2 页 3 CN 113988316 A 3

专利 对机器学习模型训练的方法和装置

专利对机器学习模型训练的方法和装置