说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111671078.2 (22)申请日 2021.12.31 (71)申请人 北京旷视科技有限公司 地址 100096 北京市海淀区西三 旗建材城 内建中路12幢一层1268号 申请人 北京迈格威科技有限公司   深圳旷视金智科技有限公司 (72)发明人 郑凯 王远江 袁野  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 代理人 唐正瑜 (51)Int.Cl. G06N 20/00(2019.01) G06V 10/74(2022.01) G06V 10/762(2022.01)G06K 9/62(2022.01) (54)发明名称 模型训练方法、 存储介质、 电子设备和计算 机程序产品 (57)摘要 本申请实施例提供一种模型训练方法、 存储 介质、 电子设备和计算机程序产品, 该模型训练 方法包括: 将第一样本图像输入到第一学生模型 中进行特征提取, 获得第一查询样本特征; 将第 二样本图像输入到第一同构教师模型中进行特 征提取, 获得第一候选样本特征; 将第一样本图 像和第二样本图像输入到异构教师模型中进行 特征提取, 获得图像特征; 其中, 图像特征包括第 二查询样 本特征; 确定第一查询样 本特征和第一 候选样本特征之间的第一样本特征关系; 分别确 定第二查询样本特征和异构教师模型记录的多 个第二候选样本特征之间的第二样 本特征关系; 根据第一样 本特征关系和第二样 本特征关系, 对 第一学生模型进行训练。 借助于上述技术方案, 本申请实施例能够提升第一学生模型的性能。 权利要求书2页 说明书12页 附图2页 CN 114372580 A 2022.04.19 CN 114372580 A 1.一种模型训练方法, 其特 征在于, 包括: 获取第一样本 图像和第二样本 图像; 其中, 所述第一样本 图像和所述第二样本 图像是 通过对同一张图像采用不同的数据增强方式获得的两张图像; 将所述第一样本图像输入到第 一学生模型中进行特征提取, 获得所述第 一学生模型输 出的第一 查询样本特 征; 将所述第二样本图像输入到第 一同构教师模型中进行特征提取, 获得所述第 一同构教 师模型输出的第一 候选样本特 征; 将所述第一样本图像和所述第 二样本图像输入到异构 教师模型中进行特征提取, 获得 所述异构教师模型输出的图像特 征; 其中, 所述图像特 征包括第二 查询样本特 征; 确定所述第一 查询样本特 征和所述第一 候选样本特 征之间的第一样本特 征关系; 分别确定所述第二查询样本特征和所述异构教师模型记录的多个第二候选样本特征 之间的第二样本特 征关系; 根据所述第一样本特征关系和所述第二样本特征关系, 对所述第一学生模型进行训 练。 2.根据权利要求1所述的模型训练方法, 其特征在于, 所述异构 教师模型包括第 二学生 模型和第二同构教师模型, 所述图像特 征还包括第二 候选样本特 征; 其中, 所述将所述第 一样本图像和所述第 二样本图像输入到异构 教师模型中进行特征 提取, 获得 所述异构教师模型输出的图像特 征, 包括: 将所述第一样本图像输入到所述第 二学生模型中进行特征提取, 获得所述第 二学生模 型输出的第二 查询样本特 征; 以及, 将所述第二样本图像输入到所述第 二同构教师模型中进行特征提取, 获得所述第 二同 构教师模型输出的第二 候选样本特 征; 其中, 所述异构 教师模型记录的多个第 二候选样本特征包括所述第 二同构教师模型当 前输出的所述第二 候选样本特 征和之前至少一次输出的至少一个第二 候选样本特 征。 3.根据权利要求2所述的模型训练方法, 其特征在于, 所述分别确定所述第 二查询样本 特征和所述异构教师模型记录的多个第二 候选样本特 征之间的第二样本特 征关系, 包括: 分别确定所述第二 查询样本特 征与每个第二候选样本特 征是否属于同一类别; 若属于同一类别, 则确定所述第 二查询样本特征与所述每个第 二候选样本特征之间的 第二样本特 征关系为 正样本关系; 若属于不同类别, 则确定所述第 二查询样本特征与每个第 二候选样本特征之间的第 二 样本特征关系为负 样本关系。 4.根据权利要求3所述的模型训练方法, 其特征在于, 所述分别确定所述第 二查询样本 特征与每个第二候选样本特 征是否属于同一类别, 包括: 获取多个聚类中心; 将所述第二查询 样本特征和所述多个聚类中心的每个聚类中心进行相似度计算, 获得 所述第二 查询样本特 征与所述每 个聚类中心之间的第一相似度分数; 将多个所述第一相似度分数中相似度分数最高的聚类中心作为所述第二查询样本特 征对应的第一目标聚类中心; 将所述多个第 二候选样本特征和所述每个聚类中心进行相似度计算, 获得所述每个第权 利 要 求 书 1/2 页 2 CN 114372580 A 2二候选样本特 征与所述每 个聚类中心之间的第二相似度分数; 将多个所述第二相似度分数中相似度分数最高的聚类中心作为所述每个第二候选样 本特征对应的第二目标聚类中心; 若所述第一目标聚类中心和所述第 二目标聚类中心为同一个聚类中心, 则确定所述第 二查询样本特 征与所述每 个第二候选样本特 征属于同一类别; 若所述第一目标聚类中心和所述第 二目标聚类中心为不同的聚类中心, 则确定所述第 二查询样本特 征与所述每 个第二候选样本特 征属于不同类别。 5.根据权利要求1所述的模型训练方法, 其特征在于, 所述根据 所述第一样本特征关系 和所述第二样本特 征关系, 对所述第一学生模型进行训练, 包括: 利用所述第 一样本特征关系, 生成第 一监督子信号; 其中, 所述第一监督子信号包括第 一样本特征关系标识, 并且所述第一样本特征关系标识用于表示所述第一查询样本特征和 所述第一 候选样本特 征的样本特 征关系; 利用所述第 二样本特征关系, 生成第 二监督子信号; 其中, 所述第二监督子信号包括第 二样本特征关系标识, 并且所述第二样本特征关系标识用于表示所述第二查询样本特征和 所述历史候选样本特 征的样本特 征关系; 根据所述第一 监督子信号和所述第二 监督子信号, 生成监 督信号; 利用所述 监督信号, 对所述第一学生模型进行训练。 6.根据权利要求5所述的模型训练方法, 其特征在于, 所述根据 所述第一监督子信号和 所述第二 监督子信号, 生成监 督信号, 包括: 对所述第一 监督子信号和所述第二 监督子信号进行拼接, 获得 所述监督信号。 7.一种存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被处理器运行 时执行如权利要求1 ‑6任一所述的模型训练方法。 8.一种电子设备, 包括处理器、 存储器及存储在存储器上的计算机程序, 其特征在于, 所述处理器执行所述计算机程序以实现如权利要求1 ‑6任一所述的模型训练方法。 9.一种计算机程序产品, 包括计算机程序, 其特征在于, 所述计算机程序被处理器执行 时实现权利要求1 ‑6任一所述的模型训练方法。权 利 要 求 书 2/2 页 3 CN 114372580 A 3

.PDF文档 专利 模型训练方法、存储介质、电子设备和计算机程序产品

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、存储介质、电子设备和计算机程序产品 第 1 页 专利 模型训练方法、存储介质、电子设备和计算机程序产品 第 2 页 专利 模型训练方法、存储介质、电子设备和计算机程序产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:31:50上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。