说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111269576.4 (22)申请日 2021.10.2 9 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦二层 (72)发明人 蒋旻悦 谭啸 孙昊  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 代理人 单冠飞 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 检测模型的训练方法、 装置、 电子设备及存 储介质 (57)摘要 本公开提供了一种检测模型的训练方法、 装 置、 电子设备及存储介质, 涉及人工智能领域, 具 体涉及计算机视觉和深度学习技术, 可用于智慧 城市和智能交通场景下。 具体实现方案为: 获取 样本数据, 并获取参考教师模型, 根据参考教师 模型生成多个待训练教师模型, 不同待训练教师 模型不相同, 将样本数据分别输入至多个待训练 教师模型之中, 以得到多个待训练教师模型分别 输出的多个结果数据, 根据样本数据、 多个结果 数据训练初始的学生检测模型, 以得到目标检测 模型, 能够实现有效地提升学生检测模型的训练 效果, 有效地提升目标检测模型的检测性能, 提 升目标检测模型的检测准确性。 权利要求书3页 说明书12页 附图5页 CN 114037052 A 2022.02.11 CN 114037052 A 1.一种检测模型的训练方法, 包括: 获取样本数据, 并获取参 考教师模型; 根据所述 参考教师模型生成多个待训练教师模型, 不同所述待训练教师模型不相同; 将所述样本数据分别 输入至所述多个待训练教师模型之中, 以得到所述多个待训练教 师模型分别输出的多个结果数据; 根据所述样本数据、 所述多个结果数据训练初始 的学生检测模型, 以得到目标检测模 型。 2.根据权利要求1所述的方法, 其中, 所述获取参 考教师模型, 包括: 获取与所述样本数据对应的初始标注数据; 根据所述样本数据和所述初始标注数据训练初始的教师模型, 以得到所述参考教师模 型。 3.根据权利要求1所述的方法, 其中, 所述根据所述参考教师模型生成多个待训练教师 模型, 不同所述待训练教师模型不相同, 包括: 确定多个模型 更新速率, 不同所述模型 更新速率 不相同; 分别采用所述多个模型更新速率对所述参考教师模型进行调 整, 以得到所述多个待训 练教师模型, 所述多个待训练教师模型分别对应多个权重更新速率, 所述多个权重更新速 率分别对应所述多个模型 更新速率。 4.根据权利要求1所述的方法, 在所述将所述样本数据分别输入至所述多个待训练教 师模型之中, 以得到所述多个待训练教师模型分别输出的多个结果数据之后, 还 包括: 根据所述多个结果数据生成目标 标注数据; 其中, 所述根据 所述样本数据、 所述多个结果数据训练初始的学生检测模型, 以得到目 标检测模型, 包括: 将所述样本数据输入至所述初始的学生检测模型之中, 以得到所述学生检测模型输出 的预测结果数据; 根据所述预测结果数据和所述目标 标注数据确定模型损失值; 如果所述模型损失值满足设定条件, 则将训练得到的所述学生检测模型作为所述目标 检测模型。 5.根据权利要求4所述的方法, 其中, 所述根据所述多个结果数据生成目标标注数据, 包括: 确定与所述多个待训练教师模型分别对应的多个模型权 重信息; 根据所述多个模型权重信 息分别对相应所述多个结果数据进行加权, 以得到多个加权 结果数据; 融合所述多个加权结果数据, 以得到所述目标 标注数据。 6.根据权利要求1所述的方法, 所述多个待训练教师模型包括: 第 一待训练教师模型和 第二待训练教师模型, 其中, 所述将所述样本数据分别输入至所述多个待训练教师模型之 中, 以得到所述多个待训练教师模型分别输出的多个结果数据, 包括: 将所述样本数据输入至所述第 一待训练教师模型之中, 以得到所述第 一待训练教师模 型输出的第一结果数据; 将所述样本数据输入至所述第 二待训练教师模型之中, 以得到所述第 二待训练教师模权 利 要 求 书 1/3 页 2 CN 114037052 A 2型输出的第二结果数据, 所述第一结果数据和所述第二结果数据被共同作为所述结果数 据。 7.一种检测方法, 包括: 获取待检测数据; 将所述待检测数据输入至如上述权利要求1 ‑6任一项所述的检测模型的训练方法训练 得到的目标检测模型之中, 以得到所述目标检测模型输出的目标 结果数据。 8.一种检测模型的训练装置, 包括: 第一获取模块, 用于获取样本数据, 并获取参 考教师模型; 第一生成模块, 用于根据所述参考教师模型生成多个待训练教师模型, 不同所述待训 练教师模型不相同; 第一处理模块, 用于将所述样本数据分别输入至所述多个待训练教师模型之中, 以得 到所述多个待训练教师模型分别输出的多个结果数据; 训练模块, 用于根据 所述样本数据、 所述多个结果数据训练初始的学生检测模型, 以得 到目标检测模型。 9.根据权利要求8所述的装置, 其中, 第一获取模块, 具体用于: 获取与所述样本数据对应的初始标注数据; 根据所述样本数据和所述初始标注数据训练初始的教师模型, 以得到所述参考教师模 型。 10.根据权利要求8所述的装置, 其中, 第一 生成模块, 包括: 确定子模块, 用于确定多个模型 更新速率, 不同所述模型 更新速率 不相同; 调整子模块, 用于分别采用所述多个模型更新速率对所述参考教师模型进行调整, 以 得到所述多个待训练教师模型, 所述多个待训练教师模型分别对应多个权重更新速率, 所 述多个权 重更新速率分别对应所述多个模型 更新速率。 11.根据权利要求8所述的装置, 还 包括: 第二生成模块, 用于在所述将所述样本数据分别输入至所述多个待训练教师模型之 中, 以得到所述多个待训练教师模型分别输出 的多个结果数据之后, 根据所述多个结果数 据生成目标 标注数据; 其中, 所述训练模块, 具体用于: 将所述样本数据输入至所述初始的学生检测模型之中, 以得到所述学生检测模型输出 的预测结果数据; 根据所述预测结果数据和所述目标 标注数据确定模型损失值; 如果所述模型损失值满足设定条件, 则将训练得到的所述学生检测模型作为所述目标 检测模型。 12.根据权利要求1 1所述的装置, 其中, 所述第二 生成模块, 具体用于: 确定与所述多个待训练教师模型分别对应的多个模型权 重信息; 根据所述多个模型权重信 息分别对相应所述多个结果数据进行加权, 以得到多个加权 结果数据; 融合所述多个加权结果数据, 以得到所述目标 标注数据。 13.根据权利要求8所述的装置, 所述多个待训练教师模型包括: 第一待训练教师模型权 利 要 求 书 2/3 页 3 CN 114037052 A 3

.PDF文档 专利 检测模型的训练方法、装置、电子设备及存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 检测模型的训练方法、装置、电子设备及存储介质 第 1 页 专利 检测模型的训练方法、装置、电子设备及存储介质 第 2 页 专利 检测模型的训练方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:02:56上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。