说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111670232.4 (22)申请日 2021.12.31 (71)申请人 北京三快在线科技有限公司 地址 100080 北京市海淀区北四环西路9号 2106-030 (72)发明人 曾俊杰 刘曦 张睿 (74)专利代理 机构 北京曼威知识产权代理有限 公司 11709 代理人 邓超 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/22(2022.01) G06V 10/80(2022.01) G06N 20/00(2019.01) (54)发明名称 一种模型训练方法、 装置、 存储介质及电子 设备 (57)摘要 本说明书提供了一种模 型训练方法, 通过待 训练模型中的编码端和主解码端对有标签的第 一训练样 本和无标签的第二训练样 本进行处理, 得到第一文字行识别结果和第二文字行识别结 果, 随后对编码端从第二训练样 本中提取出的第 二特征进行加扰, 得到带扰特征, 并根据带扰特 征得到带扰识别结果, 将第一文字行识别结果与 第一训练样本的标签之间的差异确定为第一差 异, 将第二文字行识别结果与带扰识别结果之间 的差异确定为第二差异, 根据第一差异和第二差 异得到最终差异, 并以最终差异最小化为优化目 标, 对编码端的参数进行调整。 本方法通过对第 二特征进行加扰的方式, 使大量无标签训练样本 得以利用, 加强了训练出的模型的抗干扰能力, 有效提高了模型的性能。 权利要求书2页 说明书11页 附图5页 CN 114283312 A 2022.04.05 CN 114283312 A 1.一种模型训练方法, 其特 征在于, 包括: 获取有标签的第一训练样本和无 标签的第二训练样本; 将所述第一训练样本和所述第 二训练样本输入到待训练模型中, 得到对应于所述第 一 样本的第一文字行识别结果和对应于所述第二样本的第二文字行识别结果; 所述待训练模 型中包含编码端和主解码端; 其中, 所述编 码端用于提取输入的训练样本的编码特征; 所述 解码端用于根据所述编码特 征确定输入的训练样本的文字行识别结果; 对所述编码端从所述第二训练样本中提取的第二特 征进行加扰, 得到带扰特 征; 根据所述带扰特 征得到带扰识别结果; 确定所述第 一文字行识别结果与 所述第一训练样本的标签的第 一差异, 并确定所述第 二文字行识别结果与所述带扰识别结果的第二差异; 根据所述第一差异与所述第二差异得到最终差异; 以所述最终差异最小为优化目标, 对所述编码端的参数进行调整。 2.如权利要求1所述的方法, 其特征在于, 对所述编码端从所述第 二训练样本中提取的 第二特征进行加扰, 得到带扰特 征, 具体包括: 通过至少两种加扰方法, 对所述编码段从所述第 二训练样本 中提取的第 二特征进行加 扰, 得到分别对应于每种加扰方法的带扰特 征。 3.如权利要求2所述的方法, 其特征在于, 根据所述带扰特征得到带扰识别结果, 具体 包括: 针对每种加扰方法, 通过与 该加扰方法对应的辅助解码端对通过该加扰方法得到的带 扰特征进行解码, 得到带扰识别结果。 4.如权利要求3所述的方法, 其特征在于, 确定所述第 二文字行识别结果与 所述带扰识 别结果的第二差异, 具体包括: 针对每个带扰识别结果, 确定所述第二文字行识别结果与该带扰识别结果之间的差 异, 作为带扰差异; 将分别针对每 个带扰识别结果确定出的各 带扰差异进行融合, 得到第二差异。 5.如权利要求1所述的方法, 其特征在于, 根据所述第 一差异与 所述第二差异得到最终 差异, 具体包括: 确定预设的对应于第一差异的第一权 重和对应于第二差异的第二权 重; 根据所述第一差异、 所述第二差异、 所述第一权 重、 所述第二权 重确定最终差异。 6.一种文字行检测方法, 其特 征在于, 包括: 获取待识别图像; 将所述待识别图像输入到采用如权利要求1~5任一项方法训练出的文字行检测模型; 获得所述文字行检测模型输出的所述待识别图像对应的文字行识别结果。 7.一种模型训练装置, 其特 征在于, 包括: 获取模块, 获取有标签的第一训练样本和无 标签的第二训练样本; 结果确定模块, 将所述第一训练样本和所述第二训练样本输入到待训练模型中, 得到 对应于所述第一样本的第一文字行识别结果和对应于所述第二样本的第二文字行识别结 果; 所述待训练模型中包含编码端和解码端; 其中, 所述编码端用于提取输入的训练样 本的 编码特征; 所述解码端用于根据所述编码特 征确定输入的训练样本的文字行识别结果;权 利 要 求 书 1/2 页 2 CN 114283312 A 2加扰模块, 对所述编码端从所述第二训练样本中提取的第二特征进行加扰, 得到带扰 特征; 带扰结果确定模块, 根据所述带扰特 征得到带扰识别结果; 差异确定模块, 确定所述第一文字行识别结果与所述第一训练样本的标签的第一差 异, 并确定所述第二文字行识别结果与所述带扰识别结果的第二差异; 最终差异确定模块, 根据所述第一差异与所述第二差异得到最终差异; 调整模块, 以所述 最终差异最小为优化目标, 对所述编码端的参数进行调整。 8.一种文字行检测装置, 其特 征在于, 包括: 获取模块, 获取待识别图像; 输入模块, 将所述待识别图像输入到采用如权利要求1~5任一项方法训练出的文字行 检测模型; 输出模块, 获得 所述文字行检测模型输出的所述待识别图像对应的文字行识别结果。 9.一种计算机可读存储介质, 其特征在于, 所述存储介质存储有计算机程序, 所述计算 机程序被处 理器执行时实现上述权利要求1~6任一项所述的方法。 10.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 其特征在于, 所述处理器执行所述程序时实现上述权利要求1~6任一项所述的方 法。权 利 要 求 书 2/2 页 3 CN 114283312 A 3
专利 一种模型训练方法、装置、存储介质及电子设备
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 19:29:08
上传分享
举报
下载
原文档
(842.0 KB)
分享
友情链接
GB-T 18135-2008 电气工程CAD制图规则.pdf
JY-T 0568-2020 电感耦合等离子体质谱分析方法通则.pdf
GB-T 21052-2007 信息安全技术 信息系统物理安全技术要求.pdf
JR-T0199-2020 金融科技创新安全通用规范.pdf
GB-T 36084-2018 纳米技术 水溶液中铜、锰、铬离子含量的测定 紫外-可见分光光度法.pdf
GB-T 3565.4-2022 自行车安全要求 第4部分:车闸试验方法.pdf
GB-T 41944-2022 丁基橡胶阻尼片.pdf
GB-T 41648-2022 旅游民宿基本要求与等级划分.pdf
GB-T 29115-2012 工业企业节约原材料评价导则.pdf
GB-T 27000-2023 合格评定 词汇和通用原则.pdf
T-CSAC 004—2023 网络靶场 试验任务导调总体要求.pdf
GM-T 0105-2021 软件随机数发生器设计指南.pdf
T-CCTA 20102—2023 纺织品 抗氧化能力的测定及评价 DPPH和ABTS法.pdf
T-CES 160—2022 数字孪生变电站智能传感器接入技术规范.pdf
ISO IEC 27000-2020.pdf
GB-T 35276-2017 信息安全技术 SM2密码算法使用规范.pdf
GB-T 36631-2018 信息安全技术 时间戳策略和时间戳业务操作规则.pdf
GB-T 39399-2020 北斗卫星导航系统测量型接收机通用规范.pdf
T-WD 107—2020 公共海外仓设施技术要求与运营管理规范.pdf
NB-T 10881—2021 水力发电厂火灾自动报警系统设计规范.pdf
1
/
3
19
评价文档
赞助2.5元 点击下载(842.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。