说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111360276.7 (22)申请日 2021.11.17 (71)申请人 深圳前海微众 银行股份有限公司 地址 518052 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (72)发明人 黄安埠 (74)专利代理 机构 北京派特恩知识产权代理有 限公司 1 1270 代理人 赵翠萍 张颖玲 (51)Int.Cl. G06F 30/27(2020.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 机器学习模型的训练方法、 装置、 电子设备 及存储介质 (57)摘要 本申请提供了一种机器学习模型的训练方 法、 装置; 方法包括: 基于共享样本集以及训练方 设备的私有样本集, 对训练方设备的机器学习模 型进行训练, 得到训练后的机器学习模型; 基于 共享样本集, 调用训练后的机器学习模型进行预 测处理, 得到预测值集合; 向服务方设备发送预 测值集合, 预测值集合用于供服务方设备结合其 他训练方设备 发送的预测值集合进行融合处理, 得到融合值集合; 接收服务方设备 发送的融合值 集合, 并根据融合值集合更新共享样本集; 更新 后的共享样 本集与私有样本集, 用于供训练方设 备对机器学习模 型进行下一轮的训练。 通过本申 请, 能够充分利用多 方样本数据减少模型训练耗 时, 提升模型训练效率。 权利要求书3页 说明书18页 附图6页 CN 114021473 A 2022.02.08 CN 114021473 A 1.一种机器学习模型的训练方法, 其特 征在于, 应用于训练方设备, 所述方法包括: 基于共享样本集以及所述训练方设备的私有样本集, 训练所述训练方设备的机器学习 模型; 基于所述共享样本集, 调用训练后的所述机器学习模型进行预测 处理, 得到预测值集 合; 向服务方设备发送所述预测值集合; 其中, 所述预测值集合用于供所述服务方设备结 合其他训练方设备发送的预测值 集合进行融合处 理, 得到融合 值集合; 接收所述服务方设备发送的所述融合值集合, 并根据所述融合值集合更新所述共享样 本集; 其中, 更新后的所述共享样本集与所述私有样本集, 用于供所述训练方设备对所述机 器学习模型进行 下一轮的训练。 2.根据权利要求1所述的方法, 其特征在于, 所述根据所述融合值集合更新所述共享样 本集, 包括: 针对所述共享样本集中每 个共享样本执 行以下处 理: 获取所述融合值集合与所述共享样本对应的融合值, 基于所述融合值替换所述共享样 本的标签。 3.根据权利要求1所述的方法, 其特征在于, 在训练所述训练方设备的机器学习 模型之 前, 所述方法还 包括: 向所述服务方设备发送样本获取请求; 接收所述 服务方设备响应于所述样本获取请求而发送的所述共享样本集; 其中, 所述共享样本集包括每 个所述训练方设备的私有样本集中的部分样本 。 4.根据权利要求1所述的方法, 其特征在于, 在训练所述训练方设备的机器学习 模型之 前, 所述方法还 包括: 接收所述 服务方设备发送的样本上传请求; 从所述训练方设备的私有样本集中选取部分样本, 并向所述服务方设备发送所述部分 样本。 5.根据权利要求4所述的方法, 其特征在于, 所述从所述训练方设备的私有样本集中选 取部分样本, 包括: 基于样本上传比例, 从所述训练方设备的私有样本集中选取与 所述样本上传比例对应 的样本; 或者, 从所述训练方设备的所述私有样本集中选取目标 数量的样本 。 6.根据权利要求1所述的方法, 其特征在于, 在训练所述训练方设备的机器学习 模型之 前, 所述方法还 包括: 向所述服务方设备发送模型获取请求; 其中, 所述模型获取请求包括模型 标识; 接收所述服务方设备发送的与所述模型标识对应的初始机器学习 模型, 将所述初始机 器学习模型作为待训练的机器学习模型。 7.根据权利要求1所述的方法, 其特征在于, 在训练所述训练方设备的机器学习 模型之 前, 所述方法还 包括: 向所述服务方设备发送模型参数获取请求; 其中, 所述模型参数获取请求包括模型标权 利 要 求 书 1/3 页 2 CN 114021473 A 2识; 接收所述服务方设备发送的与所述模型标识对应的模型参数; 其中, 所述模型参数是 所述服务方设备进行初始化得到的。 8.一种机器学习模型的训练方法, 其特 征在于, 应用于服 务方设备, 所述方法包括: 向每个训练方设备发送共享样本集; 其中, 所述共享样本集和所述训练方设备的私有 样本集, 用于供 所述训练方设备训练所述训练方设备的机器学习模型; 接收每个所述训练方设备发送的预测值集合并进行融合处理, 得到融合值集合; 其中, 所述预测 值集合是所述训练方设备基于所述共享样本集调用训练后机器学习学习模型进 行预测处理得到的, 所述机器学习模型是基于所述共享样本集和所述训练方设备的私有样 本集训练的; 向所述训练方设备发送所述融合值集合; 其中, 所述融合值集合用于供所述训练方设 备更新所述共享样本集, 并结合对所述训练方设备的私有样本集对所述机器学习模型进 行 下一轮的训练。 9.根据权利要求8所述的方法, 其特征在于, 所述接收每个所述训练方设备发送的预测 值集合并进行融合处 理, 得到融合 值集合, 包括: 针对所述共享样本集中每 个共享样本执 行以下处 理: 从每个所述训练方设备发送的预测值 集合中, 获取 所述共享样本对应的多个预测值; 对所述多个预测值求平均值, 将所述平均值作为所述共享样本对应的融合值, 所述融 合值与所述共享样本存在一 一对应的关系。 10.一种机器学习模型的训练装置, 其特 征在于, 包括: 训练模块, 用于基于共享样本集以及所述训练方设备的私有样本集, 对所述训练方设 备的机器学习模型进行训练, 得到训练后的所述机器学习模型; 预测模块, 用于接收各所述训练方设备发送的对应所述共享样本集的共享预测值; 并 对所述共享预测值进行融合处 理, 得到与各 所述共享样本对应的融合 值; 第一发送模块, 用于向服务方设备发送所述预测值集合; 其中, 所述预测值集合用于供 所述服务方设备 结合其他训练方设备发送的预测值 集合进行融合处 理, 得到融合 值集合; 接收模块, 用于接收所述服务方设备发送的所述融合值集合, 并根据所述融合值集合 更新所述共享样 本集; 其中, 更新后的所述共享样本集与所述私有样本集, 用于供所述训练 方设备对所述机器学习模型进行 下一轮的训练。 11.一种机器学习模型的训练装置, 其特 征在于, 包括: 第二发送模块, 用于向每个所述训练方设备发送共享样本集; 其中, 所述共享样本集和 所述训练方设备的私有样本集, 用于供所述训练方设备训练所述训练方设备的机器学习模 型; 融合模块, 用于接收每个所述训练方设备发送的预测值集合并进行融合处理, 得到融 合值集合; 其中, 所述预测 值集合是所述训练方设备基于所述共享样本集调用训练后机器 学习学习模型进 行预测处理得到的, 所述机器学习模型是基于所述共享样本集和所述训练 方设备的私有样本集训练的; 第三发送模块, 用于向所述训练方设备发送所述融合值集合; 其中, 所述融合值集合用 于供所述训练方设备更新所述共享样本集, 并结合对所述训练方设备的私有样本集对所述权 利 要 求 书 2/3 页 3 CN 114021473 A 3
专利 机器学习模型的训练方法、装置、电子设备及存储介质
文档预览
中文文档
28 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 19:02:54
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
GB-T 21054-2023 信息安全技术 公钥基础设施 PKI系统安全测评方法.pdf
绿盟 2020 数据安全白皮书2.0.pdf
GB-T 32045-2015 节能量测量和验证实施指南.pdf
GB-T 6820-2016 工业用乙醇.pdf
GB-T 43097-2023 供热运营数据统计方法.pdf
GB-T 19668.7-2022 信息技术服务 监理 第7部分:监理工作量度量要求.pdf
GB-T 43048-2023 智慧城市 城市运行指标体系 总体框架.pdf
T-TAF 075.2—2020 支持北斗的移动通信终端定位技术要求及测试方法 第2部分:控制面协议一致性.pdf
专利 一种轴承质量检测装置及方法.PDF
T-CSAE 269—2022 智能网联汽车 自动驾驶地图动态信息数据交换格式.pdf
DB15-T 1878—2020 沙化草地治理技术规范 内蒙古自治区.pdf
GB-T 42536-2023 车用高压储氢气瓶组合阀门.pdf
SL-T 247-2020 水文资料整编规范.pdf
GB-T 26607-2011 工业用邻苯基苯酚.pdf
CNCERT 2020年上半年我国互联网网络安全监测数据分析报告.pdf
JR-T 0071.2—2020 金融行业网络安全等级保护实施指引 第2部分:基本要求.pdf
DB3301-T 0278-2019 小城镇环境综合整治长效管理规范 杭州市.pdf
CSA 大数据安全和隐私手册中文版.pdf
GB-T 20520-2006 信息安全技术 公钥基础设施 时间戳规范.pdf
GB-T 32678-2016 橡胶配合剂 高分散沉淀水合二氧化硅.pdf
1
/
3
28
评价文档
赞助2.5元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。