(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202111634568.5
(22)申请日 2021.12.2 9
(65)同一申请的已公布的文献号
申请公布号 CN 114239857 A
(43)申请公布日 2022.03.25
(73)专利权人 湖南工商大 学
地址 410205 湖南省长 沙市岳麓区岳麓 大
道569号
(72)发明人 曹文治 陈不凡 陈晓红 刘利枚
卞阳 刘星宝
(74)专利代理 机构 深圳众鼎汇成知识产权代理
有限公司 4 4566
专利代理师 朱业刚
(51)Int.Cl.
G06N 20/00(2019.01)
H04L 67/1097(2022.01)(56)对比文件
CN 108600272 A,2018.09.28
CN 110598480 A,2019.12.20
CN 112434334 A,2021.0 3.02
CN 112699339 A,2021.04.23
US 2019236598 A1,2019.08.01
WO 2021232754 A1,2021.1 1.25
陈晓红 等.数字技 术助推我国能源行业 碳
中和目标实现的路径探析. 《中国科 学院院刊》
.2021,
周洲 等.融合科研创新的密码学开 放实验
设计. 《科技视界》 .2021,
Chamatidis I lias et al.Mac hine
Learning for Al l: A More Robust F ederated
Learning Framew ork. 《Proce edings of the
5th Internati onal Conference o n
Informati on System s Security and
Privacy》 .2019,
审查员 孙亚
(54)发明名称
基于联邦学习的数据确权方法、 装置、 设备
及介质
(57)摘要
本发明公开了一种基于联邦学习的数据确
权方法、 装置、 设备及介质, 应用于数据处理技术
领域, 用于根据各参与方的元数据信息进行确
权, 提高各参与方的数据的数据使用。 本发明提
供的方法包括: 获取参与联邦学习的每个参与方
的元数据信息; 根据所述参与方的所述元数据信
息生成所述参与方权限信息和参与方密钥信息;
基于所述参与方权限信息, 依次对每个参与方的
元数据信息进行数据确权, 得到第一确权结果;
基于所述第一确权结果, 生 成每个所述参与方的
作业令牌信息; 在联邦学习训练过程中, 基于所
述作业令牌信息进行数据确权, 得到第二确权结
果; 将所述第一确权结果与所述第二确权结果作
为确权证据, 存储到所述区块链网络 。
权利要求书3页 说明书12页 附图3页
CN 114239857 B
2022.11.22
CN 114239857 B
1.一种基于联邦学习的数据确权方法, 其特 征在于, 包括:
获取参与 联邦学习的每个参与 方的元数据信 息; 所述参与 方是指持有训练数据或者训
练用的原 始数据的机构, 所述元 数据信息用以代替每 个所述参与方的原 始数据;
针对所述参与方, 根据所述参与方的所述元数据信息生成所述参与方权限信息, 并将
所述元数据信息与所述 参与方权限信息上传到区块链网络, 得到参与方密钥 信息;
按照预先生成的参与方确权顺序, 基于所述参与方权限信息, 依次对每个参与方的元
数据信息进行 数据确权, 得到第一确权结果;
基于所述第一确权结果, 生成每 个所述参与方的作业令牌信息;
其中, 所述元数据信 息包括维度随机数, 所述基于所述第 一确权结果, 生成每个所述参
与方的作业令牌信息, 包括:
若第一确权结果为确权成功, 则获取每个参与方的维度随机数, 并对所述的维度随机
数进行求和计算, 得到求和结果;
通过每个参与方的所述参与方密钥信 息对所述求和结果进行加密, 生成每个参与 方的
作业令牌信息;
所述元数据信息还 包括字段信息和对应的权限节点信息;
所述维度随机数为在将权限节点信 息相同的字段信 息集合形成维度集合后, 采用随机
数生成算法, 生成所述维度集 合的随机数;
所述字段信息为 参与方自身原 始数据的字段信息;
所述权限节点信息表示该所述字段信息的授权参与方; 在联邦学习训练过程中, 基于
所述作业令牌信息进行 数据确权, 得到第二确权结果;
将所述第一确权结果与所述第二确权结果作为确权证据, 存 储到所述区块链网络 。
2.根据权利要求1所述的基于联邦学习的数据确权方法, 其特征在于, 所述针对所述参
与方, 根据所述 参与方的所述元 数据信息生成所述 参与方权限信息, 包括:
获取参与联邦学习的每 个参与方的字段信息和每 个字段信息的权限节点信息;
将所述权限节点信 息相同的字段信 息聚集形成维度集合, 作为每个参与 方的参与 方权
限信息。
3.根据权利要求1所述的基于联邦学习的数据确权方法, 其特征在于, 所述按照预先生
成的参与方确权顺序, 基于所述参与方权限信息, 依 次对每个参与方 的元数据信息进行数
据确权, 得到第一确权结果, 包括:
每个参与 方通过所述参与 方密钥信 息对所述元数据信 息进行加密, 得到对应的元数据
加密信息;
按照预先生成的参与方确权顺序, 依次对每个参与方的元数据加密信息进行解密, 根
据解密结果确定第一确权结果。
4.根据权利要求3所述的基于联邦学习的数据确权方法, 其特征在于, 所述每个参与方
通过所述参与方密钥 信息对所述元 数据信息进行加密, 得到对应的元 数据加密信息, 包括:
通过每个参与方自身的参与方密钥信息, 对所述元数据信息进行加密, 得到第一加密
信息;
将预先生成的参与方确权顺序进行倒序, 得到数据加密顺序, 并按照所述数据加密顺
序, 依次利用其它参与方的参与方密钥信息, 对所述第一加密信息进 行加密, 得到元数据加权 利 要 求 书 1/3 页
2
CN 114239857 B
2密信息。
5.根据权利要求1所述的基于联邦学习的数据确权方法, 其特征在于, 在联邦学习训练
过程中, 基于所述作业令牌信息进行 数据确权, 得到第二确权结果, 包括:
在联邦学习训练过程中, 通过验证每个参与方的所述作业令牌信息进行身份匹配, 得
到验证结果;
若验证结果为验证通过, 基于预设的确权规则, 每个参与方基于所述作业令牌信息进
行数据确权, 得到第二确权结果。
6.根据权利要求1所述的基于联邦学习的数据确权方法, 其特征在于, 联邦学习训练结
束后得到联邦模型, 在将所述第一确权结果与所述第二确权结果作为确权证据, 存储到所
述区块链网络之后, 包括:
当接收到联邦模型使用请求时, 获取 所述联邦模型使用请求中的参与方信息;
基于所述参与方信 息, 通过所述区块链网络的智能合约获取对应的所述参与方密钥信
息以及所述作业令牌信息;
通过所述参与方密钥 信息对所述作业令牌信息进行解密, 得到解密结果;
将所述解密结果与 所述参与方存储在所述 区块链平台的元数据信 息进行匹配, 得到匹
配结果, 并基于所述匹配结果使用所述联邦模型。
7.一种基于联邦学习的数据确权装置, 其特 征在于, 包括:
数据获取模块, 用于获取参与联邦学习的每 个参与方的元 数据信息;
密钥信息生成模块, 用于针对所述参与方, 根据所述参与方的所述元数据信息生成所
述参与方权限信息, 并将所述元数据信息与所述参与方权限信息上传到区块链网络, 得到
参与方密钥 信息;
第一确权模块, 用于按照预先生成的参与 方确权顺序, 基于所述参与方权限信 息, 依次
对每个参与方的元 数据信息进行 数据确权, 得到第一确权结果;
令牌信息生成模块, 用于基于所述第一确权结果, 生成每个所述参与方的作业令牌信
息;
其中, 所述元 数据信息包括维度随机数, 所述令牌信息生成模块包括:
求和结果单元, 用于若第 一确权结果为确权成功, 则获取每个参与方的维度随机数, 并
对所述的维度随机数进行求和计算, 得到求和结果;
令牌信息生成单元, 用于通过每个参与 方的所述参与 方密钥信 息对所述求和结果进行
加密, 生成每 个参与方的作业令牌信息;
所述元数据信息还 包括字段信息和对应的权限节点信息;
所述维度随机数为在将权限节点信 息相同的字段信 息集合形成维度集合后, 采用随机
数生成算法, 生成所述维度集 合的随机数;
所述字段信息为 参与方自身原 始数据的字段信息;
所述权限节点信息表示该所述字段信息的授权参与方; 第二确权模块, 用于在联邦学
习训练过程中, 基于所述作业令牌信息进行 数据确权, 得到第二确权结果;
确权证据存储模块, 用于将所述第一确权结果与所述第二确权结果作为确权证据, 存
储到所述区块链网络 。
8.一种计算机设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器权 利 要 求 书 2/3 页
3
CN 114239857 B
3
专利 基于联邦学习的数据确权方法、装置、设备及介质
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 19:31:28上传分享