说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111665489.0 (22)申请日 2021.12.31 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融大街31号 (72)发明人 杨诗友 李鑫超 章枝宪 周旭华 尹虹舒 (74)专利代理 机构 北京律智知识产权代理有限 公司 11438 代理人 王辉 阚梓瑄 (51)Int.Cl. G06N 20/00(2019.01) G06K 9/62(2022.01) (54)发明名称 纵向联邦数据处 理方法及装置 (57)摘要 本公开提供一种纵向联邦数据处理方法及 装置, 涉及网络安全技术领域。 该方法包括: 获取 待测样本数据, 待测样本数据包含待测样本标 识, 以使各参与方基于待测样本标识, 确定待测 样本标识对应的样本中的目标特征; 并在本地计 算中间结果; 接收各参与方发送的保序变换结 果, 保序变换结果通过各参与方对每个所述中间 结果进行保序变换获得; 对所有参与方的相同样 本的保序变换结果进行融合处理; 基于融合结果 筛选出K个目标样本; 并基于K个目标样本的标 签, 确定待测样本数据的标签。 本公开可 以解决 现有技术中第三方集中安全风险高和加密解密 过程带来的数据处 理速度慢的问题。 权利要求书2页 说明书12页 附图6页 CN 114358311 A 2022.04.15 CN 114358311 A 1.一种纵向联邦数据处理方法, 其特征在于, 所述方法应用于参与纵向联邦的标签方, 所述标签方与纵向联邦的其 他参与方之间通信连接, 所述方法包括: 获取待测样本数据, 所述待测样本数据包含待测样本标识, 以使各参与方基于所述待 测样本标识, 确定所述待测样本标识对应的样本中的目标特征; 并在本地计算所述待测样 本数据到每 个样本对应目标 特征的距离信息的中间结果; 接收各参与 方发送的保序变换结果, 所述保序变换结果通过各参与 方对每个所述中间 结果进行保序变换获得; 对所有参与方的相同样本的保序变换结果进行融合处理, 以获得每个样本的融合数 据; 基于所述融合数据的大小, 筛选出K个目标样本, K为正数; 并基于所述K个目标样本的 标签, 确定所述待测样本数据的标签。 2.根据权利要求1所述的纵向联邦数据处 理方法, 其特 征在于, 所述方法还 包括: 使各参与方采用加密样本对齐方法对样本进行对齐处 理。 3.根据权利要求1所述的纵向联邦数据处理方法, 其特征在于, 所述距离信 息包含欧式 距离, 所述在本地计算所述待测样本数据到每个样本对应目标特征的距离信息的中间结 果, 包括: 通过各参与方在本地计算所述待测样本数据的特征与每个本地样本对应目标特征的 差的平方和, 并将计算结果作为中间结果。 4.根据权利要求1所述的纵向联邦数据处理方法, 其特征在于, 所述通过各参与 方对每 个所述中间结果进行保序变换获得, 包括: 通过各参与 方根据预设分箱规则对每个所述中间结果进行分箱 处理, 确定当前中间结 果所属箱; 通过各参与 方对当前中间结果所属箱内的所有中间结果进行第 一均化处理, 以获得当 前中间结果对应样本的分箱值。 5.根据权利要求 4所述的纵向联邦数据处 理方法, 其特 征在于, 所述方法还 包括: 通过各参与 方对各自获得的所有中间结果进行排序, 以获得各参与 方内每个中间结果 的序号索引; 通过各参与 方将所述序号索引作为对应分箱值的第 一权重, 采用所述第 一权重对相应 的分箱值进行第一加权处理, 以获得第一加权分箱值, 并将所述第一加权分箱值作为对应 样本的保序变换 结果。 6.根据权利要求 4所述的纵向联邦数据处 理方法, 其特 征在于, 所述方法还 包括: 通过各参与方基于当前中间结果到其所属箱 的分箱值的距离和该箱内所有中间结果 的离散程度, 以获得第二权 重; 通过各参与 方采用第 二权重对相应的该箱的分箱值进行第 二加权处理, 以获得第 二加 权分箱值, 并将所述第二加权分箱值作为对应样本的保序变换 结果。 7.根据权利要求1所述的纵向联邦数据处理方法, 其特征在于, 所述对所有参与 方的相 同样本的保序变换 结果进行融合处 理, 包括: 对所有参与方的相同样本的保序变换 结果求和, 将求和结果作为该样本的融合结果。 8.根据权利要求1所述的纵向联邦数据处理方法, 其特征在于, 所述基于所述融合数据权 利 要 求 书 1/2 页 2 CN 114358311 A 2的大小, 筛 选出K个目标样本, 包括: 对所述融合数据按从小到大进行排序; 将位于前 K位的所述融合数据对应的样本作为目标样本 。 9.根据权利要求1所述的纵向联邦数据处理方法, 其特征在于, 所述基于所述K个目标 样本的标签, 确定所述待测样本数据的标签, 包括: 当所述待测样本数据为离散变量时, 基于预设规则对所述K个目标样本的标签进行处 理, 确定所述待测样本数据的标签; 当所述待测样本数据为连续变量 时, 对所述K个目标样本的标签进行第 二均化处理, 将 第二均化处 理结果作为所述待测样本数据的标签。 10.一种纵向联邦数据处理装置, 其特征在于, 应用于参与纵向联邦的标签方, 所述标 签方与纵向联邦的其 他参与方之间通信连接, 所述装置包括: 获取模块, 用于获取待测样本数据, 所述待测样本数据包含待测样本标识, 以使各参与 方基于所述待测样本标识, 确定所述待测样本标识对应的样本中的目标特征; 并在本地计 算所述待测样本数据到每 个样本对应目标 特征的距离信息的中间结果; 接收模块, 用于接收各参与方发送的保序变换结果, 所述保序变换结果通过各参与方 对每个所述中间结果进行保序变换获得; 融合模块, 用于对所有参与方的相同样本的保序变换结果进行融合处理, 以获得每个 样本的融合数据; 标签确定模块, 用于基于所述融合数据的大小, 筛选出K个目标样本, K为正数; 并基于 所述K个目标样本的标签, 确定所述待测样本数据的标签。权 利 要 求 书 2/2 页 3 CN 114358311 A 3
专利 纵向联邦数据处理方法及装置
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 19:32:08
上传分享
举报
下载
原文档
(883.7 KB)
分享
友情链接
GB-T 32161-2015 生态设计产品评价通则.pdf
法律法规 重庆市科技创新促进条例2021-11-25.pdf
GM-T 0018-2012 密码设备应用接口规范.pdf
GB-T 19011-2021 管理体系审核指南.pdf
GM-T 0086-2020 基于SM9标识密码算法的密钥管理系统技术规范.pdf
GB-T 30030-2013 自动导引车 AGV 术语.pdf
freebuf 金融反欺诈调查报告 2019.pdf
GB-T 38561-2020 信息安全技术 网络安全管理支撑系统技术要求.pdf
DB43-T 612-2021 医疗机构能耗定额 湖南省.pdf
GB-T 17876-2010 包装容器 塑料防盗瓶盖.pdf
GM-T 0016-2023 智能密码钥匙密码应用接口规范.pdf
GA-T 913-2019 信息安全技术 数据库安全审计产品安全技术要求.pdf
GB-T 39412-2020 信息安全技术 代码安全审计规范.pdf
GB-T 21144-2023 混凝土实心砖.pdf
GB-T 35290-2023 信息安全技术 射频识别 RFID 系统安全技术规范.pdf
GB-T 32333-2015 滚动轴承 振动 加速度 测量方法及技术条件.pdf
GB-T 34079.3-2017 基于云计算的电子政务公共平台服务规范 第3部分:数据管理.pdf
GB-T 21709.1-2008 针灸技术操作规范 第1部分 艾灸.pdf
GB-T 43493.3-2023 半导体器件 功率器件用碳化硅同质外延片缺陷的无损检测识别判据 第3部分:缺陷的光致发光检测方法.pdf
法律法规 证券期货行政执法当事人承诺制度实施办法.pdf
1
/
3
21
评价文档
赞助2.5元 点击下载(883.7 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。