说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111654397.2 (22)申请日 2021.12.3 0 (71)申请人 翼健 (上海) 信息科技有限公司 地址 200000 上海市长 宁区长宁路999号6 楼6256室 (72)发明人 潘光明  (74)专利代理 机构 北京沃杰永益知识产权代理 事务所(普通 合伙) 11905 代理人 杨杰 (51)Int.Cl. G06F 21/62(2013.01) G06F 21/60(2013.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 基于特征工程IV值的隐私计算方法、 系统和 可读存储介质 (57)摘要 本发明提供一种基于特征工程IV值的隐私 计算方法、 系统和可读 存储介质, 所述方法包括: 参与方A生成自己的公私钥对, 并将公钥公开给 参与方B; 参与方A用公钥加密各个样本数据的标 签值, 并将密文标签值发送给参与方B; 参与方B 基于特征值对多个样本数据进行分组, 并结合各 个样本数据的密文标签值以及参与方A的公钥计 算每个分组的密文IV值; 参与方B将各分组的密 文IV值进行累加得到最终密文IV值; 参与方B将 最终密文IV值进行加扰后发送给参与方A; 参与 方A利用私钥解密最终密文IV加扰值, 得到明文 IV加扰值并发送给参与方B; 参与方B对明文 IV加 扰值进行去扰后得到该特征的明文IV值。 本发明 能够实现多方特 征工程IV值的隐私计算。 权利要求书5页 说明书14页 附图2页 CN 114398671 A 2022.04.26 CN 114398671 A 1.一种基于特 征工程IV值的隐私计算方法, 其特 征在于, 所述方法包括: 预设特征工程IV值联合计算的参与方A和参与方B, 以及多个样本数据, 且参与方A持有 各个样本数据的标签值, 参与方B持有各个样本数据的特 征值; 参与方A生成自己的公私钥对, 并将公钥公开给参与方B; 参与方A利用自己的公钥加密各个样本数据的标签值生成各个样本数据的密文标签 值, 并将各个样本数据的密文标签值发送给参与方B; 针对某特征, 参与 方B基于特征值对多个样本数据进行分组, 并结合各个样本数据的密 文标签值以及参与方A的公钥计算每 个分组的密文IV值; 参与方B将各分组的密文IV值进行累加, 得到该 特征的最终密文IV值; 参与方B将该特征的最终密文IV值进行加扰, 得到最终密文IV加扰值并发送给参与方 A; 参与方A利用自己的私钥解密该特征的最终密文IV加扰值, 得到该特征的明文IV加扰 值并发送给参与方B; 参与方B对该 特征的明文IV加扰值进行去扰后得到该 特征的明文IV值。 2.根据权利要求1所述的一种基于特征工程IV值的隐私计算方法, 其特征在于, 针对某 特征, 参与方B基于特征值对多个样本数据进行分组, 并结合各个样 本数据的密文 标签值以 及参与方A的公钥计算每 个分组的密文IV值, 具体包括: 预设m个样本数据, 各个样本的标签值记为Li∈{0, 1}, n个特征, Li=1表示正样本, Li= 0表示负样本, 全部正样本数量记为Gtotal, 全部负样本数量记为Btotal, i为m个样本数据中某 个样本数据的序号, 且全部正样本数量记 Gtotal和全部负样本数量记Btotal为参与方A和参与 方B所共知; 对该特征的m个样本数据进行分为N组, 每组的样本数量为ml, l为组的序号, 且l∈[1, N] , 各组所包含的全部正样本数量记为Gl, 全部负样本数量记为Bl, 且满足 获取各组中的每个样本数据的特征值Fl, j, 并采用参与方A的公钥 对各组中的每个样本 数据的特征值Fl, j进行加密得到密文特征值 其中, l表示第l组, j表示第l组的第j个 样本数据, Fl, j表示第l组的第j个样本数据的特 征值; 根据从参与方A接收到的各个样本数据的密文标签值, 获取各组中的每个样本数据的 标签值密文值 并结合密文特征值 计算出每组的全部正样本数量密文值 采用参与方A的公钥对 每组的样本数量ml进行加密, 得到每组的样本数量密文值 结合每组的样本数量密文值 和每组的全部正样本数量密文值 计算出每组的全 部负样本数量密文值 计算每组的WOE值, 记 并根据每组的WOE值计算每组的IV权 利 要 求 书 1/5 页 2 CN 114398671 A 2值, 记 则采用参与方A的公钥对Al得到密文值 对 进行变换 得到 对 进 行 变 换 得 到 记ln(1+gl)/ln10的密文值为 记ln(1+bl)/ln10的密文值 为 计算出该特征的每组密文IV值 为: 3.根据权利要求1所述的一种基于特征工程IV值的隐私计算方法, 其特征在于, 参与 方 B将该特征的最终密文IV值进行加扰, 得到最终密文IV加扰值并发送给参与方A, 具体包括: 由参与方B产生随机数e, 并采用参与方A的公钥对随机数e进行加密得到随机数e的密 文值eenc, 预设最终密文IV值为IVenc, 则根据计算式计算出最终密文IV加扰值IVenc_err= IVenc+eenc; 由参与方B将最终密文IV加扰值 IVenc_err发送给参与方A。 4.根据权利要求3所述的一种基于特征工程IV值的隐私计算方法, 其特征在于, 参与 方 B产生随机数 e, 具体包括: 预设随机数支持方C, 随机源为K个; 随机数支持方C持有K个字符串Rx, 其中x表示第x个 随机源号码, 且 x∈[1, K]; 且每 个字符串包括按照顺序排列的p个字符, 且p为偶数; 随机数支持方C按照随机的方式对每个字符串的p个字符进行两两配对, 形成p/2个配 对组, 每个配对组包括前字符和后字符; 随机数支持方C将每个字符串的p/2个配对组的前字符发送给参与方B, 并进行本地预 存; 当参与方B需要产生随机数时, 则向随机数支持方C发送指令信息; 所述随机 数支持方C基于指令信息触发采用K个字符串Rx进行调制光子串, 具体为: 将每 个字符串中的p/2个配对组的前字符分别作为调制光子串的各个调制基随机选取的第一选 取源, 并将每个字符串中的p/2个配对组的后字符作为调制光子串的调制初始信号的第二 选取源; 针对每个字符串, 从第一选取源中, 随机选取对应的前字符, 作为调制基, 并从第二 选取源中选取与前字符相对应的后字符, 作为调制初始信号, 由各个调制基分别将对应的 调制初始信号调制成光子的偏振态; 基于相同的字符串, 将所有光子的偏振态进行组合形 成对应的光子串, 将K个光子串与每个字符串对应调制基的随机选取方式一并通过量子通 信发送给参与方B; 参与方B接收到K个光子串与每个字符串对应调制基的随机选取方式, 基于每个光子串权 利 要 求 书 2/5 页 3 CN 114398671 A 3

.PDF文档 专利 基于特征工程IV值的隐私计算方法、系统和可读存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于特征工程IV值的隐私计算方法、系统和可读存储介质 第 1 页 专利 基于特征工程IV值的隐私计算方法、系统和可读存储介质 第 2 页 专利 基于特征工程IV值的隐私计算方法、系统和可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:31:27上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。