说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210966287.8 (22)申请日 2022.08.12 (71)申请人 浪潮云信息技 术股份公司 地址 250100 山东省济南市高新区浪潮路 1036号浪潮科技园S01号楼 (72)发明人 侯令晨 周永进 李国涛  (74)专利代理 机构 济南信达专利事务所有限公 司 37100 专利代理师 冯春连 (51)Int.Cl. G06F 21/62(2013.01) G06K 9/62(2022.01) G06F 17/16(2006.01) (54)发明名称 一种基于效用矩阵实现l-diversity匿名的 方法 (57)摘要 本发明公开一种基于效用矩阵实现l ‑ diversity匿名的方法, 涉及技术领域, 包 括: S1、 获取用户属性标识, 引入效用矩阵, 计算效用矩 阵所包含元素的取值概率; S2、 设定参数L、 聚类 个数N, 利用基于划分的聚类算法, 对用户属性标 识中敏感属性的值进行聚类, 并输出聚类结果; S3、 判断聚类结果中存在敏感属性值的个数是否 小于参数L的设定值, 若是, 则执行S4, 若否, 则直 接结束, 并根据聚类结果对用户属性标识中的敏 感属性值进行匿名; S4、 设定聚类次数K的阈值, 判断输出聚类结果时进行的聚类次数是否超 过K 的设定阈值, 若是, 则将聚类个数N减1后返回执 行S2, 若否, 则直接返回执行S2 。 本发明通过将用 户的敏感信息多样性提高到L, 来更好地保护用 户隐私。 权利要求书2页 说明书5页 附图1页 CN 115438371 A 2022.12.06 CN 115438371 A 1.一种基于效用矩阵实现l ‑diversity匿名的方法, 其特 征在于, 包括如下步骤: S1、 获取用户属性标识, 引入效用矩阵, 计算效用矩阵所包 含元素的取值 概率; S2、 设定参数L、 聚类个数N, 利用基于划分的聚类算法, 对用户属性标识中敏感属性的 值进行聚类, 并输出聚类结果; S3、 判断步骤S2输出的聚类结果中存在敏感属性值的个数是否小于参数L的设定值, 若 是, 则执行步骤S4, 若否, 则直接结束, 并根据聚类结果对用户属性标识中的敏感属性值进 行匿名; S4、 设定聚类次数K的阈值, 判断输出聚类结果时进行的聚类次数是否超过K的设定阈 值, 若是, 则将聚类 个数N减1后返回执 行步骤S2, 若否, 则直接返回执 行步骤S2。 2.根据权利要求1所述的一种基于效用矩阵实现l ‑diversity匿名的方法, 其特征在 于, 执行步骤S1, 获取的用户属性标识包括显示标识符、 准标识符、 敏感属性三类, 其中, 显 示标识符能唯一标识单一个体的属性, 多个准标识符组合起来能唯一标识 一个用户的多个 属性, 敏感属性 为涉及隐私的属性; 多个用户的属性标识存储在同一个数据集内, 不同用户的属性标识存储在不同的数据 子集内。 3.根据权利要求2所述的一种基于效用矩阵实现l ‑diversity匿名的方法, 其特征在 于, 执行步骤S1, 引入效用矩阵, 计算效用矩阵所包 含元素的取值 概率, 具体操作流 程如下: S1.1、 引入效用矩阵, 效用矩阵的定义如下: U=(uij)m×n,       公式(a) 其中, 矩阵元素uij表示准标识符 中第j个属性对敏感属性中第i个属性的效用, m是敏感 属性包含的属性个数, n是准标识符包 含的属性个数; S1.2、 获取用户的准标识符和敏感属性, 利用效用矩阵计算矩阵元素uij的取值概率, 计 算公式如下: 其中, 是矩阵元素uij的值, 表示qj对si的取值概率, si表示敏感属性中第i个属性的 值, qj表示准标识符中第j个属性的值。 4.根据权利要求3所述的一种基于效用矩阵实现l ‑diversity匿名的方法, 其特征在 于, 用户的准标识符和敏感属性是 数值型数据或离 散型数据; 当准标识符是数值型数据时, 表示: 对敏感属性si而言, 的取值等于准标识符 qj的取值范围与整个数据集上准标识符中qj的取值范围之比; 当准标识符是离散型数据, 表示: 对敏感属性si而言, 的取值等于准标识符qj 的取值个数与整个数据集上准标识符中qj的取值个数之比。 5.根据权利要求3所述的一种基于效用矩阵实现l ‑diversity匿名的方法, 其特征在 于, 针对数据集上所有用户的属性标识, 参数L大于同一敏感属性取不同值的最大取值个 数; 聚类个数N等于敏感属性所包 含的属性个数; 聚类次数 K的阈值不超过敏感属性所包 含属性个数的一半。权 利 要 求 书 1/2 页 2 CN 115438371 A 26.根据权利要求5所述的一种基于效用矩阵实现l ‑diversity匿名的方法, 其特征在 于, 执行步骤S2, 利用基于划分的聚类算法, 对用户属性标识中敏感属性的值进行聚类, 具 体操作流 程如下: S2.1、 将聚类次数计数器的计数值初始化为0, 以敏感属性值、 效用矩阵、 参数L作为基 于划分的聚类算法的输入; S2.2、 随机 选取N个敏感属性 值, 作为N个聚类的初始聚类中心; S2.3、 聚类次数计数器的计数值+1; S2.4、 计算敏感属性 值到每个聚类中心的距离, 将敏感属性 值分配到距离最近的聚类; S2.5、 所有用户的敏感属性 值全部分配完成后, 更新聚类中心; S2.6、 基于更新的聚类中心, 重新执行步骤S2.4 ‑步骤S2.5, 直至聚类结果不再发生变 化。 7.根据权利要求6所述的一种基于效用矩阵实现l ‑diversity匿名的方法, 其特征在 于, 执行步骤S2.2时, 被选取的N个敏感属性值不一定属于同一个用户, 且被选取的N个敏感 属性值对应N个不同的敏感属性。 8.根据权利要求7所述的一种基于效用矩阵实现l ‑diversity匿名的方法, 其特征在 于, 执行步骤S4后, 聚类个数N减1后返回执行步骤S2, 此时, 从N个敏感属性中随机选取N ‑1 个敏感属性 值作为新的聚类中心。权 利 要 求 书 2/2 页 3 CN 115438371 A 3

PDF文档 专利 一种基于效用矩阵实现l-diversity匿名的方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于效用矩阵实现l-diversity匿名的方法 第 1 页 专利 一种基于效用矩阵实现l-diversity匿名的方法 第 2 页 专利 一种基于效用矩阵实现l-diversity匿名的方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:37上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。