说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111525829.X (22)申请日 2021.12.14 (71)申请人 杭萧钢构股份有限公司 地址 310000 浙江省杭州市萧 山经济技 术 开发区萧清大道 2826号 (72)发明人 李震宇 王振众 张哲 (74)专利代理 机构 北京辰权知识产权代理有限 公司 11619 代理人 李小朋 (51)Int.Cl. G06F 21/62(2013.01) G06F 21/64(2013.01) G06F 21/60(2013.01) H04L 9/40(2022.01) (54)发明名称 一种数据脱敏 方法、 装置、 存 储介质及终端 (57)摘要 本发明公开了一种数据脱敏方法、 装置、 存 储介质及终端, 应用于服务端, 方法包括: 当接收 到待分发的目标数据文本时, 获取目标数据文本 的多个字段; 在多个字段中识别敏感字段以及非 敏感字段, 生成敏感字段集合以及非敏感字段集 合; 对敏感字段集合中各敏感字段的数据进行脱 敏处理, 生成脱敏后的数据; 将脱敏后的数据与 非敏感字段的数据组合, 并将组合后的数据分发 至客户端。 由于本申请通过在服务端自动识别目 标数据文本中存在的敏感字段进行自动脱敏处 理, 从而实现了能进行数据的自动识别、 脱敏 以 及分发, 减少了数据流转所导致的数据泄露风 险, 提高了数据分发的效率。 权利要求书2页 说明书10页 附图3页 CN 114398665 A 2022.04.26 CN 114398665 A 1.一种数据脱敏 方法, 其特 征在于, 应用于服 务端, 所述方法包括: 当接收到待分发的目标 数据文本时, 获取 所述目标 数据文本的多个字段; 在所述多个字段中识别敏感字段以及非敏感字段, 生成敏感字段集合以及非敏感字段 集合; 对所述敏感字段集 合中各敏感字段的数据进行脱敏处 理, 生成脱敏后的数据; 将所述脱敏后的数据与所述非敏感字段的数据组合, 并将组合后的数据分发至客户 端。 2.根据权利要求1所述的方法, 其特征在于, 所述获取所述目标数据文本的多个字段, 包括: 根据预设键值 规则解析 所述目标 数据文本, 生成解析后的数据文本; 在解析后的数据文本中逐一遍历获取键值对集 合; 将所述键值对集合中每个键值对划分为属性特征和值特征, 得到每个键值对的属性特 征和值特 征; 基于所述每 个键值对的属性特 征和值特 征确定所述目标 数据文本的多个字段。 3.根据权利要求2所述的方法, 其特征在于, 所述基于所述每个键值对的属性特征和值 特征确定所述目标 数据文本的多个字段, 包括: 将所述每 个键值对的属性特 征和值特 征进行特征拼接, 得到多个拼接特 征; 将每个所述拼接特征转换为 一个向量, 得到向量 集合; 将所述向量 集合中各向量组合后生成词项矩阵; 将所述词项矩阵进行奇异值分解, 得到多个 语义索引; 根据预设语义字段表查询所述多个语义索引中每个语义索引对应的字段, 得到所述目 标数据文本的多个字段。 4.根据权利要求1所述的方法, 其特征在于, 所述在所述多个字段中识别敏感字段以及 非敏感字段, 生成敏感字段集 合以及非敏感字段集 合, 包括: 获取针对所述敏感字段设置的敏感字段类型表; 分析所述多个字段中每 个字段的数据类型; 根据所述敏感字段类型表以及所述每个字段的数据类型逐一映射, 以判定所述每个字 段是否为敏感字段, 并将敏感字段 标记为1, 以及将非敏感字段 标记为0; 统计所述标记为1的字段, 并确定为敏感字段集 合; 统计所述标记为0的字段, 并确定为非敏感字段集 合。 5.根据权利要求4所述的方法, 其特征在于, 所述分析所述多个字段中每个字段的数据 类型, 包括: 将所述多个字段中每个字段输入预先训练 的数据类型识别模型中, 输出每个字段的数 据类型; 其中, 按照以下步骤生成预 先训练的数据类型识别模型, 包括: 采用卷积神经网络创建数据类型识别模型; 获取预先标记的多条字段 ‑类型标签数据; 将所述多条字段 ‑类型标签数据输入所述数据类型识别模型进行训练, 输出损失值; 当所述损失值到 达最小时, 生成预 先训练的数据类型识别模型。权 利 要 求 书 1/2 页 2 CN 114398665 A 26.根据权利要求1所述的方法, 其特征在于, 所述对所述敏感字段集合中各敏感字段的 数据进行脱敏处 理, 生成脱敏后的数据, 包括: 根据所述敏感字段集 合中各敏感字段的类型信息获取每 个敏感字段对应的脱敏规则; 根据所述每个敏感字段对应的脱敏规则将对应的敏感字段的数据进行脱敏处理, 得到 脱敏数据; 对脱敏数据进行脱敏复制后生成脱敏后的数据。 7.根据权利要求6所述的方法, 其特征在于, 所述对脱敏数据进行脱敏复制后生成脱敏 后的数据之后, 还 包括: 删除所述敏感字段集 合和脱敏 数据。 8.一种数据脱敏装置, 其特 征在于, 应用于服 务端, 所述装置包括: 字段获取模块, 用于当接收到待分发的目标数据文本时, 获取所述目标数据文本的多 个字段; 字段识别模块, 用于在所述多个字段中识别敏感字段以及非敏感字段, 生成敏感字段 集合以及非敏感字段集 合; 字段脱敏模块, 用于对所述敏感字段集合中各敏感字段的数据进行脱敏处理, 生成脱 敏后的数据; 数据分发模块, 用于将所述脱敏后的数据与所述非敏感字段的数据组合, 并将组合后 的数据分发至客户端。 9.一种计算机存储介质, 其特征在于, 所述计算机存储介质存储有多条指令, 所述指令 适于由处 理器加载并执 行如权利要求1 ‑7任意一项的方法步骤。 10.一种终端, 其特征在于, 包括: 处理器和存储器; 其中, 所述存储器存储有计算机程 序, 所述计算机程序适于由所述处 理器加载并执 行如权利要求1 ‑7任意一项的方法步骤。权 利 要 求 书 2/2 页 3 CN 114398665 A 3
专利 一种数据脱敏方法、装置、存储介质及终端
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 23:33:52
上传分享
举报
下载
原文档
(775.9 KB)
分享
友情链接
硅创社2024002-AIGC新书推荐榜2月.pdf
GB-T 17901.1-2020 信息技术 安全技术 密钥管理 第1部分:框架.pdf
T-CCGA 40005—2021 加氢站用液驱活塞氢气压缩机安全使用技术规范.pdf
付晓岩 数字银行论坛-以企业架构推动数字化 转型指导文件的落实 .pdf
GM-T 0005-2012 随机性检测规范.pdf
YD-T 4177.3-2022 移动互联网应用程序(APP)收集使用个人信息最小必要评估规范 第3部分:图片信息.pdf
GB-T 23176-2008 篮球架.pdf
GB-T 18521-2001 地名分类与类别代码编制规则.pdf
GB-T 32169.3-2015 政务服务中心运行规范 第3部分:窗口服务提供要求.pdf
GB-T 17747.2-2011 天然气压缩因子的计算 第2部分:用摩尔组成进行计算.pdf
T-SZWA 001—2017 高分子益胶泥.pdf
DB43-T 1636-2019 法定计量检定机构服务规范 湖南省.pdf
网络数据安全管理条例(征求意见稿).pdf
JR-T 0002-2016 银行卡自动柜员机(ATM)终端技术规范.pdf
T-CEC 675—2022 电化学储能电站安全规程.pdf
T-CAAMTB 134—2023 质量分级及“领跑者”评价要求 电动汽车用驱动电机系统.pdf
SL-T 793-2020 河湖健康评估技术导则.pdf
GB-T 33697-2017 公路交通气象监测设施技术要求.pdf
数据供应链管理办法.pdf
GB-T 30692-2014 提高在用自动扶梯和自动人行道安全性的规范.pdf
1
/
3
16
评价文档
赞助2.5元 点击下载(775.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。