说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210946807.9 (22)申请日 2022.08.09 (71)申请人 深圳市跨越新科技有限公司 地址 518000 广东省深圳市宝安区航城街 道后瑞社区深圳机场航站四路汉莎航 空园区A栋4楼 (72)发明人 寇宇 陈才宁 赵兴 (74)专利代理 机构 深圳国新 南方知识产权代理 有限公司 4 4374 专利代理师 张亚娟 (51)Int.Cl. G06F 40/279(2020.01) G06V 30/10(2022.01) G06V 30/14(2022.01) G06V 30/412(2022.01)G06F 21/62(2013.01) (54)发明名称 一种敏感信息识别方法、 装置、 设备及存储 介质 (57)摘要 本发明公开了一种敏感信息识别方法、 装 置、 设备及存储介质, 其中方法包括: 对输入图片 进行信息提取, 获得若干文字信息和每一文字信 息对应的位置信息; 将所述文字信息按照其对应 的位置信息进行排序, 按照顺序依次判断当前文 字信息是否为第一类关键词; 若为, 确定当前文 字信息处于表格中, 则判断其所处表格类型并识 别相应位置的文字信息是否含有敏感标识, 若 是, 继续识别下一个文字信息; 若否, 确定 所述输 入图片包含敏感信息; 若不为, 判断当前文字信 息是否包含第二类关键词, 若包含, 确定所述输 入图片包含敏感信息; 若不包含, 继续识别下一 个文字信息。 本发明能够在敏感信息不可见的情 况下, 高效准确的识别图片中是否存在敏感信 息, 保障信息安全。 权利要求书2页 说明书10页 附图3页 CN 115422917 A 2022.12.02 CN 115422917 A 1.一种敏感信息识别方法, 其特 征在于, 包括: 对输入图片进行信息提取, 获得若干文字信息和每一文字信息对应的位置信息; 将所述文字信 息按照其对应的位置信 息进行排序, 按照顺序依次判断当前文字信 息是 否为第一类关键词; 若为, 确定当前文字信息处于表格中, 则判断其所处表格类型并识别相应位置的文字 信息是否含有敏感标识, 若是, 继续识别下一个文字信息; 若否, 确定所述输入图片包含敏 感信息; 若不为, 判断当前文字信 息是否包含第二类关键词, 若包含, 确定所述输入图片包含敏 感信息; 若不包 含, 继续识别下一个文字信息 。 2.如权利要求1所述的一种敏感信 息识别方法, 其特征在于, 所述表格类型包括竖向表 格和横向表格; 所述判断其所处表格 类型, 包括: 判断所述当前文字信 息的上侧和/或下侧是否为第 一类关键词, 若是, 确定其所处表格 类型为横向表格; 若否, 判断所述当前文字信息的左侧和/或右侧是否为第一类关键词, 若是, 确定其所 处表格类型为竖向表格。 3.如权利要求2所述的一种敏感信 息识别方法, 其特征在于, 所述识别相应位置的文字 信息是否含有敏感标识, 包括: 若所述当前文字信 息所处表格类型为所述横向表格, 识别其右侧相邻的文字信 息是否 含有敏感标识; 若所述当前文字信 息所处表格类型为所述竖向表格, 识别其下侧相邻的文字信 息是否 含有敏感标识。 4.如权利要求3所述的一种敏感信 息识别方法, 其特征在于, 所述位置信 息包括每一文 字信息的左侧边界的位置信息; 识别所述当前文字信 息下侧相邻的文字信 息含有敏感标识后, 继续依次识别位于所述 当前文字信息下侧、 且左侧边界的位置信息与其相同的文字信息是否含有敏感标识。 5.如权利要求1或权利要求3或权利要求4所述的一种敏感信 息识别方法, 其特征在于, 相应位置的文字信息识别含有敏感标识后, 对其设置已识别标识; 当按照顺序依次判断当前文字信 息是否为第 一类关键词时, 跳过有已识别标识的文字 信息。 6.如权利要求1所述的一种敏感信 息识别方法, 其特征在于, 所述将所述文字信 息按照 其对应的位置信息进行排序, 包括: 将所述文字信息按照其对应的位置信息从左到右、 从上到下进行排序。 7.如权利要求1所述的一种敏感信 息识别方法, 其特征在于, 所述敏感标识用于屏蔽信 息。 8.一种敏感信 息识别装置, 其特征在于, 包括数据获取模块、 文本排序模块和判断引擎 模块; 所述数据获取模块用于对输入图片进行信 息提取, 获得若干文字信 息和每一文字信 息 对应的位置信息; 所述文本排序模块用于将所述文字信息按照其对应的位置信息进行排序;权 利 要 求 书 1/2 页 2 CN 115422917 A 2所述判断引擎模块用于按照顺序依次判断当前文字信息是否为第一类关键词; 若为, 确定当前文字信息处于表格中, 则判断其所处表格类型并识别相应位置的文字 信息是否含有敏感标识, 若是, 继续识别下一个文字信息; 若否, 确定所述输入图片包含敏 感信息; 若不为, 所述判断引擎模块继续判断当前文字信息是否包含第二类关键词, 若包含, 确 定所述输入图片包 含敏感信息; 若不包 含, 继续识别下一个文字信息 。 9.一种敏感信息识别设备, 包括处 理器和存 储器, 其中: 所述存储器用于存 储计算机程序; 所述处理器用于读取所述存储器 中的计算机程序, 并执行如权利要求1~7所述的任一 敏感信息识别方法的步骤。 10.一种计算机可读存储介质, 其上存储有可读的计算机程序, 该程序被处理器执行时 实现如权利要求1~7 所述的任一敏感信息识别方法的步骤。权 利 要 求 书 2/2 页 3 CN 115422917 A 3
专利 一种敏感信息识别方法、装置、设备及存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:34:39
上传分享
举报
下载
原文档
(759.2 KB)
分享
友情链接
GB-T 42571-2023 信息安全技术 区块链信息服务安全规范.pdf
GB-T 35291-2017 信息安全技术 智能密码钥匙应用接口规范.pdf
GY-T 352-2021 广播电视网络安全等级保护基本要求.pdf
GB-T 35966-2018 高技术服务业服务质量评价指南.pdf
GB-T 35164-2017 用于水泥、砂浆和混凝土中的石灰石粉.pdf
GB-T 18916.61-2022 取水定额 第61部分:赖氨酸盐.pdf
T-CI 047—2021 医用镥[177Lu]及其放射性药物的 质量标准.pdf
GB-T 29042-2020 汽车轮胎滚动阻力限值和等级.pdf
GB-T 42555-2023 计量器具控制软件的通用要求.pdf
GB-T 20502-2006 膜组件及装置型号命名.pdf
Tomcat Web服务器安全配置基线.doc
T-ZGKSL 010—2023 重组胶原蛋白透皮吸收测定方法.pdf
阿里云 专有云敏捷版云原生PaaS场景 阿里云企业级容器平台AECP 产品文档 2021.pdf
GB-T 706-2016 热轧型钢.pdf
DB3305-T 216-2021 计量检定、校准数据交互规范 湖州市.pdf
GB-T 40211-2021 工业通信网络 网络和系统安全 术语、概念和模型 ISO 62443-1-1-2009.pdf
GB-T 43208.1-2023 信息技术服务 智能运维 第1部分:通用要求.pdf
SY-T 7640-2021 非常规气田采出水回注环境保护规范.pdf
GB-T 33848.3-2017 信息技术 射频识别 第3部分:13.56MHz的空中接口通信参数.pdf
清华大学 - SuperBench大模型综合能力评测报告 0412 v2.2.pdf
1
/
16
评价文档
赞助2.5元 点击下载(759.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。