说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111345766.X (22)申请日 2021.11.10 (71)申请人 武汉天恒信息技 术有限公司 地址 430000 湖北省武汉市武汉东湖新 技 术开发区东一产业园光谷大道金融后 台服务中心基地建设项目二期2.7期 B26幢8层3号 (72)发明人 唐坚强 周慧明 (74)专利代理 机构 武汉知产时代知识产权代理 有限公司 42 238 代理人 吴晓茜 (51)Int.Cl. G06N 20/00(2019.01) G06N 3/02(2006.01) G06K 9/62(2022.01)G06F 16/215(2019.01) (54)发明名称 基于神经网络的业务系统地址解析方法、 系 统和存储介质 (57)摘要 本发明提供了一种基于神经网络的业务系 统地址解析方法, 包括获取中文数据集训练并存 储bert模型; 获取业务系统中的地址数据并清 洗; 划分训练集和测试集, 人工标注清洗后的训 练集, 得到标注地址数据; 利用 BIOS程序将标注 地址数据处理为程序标注数据; 将程序标注数据 中的原始地址与对应的标注数据构造为数据对; 将数据对中的原始地址和标注数据分别作为存 储的bert模型的输入和输出, 优化bert模型; 用 测试集测试优化后的bert模型的预测准确度; 当 优化后的bert模型的预测效果满足预期效果后, 使用测试后的bert模型解析业务系统地址。 本发 明中基于机器学习的地址解析方法准确度和灵 活性更高。 权利要求书2页 说明书4页 附图1页 CN 114239845 A 2022.03.25 CN 114239845 A 1.一种基于神经网络的业 务系统地址解析 方法, 其特 征在于, 包括: 获取中文数据集, 利用所述中文数据集训练并存 储bert模型; 获取业务系统中的地址数据并清洗; 将清洗后的所述 地址数据划分为测试集和训练集; 人工标注所述训练集, 得到标注地址数据; 利用序列标注法将所述标注地址数据处 理为程序标注数据; 将所述程序标注数据中的原 始地址与对应的标注数据构造为数据对; 将所述数据对编码, 并将编码后的数据对中的所述原始地址和所述程序标注数据分别 作为存储的所述ber t模型的输入和输出, 优化所述ber t模型; 输入所述测试集, 用K折法测试优化后的所述ber t模型的预测准确度; 当优化后的bert模型的预测效果满足预期效果后, 使用测试后的bert模型解析业务系 统地址。 2.如权利要求1所述的业务系统地址解析方法, 其特征在于, 在优化所述bert模型过程 中, 还包括步骤: 在bert模型输出预测数据时, 当有一个以上的预测数据被归类进同一个标注的地址标 签时, 只保留第一个预测数据。 3.如权利要求1所述的业务系统地址解析方法, 其特征在于, 清洗业务系统中的地址数 据的步骤 包括: 去除每条地址数据前后的特殊字符、 不可 见符号、 空白, 和/或, 换 行符。 4.如权利要求1所述的业务系统地址解析方法, 其特征在于, 人工标注所述训练集, 得 到标注地址数据的步骤 包括: 预先定义不同地址类型的数据 标签, 包括定义省级行政区划、 地级行政区划、 县级行政 区划、 乡级行政区划、 社区、 行政村、 自然村、 村组、 道路名、 道路号、 楼层, 和/或, 房间号对应 的数据起始标签、 数据内部标签和数据结束标签。 5.如权利要求1所述的业务系统地址解析方法, 其特征在于, 若模型预测效果不满足预 期效果, 则重复训练、 优化及测试所述b ert模型的步骤直至所述b ert模型的预测准确度满 足预期效果。 6.如权利要求1所述的业务系统地址解析方法, 其特征在于, 在优化bert模型过程中, 计算bert模型的通过率、 召回率以及F1分数作为模型的效果测试参数, 并使用反向传播算 法更新ber t模型神经网络中各节点的参数值。 7.如权利要求1所述的业务系统地址解析方法, 其特征在于, 使用测试后的bert模型解 析业务系统地址后, 还 包括: 将解析后的地址作为新的数据源混入业务系统 的历史地址数据中, 从而对测试后封装 的bert模型进行迭代升级。 8.一种基于神经网络的业务系统地址解析系统, 其特征在于, 所述业务系统地址解析 系统包括存储器、 处理器及 存储在所述存储器上并可在所述处理器上运行的基于神经网络 的业务系统地址解析程序, 所述基于神经网络的业务系统地址解析程序被所述处理器执行 时实现如权利要求1至7中任一项所述的基于神经网络的业 务系统地址解析 方法的步骤。 9.一种存储介质, 其特征在于, 所述存储介质为计算机可读存储介质, 所述计算机可读权 利 要 求 书 1/2 页 2 CN 114239845 A 2存储介质上存储有计算机程序, 所述计算机程序运行时用于实现如权利要求1 ‑7任一所述 的基于神经网络的业 务系统地址解析 方法的步骤。权 利 要 求 书 2/2 页 3 CN 114239845 A 3
专利 基于神经网络的业务系统地址解析方法、系统和存储介质
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 19:02:15
上传分享
举报
下载
原文档
(364.4 KB)
分享
友情链接
GB-T 36145-2018 建筑用不锈钢压型板.pdf
DB15-T 1873—2020 大数据平台 数据接入质量规范 内蒙古自治区.pdf
GB-T 25062-2010 信息安全技术 鉴别与授权 基于角色的访问控制模型与管理规范.pdf
GB-T 43079.1-2023 钢制管法兰、垫片及紧固件选用规定 第1部分:PN系列.pdf
GB-T 33585-2017 复合磺酸钙基润滑脂.pdf
GB-T 5585.1-2018 电工用铜、铝及其合金母线 第1部分:铜和铜合金母线.pdf
T-QGCML 544—2022 井下移动瓦斯抽采泵站建设规范.pdf
思度安全-DSMM-015 元数据安全管理规范V1.0.pdf
GB-T 41864-2022 信息技术 计算机视觉 术语.pdf
GB-T 40753.4-2024 供应链安全管理体系 ISO 28000实施指南 第4部分:以符合GB-T 38702为管理目标实施ISO 28000的附加特定指南.pdf
专利 一种用于高功率密度机柜的泵驱双环路热管组合散热系统.PDF
GB-T 12714-2009 镅铍中子源.pdf
GB-T 30677-2014 轻型汽车电子稳定性控制系统性能要求及试验方法.pdf
GB-T 446-2023 全精炼石蜡.pdf
中国信创产业研究报告.pdf
T-GCHA 1.3—2018 定制家居产品 人造板定制衣柜 第3部分:有害物质限量及气味等级.pdf
AQ 1098-2014 露天煤矿安全设施设计编制导则.pdf
GB-T 31986-2015 电子工业用气体 八氟丙烷.pdf
GB-T 5106-2012 圆柱直齿渐开线花键 量规.pdf
GB-T 25767-2010 滚动轴承 圆锥滚子.pdf
1
/
3
8
评价文档
赞助2.5元 点击下载(364.4 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。