说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111345766.X (22)申请日 2021.11.10 (71)申请人 武汉天恒信息技 术有限公司 地址 430000 湖北省武汉市武汉东湖新 技 术开发区东一产业园光谷大道金融后 台服务中心基地建设项目二期2.7期 B26幢8层3号 (72)发明人 唐坚强 周慧明  (74)专利代理 机构 武汉知产时代知识产权代理 有限公司 42 238 代理人 吴晓茜 (51)Int.Cl. G06N 20/00(2019.01) G06N 3/02(2006.01) G06K 9/62(2022.01)G06F 16/215(2019.01) (54)发明名称 基于神经网络的业务系统地址解析方法、 系 统和存储介质 (57)摘要 本发明提供了一种基于神经网络的业务系 统地址解析方法, 包括获取中文数据集训练并存 储bert模型; 获取业务系统中的地址数据并清 洗; 划分训练集和测试集, 人工标注清洗后的训 练集, 得到标注地址数据; 利用 BIOS程序将标注 地址数据处理为程序标注数据; 将程序标注数据 中的原始地址与对应的标注数据构造为数据对; 将数据对中的原始地址和标注数据分别作为存 储的bert模型的输入和输出, 优化bert模型; 用 测试集测试优化后的bert模型的预测准确度; 当 优化后的bert模型的预测效果满足预期效果后, 使用测试后的bert模型解析业务系统地址。 本发 明中基于机器学习的地址解析方法准确度和灵 活性更高。 权利要求书2页 说明书4页 附图1页 CN 114239845 A 2022.03.25 CN 114239845 A 1.一种基于神经网络的业 务系统地址解析 方法, 其特 征在于, 包括: 获取中文数据集, 利用所述中文数据集训练并存 储bert模型; 获取业务系统中的地址数据并清洗; 将清洗后的所述 地址数据划分为测试集和训练集; 人工标注所述训练集, 得到标注地址数据; 利用序列标注法将所述标注地址数据处 理为程序标注数据; 将所述程序标注数据中的原 始地址与对应的标注数据构造为数据对; 将所述数据对编码, 并将编码后的数据对中的所述原始地址和所述程序标注数据分别 作为存储的所述ber t模型的输入和输出, 优化所述ber t模型; 输入所述测试集, 用K折法测试优化后的所述ber t模型的预测准确度; 当优化后的bert模型的预测效果满足预期效果后, 使用测试后的bert模型解析业务系 统地址。 2.如权利要求1所述的业务系统地址解析方法, 其特征在于, 在优化所述bert模型过程 中, 还包括步骤: 在bert模型输出预测数据时, 当有一个以上的预测数据被归类进同一个标注的地址标 签时, 只保留第一个预测数据。 3.如权利要求1所述的业务系统地址解析方法, 其特征在于, 清洗业务系统中的地址数 据的步骤 包括: 去除每条地址数据前后的特殊字符、 不可 见符号、 空白, 和/或, 换 行符。 4.如权利要求1所述的业务系统地址解析方法, 其特征在于, 人工标注所述训练集, 得 到标注地址数据的步骤 包括: 预先定义不同地址类型的数据 标签, 包括定义省级行政区划、 地级行政区划、 县级行政 区划、 乡级行政区划、 社区、 行政村、 自然村、 村组、 道路名、 道路号、 楼层, 和/或, 房间号对应 的数据起始标签、 数据内部标签和数据结束标签。 5.如权利要求1所述的业务系统地址解析方法, 其特征在于, 若模型预测效果不满足预 期效果, 则重复训练、 优化及测试所述b ert模型的步骤直至所述b ert模型的预测准确度满 足预期效果。 6.如权利要求1所述的业务系统地址解析方法, 其特征在于, 在优化bert模型过程中, 计算bert模型的通过率、 召回率以及F1分数作为模型的效果测试参数, 并使用反向传播算 法更新ber t模型神经网络中各节点的参数值。 7.如权利要求1所述的业务系统地址解析方法, 其特征在于, 使用测试后的bert模型解 析业务系统地址后, 还 包括: 将解析后的地址作为新的数据源混入业务系统 的历史地址数据中, 从而对测试后封装 的bert模型进行迭代升级。 8.一种基于神经网络的业务系统地址解析系统, 其特征在于, 所述业务系统地址解析 系统包括存储器、 处理器及 存储在所述存储器上并可在所述处理器上运行的基于神经网络 的业务系统地址解析程序, 所述基于神经网络的业务系统地址解析程序被所述处理器执行 时实现如权利要求1至7中任一项所述的基于神经网络的业 务系统地址解析 方法的步骤。 9.一种存储介质, 其特征在于, 所述存储介质为计算机可读存储介质, 所述计算机可读权 利 要 求 书 1/2 页 2 CN 114239845 A 2存储介质上存储有计算机程序, 所述计算机程序运行时用于实现如权利要求1 ‑7任一所述 的基于神经网络的业 务系统地址解析 方法的步骤。权 利 要 求 书 2/2 页 3 CN 114239845 A 3

.PDF文档 专利 基于神经网络的业务系统地址解析方法、系统和存储介质

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于神经网络的业务系统地址解析方法、系统和存储介质 第 1 页 专利 基于神经网络的业务系统地址解析方法、系统和存储介质 第 2 页 专利 基于神经网络的业务系统地址解析方法、系统和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:02:15上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。