说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111370407.X (22)申请日 2021.11.18 (71)申请人 携程科技 (上海) 有限公司 地址 200335 上海市长 宁区金钟路968号16 号楼901室 (实际楼层8楼) (72)发明人 韩宝龙 孙玉霞 何蜀波 邹宇  (74)专利代理 机构 上海弼兴律师事务所 31283 代理人 马涛 罗朗 (51)Int.Cl. G06F 40/58(2020.01) G06F 16/31(2019.01) G06F 16/387(2019.01) G06F 40/126(2020.01) G06F 40/216(2020.01) G06F 40/242(2020.01)G06N 20/00(2019.01) (54)发明名称 地址解析方法、 电子设备及 介质 (57)摘要 本发明公开了一种地址解析方法、 电子设备 及介质, 该方法包括步骤, S1、 建立地址实体字 典, 所述地址实体字典包括若干实体地址以及与 所述实体地址所对应的翻译文本; S2、 将需要翻 译的地址与所对应的所述实体地址匹配; 本申请 通过对于翻译地址的搜索具有将地址进行识别, 对于翻译文本有很好的拓展性, 随着将翻译文本 的不断拓展, 翻译的精准度进行提高, 此外本发 明可以降低地址中的机器所需要的性能要求, 满 足机器翻译的实时性。 权利要求书2页 说明书6页 附图4页 CN 114139558 A 2022.03.04 CN 114139558 A 1.一种地址解析 方法, 其特 征在于, 包括 步骤: S1、 建立地址实体字典, 所述地址实体字典包括若干实体地址以及与所述实体地址所 对应的翻译 文本; 所述实体地址包括若干字符, 所述字符按照编码排序, 所述实体地址按照所述字符的 排序进行排序; S2、 将需要翻译的地址与所对应的所述实体地址匹配; 所述将需要翻译的地址与所对应的所述实体地址匹配包括: 对所述需要翻译的地址按照三叉树搜索树策略与实体地址进行匹配; 所述三叉树搜索树策略为对所述需要翻译的地址中第 n个字符生成预测字符, n为大于 等于1的自然数; 所述预测字符为根据 所述需要翻译的地址中第 n个字符之前已经匹配完成的字符在实 体地址字典中进行搜索的下一个可能的字符, 当所述需要翻译的地址中第 n个字符的排序 大于/小于所述预测字符的排序, 则生成下 一个预测字符; 所述需要翻译的地址 中第n个字符的排序等于所述预测字符的排序时, 则完成所述第n 个字符的匹配, 并对n加1; 当所述需要翻译的地址中第n个字符在实地地址字典中没有所述预测字符时, 将所述 需要翻译的地址中第n个字符作为下一个需要翻译的地址的第一个字符, 并确定原所述需 要翻译的地址与所对应的所述实体地址匹配完成; 当确定原所述需要翻译的地址与 所对应的所述实体地址匹配完成时, 将所述需要翻译 的地址替换为与需要翻译的地址所匹配的实体地址相对应的所述翻译 文本。 2.如权利要求1所述的地址解析方法, 其特征在于, 所述预测字符为在所述实体地址字 典中根据匹配完成的字符中选取 下一可能的字符中历史出现最多的字符; 当所述需要翻译的地中第n个字符与所述预测字符进行匹配成功 的时候, 将所述字符 所出现的次数进行累加。 3.如权利要求1所述的地址解析 方法, 其特 征在于, 所述预测字符有三个; 第一个所述预测字符为当前 所述实体地址 字典中可能出现的字符中排序最小的字符; 第二个所述预测字符为所述第一个所述预测字符为当前所述实体地址字典中可能出 现的字符中排序为中位数的字符; 第三个所述预测字符为所述第一个所述预测字符为当前所述实体地址字典中可能出 现的字符中排序最大的字符。 4.如权利要求1所述的地址解析方法, 其特征在于, 将所述实体地址建立矩阵, 所述矩 阵包括若干行, 所述实体地址按照 实体地址信息对应分配至对应的行中, 并赋予行与行之 间不同的权重, 所述行与行之 间不同的权重用于判断每个实体地址前后所对应的最合适的 实体地址 。 5.如权利要求 4所述的地址解析 方法, 其特 征在于, 所述实体地址信息包括国家、 省级单位、 市级单位、 区单位、 县单位、 街道以及标志性建 筑。 6.如权利要求1所述的地址解析 方法, 其特 征在于,权 利 要 求 书 1/2 页 2 CN 114139558 A 2步骤S1还 包括S11、 在文本中识别需要翻译的地址的范围; 步骤S2还 包括S21、 将所述翻译 文本输出。 7.如权利要求6所述的地址解析 方法, 其特 征在于, 步骤S11还包括对于文本进行 预处理并将需要翻译的地址进行占位符替换; 步骤S21还 包括将所述翻译 文本倒序排列并将替换 所述占位符。 8.如权利要求1所述的地址解析 方法, 其特 征在于, 所述字符按照 编码排序按照un icode码排序。 9.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至8 中任一项所述 的地址解析 方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至8中任一项所述的地址解析 方法。权 利 要 求 书 2/2 页 3 CN 114139558 A 3

.PDF文档 专利 地址解析方法、电子设备及介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 地址解析方法、电子设备及介质 第 1 页 专利 地址解析方法、电子设备及介质 第 2 页 专利 地址解析方法、电子设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:01:28上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。