说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202111336032.5 (22)申请日 2021.11.12 (65)同一申请的已公布的文献号 申请公布号 CN 113779182 A (43)申请公布日 2021.12.10 (73)专利权人 航天宏康智能科技 (北京) 有限公 司 地址 100048 北京市海淀区阜成路14 号 (72)发明人 王潇茵 李瑞群 丁醒醒 郑俊康 张家华 (74)专利代理 机构 北京铭硕知识产权代理有限 公司 11286 代理人 武慧南 张川绪 (51)Int.Cl. G06F 16/31(2019.01)G06N 20/00(2019.01) 审查员 白露霜 (54)发明名称 从文本数据抽取事 件的方法及装置 (57)摘要 本申请提供一种从文本数据抽取事件的方 法及装置, 所述方法包括: 获取文本数据; 基于所 述文本数据, 确定所述文本数据的第一特征序 列; 对所述第一特征序列中的每个第一特征向量 的第一特征元素进行二值标记; 基于标记后的第 一特征序列, 对所述文本数据中的事件进行抽 取。 根据本申请的从文本数据抽取事件的方法及 装置解决了无法对多个事件分别抽取的问题, 能 够从文本数据抽取事件的方法及装置能够对输 入的自然语言文本中的一个或多个事件分别进 行抽取, 提高事 件抽取的效率和准确性。 权利要求书2页 说明书9页 附图3页 CN 113779182 B 2022.02.15 CN 113779182 B 1.一种从文本数据抽取事 件的方法, 其特 征在于, 所述方法包括: 获取文本数据; 基于所述文本数据, 确定所述文本数据的第一特征序列, 其中, 所述第 一特征序列包括 字符的在所述文本数据中的序列位置信息以及与所述文本数据中的每个字符对应的第一 特征向量, 每个第一特征向量包括多个第一特征元素, 所述第一特征元素表示字符在多个 事件中的每 个事件的事件要素中的预定位置的概 率; 对所述第一特 征序列中的每 个第一特 征向量的第一特 征元素进行二 值标记; 基于标记后的第一特 征序列, 对所述文本数据中的事 件进行抽取, 其中, 基于标记后的第一特 征序列, 对所述文本数据中的事 件进行抽取的步骤 包括: 基于标记后的第一特征序列, 针对所述多个事件中的每个事件, 提取通过二值标记被 赋值为第一值的第一特征元素作为第二特征元素, 以获得针对每个事件的第二特征序列, 其中, 所述第二特 征序列包括所述第二特 征元素以及对应的字符的序列位置信息; 基于所述第二特 征序列, 对所述文本数据中的事 件进行抽取, 其中, 所述第二特征元素表示在单个事件中字符出现在事件要素中的预定位置, 每个 第二特征序列包含单个事件中所有事件要 素的预定位置处的字符的序列位置信息, 每个事 件对应有一个第二特 征序列。 2.根据权利要求1所述的方法, 其特征在于, 对所述第 一特征序列中的每个第 一特征向 量的第一特 征元素进行二 值标记的步骤 包括: 将所述第一特征序列中的每个第一特征向量的每个第一特征元素和预设阈值进行比 较; 当所述第一特 征元素大于所述预设阈值时, 将所述第一特 征元素赋值为第一值; 当所述第一特征元素小于或等于所述预设阈值时, 将所述第一特征元素赋值为第二 值。 3.根据权利要求2所述的方法, 其特征在于, 所述预定位置包括事件要素的开始字符位 置和结束字符位置, 基于所述第二特 征序列, 对所述文本数据中的事 件进行抽取的步骤 包括: 基于所述第二特征序列, 针对事件中的每个事件要素, 确定事件要素的与表示开始字 符位置的第二特征元素所对应的开始字符以及与表示结束字符位置的第二特征元素所对 应的结束字符; 基于所述 开始字符和所述结束字符, 对所述文本数据中的事 件进行抽取。 4.根据权利要求3所述的方法, 其特征在于, 基于所述开始字符和所述结束字符, 对所 述文本数据中的事 件进行抽取, 包括: 针对每个事件要素, 基于所述开始字符、 所述结束字符以及所述序列位置信息, 抽取在 所述开始字符与所述结束字符 之间的所有字符作为中间字符; 基于所述开始字符、 所述结束字符和所述中间字符, 确定组成所述文本数据中的每个 事件的每个事件要素的字符组合, 以从文本数据抽取 所述多个事 件中的每 个事件。 5.根据权利要求1至4中任一项所述的方法, 其特征在于, 所述第一特征向量的维度通 过事件的数量、 事件要素 的数量以及所述预定位置的数量来确定, 所述事件要素包括触发 词和事件论元, 所述事 件论元包括主体、 客体、 时间、 地 点、 原因中的至少一 者。权 利 要 求 书 1/2 页 2 CN 113779182 B 26.根据权利要求5所述的方法, 其特征在于, 所述预定位置包括事件要素参考位置、 中 间字符位置及无关字符位置, 所述第一特征向量的维度通过事件的数量、 事件要素 的数量 与事件要素参考位置的数量相乘得到的结果加上中间字符位置的数量和无关字符位置的 数量而获得。 7.一种从文本数据抽取事 件的装置, 其特 征在于, 所述装置包括: 获取单元, 获取文本数据; 处理单元, 基于所述文本数据, 确定所述文本数据的第一特征序列, 其中, 所述第一特 征序列包括字符的在所述文本数据中的序列位置信息以及与所述文本数据中的每个字符 对应的第一特征向量, 每个第一特征向量包括多个第一特征元素, 所述第一特征元素表示 字符在多个事 件中的每 个事件的事件要素中的预定位置的概 率; 标记单元, 对所述第一特征序列中的每个第一特征向量的第一特征元素进行二值标 记; 抽取单元, 基于标记后的第一特 征序列, 对所述文本数据中的事 件进行抽取, 其中, 基于标记后的第一特 征序列, 对所述文本数据中的事 件进行抽取的操作包括: 基于标记后的第一特征序列, 针对所述多个事件中的每个事件, 提取通过二值标记被 赋值为第一值的第一特征元素作为第二特征元素, 以获得针对每个事件的第二特征序列, 其中, 所述第二特 征序列包括所述第二特 征元素以及对应的字符的序列位置信息; 基于所述第二特 征序列, 对所述文本数据中的事 件进行抽取, 其中, 所述第二特征元素表示在单个事件中字符出现在事件要素中的预定位置, 每个 第二特征序列包含单个事件中所有事件要 素的预定位置处的字符的序列位置信息, 每个事 件对应有一个第二特 征序列。 8.一种电子设备, 其特 征在于, 所述电子设备包括: 处理器; 存储器, 存储有计算机程序, 当所述计算机程序被处理器执行时, 实现根据权利要求1 至6中的任一项所述的从文本数据抽取事 件的方法。 9.一种存储有计算机程序的计算机可读存储介质, 其特征在于, 当所述计算机程序被 处理器执行时, 实现根据权利要求1至 6中的任一项所述的从文本数据抽取事 件的方法。权 利 要 求 书 2/2 页 3 CN 113779182 B 3
专利 从文本数据抽取事件的方法及装置
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 19:01:16
上传分享
举报
下载
原文档
(559.9 KB)
分享
友情链接
Microsoft SDL 简化实施 2010 中文版.pdf
GM-T 0002-2012 SM4分组密码算法.pdf
GB-T 41255-2022 智能工厂 通用技术要求.pdf
DB11-T 1231-2015 燃气工业锅炉节能监测 北京市.pdf
ISO IEC 38505-1 中文版.pdf
GB-T 6434-2022 饲料中粗纤维的含量测定.pdf
GB-T 2585-2021 铁路用热轧钢轨.pdf
数据安全事件管理办法.pdf
GB-T 37002-2018 信息安全技术 电子邮件系统安全技术要求.pdf
GB-T 35010.3-2018 半导体芯片产品 第3部分:操作、包装和贮存指南.pdf
ISO IEC 20924 2024 Internet of Things (IoT) and digital twin — Vocabulary.pdf
GB-T 30287.3-2013 卫星定位船舶信息服务系统 第3部分:信息安全规范.pdf
GB-T 34534-2017 焦炭 灰成分含量的测定 X射线荧光光谱法.pdf
GB-T 3883.1-2014 手持式、可移式电动工具和园林工具的安全 第1部分:通用要求.pdf
GB-T 36341.1-2018 信息技术 形状建模信息表示 第1部分:框架和基本组件.pdf
GB-T 31496-2015 - ISO 27003-2010 信息技术 安全技术 信息安全管理体系实施指南 .pdf
GB-T 17245-2004 成年人人体惯性参数.pdf
奇安信 天眼新一代威胁感知系统产品白皮书 2020.pdf
T-CCIASD 10005—2023 集装箱结构有限元分析指南.pdf
DB53-T 1175-2023 网络视频“明厨亮灶”系统运维规范 云南省.pdf
1
/
3
15
评价文档
赞助2.5元 点击下载(559.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。