说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111659837.3 (22)申请日 2021.12.31 (71)申请人 北京华彬立成科技有限公司 地址 102200 北京市昌平区科技园区超前 路37号院16号楼 2层C2040 (72)发明人 周立运  (51)Int.Cl. G06F 16/2458(2019.01) G06F 16/28(2019.01) G06N 20/00(2019.01) (54)发明名称 技术圈信息的挖掘方法、 装置、 电子设备和 存储介质 (57)摘要 本发明提供一种技术圈信息的挖掘方法、 装 置、 电子设备和存储介质, 其中方法包括: 基于待 挖掘的技术文本, 在符合预设技术领域的文本上 标记对应的技术标签; 基于待挖掘的技术文本, 获取各文本对应的作者信息、 作者所属机构信 息; 将获取的所述技术标签、 作者信息及机构信 息进行映射式耦合, 得到标准化的技术圈信息 集。 本发明提供的方法、 装置、 电子设备和存储介 质, 建立清晰、 准确且完整的技术圈信息映射关 系, 有利于用户快速聚焦锁定目标技术路线, 并 快速获取技术背后的关键技术人员和机构, 提高 了技术圈信息集的可用性。 权利要求书2页 说明书9页 附图4页 CN 114357026 A 2022.04.15 CN 114357026 A 1.一种技 术圈信息的挖掘方法, 其特 征在于, 包括: 基于待挖掘的技 术文本, 在符合预设技 术领域的文本上 标记对应的技 术标签; 基于待挖掘的技 术文本, 获取 各文本对应的作者信息、 作者所属机构信息; 将获取的所述技术标签、 作者信息及机构信息进行映射式耦合, 得到标准化的技术圈 信息集。 2.根据权利要求1所述的技术圈信 息的挖掘方法, 其特征在于, 所述在符合预设技术领 域的文本上 标记对应的技 术标签, 包括: 获取目标 领域技术文本; 预先构建所述目标 领域下对应的所述预设技 术领域的技 术标签; 基于所述预 先构建的技 术标签, 对所述目标 领域技术文本标记对应的技 术标签。 3.根据权利要求2所述的技术圈信息的挖掘方法, 其特征在于, 将获取的所述技术标 签、 作者信息及机构信息进行映射式耦合, 包括: 基于目标技 术标签对应的技 术文本, 获取排名超过 预设阈值的作者信息; 获取目标作者在目标技术标签下对应的所有技术文本下的关联作者信息和关联机构 信息; 基于所述目标技 术标签、 目标作者、 关联作者信息及关联机构信息构成映射关系。 4.根据权利要求2所述的技术圈信息的挖掘方法, 其特征在于, 将获取的所述技术标 签、 作者信息、 所属机构信息进行映射式耦合, 还 包括: 基于目标技 术标签对应的技 术文本, 获取排名超过 预设阈值的机构信息; 获取目标机构信息在目标技术标签下对应的所有技术文本下的关联机构信息和关联 作者信息; 基于所述目标技 术标签、 目标机构、 关联机构信息及关联作者信息构成映射关系。 5.根据权利要求3或4中任意一项所述的技术圈信息的挖掘方法, 其特征在于, 所述排 名超过预设阈值的计算方法, 包括: 获取技术文本的评估分数; 基于所述评估分数, 获取目标作者或目标机构在目标技术标签下对应的技术文本的评 估分数总和; 基于评估分数总和, 对作者和/或机构进行倒序排列, 获取排名超过预设阈值的作者 和/或机构。 6.根据权利要求5所述的技术圈信 息的挖掘方法, 其特征在于, 所述标准化的技术圈信 息集, 包括: 获取技 术文本发表时间信息; 基于技术标签、 时间信 息、 排名超过预设阈值的作者信 息、 排名超过预设阈值的机构信 息、 关联作者信息、 关联机构信息共同构成标准 化的技术圈信息集。 7.根据权利要求6所述的技术圈信 息的挖掘方法, 其特征在于, 所述标准化的技术圈信 息集, 在应用时: 输入技术标签、 作者信息及机构信息中至少一个信息; 即可获得至少包括含有技术标签、 排名超过预设阈值的作者信息、 排名超过预设阈值 的机构信息、 关联作者信息、 关联机构信息、 时间信息中的至少一个映射关系。 8.一种技 术圈信息挖掘装置, 其特 征在于, 包括:权 利 要 求 书 1/2 页 2 CN 114357026 A 2第一信息获取模块: 基于待挖掘的技术文本, 在符合预设技术领域的文本上标记对应 的技术标签; 第二信息获取模块: 基于待挖掘的技术文本, 获取各文本对应的作者信息、 作者所属机 构信息; 信息存储模块: 将获取的所述技术标签、 作者信息及机构信 息进行映射式耦合, 得到标 准化的技术圈信息集。 9.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至7任一项所 述技术圈信息挖掘方法的步骤。 10.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算 机程序被处 理器执行时实现如权利要求1至7任一项所述 技术圈信息挖掘方法的步骤。权 利 要 求 书 2/2 页 3 CN 114357026 A 3

.PDF文档 专利 技术圈信息的挖掘方法、装置、电子设备和存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 技术圈信息的挖掘方法、装置、电子设备和存储介质 第 1 页 专利 技术圈信息的挖掘方法、装置、电子设备和存储介质 第 2 页 专利 技术圈信息的挖掘方法、装置、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:31:39上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。