说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111386176.1 (22)申请日 2021.11.22 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 李旭 吴越 孙明明 李平  (74)专利代理 机构 北京鸿德 海业知识产权代理 有限公司 1 1412 代理人 田宏宾 (51)Int.Cl. G06F 16/901(2019.01) G06F 16/36(2019.01) G06N 5/00(2006.01) G06N 20/00(2019.01) G16C 20/50(2019.01) (54)发明名称 图生成方法、 装置、 设备和存 储介质 (57)摘要 本公开提供了一种图生成方法、 装置、 设备 和存储介质, 涉及计算机领域, 具体涉及博弈搜 索、 机器学习、 自然语 言理解、 知 识图谱等人工智 能领域。 图生成方法包括: 基于目标对象的表示 序列, 确定所述目标对象 的表示图的顶点的顶点 信息; 基于搜索树, 确定所述表示图的边的边信 息; 基于所述顶点信息和所述边信息, 生成所述 表示图。 本公开可以提高图生成效果。 权利要求书3页 说明书11页 附图6页 CN 114329083 A 2022.04.12 CN 114329083 A 1.一种图生成方法, 包括: 基于目标对象的表示序列, 确定所述目标对象的表示图的顶点的顶点信息; 基于搜索树, 确定所述表示图的边的边信息; 基于所述顶点信息和所述 边信息, 生成所述表示图。 2.根据权利要求1所述的方法, 其中, 所述边信息在至少一个决策阶段确定, 所述方法 还包括: 将所述至少一个决策阶段中的各个决策阶段分别作为当前 决策阶段, 构建所述当前 决 策阶段的最终搜索树, 所述当前决策阶段用以确定当前顶点的出边的边信息, 所述当前顶 点为所述表示图中存在出边的顶点, 所述出边是以所述当前顶点 为起点的边; 所述基于 搜索树, 确定所述表示图的边的边信息, 包括: 基于所述当前决策阶段的最终搜索树, 确定所述当前顶点的出边的边信息 。 3.根据权利要求2所述的方法, 其中, 所述构建所述当前决策阶段的最终搜索树, 包括: 获取所述当前决策阶段的初始搜索树, 所述初始搜索树包括根结点, 所述根结点对应 所述当前顶点的入边的边信息, 所述入边是以所述当前顶点 为终点的边; 将所述初始搜索树作为第一次迭代过程的待更新搜索树, 执行至少一次的迭代过程, 以获得最后一次迭代过程的更新后的搜索树, 将所述最后一次迭代过程的更新后的搜索树 作为所述 最终搜索树。 4.根据权利要求3所述的方法, 其中, 所述执行至少一次的迭代过程, 包括执行各次迭 代过程, 所述执 行各次迭代过程包括: 针对所述各次迭代过程的待更新搜索树, 从所述待更新搜索树的根结点开始, 依次选 择子结点, 直至到达所述待 更新搜索树中的待扩展子结点, 并生成选择路径, 所述选择路径 上的结点 为所述依次选择的子结点; 针对所述待扩展子结点, 生成新的子结点; 对所述新的子结点进行仿真, 以获得 所述新的子结点的仿真结果; 基于所述新的子结点的仿真信息, 对所述选择路径上的结点的结点信息进行更新, 以 获得所述各次迭代过程的更新后的搜索树。 5.根据权利要求 4所述的方法, 其中, 所述结点信息包括: 收益信息和遍历次数; 所述对所述 新的子结点进行仿真, 以获得 所述新的子结点的仿真结果, 包括: 将所述当前边信息输入收益网络中进行处理, 以输出所述新的结点的仿真结果, 所述 仿真结果包括所述 新的结点的当前收益 值; 所述基于所述仿真结果, 对所述选择路径上的结点的结点信息进行 更新, 包括: 将所述遍历次数增加1, 以及, 基于所述当前收益值以及更新后的遍历次数, 更新所述 收益信息 。 6.根据权利要求2所述的方法, 其中, 所述基于所述当前决策阶段的最终搜索树, 确定 所述当前顶点的出边的边信息, 包括: 将所述最终搜索树的根结点的子结点的结点信 息输入策略网络中进行处理, 以获得网 络输出; 基于所述网络 输出, 确定所述当前顶点的出边的边信息 。权 利 要 求 书 1/3 页 2 CN 114329083 A 27.根据权利要求6所述的方法, 其中, 所述基于所述网络输出, 确定所述当前顶点的出 边的边信息, 包括: 将所述网络 输出作为所述当前顶点的出边的边信息; 或者, 基于推理组件, 获得所述网络输出中符合所述目标对象的图规则的边信息, 作为所述 当前顶点的出边的边信息 。 8.一种图生成装置, 包括: 第一确定模块, 用于基于目标对象的表示序列, 确定所述目标对象的表示图的顶点的 顶点信息; 第二确定模块, 用于基于 搜索树, 确定所述表示图的边的边信息; 生成模块, 用于基于所述顶点信息和所述 边信息, 生成所述表示图。 9.根据权利要求8所述的装置, 其中, 所述边信息在至少一个决策阶段确定, 所述装置 还包括: 构建模块, 用于将所述至少一个决策阶段中的各个决策阶段分别作为当前决策阶段, 构建所述当前决策阶段的最 终搜索树, 所述当前决策阶段用以确定 当前顶点的出边的边信 息, 所述当前顶点为所述表示图中存在出边的顶点, 所述出边是以所述当前顶点为起点的 边; 所述第二确定模块进一步用于: 基于所述当前决策阶段的最终搜索树, 确定所述当前 顶点的出边的边信息 。 10.根据权利要求9所述的装置, 其中, 所述构建模块包括: 获取单元, 用于获取所述当前决策阶段的初始搜索树, 所述初始搜索树包括根结点, 所 述根结点对应所述当前顶点的入边的边信息, 所述入边是以所述当前顶点 为终点的边; 更新单元, 用于将所述初始搜索树作为第一次迭代过程的待更新搜索树, 执行至少一 次的迭代过程, 以获得最后一次迭代过程的更新后的搜索树, 将所述最后一次迭代过程的 更新后的搜索树作为所述 最终搜索树。 11.根据权利要求10所述的装置, 其中, 所述执行至少一次的迭代过程, 包括执行各次 迭代过程, 所述更新单 元进一步用于: 针对所述各次迭代过程的待更新搜索树, 从所述待更新搜索树的根结点开始, 依次选 择子结点, 直至到达所述待 更新搜索树中的待扩展子结点, 并生成选择路径, 所述选择路径 上的结点 为所述依次选择的子结点; 针对所述待扩展子结点, 生成新的子结点; 对所述新的子结点进行仿真, 以获得 所述新的子结点的仿真结果; 基于所述新的子结点的仿真信息, 对所述选择路径上的结点的结点信息进行更新, 以 获得所述各次迭代过程的更新后的搜索树。 12.根据权利要求1 1所述的装置, 其中, 所述结点信息包括: 收益信息和遍历次数; 所述更新单 元进一步用于: 将所述当前边信息输入收益网络中进行处理, 以输出所述新的结点的仿真结果, 所述 仿真结果包括所述 新的结点的当前收益 值; 将所述遍历次数增加1, 以及, 基于所述当前收益值以及更新后的遍历次数, 更新所述权 利 要 求 书 2/3 页 3 CN 114329083 A 3

.PDF文档 专利 图生成方法、装置、设备和存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图生成方法、装置、设备和存储介质 第 1 页 专利 图生成方法、装置、设备和存储介质 第 2 页 专利 图生成方法、装置、设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:01:28上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。