专利 图生成方法、装置、设备和存储介质

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111386176.1 (22)申请日 2021.11.22 (71)申请人北京百度网讯科技有限公司地址 100085 北京市海淀区上地十街10号百度大厦2层 (72)发明人李旭　吴越　孙明明　李平　 (74)专利代理机构北京鸿德海业知识产权代理有限公司 1 1412 代理人田宏宾 (51)Int.Cl. G06F 16/901(2019.01) G06F 16/36(2019.01) G06N 5/00(2006.01) G06N 20/00(2019.01) G16C 20/50(2019.01) (54)发明名称图生成方法、装置、设备和存储介质 (57)摘要本公开提供了一种图生成方法、装置、设备和存储介质，涉及计算机领域，具体涉及博弈搜索、机器学习、自然语言理解、知识图谱等人工智能领域。图生成方法包括：基于目标对象的表示序列，确定所述目标对象的表示图的顶点的顶点信息；基于搜索树，确定所述表示图的边的边信息；基于所述顶点信息和所述边信息，生成所述表示图。本公开可以提高图生成效果。权利要求书3页说明书11页附图6页 CN 114329083 A 2022.04.12 CN 114329083 A 1.一种图生成方法，包括：基于目标对象的表示序列，确定所述目标对象的表示图的顶点的顶点信息；基于搜索树，确定所述表示图的边的边信息；基于所述顶点信息和所述边信息，生成所述表示图。 2.根据权利要求1所述的方法，其中，所述边信息在至少一个决策阶段确定，所述方法还包括：将所述至少一个决策阶段中的各个决策阶段分别作为当前决策阶段，构建所述当前决策阶段的最终搜索树，所述当前决策阶段用以确定当前顶点的出边的边信息，所述当前顶点为所述表示图中存在出边的顶点，所述出边是以所述当前顶点为起点的边；所述基于搜索树，确定所述表示图的边的边信息，包括：基于所述当前决策阶段的最终搜索树，确定所述当前顶点的出边的边信息。 3.根据权利要求2所述的方法，其中，所述构建所述当前决策阶段的最终搜索树，包括：获取所述当前决策阶段的初始搜索树，所述初始搜索树包括根结点，所述根结点对应所述当前顶点的入边的边信息，所述入边是以所述当前顶点为终点的边；将所述初始搜索树作为第一次迭代过程的待更新搜索树，执行至少一次的迭代过程，以获得最后一次迭代过程的更新后的搜索树，将所述最后一次迭代过程的更新后的搜索树作为所述最终搜索树。 4.根据权利要求3所述的方法，其中，所述执行至少一次的迭代过程，包括执行各次迭代过程，所述执行各次迭代过程包括：针对所述各次迭代过程的待更新搜索树，从所述待更新搜索树的根结点开始，依次选择子结点，直至到达所述待更新搜索树中的待扩展子结点，并生成选择路径，所述选择路径上的结点为所述依次选择的子结点；针对所述待扩展子结点，生成新的子结点；对所述新的子结点进行仿真，以获得所述新的子结点的仿真结果；基于所述新的子结点的仿真信息，对所述选择路径上的结点的结点信息进行更新，以获得所述各次迭代过程的更新后的搜索树。 5.根据权利要求 4所述的方法，其中，所述结点信息包括：收益信息和遍历次数；所述对所述新的子结点进行仿真，以获得所述新的子结点的仿真结果，包括：将所述当前边信息输入收益网络中进行处理，以输出所述新的结点的仿真结果，所述仿真结果包括所述新的结点的当前收益值；所述基于所述仿真结果，对所述选择路径上的结点的结点信息进行更新，包括：将所述遍历次数增加1，以及，基于所述当前收益值以及更新后的遍历次数，更新所述收益信息。 6.根据权利要求2所述的方法，其中，所述基于所述当前决策阶段的最终搜索树，确定所述当前顶点的出边的边信息，包括：将所述最终搜索树的根结点的子结点的结点信息输入策略网络中进行处理，以获得网络输出；基于所述网络输出，确定所述当前顶点的出边的边信息。权　利　要　求　书 1/3 页 2 CN 114329083 A 27.根据权利要求6所述的方法，其中，所述基于所述网络输出，确定所述当前顶点的出边的边信息，包括：将所述网络输出作为所述当前顶点的出边的边信息；或者，基于推理组件，获得所述网络输出中符合所述目标对象的图规则的边信息，作为所述当前顶点的出边的边信息。 8.一种图生成装置，包括：第一确定模块，用于基于目标对象的表示序列，确定所述目标对象的表示图的顶点的顶点信息；第二确定模块，用于基于搜索树，确定所述表示图的边的边信息；生成模块，用于基于所述顶点信息和所述边信息，生成所述表示图。 9.根据权利要求8所述的装置，其中，所述边信息在至少一个决策阶段确定，所述装置还包括：构建模块，用于将所述至少一个决策阶段中的各个决策阶段分别作为当前决策阶段，构建所述当前决策阶段的最终搜索树，所述当前决策阶段用以确定当前顶点的出边的边信息，所述当前顶点为所述表示图中存在出边的顶点，所述出边是以所述当前顶点为起点的边；所述第二确定模块进一步用于：基于所述当前决策阶段的最终搜索树，确定所述当前顶点的出边的边信息。 10.根据权利要求9所述的装置，其中，所述构建模块包括：获取单元，用于获取所述当前决策阶段的初始搜索树，所述初始搜索树包括根结点，所述根结点对应所述当前顶点的入边的边信息，所述入边是以所述当前顶点为终点的边；更新单元，用于将所述初始搜索树作为第一次迭代过程的待更新搜索树，执行至少一次的迭代过程，以获得最后一次迭代过程的更新后的搜索树，将所述最后一次迭代过程的更新后的搜索树作为所述最终搜索树。 11.根据权利要求10所述的装置，其中，所述执行至少一次的迭代过程，包括执行各次迭代过程，所述更新单元进一步用于：针对所述各次迭代过程的待更新搜索树，从所述待更新搜索树的根结点开始，依次选择子结点，直至到达所述待更新搜索树中的待扩展子结点，并生成选择路径，所述选择路径上的结点为所述依次选择的子结点；针对所述待扩展子结点，生成新的子结点；对所述新的子结点进行仿真，以获得所述新的子结点的仿真结果；基于所述新的子结点的仿真信息，对所述选择路径上的结点的结点信息进行更新，以获得所述各次迭代过程的更新后的搜索树。 12.根据权利要求1 1所述的装置，其中，所述结点信息包括：收益信息和遍历次数；所述更新单元进一步用于：将所述当前边信息输入收益网络中进行处理，以输出所述新的结点的仿真结果，所述仿真结果包括所述新的结点的当前收益值；将所述遍历次数增加1，以及，基于所述当前收益值以及更新后的遍历次数，更新所述权　利　要　求　书 2/3 页 3 CN 114329083 A 3

专利 图生成方法、装置、设备和存储介质

专利图生成方法、装置、设备和存储介质