专利 图数据处理方法、装置、系统、电子设备及可读存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111676624.1 (22)申请日 2021.12.31 (71)申请人北京三快在线科技有限公司地址 100080 北京市海淀区北四环西路9号 2106-030 (72)发明人李旭　潘道儒　王超　 (74)专利代理机构北京润泽恒知识产权代理有限公司 1 1319 专利代理师庞静 (51)Int.Cl. G06N 20/00(2019.01) G06F 9/48(2006.01) (54)发明名称图数据处理方法、装置、系统、电子设备及可读存储介质 (57)摘要本发明实施例提供了一种图数据处理方法、装置、系统、电子设备及可读存储介质。该方法中，基于多个并行的处理进程分别从原始图数据中获取子图生成数据。对于任一处理进程，基于处理进程根据子图生成数据生成训练子图，将各处理进程生成的训练子图写入指定存储空间，以供图学习端从指定存储空间读取训练子图，并根据训练子图进行图深度学习。由于图计算端并行获取了多个训练子图并存入指定内存空间，这样，一定程度上可以确保图学习端在需要进行图深度学习的任意时刻，基于指定内存空间即可获取到所需的训练子图，进而一定程度上可以确保图深度学习的整体效率。权利要求书2页说明书14页附图4页 CN 114444715 A 2022.05.06 CN 114444715 A 1.一种图数据处理方法，其特征在于，应用于图计算端，所述方法包括：基于多个并行的处理进程分别从原始图数据中获取子图生成数据；对于任一所述处理进程，基于所述处理进程根据所述子图生成数据生成训练子图；将各所述处理进程生成的训练子图写入指定存储空间，以供图学习端从所述指定存储空间读取所述训练子图，并根据所述训练子图进行图深度学习。 2.根据权利要求1所述方法，其特征在于，所述指定存储空间为预设队列集群中的存储空间；所述将各所述处理进程生成的训练子图写入指定存储空间，包括：将各所述训练子图作为第一队列元素，并写入预设队列集群中的第一队列；其中，所述预设队列集群分别与所述图计算端以及所述图学习端连接，所述第一队列位于所述预设队列集群中的存储空间。 3.根据权利要求2所述方法，其特征在于，所述将各所述训练子图作为第一队列元素，并写入预设队列集群中的第一队列，包括：在各所述处理进程生成所述训练子图之后，将各所述训练子图作为第二队列元素，并分别写入所述图计算端内部的第二队列；将所述第二队列中的第二队列元素，依次分批写入所述第一队列。 4.根据权利要求1所述方法，其特征在于，所述基于多个并行的处理进程分别从原始图数据中获取子图生成数据，包括：读取历史数据信息；所述历史数据信息用于表征生成历史训练子图时使用过的历史子图生成数据；根据所述历史数据信息，确定各所述处理进程所需读取的子图生成数据，并从所述原始图数据中读取所述子图生成数据；所述子图生成数据与所述历史子图生成数据存在差异。 5.根据权利要求4所述方法，其特征在于，所述基于所述处理进程根据所述子图生成数据生成训练子图之后，所述方法还包括：将所述训练子图使用的子图生成数据作为新的历史子图生成数据，并根据所述新的历史子图生成数据，确定目标信息；将所述目标信息添加至所述历史数据信息。 6.根据权利要求2所述方法，其特征在于，所述第一队列包括队列分区，所述图学习端包括多个处理节点，一个所述处理节点用于根据一个所述队列分区中存储的训练子图进行图深度学习；所述方法还包括：确定各所述队列分区中存储的训练子图的数量，得到参照数量；按照各所述队列分区的参照数量，对所述队列分区中存储的训练子图进行调整，以使调整后的各所述队列分区的参照数量之间的差值不大于预设阈值。 7.一种图数据处理方法，其特征在于，应用于图学习端，所述方法包括：从指定存储空间中读取训练子图；所述指定存储空间中存储的训练子图是图计算端基于多个并行的处理进程从原始图数据中读取子图生成数据，并基于所述子图生成数据生成的；根据读取到的所述训练子图进行图深度学习。权　利　要　求　书 1/2 页 2 CN 114444715 A 28.根据权利要求7所述方法，其特征在于，所述指定存储空间对应预设队列集群中的第一队列；所述从指定存储空间中读取训练子图，包括：从所述第一队列的队列消费端游标当前所指向的队列元素开始，依次读取M个队列元素，以作为所述训练子图；所述队列消费端游标用于指向最近一次从所述第一队列中读取过的队列元素；在所述队列消费端游标指向所述第一队列中的末位队列元素的情况下，对所述队列消费端游标进行回溯，以重复读取所述第一队列中队列元素，作为所述训练子图。 9.一种图数据处理方法，其特征在于，应用于包括图计算端以及图学习端的系统，所述方法包括：所述图计算端基于多个并行的处理进程分别从原始图数据中获取子图生成数据；所述图计算端基于各个所述处理进程，根据所述子图生成数据生成训练子图；所述图计算端将各所述处理进程生成的训练子图写入指定存储空间；所述图学习端从所述指定存储空间中读取所述训练子图；所述图学习端根据读取到的所述训练子图进行图深度学习。 10.一种图数据处理装置，其特征在于，应用于图计算端，所述装置包括：获取模块，用于基于多个并行的处理进程分别从原始图数据中获取子图生成数据；生成模块，用于对于任一所述处理进程，基于所述处理进程根据所述子图生成数据生成训练子图；写入模块，用于将各所述处理进程生成的训练子图写入指定存储空间，以供图学习端从所述指定存储空间读取所述训练子图，并根据所述训练子图进行图深度学习。 11.一种图数据处理装置，其特征在于，应用于图学习端，所述装置包括：读取模块，用于从指定存储空间中读取训练子图；所述指定存储空间中存储的训练子图是图计算端基于多个并行的处理进程从原始图数据中读取子图生成数据，并基于所述子图生成数据生成的；学习模块，用于根据读取到的所述训练子图进行图深度学习。 12.一种图数据处理系统，其特征在于，所述系统包括图计算端以及图学习端；所述图计算端，用于基于多个并行的处理进程分别从原始图数据中获取子图生成数据；所述图计算端，用于基于各个所述处理进程，根据所述子图生成数据生成训练子图；所述图计算端，用于将各所述处理进程生成的训练子图写入指定存储空间；所述图学习端，用于从所述指定存储空间中读取所述训练子图；所述图学习端，用于根据读取到的所述训练子图进行图深度学习。 13.一种电子设备，其特征在于，包括：处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1 ‑9中一个或多个所述的方法。 14.一种可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行权利要求1 ‑9中一个或多个所述的方法。权　利　要　求　书 2/2 页 3 CN 114444715 A 3

专利 图数据处理方法、装置、系统、电子设备及可读存储介质

专利图数据处理方法、装置、系统、电子设备及可读存储介质