说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111676624.1 (22)申请日 2021.12.31 (71)申请人 北京三快在线科技有限公司 地址 100080 北京市海淀区北四环西路9号 2106-030 (72)发明人 李旭 潘道儒 王超  (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 专利代理师 庞静 (51)Int.Cl. G06N 20/00(2019.01) G06F 9/48(2006.01) (54)发明名称 图数据处理方法、 装置、 系统、 电子设备及可 读存储介质 (57)摘要 本发明实施例提供了一种图数据处理方法、 装置、 系统、 电子设备及可读存储介质。 该方法 中, 基于多个并行的处理进程分别从原始图数据 中获取子图生成数据。 对于任一处理进程, 基于 处理进程根据子图生成数据生 成训练子图, 将各 处理进程生成的训练子图写入指定存储空间, 以 供图学习端从指定存储空间读取训练子图, 并根 据训练子图进行图深度学习。 由于图计算端并行 获取了多个训练子图并存入指定内存空间, 这 样, 一定程度上可以确保图学习端在需要进行图 深度学习的任意时刻, 基于指定内存空间即可获 取到所需的训练子图, 进而一定程度上可以确保 图深度学习的整体效率。 权利要求书2页 说明书14页 附图4页 CN 114444715 A 2022.05.06 CN 114444715 A 1.一种图数据处 理方法, 其特 征在于, 应用于图计算端, 所述方法包括: 基于多个并行的处 理进程分别从原 始图数据中获取子图生成数据; 对于任一所述处 理进程, 基于所述处 理进程根据所述子图生成数据生成训练子图; 将各所述处理进程生成的训练子图写入指定存储空间, 以供图学习 端从所述指定存储 空间读取 所述训练子图, 并根据所述训练子图进行图深度学习。 2.根据权利要求1所述方法, 其特征在于, 所述指定存储空间为预设队列集群中的存储 空间; 所述将各 所述处理进程生成的训练子图写入指定存 储空间, 包括: 将各所述训练子图作为第一队列元 素, 并写入预设队列集群中的第一队列; 其中, 所述预设 队列集群分别与所述图计算端以及所述图学习端连接, 所述第一队列 位于所述预设队列集群中的存 储空间。 3.根据权利要求2所述方法, 其特征在于, 所述将各所述训练子 图作为第一队列元素, 并写入预设队列集群中的第一队列, 包括: 在各所述处理进程生成所述训练子 图之后, 将各所述训练子 图作为第二队列元素, 并 分别写入所述图计算端内部的第二队列; 将所述第二队列中的第二队列元 素, 依次分批写入所述第一队列。 4.根据权利要求1所述方法, 其特征在于, 所述基于多个并行的处理进程分别从原始图 数据中获取子图生成数据, 包括: 读取历史数据信 息; 所述历史数据信 息用于表征生成历史训练子图时使用过的历史子 图生成数据; 根据所述历史数据信息, 确定各所述处理进程所需读取的子 图生成数据, 并从所述原 始图数据中读取所述子图生成数据; 所述子图生成数据与所述历史子图生成数据存在差 异。 5.根据权利要求4所述方法, 其特征在于, 所述基于所述处理进程根据 所述子图生成数 据生成训练子图之后, 所述方法还 包括: 将所述训练子图使用的子图生成数据作为新的历史子图生成数据, 并根据所述新的历 史子图生成数据, 确定目标信息; 将所述目标信息添加至所述历史数据信息 。 6.根据权利要求2所述方法, 其特征在于, 所述第一队列包括队列分区, 所述图学习端 包括多个处理节点, 一个所述处理节点用于根据一个所述队列分区中存储的训练子图进 行 图深度学习; 所述方法还 包括: 确定各所述队列分区中存 储的训练子图的数量, 得到参照数量; 按照各所述队列分区的参照数量, 对所述队列分区中存储的训练子 图进行调整, 以使 调整后的各 所述队列分区的参照数量之间的差值 不大于预设阈值。 7.一种图数据处 理方法, 其特 征在于, 应用于图学习端, 所述方法包括: 从指定存储空间中读取训练子图; 所述指定存储空间中存储的训练子图是图计算端基 于多个并行的处理进程从原始图数据中读取子图生成数据, 并基于所述子图生成数据生成 的; 根据读取到的所述训练子图进行图深度学习。权 利 要 求 书 1/2 页 2 CN 114444715 A 28.根据权利要求7所述方法, 其特征在于, 所述指定存储空间对应预设队列集群中的第 一队列; 所述从指定存 储空间中读取训练子图, 包括: 从所述第一队列的队列消费端游标当前所指向的队列元素开始, 依次读取M个队列元 素, 以作为所述训练子图; 所述队列消费端游标用于指向最近一次从所述第一队列中读取 过的队列元 素; 在所述队列消费端游标指向所述第 一队列中的末位队列 元素的情况下, 对所述队列消 费端游标进行回溯, 以重复读取 所述第一队列中队列元 素, 作为所述训练子图。 9.一种图数据处理方法, 其特征在于, 应用于包括图计算端以及图学习 端的系统, 所述 方法包括: 所述图计算端基于多个并行的处 理进程分别从原 始图数据中获取子图生成数据; 所述图计算端基于各个所述处 理进程, 根据所述子图生成数据生成训练子图; 所述图计算端将各 所述处理进程生成的训练子图写入指定存 储空间; 所述图学习端从所述指定存 储空间中读取 所述训练子图; 所述图学习端根据读取到的所述训练子图进行图深度学习。 10.一种图数据处 理装置, 其特 征在于, 应用于图计算端, 所述装置包括: 获取模块, 用于基于多个并行的处 理进程分别从原 始图数据中获取子图生成数据; 生成模块, 用于对于任一所述处理进程, 基于所述处理进程根据所述子 图生成数据生 成训练子图; 写入模块, 用于将各所述处理进程生成的训练子 图写入指定存储空间, 以供图学习端 从所述指定存 储空间读取 所述训练子图, 并根据所述训练子图进行图深度学习。 11.一种图数据处 理装置, 其特 征在于, 应用于图学习端, 所述装置包括: 读取模块, 用于从指定存储空间中读取训练子 图; 所述指定存储空间中存储的训练子 图是图计算端基于多个并行的处理进程从原始图数据中读取子图生成数据, 并基于所述子 图生成数据生成的; 学习模块, 用于根据读取到的所述训练子图进行图深度学习。 12.一种图数据处 理系统, 其特 征在于, 所述系统包括图计算端以及图学习端; 所述图计算端, 用于基于多个并行的处理进程分别从原始图数据中获取子图生成数 据; 所述图计算端, 用于基于各个所述处 理进程, 根据所述子图生成数据生成训练子图; 所述图计算端, 用于将各 所述处理进程生成的训练子图写入指定存 储空间; 所述图学习端, 用于从所述指定存 储空间中读取 所述训练子图; 所述图学习端, 用于根据读取到的所述训练子图进行图深度学习。 13.一种电子设备, 其特 征在于, 包括: 处理器、 存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序, 其 特征在于, 所述处 理器执行所述程序时实现如权利要求1 ‑9中一个或多个所述的方法。 14.一种可读存储介质, 其特征在于, 当所述存储介质中的指令由电子设备的处理器执 行时, 使得电子设备能够执 行权利要求1 ‑9中一个或多个所述的方法。权 利 要 求 书 2/2 页 3 CN 114444715 A 3

.PDF文档 专利 图数据处理方法、装置、系统、电子设备及可读存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图数据处理方法、装置、系统、电子设备及可读存储介质 第 1 页 专利 图数据处理方法、装置、系统、电子设备及可读存储介质 第 2 页 专利 图数据处理方法、装置、系统、电子设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:31:19上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。