说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111284302.2 (22)申请日 2021.11.01 (71)申请人 上海交通大 学 地址 200240 上海市闵行区东川路80 0号 (72)发明人 陈全 白铠豪 (74)专利代理 机构 上海光华专利事务所(普通 合伙) 31219 代理人 庞红芳 (51)Int.Cl. G06N 20/00(2019.01) G06F 9/48(2006.01) G06F 9/54(2006.01) G06F 9/52(2006.01) (54)发明名称 基于双层索引嵌入层的推荐模型分布式训 练方法及GPU (57)摘要 本发明提供一种基于双层索引嵌入层的推 荐模型分布式训练方法及GPU, 所述方法包括: 于 服务器节点和计算节点对于嵌入层向量分别构 造两层索引, 其中, 所述服务器节点内为静态索 引, 所述计算节点内为动态索引; 在所述服务器 节点引入采样器, 根据采样数据制定分片策略; 在所述计算节点引入乒乓缓冲区读取和写入嵌 入层向量, 并基于相邻迭代的输入 预取所述嵌入 层向量, 形成数据预取流水线。 本发明能够在确 保模型预测性能不下降的前提下, 提升了推荐模 型训练的总吞吐量, 增强了分布式训练的可扩展 性, 有效地支持大规模嵌入层推荐 模型的训练。 权利要求书2页 说明书6页 附图2页 CN 114021736 A 2022.02.08 CN 114021736 A 1.一种基于双 层索引嵌入层的推荐模型分布式训练方法, 其特 征在于: 所述方法包括: 于服务器节点和计算节点对于嵌入层 向量分别构造两层索引, 其中, 所述服务器节点 内为静态索引, 所述计算节点内为动态索引; 在所述服务器节点引入 采样器, 根据采样数据制定分片策略; 在所述计算节点引入乒乓缓冲区读取和写入嵌入层向量, 并基于相邻迭代的输入预取 所述嵌入层向量, 形成数据预 取流水线。 2.根据权利要求1所述的基于双层索引嵌入层的推荐模型分布式训练方法, 其特征在 于: 所述于服 务器节点和计算节点对于嵌入层向量分别构造 两层索引包括: 通过参数服务器架构将完整的嵌入层初始化在服务器节点, 并在服务器节点构造第 一 层索引用于嵌入层的参数同步更新; 在计算节点内预分配与输入维度和计算节点内工作节点个数相关的显存空间, 在每个 迭代周期聚合各工作节点的输入动态构造第二层 索引以支持 嵌入层计算。 3.根据权利要求1或2所述的基于双层索引嵌入层的推荐模型分布式训练方法, 其特征 在于: 还包括: 基于索引结构的通信方式配置: 所述在计算节点内先聚合各工作节点的输 入, 并初始化 通信缓冲区代替工作节点与服 务器节点 通信。 4.根据权利要求1所述的基于双层索引嵌入层的推荐模型分布式训练方法, 其特征在 于: 所述根据采样数据制定分片策略包括: 采样器根据采样规则对训练集进行采样得到嵌入层的访问频率; 再通过预先设定的阈值筛 选出嵌入层热点 参数, 并通过 热点位图记录热点 参数; 根据热点参数的访问频率, 通过可更换的热点感知 分片策略在各服务器节点再次将热 点参数初始化, 建立嵌入层 索引到服 务器节点的分片映射表; 在训练时基于所述热点位图判断当前嵌入向量是否为热点参数, 若是则根据 所述分片 映射表拉取和更新嵌入向量, 并旁路原有映射。 5.根据权利要求1所述的基于双层索引嵌入层的推荐模型分布式训练方法, 其特征在 于: 所述在所述计算节点引入乒乓缓冲区读取和写入嵌入层向量包括: 根据预设的输入维度建立乒乓缓冲区, 包 含可读缓冲区和可写缓冲区; 可读缓冲区服务于当前迭代的嵌入层计算, 可写缓冲区基于下一迭代的输入写入对应 的嵌入层向量。 6.根据权利要求5所述的基于双层索引嵌入层的推荐模型分布式训练方法, 其特征在 于: 所述数据预取流水线根据当前迭代和下一迭代的输入提前拉取未被更新的嵌入层向 量。 7.根据权利要求6所述的基于双层索引嵌入层的推荐模型分布式训练方法, 其特征在 于: 所述数据预 取流水线的过程包括: 计算节点内各工作节点 时, 首先读入当前迭代的输入以构造对应的第 二层索引放入可 读缓冲区, 再读入下一迭代的输入以构造索引放入可写缓冲区; 在与服务器节点通信时, 拉取可读缓冲区中所有索引对应的嵌入向量放入可读缓冲区 并开始模型计算; 在模型计算时, 启动通信线程与服务器节点第二次通信, 向服务器节点请求可写缓冲 区中未被访问的索引。权 利 要 求 书 1/2 页 2 CN 114021736 A 28.根据权利要求7所述的基于双层索引嵌入层的推荐模型分布式训练方法, 其特征在 于: 所述服务器节 点对第一次通信计数, 当通信数等于工作 节点数时, 允许处理各工作 节点 的第二次通信; 之后, 所述服务器节 点查看访问位图判断是否在前一迭代中访问, 返回其中 没被访问的嵌入层参数, 并对第二次通信计数, 等于 工作节点数时将位图重 置。 9.根据权利要求1所述的基于双层索引嵌入层的推荐模型分布式训练方法, 其特征在 于: 所述计算节点的通信线程在第二次通信过程中持有锁, 直到下一迭代请求返回未被访 问的嵌入层并拷贝到可写缓冲区中对应位置后才释放, 且下一次迭代的计算需等待锁释放 才可进行。 10.一种GPU, 其特征在于: 所述GPU应用如权利要求1至权利要求10任一权利要求所述 的基于双 层索引嵌入层的推荐模型分布式训练方法。权 利 要 求 书 2/2 页 3 CN 114021736 A 3
专利 基于双层索引嵌入层的推荐模型分布式训练方法及GPU
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 19:01:42
上传分享
举报
下载
原文档
(455.6 KB)
分享
友情链接
ISO27002-2022 信息技术 网络安全与隐私保护 信息安全控制.pdf
NB-T 10936-2022 电加热锅炉技术条件.pdf
T-CIIA 023—2022 科学数据 云平台运维流程与要求.pdf
云计算服务安全评估申报书.pdf
DB52-T 1636.1-2021 机关事务云 第1部分:数据技术要求 贵州省.pdf
GB-T 39909-2021 科技计划形成的科学数据汇交 通用数据元.pdf
产品采购安全管理制度.pdf
穿越数据的迷宫扫描版.pdf
T-CNPHARS 0001—2023 个体化用药遗传咨询指南.pdf
GB-T 34658-2017 电动汽车非车载传导式充电机与电池管理系统之间的通信协议一致性测试.pdf
GB-T 17901.1-2020 信息技术 安全技术 密钥管理 第1部分:框架.pdf
SY-T 5974-2020 钻井井场设备作业安全技术规程.pdf
中国移动研究院 5G基站节能技术白皮书 2020.pdf
6-01-07-01 海盐制盐工.pdf
T-GHDQ 114—2022 车载CAN网络入侵检测和态势感知技术要求.pdf
GB-T 34095-2017 信息安全技术 用于电子支付的基于近距离无线通信的移动终端安全技术要求.pdf
GB-T 43388-2023 家用汽车产品严重安全性能故障判断指南.pdf
T-CEC 694—2022 变电站二次系统数字化设计编码规范.pdf
T-CPPC 1055—2022 全地形车 休闲项目技术规范.pdf
DB31-T 945.3-2020 节能服务业服务规范 第3部分:工业企业能源审计 上海市.pdf
1
/
3
11
评价文档
赞助2.5元 点击下载(455.6 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。