(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111633142.8
(22)申请日 2021.12.2 9
(71)申请人 上海智能网联汽车技 术中心有限公
司
地址 201499 上海市奉贤区金海公路6 055
号22幢
申请人 上海交通大 学
(72)发明人 李高磊 伍军 佟光辉 李建华
殷承良 于娜娜 胡勇庆
(74)专利代理 机构 上海科盛知识产权代理有限
公司 312 25
专利代理师 杨宏泰
(51)Int.Cl.
G06N 20/00(2019.01)
G06N 5/02(2006.01)G06K 9/62(2022.01)
(54)发明名称
基于梯度记忆的车联网联邦学习分层知识
安全迁移方法
(57)摘要
本发明涉及一种基于梯度记忆的车联网联
邦学习分层知识安全迁移方法, 该方法包括以下
步骤: 步骤1: 采用层次聚类算法对多个客户端进
行聚类, 获取多个独立同分布的集群, 以实现将
多个数据异质化的客户端合并为独立同分布的
集群; 步骤2: 建立基于分层集群架构的车联网联
邦学习模型; 步骤3: 采用基于梯度记忆的知识 迁
移联邦学习算法进行不同集群 之间的知识迁移,
以缓解分层集群架构中进行知识迁移的灾难性
遗忘问题, 与现有技术相比, 本发明具有减轻灾
难性遗忘的问题以及有效地提高模型收敛速度
和模型精度等优点。
权利要求书3页 说明书9页 附图3页
CN 114492833 A
2022.05.13
CN 114492833 A
1.一种基于梯度记忆的车联网联邦学习分层知识安全迁移方法, 其特征在于, 该方法
包括以下步骤:
步骤1: 采用层次聚类算法对多个客户端进行聚类, 获取多个独立同分布 的集群, 以实
现将多个数据异质化的客户端合并为独立同分布的集群;
步骤2: 建立基于分层集群架构的车 联网联邦学习模型;
步骤3: 采用基于梯度记忆的知识迁移联邦学习算法进行不同集群之间的知识迁移, 以
缓解分层集群架构中进行知识迁移的灾难性遗 忘问题。
2.根据权利要求1所述的一种基于梯度记忆的车联网联邦学习分层知识安全迁移方
法, 其特征在于, 所述的步骤1中, 层次聚类算法通过计算客户端之间的数据相似度将多个
客户端进行聚类, 自下而上不断将多个单一的集群聚合成为多个大 的集群, 即将非独立同
分布下的客户端划分为独立同分布的集群, 且分别位于不同的层级中, 形成树状的分层集
群结构, 采用层次聚类算法对多个客户端 进行聚类的过程具体包括以下步骤:
步骤101: 将数据集分配至各个客户端, 每 个客户端对应一个数据集, 即本地数据集;
步骤102: 初始时每个客户端的数据集分别作为单一的集群, 计算每个单一的集群之间
的距离, 并得到距离矩阵D;
步骤103: 遍历距离矩阵D, 获取距离矩阵D中的最小距离, 并得到最小距离的两个集群
的编号;
步骤104: 将最小距离的两个单一的集群聚类为一个新的集群, 并基于L ance‑Williams
法更新距离矩阵D, 即删除这两个集群对应的行和列, 并将根据新的集群计算得到的距离插
入距离矩阵D中;
步骤105: 当一个集群包含多个客户端时, 采用平均连接, 即选择两个集群之间距离的
平均值作为 集群之间的距离;
步骤106: 返回步骤10 3, 直至最终的距离矩阵D中的最小距离大于规定的距离门限。
3.根据权利要求2所述的一种基于梯度记忆的车联网联邦学习分层知识安全迁移方
法, 其特征在于, 所述的步骤102中, 给定两个客户端的数据集d1和数据集d2, 两个客户端的
数据集d1和数据集d2之间距离的计算公式为:
其中,
为根据耦合数据相似度定义的耦合属性值相似度, d1h和d2h分别为数据集d1和
数据集d2中的第h个样本, n 为样本的数量。
4.根据权利要求2所述的一种基于梯度记忆的车联网联邦学习分层知识安全迁移方
法, 其特征在于, 所述的步骤101中, 距离矩阵D的表达式为:
其中, Dqr为第q个客户端的数据集dq和第r个客户端的数据集dr之间的距离 。
5.根据权利要求1所述的一种基于梯度记忆的车联网联邦学习分层知识安全迁移方
法, 其特征在于, 所述的车 联网联邦学习模型的分层集群架构具体为:权 利 要 求 书 1/3 页
2
CN 114492833 A
2车联网联邦学习模型设有多个层级, 按照学习顺序在层级中分配集群, 同一层级为独
立同分布下的客户端 形成的集群, 且不同层级之间的客户端的本地数据集是非独立同分布
的, 每个层级分别包括多个相同数据分布的客户端和 一个中央参数服务器, 形成一个车联
网联邦学习子系统, 中央参数服务器将模型和数据集分别 分配至每个客户端, 即每个客户
端对应一个特定的本地模型和本地数据集, 中央参数服务器对各个客户端协作训练进 行协
调。
6.根据权利要求1所述的一种基于梯度记忆的车联网联邦学习分层知识安全迁移方
法, 其特征在于, 所述的步骤3中, 基于梯度 记忆的知识迁移联邦学习算法引入梯度 记忆, 梯
度记忆存储多个过去训练任务中的样本, 即过去样本, 采用基于梯度记忆的模型更新策略
在最小化当前训练任务中的损失函数的同时要求过去训练任务中的损失函数不再增加, 以
实现在当前训练任务中梯度有方向地更新, 进而保证全局模型在所有训练任务上的预测性
能, 采用基于梯度记忆的知识迁移联邦学习算法进行不同集群之 间的知识迁移的过程具体
包括以下步骤:
步骤301: 令r1,r2,…,rt分别为集群C1,C2,…,Ct提交的请求, 请求rk为执行除了当前训
练任务Tk之外的k‑1个过去训练任务T1,T2,…,Tk‑1的请求, 当集群发起请求时, 相关的集群
进行协作训练;
步骤302: 对于请求rt, 假设t‑1个集群已在对应的层级上完成训练任务, 且梯度记忆
存储t‑1个集群的数据集中的部分样本, 即过去样本;
步骤303: 集群Ct中的中央参数服务器将基于梯度记忆的知识迁移联邦学习 算法、 模型
ft和数据集分别分配至集群Ct内的每个客户端, 各个客户端开始训练并更新本地模型;
步骤304: 各个客户端通过计算当前训练任务中本地数据集的梯度与通过梯度记忆存
储的过去样本的梯度之间的内积决定是否更新当前训练任务的梯度g, 以实现对本地模型
进行更新, 并将更新后的本地模型参数θ 发送至中央服 务器进行聚合;
步骤305: 各个客户端训练本地模型和中央服务器聚合上传的本地模型参数不断进行,
直至最终的全局模型收敛或达 到设定的通讯次数;
步骤306: 集群Ct完成训练后将得到的收敛的全局模型传输至上一层级, 同时选取各个
客户端对应的本地数据集中的部分样本存 入梯度记 忆
中, 上一层级的集群遵循相同的训
练过程完成该集群的训练任务和知识的不断 向上迁移。
7.根据权利要求6所述的一种基于梯度记忆的车联网联邦学习分层知识安全迁移方
法, 其特征在于, 所述的步骤3 04中, 对本地模型进行 更新的过程具体包括以下步骤:
步骤304A: 各个客户端通过最小化本地数据集的损失函数更新本地模型的参数, 分别
获取本地数据集在当前的本地模型中的当前梯度gt和梯度记忆中存储的过去样本在当前
的本地模型中的过去梯度g1,...,gt‑1;
步骤304B: 各个客户端计算当前梯度gt与过去梯度g1,...,gt‑1之间的内积, 根据内积判
断过去训练任务中的损失函数是否增加, 即判断是否需要对梯度进行投影变换, 若内积小
于0, 则对梯度进行投影变换, 表示参数更新后部分过去训练任务的损失函数增加, 即当前
本地模型参数在本地数据集中的当前样本下的更新方向与之前的本地模型参数的更新方
向是偏离的, 导 致在过去训练任务上的本地模型性能降低;
步骤304C: 将当前本地模型参数更新的梯度投影变换到最临近的距离, 采用二次规划权 利 要 求 书 2/3 页
3
CN 114492833 A
3
专利 基于梯度记忆的车联网联邦学习分层知识安全迁移方法
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 19:31:25上传分享