说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111653297.8 (22)申请日 2021.12.3 0 (71)申请人 咪咕文化科技有限公司 地址 100032 北京市西城区德胜门外大街 11号5幢40 0室(德胜园区) 申请人 中国移动通信集团有限公司 (72)发明人 许明微 李小海 李琳 周冰  吴耀华  (74)专利代理 机构 北京市浩天知识产权代理事 务所(普通 合伙) 11276 代理人 石志娟 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/44(2022.01) G06V 10/24(2022.01)G06N 20/00(2019.01) (54)发明名称 数据处理方法、 装置、 设备以及计算机存储 介质 (57)摘要 本发明实施例涉及计算机数据处理技术领 域, 公开了一种数据处理方法, 该方法包括: 对源 域样本数据和目标域样本数据进行特征增强, 得 到增强后源域样本数据和增强后目标域样本数 据; 根据增强后源域样本数据和增强后目标域样 本数据之间的距离确定增强后源域样本数据对 应的权重矩阵; 根据权重矩阵、 增强后源域样本 数据确定源域子空间; 根据增强后目标域样本数 据确定目标域子空间; 将源域子空间和目标域子 空间对齐, 得到对齐后源域样本数据、 对齐后目 标域样本数据; 根据对齐后源域样本数据、 对齐 后目标域样本数据以及源域样本数据对应的样 本标签确定目标域样本数据对应的样本标签。 通 过上述方式, 本发明实施例提高了行人重识别的 准确率。 权利要求书2页 说明书13页 附图3页 CN 114429643 A 2022.05.03 CN 114429643 A 1.一种数据处 理方法, 其特 征在于, 所述方法包括: 对源域样本数据和目标域样本数据进行特征增强, 得到增强后源域样本数据和增强后 目标域样本数据; 根据所述增强后源域样本数据和增强后目标域样本数据之间的距离确定所述增强后 源域样本数据对应的权 重矩阵; 根据所述权 重矩阵、 所述增强后源域样本数据确定源域子空间; 根据所述增强后目标域样本数据确定目标域子空间; 将所述源域子空间和所述目标域子空间对齐, 得到对齐后源域样本数据、 对齐后目标 域样本数据; 根据所述对齐后源域样本数据、 对齐后目标域样本数据以及所述源域样本数据对应的 样本标签确定所述目标域样本数据对应的样本标签。 2.根据权利要求1所述的方法, 其特征在于, 所述源域样本数据中包括多个源域样本; 所述目标域样本数据中包括多个目标域样本; 所述对源域样本数据和目标域样本数据进 行 特征增强, 得到增强后源域样本数据和 增强后目标域样本数据, 包括: 根据高斯核函数分别确定各个所述源域样本以及各个所述目标域样本与样本集合之 间的相似度; 所述样本集 合中包括所有所述源域样本和所有所述目标域样本; 根据所述相似度分别对所述源域样本数据和所述目标样本数据进行特征增强, 得到所 述增强后源域样本数据和所述增强后目标域样本数据。 3.根据权利要求1所述的方法, 其特征在于, 所述增强后源域样本数据中包括多个增强 后源域样本; 所述增强后目标域样本数据中包括多个增强后目标域样本; 所述根据所述增 强后源域样本和增强后目标域样本之间的距离确定所述增强后源域样本数据对应的权重 矩阵, 包括: 分别确定各个所述增强后目标域样本与所有所述增强后源域样本之间的距离中的最 小值; 根据所述最小值以及各个所述增强后源域样本与各个所述增强后目标域样本之间的 距离分别确定各个所述增强后源域样本对应的权 重值, 得到所述权 重矩阵。 4.根据权利要求1所述的方法, 其特征在于, 所述根据所述权重矩阵、 所述增强后源域 样本数据确定源域子空间, 包括: 根据所述权 重矩阵和所述增强后源域样本数据确定协方差矩阵; 根据所述协方差矩阵进行 特征值分解, 得到多个特 征值; 根据所述多个特 征值确定所述源域子空间。 5.根据权利要求4所述的方法, 其特征在于, 所述增强后源域样本数据中包括多个增强 后源域样本; 所述增强后目标域样本数据中包括多个增强后目标域样本; 所述根据所述权 重矩阵和所述增强后源域样本数据确定协方差矩阵, 包括: 根据下式确定所述协方差矩阵: 其中, C为所述协方差矩阵; m为所述增 强后源域样本的数量; i为所述增 强后源域样本权 利 要 求 书 1/2 页 2 CN 114429643 A 2的序号; 为第i个所述增强后源域样本; wi为 在所述权重矩阵中对应 的权重值。 6.根据权利要求4所述的方法, 其特征在于, 所述根据所述特征值确定所述源域子空 间, 包括: 按照特征值的降序对所述多个特 征值进行排序, 得到特 征值序列; 根据所述特征值序列中排名前n的特征值对应的特征向量确定源域子空间; n为正整 数。 7.根据权利要求1 ‑6任一项所述的方法, 其特征在于, 所述源域样本数据和所述源域样 本数据对应的样本标签用于训练原场景对应的行人重识别模型; 在所述根据所述对齐后源 域样本数据、 对齐后目标域样本数据以及所述源域样本数据对应的样本标签确定所述目标 域样本数据对应的样本标签之后, 还 包括: 获取目标场景对应的待识别图像数据; 将所述待识别图像数据输入所述目标场景对应的行人重识别模型, 得到所述待识别图 像数据对应的行人识别结果; 其中, 所述 目标场景对应的行人重识别模型根据所述 目标域 样本数据和所述目标域样本数据对应的样本标签训练得到 。 8.一种数据处 理装置, 其特 征在于, 所述装置包括: 增强模块, 用于对源域样本数据和目标域样本数据进行特征增强, 得到增强后源域样 本数据和 增强后目标域样本数据; 第一确定模块, 用于根据所述增强后源域样本数据和增强后目标域样本数据之间的距 离确定所述增强后源域样本数据对应的权 重矩阵; 第二确定模块, 用于根据所述权 重矩阵、 所述增强后源域样本数据确定源域子空间; 第三确定模块, 用于根据所述增强后目标域样本数据确定目标域子空间; 对齐模块, 用于将所述源域子空间和所述目标域子空间对齐, 得到对齐后源域样本数 据、 对齐后目标域样本数据; 第四确定模块, 用于根据所述对齐后源域样本数据、 对齐后目标域样本数据以及所述 源域样本数据对应的样本标签确定所述目标域样本数据对应的样本标签。 9.一种数据处理设备, 其特征在于, 包括: 处理器、 存储器、 通信接口和通信总线, 所述 处理器、 所述存 储器和所述 通信接口通过 所述通信总线完成相互间的通信; 所述存储器用于存放至少一可执行指令, 所述可执行指令使所述处理器执行如权利要 求1‑7任意一项所述的数据处 理方法的操作。 10.一种计算机可读存储介质, 其特征在于, 所述存储介质中存储有至少一可执行指 令, 所述可执行指 令在数据处理设备上运行时, 使得数据处理设备执行如权利要求 1‑7任意 一项所述的数据处 理方法的操作。权 利 要 求 书 2/2 页 3 CN 114429643 A 3

.PDF文档 专利 数据处理方法、装置、设备以及计算机存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据处理方法、装置、设备以及计算机存储介质 第 1 页 专利 数据处理方法、装置、设备以及计算机存储介质 第 2 页 专利 数据处理方法、装置、设备以及计算机存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:31:43上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。