说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211106572.9 (22)申请日 2022.09.12 (71)申请人 南京理工大 学 地址 210094 江苏省南京市孝陵卫20 0号 (72)发明人 魏秀参 徐赫洋  (74)专利代理 机构 南京理工大 学专利中心 32203 专利代理师 陈鹏 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) (54)发明名称 基于反标签学习的半监督少样本图像分类 学习方法及系统 (57)摘要 本发明公开了一种基于反标签学习的半监 督少样本图像分类学习方法及系统, 方法包括: 构造元任务, 使用预训练的神经网络作为特征提 取器, 提取元任务中对应数据的特征, 并在支持 集上训练一个 分类器用于后续分类任务; 反标签 学习模块 以较高正确率给无标签数据打上反标 签, 分类器在反标签上进行学习更新, 不断迭代 直到无法选出反标签; 在反标签模块迭代结束之 后, 得到类别均衡且正确率较高的正标签, 并用 分类器进行学习更新。 本发明充分且高质量的利 用无标签数据, 可以获得更高的少样本学习图像 分类准确率。 权利要求书3页 说明书6页 附图1页 CN 115439715 A 2022.12.06 CN 115439715 A 1.一种基于反标签学习的半监督少样本图像分类学习方法, 其特征在于, 包括以下步 骤: 步骤1, 构造元任务, 使用预训练的神经网络作为特征提取器提取图像数据, 提取元任 务中支持集、 查询集以及无标签数据集对应的特征, 并在支持集上训练一个分类器, 用于后 续图像分类任务; 步骤2, 反标签学习 模块以第 一正确率给无标签图像数据打上反标签, 用分类器在 反标 签上进行 学习更新, 通过不断迭代直到无法选出反标签; 步骤3, 正标签学习 模块得到类别均衡且满足第 二正确率的正标签, 并用分类器进行学 习更新; 步骤4, 用训练好的分类 器在查询集上 预测得到最后图像分类的类别结果。 2.根据权利要求1所述的基于反标签学习的半监督少样本图像分类学习方法, 其特征 在于, 步骤1中, 利用预训练的卷积神经网络模型提取元任务中支持集、 查询集以及无标签 图像数据集的特 征, 接着在支持集的特 征上训练一个分类 器, 具体如下: 通过卷积神经网络提取 元任务中对应图像数据集 合的特征: xset∈{S,Q, U}=F(I; θr) (1) 其中I为输入数据, F( ·; θr)为预训练的卷积神经网络模型, θr为该模型的参数; xset为 set集合提取出来的特 征, set取S、 Q或U, 分别代 表支持集、 查询集以及无 标签数据集; 初始化分类器f( ·; θc), 其中θc为该分类器参数; 用分类器将xS映射到对应的概率空 间: ps=f(xS; θc) (2) 使用交叉熵损失进行训练, 其中交叉熵损失表示如下: 3.根据权利要求2所述的基于反标签学习的半监督少 样本学习方法, 其特征在于, 构建 反标签学习模块, 该模块以迭代的方式, 通过对无标签数据的处理挑选出反标签并用于分 类器的学习, 直到无法挑选出符合条件的数据则迭代结束; 首先, 使用分类 器f(·; θc), 将无标签数据映射到类别的概 率空间: PU=f(xU; θc) (4) 其中xU为公式(1)中得到的无标签数据特征, pU为无标签数据经过分类器映射后得到的 类别后验概 率值, 上标U代表无标签数据; 进行反标签学习模块的第一轮迭代, 挑选反标签方法如下: 其中k代表pU中概率最小的对应的位置, 即对应概率最小的类别, 为对应类别的概率 值, δ作为挑选反标签的阈值, 为当前输入数据的反标签, 即当概率最小类别的概率值小 于该阈值时, 反标签取1, 此时反标签 类别为k, 当不满足条件时该样本不 参与本轮的迭代; 经 过 第 一 轮 迭 代 ,得 到 无 标 签 数 据 中 被 标 记 上 反 标 签 数 据 的 集 合权 利 要 求 书 1/3 页 2 CN 115439715 A 2其中i表示挑选出来的反标签数据的下标, 这里Nj为第j 次迭代中按照公式(5)挑选出数据的数量, 其中j代表迭代的次数; 和 分别代表挑选出 的第i个数据的特 征向量以及对应的反标签; 反标签学习模块中, 设计迭代挑选反标签的策略, 对于一个输入数据, 已经标记过的反 标签类别, 在之后的迭代过程中将不再考虑该类别; 定义一个列表记录每个数据在每次迭 代中挑选的反标签: 其中 为本次迭代中满足条件的样本标记的反标签, 有些样本无法满足条件, 因此将 一些列表中设置为空; M为无 标签数据集U的数据量, 类别数为C, 即 将交叉熵损失函数进行修改, 使其能够用来在 上训练分类 器f(·; θc), 形式如下: 至此第一轮迭代结束, 接着循环前述步骤, 直到在迭代中无法挑选出满足条件的反标 签数据, 即迭代 停止。 4.根据权利要求3所述的基于反标签学习的半监督少样本图像分类学习方法, 其特征 在于, 步骤2中, 反标签学习模块通过迭代的方式给无标签图像数据打反标签, 迭代结束之 后将排除对于数据极不置信的标签, 即在迭代中被挑选的反标签; 正标签学习模块通过对 Position列表进行判断, 对于一个输入数据而言, 如果其只剩下一个标签没有被打上反标 签, 即将该标签作为这个数据的正标签, 若有多个标签没有被打上反标签, 则舍弃该样本, 不参与之后的过程; 得到带有正标签的数据集合 其中L 为符合条件被挑选出来标记正标签的数据数量; 接下来用分类器f( ·; θc)在 上使用公 式(2)进行训练。 5.根据权利要求3所述的基于反标签学习的半监督少样本图像分类学习方法, 其特征 在于, 步骤4用训练好的分类 器在查询集的特 征上预测得到最后的类别结果, 具体如下: 首先用分类 器f(·; θc), 将查询集特 征映射到和类别相关的概 率空间: pQ=f(xQ; θc) (8) 其中xQ为公式(1)得到的查询集的特 征; 接着对输出的概 率pQ进行处理, 得到输入数据的类别为: 其中i表示 查询集中数据的位置, 查询集数据共有E个, 则i∈[0,1,2,. ..,E]。 6.根据权利要求1所述的基于反标签学习的半监督少样本图像分类学习方法, 其特征 在于, 第一 正确率为95%, 第二 正确率为85%。 7.一种基于反标签学习的半监 督少样本图像分类学习 系统, 其特 征在于, 包括: 特征提取模块, 用于构造元任务, 使用预训练的神经网络作为特征提取器提取图像数 据, 提取元任务中支持集、 查询集以及无标签数据集对应的特征, 并在支持集上训练一个分权 利 要 求 书 2/3 页 3 CN 115439715 A 3

PDF文档 专利 基于反标签学习的半监督少样本图像分类学习方法及系统

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于反标签学习的半监督少样本图像分类学习方法及系统 第 1 页 专利 基于反标签学习的半监督少样本图像分类学习方法及系统 第 2 页 专利 基于反标签学习的半监督少样本图像分类学习方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:52上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。