说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210684555.7 (22)申请日 2022.06.16 (71)申请人 中国人民解 放军火箭军工程大 学 地址 710025 陕西省西安市灞桥区洪 庆街 道同心路2号 (72)发明人 蔡伟 蒋昕昊 杨志勇 姜波  李敏 王鑫  (74)专利代理 机构 西安弘理专利事务所 61214 专利代理师 燕肇琪 (51)Int.Cl. G06V 10/40(2022.01) G06V 10/25(2022.01) G06V 10/46(2022.01) G06V 10/774(2022.01) G06V 10/764(2022.01)G06V 10/82(2022.01) G06V 10/80(2022.01) G06V 10/44(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于三元级联感知的伪装目标框检测 方法 (57)摘要 本发明公开了一种基于三元级联感知的伪 装目标框检测方法, 结合伪装目标的特性构建级 联感知网络。 输入至输出分别包括特征提取模 块、 三元级联感知模块和检测输出头。 特征提取 模块通过级联使用特征提取器和特征金字塔网 络获取多尺度特征; 三元级 联感知模块包含特征 感知模块、 关键点感知模块和区域感知模块; 检 测输出头在训练时通过更新联合损失函数进行 反向传播, 在检测时将特征图编码 输出为目标类 别、 目标框信息和目标置信度。 本发明针对性设 计的级联感知网络通过学习特征间的关系信息、 关键点位置信息和关键区域多尺度信息, 进一步 提升了伪装目标的精准检测和定位能力, 具有较 高的检测准确性和可靠性。 权利要求书4页 说明书8页 附图2页 CN 114913337 A 2022.08.16 CN 114913337 A 1.一种基于三元级联感知的伪装目标框检测方法, 其特 征在于: 包括以下步骤: 步骤1: 针对伪装目标特性构建三元级联感知模块(Ternary  Cascade Perception   Module, TCPM); 步骤2: 结合步骤一, 设计伪装目标级联感知网络(Cascade  Perception  Network, CPNet): 步骤3: 构建联合损失函数, 对级联感知网络进行模型参数训练和检测准确度验证。 2.根据权利要求1所述的一种基于三元级联感知的伪装目标框检测方法, 其特征在于, 所述步骤1中三元级联感知模块TCPM基于伪装目标特性构建, 具体包括特征感知模块 (Featrue  Perception  Module, FPM)、 关键点感知模块(Key ‑point Perception  Module, KPM)和区域感知模块(Region  Perception  Module, RPM), 特征感知模块通过图卷积网络 (Graph Convolution  Network, GCN)获取特征间的相对关系信 息, 关键点感知模块通过不 同维度的平均池化(Av erage Pooling, AP)获取关键点的位置信息, 区域 感知模块通过融和 不同尺度的扩张卷积(Dilated  Convolution, DConv)增大感受野以获取更多的区域多尺度 信息, 三个感知模块 通过级联的方式嵌入到主干网络当中。 3.根据权利要求2所述的一种基于三元级联感知的伪装目标框检测方法, 其特征在于, 所述特征感知模块FPM, 对于输入张量F∈RW×H×C, 首先使用卷积层组合(卷积 Conv+批量归一 化BN+激活函数Relu, CBR)进行 预处理, 得到特 征图 其中, Conv(BN(Relu( ·)))表示进行卷积层组合CBR操作, 其次通过全局平均池化 (Global Average Pooling, GAP)对整张特征图进行双维度池化, 生成三维张量池化特征图 FGAP∈R1×1×C, 其中, GAP( ·, (W=1, H=1))表示将输入特征图全局池化为W=1、 H=1的特征图操作, 卷积神经网络中, 通道数C代表该特征图提取出的特征数, 故三维张量FGAP∈R1×1×C可视作 256个特征的点集合, 为进一步得到特征间的相 对关系信息, 使用图卷积网络GCN进行节点 间的关系学习, 得到新的带有节 点关系的三 维张量特征图FGCN∈R1×1×C, 基于此, 进行通道维 度的Softmax 归一化操作, 将关系信息归一 化至0~1, 得到三维张量权 重特征图 其中, Softmax( ·, dim=C)表示对通道维度进行Softmax操作, 将权重特征图FWeight与 预处理特征图 逐通道相乘, 获得关系加权后的特征图 最后与原始输入进 行残差连接, 逐像素相加得到特征感知模块FPM的输出特征张量 重新输入至主 干网络当中, 4.根据权利要求2所述的一种基于三元级联感知的伪装目标框检测方法, 其特征在于, 所述关键点感知模块KPM, 对于特征感知模块的输出张量 首先使用卷积层组合 CBR(同权利要求3所述CBR)进行 预处理, 得到特 征图 权 利 要 求 书 1/4 页 2 CN 114913337 A 2与特征感知模块FPM不同的是, 平均池化不对整张特征图进行操作, 而是分为W维度和H 维度两个维度分别进行, 获取特征节点在特征图横向和纵向上的位置信息, 生成一对三维 张量池化特 征图 和FPool‑W∈R1×H×C 其次, 将两个包含关键点不同方向位置信息的特征图相乘, 得到嵌入关键点的全局位 置信息的特征图FW×HRW×H×C, 而后使用卷积层组合CBR进行通道间的信息融合, 再通 过通道维 度的Softmax归一化操作, 将位置信息归一化至0~1, 得到三 维张量关键点位置信息权重特 征图 将权重特征图 与预处理特征图 逐通道相乘, 获得关系加权后的特征图 最后与输入(即特征感知模块FPM的输出特征张量 进行残差连接, 逐像素相加得到关键点感知模块KPM的输出特征张量 重新输入至主干网络当 中, 5.根据权利要求2所述的一种基于三元级联感知的伪装目标框检测方法, 其特征在于, 所述区域感知模块RPM, 对于关键点感知模块的输出张量 首先使用卷积层组合 CBR(同权利要求3所述CBR)进行 预处理, 得到特 征图 与关键点感知模块KPM不同的是, 为获得关键区域的多尺度信息, 需要进行小范围的特 征提取, 使用两个不同大小的扩张卷积DConv分支以扩大感受野, 获取多尺度区域信息, 扩 张卷积核大小分别为3 ×3和5×5, 扩张系数均为2, 而后将两组特征图叠加, 获得两倍通道 数的感受野增强特 征图FRF∈RW×H×2C, 其中, DConv( ·, K=i, D=2)表示扩张系数为2, 卷积核大小为i的扩张卷积, Add (·,·)表示将两组特征图进行通道维度的叠加操作, 而后对通道维度进行Softmax操作, 而后使用卷积层组合CBR进行通道恢复和信息融合, 再通过通道维度的Softmax归一化操 作, 将位置信息归一 化至0~1, 得到三维张量区域多尺度信息 权重特征图 将权重特征图 与预处理特征图 逐通道相乘, 获得关系加权后的特征图 最后与模块输入(即关键点感知模块KPM的输出特征张量 进行残 差连接, 逐像素相加得到区域感知模块RPM的输出特征张量 重新输入至主干网 络当中, 6.根据权利要求1所述的一种基于三元级联感知的伪装目标框检测方法, 其特征在于, 所述步骤2中伪装目标级 联感知网络CPNet围绕三元级 联感知模块TCPM进行设计, 依次级联权 利 要 求 书 2/4 页 3 CN 114913337 A 3

PDF文档 专利 一种基于三元级联感知的伪装目标框检测方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于三元级联感知的伪装目标框检测方法 第 1 页 专利 一种基于三元级联感知的伪装目标框检测方法 第 2 页 专利 一种基于三元级联感知的伪装目标框检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:40:56上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。