专利 一种多先验驱动的显著性目标检测算法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210726449.0 (22)申请日 2022.06.24 (71)申请人温州大学地址 325000 浙江省温州市瓯海区东方南路38号温州市国家大学科技园孵化器 (72)发明人张笑钦　徐曰旺　赵丽　廖唐飞　冯士杰　 (74)专利代理机构北京阳光天下知识产权代理事务所(普通合伙) 11671 专利代理师李满红 (51)Int.Cl. G06V 10/80(2022.01) G06V 10/44(2022.01) G06V 10/46(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种多先验驱动的显著性目标检测算法 (57)摘要本发明提供了一种多先验驱动的显著性目标检测算法，涉及图像处理技术领域，包括：获取待检测目标图像，并对所述待检测目标图像进行预处理，得到具有显著性先验知识的先验图像；采用不同网络参数量的先验视觉注意力模块对不同的先验图像进行处理，获得八个不同尺度的显著性特征图；对八个不同尺度的显著性特征图进行特征融合，得到四个融合特征表示；根据四个融合特征表示提取显著性目标边缘特征信息；将提取的显著性目标边缘特征信息补充至上采样后的全分辨率显著性 mask中，根据补充信息后的显著性 mask完成目标检测，本发明可实现在前景和背景对比度低、背景复杂、主体形状复杂等各种复杂环境下的主体边缘的精确分割。权利要求书2页说明书6页附图4页 CN 115205641 A 2022.10.18 CN 115205641 A 1.一种多先验驱动的显著性目标检测算法，其特征在于，包括以下步骤：获取待检测目标图像，并对所述待检测目标图像进行预处理，得到具有显著性先验知识的先验图像；采用不同网络参数量的先验视觉注意力模块对不同的先验图像进行处理，获得八个不同尺度的显著性特征图；对所述八个不同尺度的显著性特征图进行特征融合，得到包含语义信息和结构化细节信息的四个融合特征表示；根据所述四个融合特征表示提取显著性目标边缘特征信息；将提取的显著性目标边缘特征信息补充至上采样后的全分辨率显著性mask中，根据补充信息后的显著性mask完成目标检测。 2.如权利要求1所述的多先验驱动的显著性目标检测算法，其特征在于，所述预处理过程包括：通过机器学习方法获取输入的待检测目标图像的五种先验图像，所述五种先验图像包括LC、 FT、 FG、 RC和Gradient；构建先验指导网络，并通过所述先验指导网络筛选出比原输入图像的显著性表征能力强的先验图像，并针对最终输出显著性mask与标签图像进行损失计算及反向传播优化，所述先验指导网络由ResNet5 0网络和多先验注意力网络组成；将三通道 RGB图像输入ResNet50网络进行处理，得到第一特征信息，所述多先验注意力网络使用四个带分组卷积的空间注意力模块对输入的三通道先验特征图进行处理输出第二特征信息；通过add函数将所述第一特征信息和所述第二特征信息进行相加融合后输出先验特征图；根据先验指导网络输出的先验特征图筛选出FG和Gradient作为具有显著性先验知识的先验图像。 3.如权利要求2所述的多先验驱动的显著性目标检测算法，其特征在于，所述采用不同网络参数量的先验视觉注意力模块对不同的先验特征图进行处理，获得八个不同尺度的显著性特征图包括：通过所述先验视觉注意力模块从Gradient获得的四项特征，所述四项特征为FG2、 FG4、 FG8和FG16，从FG获得的四项特征，所述四项特征为FF2、 FF4、 FF8和FF16，并使用标签 mask对上采样至原图分辨率的FG2、 FG4、 FG8、 FG16、 FF2、 FF4、 FF8和FF16进行损失计算及阶段性反向传播优化；所述先验视觉注意力模块由四级伪孪生网络块串联而成，即当前级伪孪生网络块的输入为上一级伪孪生网络块的输出，每个伪孪生网络块包括通道配置子模块、空间注意力子模块和组间整合子模块，所述三个子模块按顺序串联。 4.如权利要求3所述的多先验驱动的显著性目标检测算法，其特征在于，所述通道配置子模块将每一级伪孪生网络块的输入特征通道数量增加至64、 128、 256和512，实现对显著性特征信息的增加及细化；所述空间注意力子模块利用PyTorch框架中的分组卷积按通道数量进行分组处理，分组数量与输入特征图通道数量保持一致，所述分组卷积的卷积核大小k共有三种， k＝1、 k＝5和k＝7，激活函数使用高斯误差线性单元GELU进行特征激活；所述组间整合子模块使用2D卷积对所述空间注意力子模块输出的特征进行处理，将输出的特征通道数量转化至下一级伪孪生网络块要求的特征通道数，输出即为FF2、 FG2、 FF4、 FG4、 FF8、 FG8、权　利　要　求　书 1/2 页 2 CN 115205641 A 2FF16和FG16八个特征。 5.如权利要求4所述的多先验驱动的显著性目标检测算法，其特征在于，所述对所述八个不同尺度的显著性特征图进行特征融合包括：通过逐像素相加操作将输入的所述八个特征按分辨率大小分为四组，采用add函数将每一组内两个分辨率一致的特征进行融合并进行batc hnorm批归一化和GELU 线性激活；然后通过特征信息补充操作利用较大分辨率特征具有的细节信息补充至较小分辨率特征具有的语义信息中：将原图分辨率的FG2分别下采样至FG4、 FG8和FG16分辨率进行逐像素相加融合，将原图分辨率的FG4分别下采样至FG8和FG16，将原图分辨率的FG8下采样至 FG16，将分辨率进行逐像素相加融合；使用标签mask对上采样至原图分辨率的FP2、 FP4、 FP8和FP16进行损失计算及阶段性反向传播优化。 6.如权利要求5所述的多先验驱动的显著性目标检测算法，其特征在于，所述根据所述四个融合特征表示提取显著性目标边缘特征信息包括通过边缘提取操作对输入的四个特征进行边缘特征提取，然后利用边缘特征融合操作融合四个不同分辨率的特征，输出全分辨率的显著性边缘特征图FE；所述边缘提取操作利用两组不同卷积核大小k(k＝1,3)和不同空洞率d(d＝1,2)的空洞卷积组对输入特征进行处理,根据两组空洞卷积后的特征差值计算注意力权重图，将原特征图与所述注意力权重图相乘获得粗粒度的显著性边缘特征，所述显著性边缘特征再经过卷积、 reshape和转置操作，计算非局部增强权重图，将粗粒度的显著性边缘特征与非局部增强权重图相乘可得细粒度的显著性边缘特征图；所述边缘特征融合操作首先将得到的四个显著性边缘特征图上采样至原图分辨率，再使用PyTorch框架中的cat函数按通道拼接，最后使用卷积核大小为3*3的2D卷积将拼接特征通道数变为1；并使用边缘标签mask对FE进行损失计算及阶段性反向传播优化。 7.如权利要求6所述的多先验驱动的显著性目标检测算法，其特征在于，所述将提取的显著性目标边缘特征信息补充至上采样后的全分辨率显著性mask中包括：首先将输入的 FP2、 FP4、 FP8和FP16特征图上采样至原图分辨率，并融合为通道数1的显著性特征图FP；再利用 PyTorch中的add函数将FP和FE逐像素相加融合，最终得到显著性mask。权　利　要　求　书 2/2 页 3 CN 115205641 A 3

专利 一种多先验驱动的显著性目标检测算法

专利一种多先验驱动的显著性目标检测算法