专利 一种基于注意力机制的单图像超分辨率算法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210719954.2 (22)申请日 2022.06.23 (71)申请人东南大学地址 211189 江苏省南京市江宁区东南大学路2号 (72)发明人裴文江　蔡清　夏亦犁　 (74)专利代理机构南京瑞弘专利商标事务所 (普通合伙) 32249 专利代理师徐激波 (51)Int.Cl. G06T 3/40(2006.01) G06V 10/44(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称一种基于注意力机制的单图像超分辨率算法 (57)摘要本发明公开了一种基于注意力机制的单图像超分辨率算法，提出了一新的多尺度注意力残差块，并改进了残差里套残差的网络设计框架，在其中引入了层间注意力。在上述两个创新点的基础上了提出了一个新的多尺度整体注意力网络。所述MSAB的具体特征如下： (1)在普通的残差块中引入了通道注意力机制和空间注意力机制，并采用双分支的学习策略，将两个注意力机制分别用于不同的分支，并在最后用1x1的卷积层进行级联。 (2)在上述基础上引入了多尺度卷积，采用了3x3和5x5的两个卷积块，也是按照双分支的策略分别进行特征提取，并用1x1的卷积层进行级联。本发明MSHAN网络在模型性能和参数数量的综合度量下获得了显著的结果。权利要求书4页说明书7页附图3页 CN 115170392 A 2022.10.11 CN 115170392 A 1.一种基于注意力机制的单图像超分辨率算法，其特征在于：包含三个步骤，分别是浅层特征提取操作、中间特征映射操作和上采样操作； 1)浅层特征提取操作：用X和YSR分别表示整个网络的输入和输出，对输入的低分辨率图片X，采用一个3x3的卷积层去提取初始的浅层特征，如下公式所示： FIFE＝SIFENet(X) 其中SIFENet代表着浅层特征提取模块的函数，提取的浅层 FIFE特征会作为初始的输入被送入后面的特征映射部分，也会被用作全局特征的学习； 2)中间特征映射操作：中间特征映射的输入是浅层特征提取操作得到FIFE，其操作的基本单元是一个多尺度注意力残差块；设所述多尺度注意力残差块的输入为H0，输入首先会经过两个并行的3x3卷积模块和 5x5卷积模块生成对应的输出，如下公式所示：其中和代表着3x3模块的第一个卷积层的权重和偏差，和代表着3x3 模块的第二个卷积层的权重和偏差；同理，和代表着5x5模块的第一个卷积层的权重和偏差，和代表着5x5模块的第二个卷积层的权重和偏差； δ表示ReLU激活函数， Hm3和Hm5分别代表3x3和5x5模块的输出；在得到3x3模块的输出特征Hm3和5x5模块输出特征Hm5后，会送进一个级联模块去融合两个不同尺度下卷积到的特征，并通过1x1的卷积层去调整其维度大小以便送进后续模块进行进一步特征提取，过程如下：其中代表第一个级联模块的输出， [ ]代表级联操作，和代表第一个级联块中 1x1卷积层的权重和偏差； 3)上采样操作：上采样操作的输入是前一个中间特征映射操作的输出FMF，然后使用亚像素卷积作为最后一个上采样模块，该模块通过像素平移将给定放大系数的比例采样转换为上采样，亚像素卷积运算是用来聚合低分辨率特征映射，同时将特征映射到高维空间来重建HR图像；整个过程如下公式所示： YSR＝U↑(FMF) ＝U↑(FIFE+FN+FLA) 其中U↑表示亚像素卷积运算， YSR是重建的SR结果；此外还引入了长跳跃连接，以稳定所提出的深度网络的训练，亚像素上采样块以FIFE+FN+FLA作为输入。 2.根据权利要求1所述的一种基于注意力机制的单图像超分辨率算法，其特征在于：所述步骤2)中，有了中间第一个级联块的输出后，应用注意力机制去进一步的加强那些富有重要特征的通道和空间位置的权重；为此设计了两个并行分支，一个通过通道注意力机制去生成一个大小为Cx1x1权重系数去调整每个通道的特征数值；另一个分支则利用空间注意力机制去生成一个大小为1xHxW的权重系数去调整每个通道内空间位置的特征数值；利用该并行分支，让网络利用通道和空间位置的相关性去近一步提取有效的特征表征从而提权　利　要　求　书 1/4 页 2 CN 115170392 A 2升网络的性能；定义输入的特征其中包含了C个特征映射，然后每个特征映射的大小为HxW。 3.根据权利要求2所述的一种基于注意力机制的单图像超分辨率算法，其特征在于：所述步骤2)中，通道注意力分支的提取过程：首先通过全局平均池化层生成一个每通道的总和数字特征 μ∈RCx1x1，平局池化层是作用于独立的特征通道，所以μ 的第c个通道表示为：其中代表位置在(i， j)的第c个通道的像素值；随后数字特征 μ会送入一个激活函数去进行卷积求和，过程如下：其中和分别是第一个卷积层的权重和偏差被用来通过缩放比例γ来改变通道的数量；同理，参数为和的卷积层再将通道数量转换为原始的数量； σ 和 δ 分别代表着 sigmoid和ReLU激活函数。此外，每通道注意权重α通过sigmoid激活函数σ 来将值适应到0 ‑1之间，并用它来重新缩放输入特征；再得到通道注意力系数α后，将其原始输入的特征进行每元素相乘得到通道注意力模块分支最终的输出：其中HCA表示通道注意力模块最后的输出， FCA表示通道特征和其对应的通道权重的每通道相乘；第一个级联模块输出的特征会被输入进另外一个空间注意力模块分支去进行空间注意力调整特征；空间注意力模块比通道注意力模块少一个全局平均的池化层，因为空间注意力模块不需要通过全局平均池化层来讲全局空间信息压缩到每个通道的统计描述符中；其余过程跟通道注意力相似，空间注意力掩膜系数如下公式所示：其中σ 和 δ 分别代表着sigmoid和ReLU激活函数，第一个权重为和偏差为的卷积层被用来产生每通道的特征映射，然后产生的特征映射和一个单一的注意映射相结合经过一个权重为和偏差为的1x1的卷积层； sigmoid函数σ 将特征映射归一化到0 ‑1的范围内去获得空间注意力自适应掩膜β；卷积层的尺度因子γ用来方便维度的变化；得到空间注意力掩膜系数后，与输入特征在空间位置上进行每元素相乘得到空间注意力模块分支最终的输出：其中HsA表示空间注意力模块最后的输出， FSA表示空间位置特征和其对应的空间位置权重的每元素相乘。 4.根据权利要求3所述的一种基于注意力机制的单图像超分辨率算法，其特征在于：所述步骤2)中，在得到通道注意力模块的输出HCA和空间注意力模块的输出HSA后，会被当做输入送进第二个级联模块去融合两个模块的空间特征，并通过1x1卷积层改变其特征通道数量来更好的在块间传输，得到第二个级联模块的输出再与一开始MSAB块的输入进行残差操作就得到整个MSAB的输出，如下公式所示：权　利　要　求　书 2/4 页 3 CN 115170392 A 3

专利 一种基于注意力机制的单图像超分辨率算法

专利一种基于注意力机制的单图像超分辨率算法