(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210705367.8
(22)申请日 2022.06.21
(71)申请人 重庆邮电大 学
地址 400065 重庆市南岸区黄桷垭崇文路2
号
(72)发明人 向娇 李国权 黄正文 林金朝
吴建
(74)专利代理 机构 北京同恒源知识产权代理有
限公司 1 1275
专利代理师 廖曦
(51)Int.Cl.
G06T 7/00(2017.01)
G06V 10/44(2022.01)
G06V 10/764(2022.01)
G06V 10/766(2022.01)G06V 10/80(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于改进YOLOv5s的X光安检图像违禁物品
检测方法
(57)摘要
本发明涉及一种基于改进YOLOv5s的X光安
检图像违禁物品检测方法, 属于图像检测领域。
该方法包括以下步骤: S1: 建立基于重参数思想
设计的Rep模块; S2: 建立基于重参数的YOLOv5s
违禁物品检测算法; S3: 对颈部PAN进行改进。 相
对于传统的检测方法, 本发明检测精度更高, 更
能够满足X光安检图像中违禁物品检测的实际应
用需要。
权利要求书2页 说明书9页 附图4页
CN 114897887 A
2022.08.12
CN 114897887 A
1.基于改进YOLOv5s的X光安检图像违禁物品检测方法, 其特征在于: 该方法包括以下
步骤:
S1: 建立基于 重参数思想设计的Rep模块;
S2: 建立基于 重参数的YOLOv5s违 禁物品检测算法;
S3: 对颈部PAN进行改进。
2.根据权利要求1所述的基于改进YOLOv5s的X光安检图像违禁物品检测方法, 其特征
在于: 所述S1具体为:
设构造的Rep模块参数如公式(1)所示, 即两个平行卷积分支相加; Rep模块产 生的信息
流表示为y=f(x)+g(x), 其中f(x)、 g(x)分别是由3 ×3核和1×1核实现的卷积分支;
Rep(3×3)=3×3‑BN+1×1‑BN (1)
对每个3×3卷积, 在训练阶段给构造并行的1 ×1卷积分支, 并各自经过归一化操作后
相加; 在推理阶段将1 ×1分支融合进3 ×3分支, 得到一个3 ×3卷积分支, 减去另一平行分支
结构, 提升卷积网络的性能, 不影响网络检测效率;
在Rep模块构造的基础上, 基于RepVGG的思想将多分支模块转为单分支; 模型的转换是
在训练完成后进行, 包 含如下两个步骤:
①首先将每个分支中的卷积层、 BN层进行融合; 直接将卷积结果带入bn公式中, 如图3
中左边箭头, 则输出表示 为公式(2):
M(2)=bn(W(3)*M(1), μ(3), σ(3),γ(3), β(3))+bn(W(1)*M(1), μ(1), σ(1),γ(1), β(1)) (2)
其中,
和
分别表示表示3 ×3和1×1卷积层的卷积核, C1, C2代
表输入、 输出通道数; μ(3), σ(3),γ(3), β(3)分别表示3 ×3卷积后BN层的累积均值、 标准差、 缩
放因子和偏差项, μ(1), σ(1),γ(1), β(1)对应1×1卷积后BN层的累积均值、 标准差、 缩放因子和
偏差项; 输入、 输出分别表示 为
*代表卷积运 算;
将参数带入公式(2), 得到结果如公式(3); 其中, bn是推理阶段的批量标准化函数, i∈
[1,C2];
对公式(3)化简得到一个带有偏差项的卷积层; 以{W',b'}形式表示{W,b, μ, σ,γ, β }转
化后得到的卷积核和偏差项, 则有:
对任意的i∈[1,C2], 有bn(W*M, μ, σ,γ, β ):,i,:,:=(W'*M):,i,:,:bi'; 融合完成后得到一
个3×3卷积核、 一个1 ×1卷积核和两个偏差项;
②对3×3卷积和1 ×1卷积进行融合, 两个偏差项相加得到融合偏差项; 将1 ×1卷积核
用0填充为3 ×3卷积核后, 再与原3 ×3卷积核相加, 得到融合卷积核; 设
为两个卷积核, 根据卷积的可加性原理, 其相加结果表示为公式(5); 卷积核融合之后实现
融合前的功能;
权 利 要 求 书 1/2 页
2
CN 114897887 A
23.根据权利要求2所述的基于改进YOLOv5s的X光安检图像违禁物品检测方法, 其特征
在于: 所述S2具体为: 将Rep结构引入YOLOv5s算法的主干网络, 得到由一系列Rep模块和C3
模块组成的升级主干网络; 调整PAN结构, 将SE模块插入PAN中上一检测层到下一检测层之
间, 得到升级PAN网络;
其中Focus模块对图片进行切片操作, 使其输入通道扩充4倍, 即操作后的图片从原先
的RGB三通道变成12个通道; 经过卷积操作, 得到没有信息丢失的二倍下采样特征图; Conv
模块封装卷积层、 BN层以及SiLU激活函数; C3模块的结构和作用与BottleneckCSP基本相
同, 但其浮点运算数更低, 运行的速度更快; SPP模块拼接不同尺 寸的最大池化结果, 实现了
局部特征和全局特征相融合; UpSample为上采样层, 其内插值方法将图像放大到原来的2
倍; 检测头中的三个Co nv[1,1]得到最终输出的特 征图。
4.根据权利要求3所述的基于改进YOLOv5s的X光安检图像违禁物品检测方法, 其特征
在于: 所述S3具体为:
SE模块包含压缩和激励两部分; 第一步为压缩阶段, 通过一个全局平均池化, 使输入W
×H×C的特征图被压缩为1 ×1×C, 这个压缩过的特征图具有全局感受野; 第二步为激励阶
段, 由两个全连接层组成: 第一个全连接层有C ×r个神经元, 第二个全连接层 有C个神经元,
其中r是一个缩放 参数, 调节这个参数减少通道个数从而降低计算 量。
5.根据权利要求4所述的基于改进YOLOv5s的X光安检图像违禁物品检测方法, 其特征
在于: 所述S4之后还 包括设置 评价指标;
检测器的检测性能评估需要同时考虑准确率Precision和召回率Recall; 目标检测中
使用IoU=0.5时的平均精度均值mAP、 宏准确率MP、 宏召回率MR和宏F1来评价网络模型的性
能; 准确率的定义为公式(6), 召回率的定义为公式(7); 其中TP、 TN、 FP和FN分别代表真阳
性、 真阴性、 假阳性和假阴性;
平均精度AP是通过结合准确率和召回率而得到, 用来评价模型检测单个类别的精度;
mAP测量模 型检测所有类别的精度, 通过求所有类AP平均值得到, 其定义如公 式(8); F1分数
是准确率与召回率的加权平均值, 定义如公式(9), 其 值越大表明效果越好;
宏准确率、 宏召回率和宏F1是通过分别求所有类别准确率、 召回率和F1分数的平均值
而得到。权 利 要 求 书 2/2 页
3
CN 114897887 A
3
专利 基于改进YOLOv5s的X光安检图像违禁物品检测方法
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:40:55上传分享