(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210216832.1
(22)申请日 2022.03.07
(71)申请人 南京工业大 学
地址 211816 江苏省南京市浦口区浦珠南
路30号
(72)发明人 王萌 杜振龙
(74)专利代理 机构 南京经纬专利商标代理有限
公司 32200
专利代理师 罗运红
(51)Int.Cl.
G06T 7/00(2017.01)
G06N 3/08(2006.01)
G06N 3/04(2006.01)
G06V 10/44(2022.01)
G06V 10/82(2022.01)
(54)发明名称
一种基于YOLOv5s神经网络的酒店套装门检
测方法
(57)摘要
本发明公开了一种基于YOLOv5s神经网络的
酒店套装门检测方法, 属于深度学习技术领域。
该方法包括以下步骤: (1)采集酒店安装好的套
装门图像并使用A CDSee批量调整图像大小成640
×640, (2)通过LabelImg目标检测标注 工具对数
据进行标记, (3)使用PyTorch深度学习框架, 搭
建基础的YOLOv5s神经网络模型并修改模型结
构, (4)利用数据集对目标检测模型进行训练和
测试, 得到最优目标检测模型并部署到华为
Atlas200DK边端设备 上。
权利要求书3页 说明书6页 附图1页
CN 114663366 A
2022.06.24
CN 114663366 A
1.一种基于YOLOv5s神经网络的酒店套装门检测方法, 其特征在于, 所述方法包括以下
步骤:
步骤一: 采集酒店安装好的套装门图像, 并使用ACD See批量调整图像大小成640 ×640;
步骤二: 通过Label Img目标检测标注工具对数据进行 标记;
步骤三: 使用PyTorch深度学习框架, 搭建基础的YOLOv5s神经网络模型并修改模型结
构;
步骤四: 利用数据集对目标检测模型进行训练和测试, 将训练好的神经网络模型部署
到华为Atlas200DK边端设备 上。
2.根据权利 要求1所述的一种基于YOLOv5s神经网络的酒店套装门检测方法, 其特征在
于, 步骤一所述的采集酒店安装好的套装门 图像, 并使用ACDSee批量调整图像大小成640 ×
640, 包括以下步骤:
步骤一: 通过装有摄像头的华为Atlas200DK设备拍 摄酒店安装好的套装门图像, 每张
图像中包 含完整的门框结构;
步骤二: 根据四边形两对边及四个角的关系, 将拍摄的图像分成8个 类别:
上下边框平行、 左右边框平行: 相邻边框均垂直或相邻边框均不垂直;
上下边框平行、 左右边框不平行: 左右边框中只有一条与上下边框垂直或相邻边框均
不垂直;
上下边框不平行、 左右边框平行: 上下边框中只有一条与左右边框垂直或相邻边框均
不垂直;
左右边不平行、 上下边框不平行: 相邻边框中只有一对垂直或相邻边框均不垂直, 按照
这个顺序从0 到7, 把每 个图像文件名前都加上类别对应的编号;
步骤三: 使用ACDSee打开存有重命名图像的文件夹, 然后右击选择 “批量”选项下的“批
量编辑”, 点击调整大小, 调整宽高为640 ×640。
3.根据权利 要求1所述的一种基于YOLOv5s神经网络的酒店套装门检测方法, 其特征在
于, 步骤二所述的通过Label Img目标检测标注工具对数据进行 标记, 包括以下步骤:
步骤一: 安装并运行Label Img标检测标注工具, 打开 LabelImg工具界面;
步骤二: 设置输入和输出文件夹, 点击 “Open Dir”选择存有640 ×640图像的文件夹, 再
点击“Change Save Dir”选择保存路径;
步骤三: 设置标记形式, 先勾 选“Verify Image”设置后一张图默认和前一张图标记相
同, 再勾选 YOLO的标记形式, 最后勾选默认保存按 钮;
步骤四: 按照文件名前的数字给图像打上 标记, 并框出图像中的套装门。
4.根据权利 要求3所述的一种基于YOLOv5s神经网络的酒店套装门检测方法, 其特征在
于, 步骤三中, 所述的使用PyTorch深度学习框架, 搭建基础的YOLOv5s神经网络模型并修改
模型结构, 包括以下步骤:
步骤一: 使用PyTorc h框架搭建基础的YOLOv5s神经网络;
步骤二: 修改YOLOv5s神经网络的主干 网络, 在主干网络中的跨阶段局部结构里嵌入坐
标注意力机制, 坐标注意力机制将通道注意力输出的原始特征xc(i,j)分解为两个一维的
转置特征映射
和
权 利 要 求 书 1/3 页
2
CN 114663366 A
2其中, c、 h、 w表示特征的可变通道、 可变高和可变宽, H和W表示特征的最大高和宽, i和j
表示逐宽和逐高累加特 征的顺序, 将两个一维特 征编码分别沿两个空间方向聚合特 征f:
其中, δ、 Conv和Concat分别表示为非线性激活函数、 卷积和特征拼接, 聚合特征再分解
沿一个空间方向捕获远程依赖关系
同时沿另一空间方向保留精确的位置信息
其中, fh和fw分别表示聚合特征f沿高和宽的方向进行 的特征分解, σ 表示Sigmoid激活
函数, 最后这两个方向的特征与原始输入特征进行展开加权求和, 得到坐标注意力特征yc
(i,j):
其中, 展开加权求和简化后以乘积的形式呈现;
步骤三: 修改原有 模型的颈部网络, 参考双向特征 金字塔结构在特 征金字塔加路径聚合
结构中的第四层建立一个双向连接, 第二层的中间输出和最终输出分 别表示为
和
其中, Conv和Concat分别表示卷积和特征拼接,
和
分别表示颈部网络中的
双向特征金字塔的第三、 四和五层的输入, Resize表示调整参数特征大小与Concat第一个
参数一致;
步骤四: 修改原有模型的头部网络, 把头部网络中用于多尺度特征预测的三分支检测
头改成两个 分支, 去掉网格最小的输出特征大小为80 ×80×255的分支, 保留两个 分支的输
出特征大小分别为 40×40×255和20×20×255。
5.根据权利 要求4所述的一种基于YOLOv5s神经网络的酒店套装门检测方法, 其特征在
于, 步骤四中, 利用数据集对目标检测模型进行训练和测试, 将训练好的神经网络模型部署
到华为Atlas200DK设备上, 包括以下步骤:
步骤一: 在训练前, 设置Adam优化器训练YOLOv5s模型, 初始学习率为0.001, 动量为
0.937, 权 重衰减为0.0 005;
步骤二: 在训练中, 使用步骤二中标注好的数据作为步骤三搭建的YOLOv5s神经网络模
型的输入, 以标注的类别作为神经网络模型 的输出对神经网络模型进行训练, 进行预设次
数的迭代训练;
步骤三: 在训练后, 保存训练好的神经网络模型, 并将训练好的神经网络模型部署到华权 利 要 求 书 2/3 页
3
CN 114663366 A
3
专利 一种基于YOLOv5s神经网络的酒店套装门检测方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:11:50上传分享