说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211106382.7 (22)申请日 2022.09.11 (71)申请人 贵州大学 地址 550025 贵州省贵阳市花溪区贵州大 学 (72)发明人 谢明山 张松 邓艳芳 贾伟  (74)专利代理 机构 贵阳春秋知识产权代理事务 所(普通合伙) 52109 专利代理师 杨云 (51)Int.Cl. G06V 10/82(2022.01) G06V 10/764(2022.01) G06V 10/25(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06T 7/70(2017.01) G06T 7/80(2017.01) (54)发明名称 一种农作物果实采摘的果实识别定位方法 (57)摘要 本发明公开了一种农作物果实采摘的果实 识别定位方法。 本发明引入Ghostnet轻量化模 块, 得到GN ‑YOLOv5s模型, 由深度可分离卷积代 替原始卷积层提取特征,减少网络计算量; 再次, 为进一步精简 模型大小,在BN层引入关于缩放系 数的正则化项进行稀 疏训练,筛选出缩放因子γ 为0‑0 .005的通道 ,做出剪枝处理得到GS ‑ YOLOv5s模型; 最后,为使剪枝后的模型保持较高 的检测精度,采用知识蒸馏方法,以教师网络辅 助剪枝后的模型微调得到PD ‑yolov5s, 降低硬件 成本,同时在低算力平台便于部署。 本发明能够 降低网络复杂度, 提升检测 效率, 使其能够部署 到算力较小的嵌入式平台, 并获得农作物密集果 实的定位信息, 为采摘机器人后续的动作规划奠 定基础的有益效果。 权利要求书3页 说明书10页 附图8页 CN 115439731 A 2022.12.06 CN 115439731 A 1.一种农作物果实采摘的果实识别定位方法, 其特 征在于: 包括有以下步骤: 步骤一、 对农作物果实进行图像采集, 建立 果实数据集; 步骤二、 将原始YOLOv5s模型中的C3_x结构替换为Ghostnet模块, 得到GN ‑YOLOv5s模 型; 步骤三、 将步骤二中得到的GN ‑YOLOv5s模型进行稀疏训练, 得到GS ‑YOLOv5s模型, 且稀 疏训练首 先以BN层的缩放因子γ作为评价 通道重要性指标; 步骤四、 设置剪枝率, 将步骤三得到的GS ‑YOLOv5s模型中γ值为0 ‑0.005的通道进行剪 枝, 移除被剪枝的通道的输入输出, 然后对剪枝后的模型权重进 行调整, 最后调整剪枝率训 练并重复这个过程, 得到GP ‑YOLOv5s模型; 步骤五、 将步骤二中的原始YOLOv5s检测模型作为教师模型, 将步骤四得到的GP ‑ YOLOv5s模型作为学生模型, 通过步骤一中的原始YOLOv5s模型的完整输出, 让步骤 四得到 的GP‑YOLOv5s模型掌握步骤一中原始YOLOv5s模型的推理方式, 步骤四得到的GP ‑YOLOv5s 模型的分类损失函数如式(4)所示,坐标框损失函数如式(5)所示.最终蒸馏总体损失函数 如式(6)所示; 其中, 式4中 为步骤四得到的GP ‑YOLOv5s模型模型对应的目标、 类别概率、 坐 标框, 为各自的真实值,fobj、 fclass、 fbb分别为目标、 分类以及坐标框的损失函 数; 其中, 式5中 为目标损失, 为蒸馏损失, λD为权重系数, 为 教师模型 预测目标; 其中, 式6中: 对应原始分类损失, 为蒸馏分类损 失, λD为权重系数, 为更新后的教师模型 预测目标, 得到P D‑YOLOv5s模型; 步骤六; 相机标定: 将双目相机水平固定, 确保标定板在相机视野内, 不断的改变标定 板的位置和姿态, 采集40 ‑50组标定图片, 选择不同角度的14 ‑20组图片, 使用MATLAB标定工 具箱进行 标定, 得到双目相机参数; 步骤七、 完成步骤六的相机标定后, 利用步骤五中得到的PD ‑YOLOv5s模型输入双目相 机, 使双目相 机的左右摄像头分别识别出 的农作物果实检测框, 将农作物检测框中心点作 为目标点, 记为P点, 左相机的在像素坐标系下目标点P的坐标(XL,YL), 记为PL(XL,YL); 右相 机的在像素坐标系下目标点P的坐标(XR,YR), 记为PR(XR,YR); 步骤八、 将步骤七中得到农作物果实目标点P的二维坐标使用SGBM立体匹配算法对双 目相机左右摄像头获取 的图片逐行进行匹配; 步骤七中得到的P点在左右相 机的投影平面 上的像素坐标分别为PL(XL,XL)和PR(XR,YR), 两相机的图像平面在同一水平面上, 步骤七中 得到的P点的坐标中Y=YL=YR, 由三角关系可以得到如式(9)所示:权 利 要 求 书 1/3 页 2 CN 115439731 A 2其中: f为相机焦距, b为左右相机光心 距离, (XC,YC,ZC)为世界坐标系下点P的坐标; 将步骤七中得到的P点的视差XL‑XR记为d, 以左相机的坐标系作为世界坐标系, 利用视 差值, 计算得到P点在左相机坐标系下的坐标, 如式(10)所示 为: 其中: b为左右相机光心距离,d为P点的视差, XL为左相机中目标点P在像素坐标系下的 横坐标, Y为左相机与相机中目标点P在像素坐标系下的纵坐标; 根据式(10)计算得到的坐标(Xc,Y c, Zc)即为 步骤七中得到的P点的三维坐标。 2.根据权利要求1所述的农作物果实采摘的果实识别定位方法, 其特征在于: 所述步骤 一中, 对农作物果 实进行图像采集后, 然后对果 实图像进行人工标注, 绘制果 实目标的外接 矩形框, 并标注被遮挡果实与未被遮挡果实两类, 标注后完成后, 建立 果实数据集。 3.根据权利要求1所述的农作物果实采摘的果实识别定位方法, 其特征在于: 所述步骤 二中, Ghost net模块首先将果 实数据集通过常规卷积, 得到常规卷积特征图, 然后由已生 成 的常规卷积特征图进行线性变换, 生成新的相似特征图, 最后将两组特征图中的信息进行 组合, 作为全部特 征信息。 4.根据权利要求1所述的农作物果实采摘的果实识别定位方法, 其特征在于: 所述步骤 三中, 稀疏训练首先以BN层的缩放因子γ作为评价通道重要性指标,γ大小与通道重要性 呈正相关, BN层的计算公式如下 所示: Zout=γ·Z^+β     (1) 其中γ、 β 为BN层的归一化参数, Zm、 Zout分别表示BN层的输入和输出, μ、 δ分别代表BN层 的均值和方差, ε表示 一个范围为0 ‑0.001的常量; 然后对BN层的γ参数引入式(3)中的正则惩罚项∑γg(γ), 同时构建稀疏训练损失函 数, 稀疏训练损失函数如下 所示: L=∑(x,y)l(f(x,W),y)+λ∑γg(γ)    (3) 其中∑(x,y)l(f(x,W),y)为步骤二中GN ‑YOLOv5s模型定义的损失函数, x表示输入矩阵、 y表示输入标签、 W表 示模型的权重; λ∑γg(γ)是用来约束γ的正则项惩罚, 其中λ=0.01用 于平衡下两项损失, 称为稀疏率。 5.根据权利要求1所述的农作物果实采摘的果实识别定位方法, 其特征在于: 所述步骤 四中, 设置65 ‑75%的剪枝率, 将步骤三得到的GS ‑YOLOv5s模型中γ值为0 ‑0.005的通道进 行剪枝, 移除被剪枝的通道的输入输出, 然后对剪枝后的模型权重进 行调整, 最后调整剪枝权 利 要 求 书 2/3 页 3 CN 115439731 A 3

PDF文档 专利 一种农作物果实采摘的果实识别定位方法

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种农作物果实采摘的果实识别定位方法 第 1 页 专利 一种农作物果实采摘的果实识别定位方法 第 2 页 专利 一种农作物果实采摘的果实识别定位方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:52上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。