专利 一种农作物果实采摘的果实识别定位方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211106382.7 (22)申请日 2022.09.11 (71)申请人贵州大学地址 550025 贵州省贵阳市花溪区贵州大学 (72)发明人谢明山　张松　邓艳芳　贾伟　 (74)专利代理机构贵阳春秋知识产权代理事务所(普通合伙) 52109 专利代理师杨云 (51)Int.Cl. G06V 10/82(2022.01) G06V 10/764(2022.01) G06V 10/25(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06T 7/70(2017.01) G06T 7/80(2017.01) (54)发明名称一种农作物果实采摘的果实识别定位方法 (57)摘要本发明公开了一种农作物果实采摘的果实识别定位方法。本发明引入Ghostnet轻量化模块，得到GN ‑YOLOv5s模型，由深度可分离卷积代替原始卷积层提取特征,减少网络计算量；再次, 为进一步精简模型大小,在BN层引入关于缩放系数的正则化项进行稀疏训练,筛选出缩放因子γ 为0‑0 .005的通道 ,做出剪枝处理得到GS ‑ YOLOv5s模型；最后,为使剪枝后的模型保持较高的检测精度,采用知识蒸馏方法,以教师网络辅助剪枝后的模型微调得到PD ‑yolov5s，降低硬件成本,同时在低算力平台便于部署。本发明能够降低网络复杂度，提升检测效率，使其能够部署到算力较小的嵌入式平台，并获得农作物密集果实的定位信息，为采摘机器人后续的动作规划奠定基础的有益效果。权利要求书3页说明书10页附图8页 CN 115439731 A 2022.12.06 CN 115439731 A 1.一种农作物果实采摘的果实识别定位方法，其特征在于：包括有以下步骤：步骤一、对农作物果实进行图像采集，建立果实数据集；步骤二、将原始YOLOv5s模型中的C3_x结构替换为Ghostnet模块，得到GN ‑YOLOv5s模型；步骤三、将步骤二中得到的GN ‑YOLOv5s模型进行稀疏训练，得到GS ‑YOLOv5s模型，且稀疏训练首先以BN层的缩放因子γ作为评价通道重要性指标；步骤四、设置剪枝率，将步骤三得到的GS ‑YOLOv5s模型中γ值为0 ‑0.005的通道进行剪枝，移除被剪枝的通道的输入输出，然后对剪枝后的模型权重进行调整，最后调整剪枝率训练并重复这个过程，得到GP ‑YOLOv5s模型；步骤五、将步骤二中的原始YOLOv5s检测模型作为教师模型，将步骤四得到的GP ‑ YOLOv5s模型作为学生模型，通过步骤一中的原始YOLOv5s模型的完整输出，让步骤四得到的GP‑YOLOv5s模型掌握步骤一中原始YOLOv5s模型的推理方式，步骤四得到的GP ‑YOLOv5s 模型的分类损失函数如式(4)所示,坐标框损失函数如式(5)所示.最终蒸馏总体损失函数如式(6)所示；其中，式4中为步骤四得到的GP ‑YOLOv5s模型模型对应的目标、类别概率、坐标框, 为各自的真实值,fobj、 fclass、 fbb分别为目标、分类以及坐标框的损失函数；其中，式5中为目标损失, 为蒸馏损失, λD为权重系数, 为教师模型预测目标；其中，式6中: 对应原始分类损失, 为蒸馏分类损失, λD为权重系数, 为更新后的教师模型预测目标，得到P D‑YOLOv5s模型；步骤六；相机标定：将双目相机水平固定，确保标定板在相机视野内，不断的改变标定板的位置和姿态，采集40 ‑50组标定图片，选择不同角度的14 ‑20组图片，使用MATLAB标定工具箱进行标定，得到双目相机参数；步骤七、完成步骤六的相机标定后，利用步骤五中得到的PD ‑YOLOv5s模型输入双目相机，使双目相机的左右摄像头分别识别出的农作物果实检测框，将农作物检测框中心点作为目标点，记为P点，左相机的在像素坐标系下目标点P的坐标(XL,YL)，记为PL(XL,YL)；右相机的在像素坐标系下目标点P的坐标(XR,YR)，记为PR(XR,YR)；步骤八、将步骤七中得到农作物果实目标点P的二维坐标使用SGBM立体匹配算法对双目相机左右摄像头获取的图片逐行进行匹配；步骤七中得到的P点在左右相机的投影平面上的像素坐标分别为PL(XL,XL)和PR(XR,YR)，两相机的图像平面在同一水平面上，步骤七中得到的P点的坐标中Y＝YL＝YR，由三角关系可以得到如式(9)所示：权　利　要　求　书 1/3 页 2 CN 115439731 A 2其中： f为相机焦距， b为左右相机光心距离， (XC,YC,ZC)为世界坐标系下点P的坐标；将步骤七中得到的P点的视差XL‑XR记为d，以左相机的坐标系作为世界坐标系，利用视差值，计算得到P点在左相机坐标系下的坐标，如式(10)所示为：其中： b为左右相机光心距离,d为P点的视差， XL为左相机中目标点P在像素坐标系下的横坐标， Y为左相机与相机中目标点P在像素坐标系下的纵坐标；根据式(10)计算得到的坐标(Xc,Y c， Zc)即为步骤七中得到的P点的三维坐标。 2.根据权利要求1所述的农作物果实采摘的果实识别定位方法，其特征在于：所述步骤一中，对农作物果实进行图像采集后，然后对果实图像进行人工标注，绘制果实目标的外接矩形框，并标注被遮挡果实与未被遮挡果实两类，标注后完成后，建立果实数据集。 3.根据权利要求1所述的农作物果实采摘的果实识别定位方法，其特征在于：所述步骤二中， Ghost net模块首先将果实数据集通过常规卷积，得到常规卷积特征图，然后由已生成的常规卷积特征图进行线性变换，生成新的相似特征图，最后将两组特征图中的信息进行组合，作为全部特征信息。 4.根据权利要求1所述的农作物果实采摘的果实识别定位方法，其特征在于：所述步骤三中，稀疏训练首先以BN层的缩放因子γ作为评价通道重要性指标,γ大小与通道重要性呈正相关， BN层的计算公式如下所示： Zout＝γ·Z^+β (1) 其中γ、 β 为BN层的归一化参数， Zm、 Zout分别表示BN层的输入和输出， μ、 δ分别代表BN层的均值和方差， ε表示一个范围为0 ‑0.001的常量；然后对BN层的γ参数引入式(3)中的正则惩罚项∑γg(γ)，同时构建稀疏训练损失函数，稀疏训练损失函数如下所示： L＝∑(x,y)l(f(x,W),y)+λ∑γg(γ) (3) 其中∑(x,y)l(f(x,W),y)为步骤二中GN ‑YOLOv5s模型定义的损失函数， x表示输入矩阵、 y表示输入标签、 W表示模型的权重； λ∑γg(γ)是用来约束γ的正则项惩罚，其中λ＝0.01用于平衡下两项损失，称为稀疏率。 5.根据权利要求1所述的农作物果实采摘的果实识别定位方法，其特征在于：所述步骤四中，设置65 ‑75％的剪枝率，将步骤三得到的GS ‑YOLOv5s模型中γ值为0 ‑0.005的通道进行剪枝，移除被剪枝的通道的输入输出，然后对剪枝后的模型权重进行调整，最后调整剪枝权　利　要　求　书 2/3 页 3 CN 115439731 A 3

专利 一种农作物果实采摘的果实识别定位方法

专利一种农作物果实采摘的果实识别定位方法