(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210909372.0
(22)申请日 2022.07.29
(71)申请人 华南理工大 学
地址 510640 广东省广州市天河区五山路
381号
申请人 佛山纽欣肯智能科技有限公司
(72)发明人 王敏 林梓欣 戴诗陆
(74)专利代理 机构 广州市华学知识产权代理有
限公司 4 4245
专利代理师 李斌
(51)Int.Cl.
B25J 9/16(2006.01)
(54)发明名称
基于外环速度补偿的封闭机器人任务空间
学习控制方法、 存 储介质及机 器人
(57)摘要
本发明公开了一种基于外环速度补偿的封
闭机器人任务空间学习控制方法、 存储介质及机
器人, 方法包括: 建立具有内部速度PI控制器的
封闭机器人动力学和运动学模型, 并构建期望的
末端周期轨迹; 设计自适应神经网络速度补偿控
制指令, 利用确定学习理论获取经验知识, 并通
过参数收敛性质获取机器人运动学知识; 基于所
获知识设计速度补偿学习控制指令。 本发明所设
计方法通过分离封闭机器人动力学和运动学, 在
运用确定学习理论实现系统经验知识获取的基
础上, 保证了未知运动学参数的收敛, 实现了学
习控制算法在具有未知动力学和运动学封闭机
器人系统上的应用, 基于所获知识设计的速度补
偿学习控制指令, 在节省计算资源的同时提升了
机器人暂态 跟踪性能。
权利要求书3页 说明书10页 附图5页
CN 115122335 A
2022.09.30
CN 115122335 A
1.基于外环速度补偿的封闭机器人任务空间学习控制方法, 其特征在于, 包括下述步
骤:
S1、 建立具有内部速度PI控制器的封闭机器人动力学模型和运动学模型, 并构建期望
的末端周期轨 迹;
S2、 运用动态布置神经元的方式构建神经网络, 结合李雅普诺夫稳定性理论设计自适
应神经网络速度补偿控制指令, 利用确定 学习理论将收敛后的神经网络权值
保存为常值
权值
并通过参数收敛性质将收敛后的未知运动学参数估计值
保存为常值运动学参数
所述自适应神经网络 速度补偿控制指令如下:
z1=x1‑xd1
其中, α1为封闭机器人系统虚拟控制器,
为封闭机器人关节参考速度,
为自适应神
经网络速度补 偿控制指令, z1为封闭机器人末端跟踪误差, x1为封闭机器人末端在任务空间
的位置, xd1为封闭机器人末端期 望的任务空间位置周期 轨迹,
为封闭机器人末端期 望的
任务空间速度周期轨迹,
为被估计雅可比矩阵的逆,
为未知运动学参数ak的估
计值,
为神经网络权值的估计值, Φ( β )=[φ1(||β‑θ1||),…,φN(||β‑θN||)]T为神经网
络高斯型径向基函数,
θk为中心点, ρk为宽
度, N为神经网络布 点数,
为神经网络的输入, q为封闭机器人关节的角位
置,
为封闭机器人 的关节角速度, qc为对
积分得到的位置补偿控制指令,
为封闭机器
人关节参考速度
的导数, c1为α1中的正常数控制增益, c2为
中的正常数控制增益,s为控
制器设计过程中的中间误差变量;
所述神经网络 权值
的更新律为:
其中, γ1为神经网络 权值更新 律的增益项, σ1为神经网络 权值更新 律的设计常数;
所述未知运动学参数估计值
的更新律为:
其中,
为封闭机器人运动学回归矩阵, γ2为未知运动学参数更新律的增益项,
σ2为未知运动学参数 更新律的设计常数;
S3、 利用常值权值
和常值运动学参数
设计常值神经网络 速度补偿控制指令:
2.根据权利要求1所述基于外环速度补偿 的封闭机器人任务空间学习控制方法, 其特权 利 要 求 书 1/3 页
2
CN 115122335 A
2征在于, 步骤S1中, 所述PI控制器具体为:
其中, KP为比例系数, KI为积分系数, 均为未知对角正定矩阵。
3.根据权利要求1所述基于外环速度补偿 的封闭机器人任务空间学习控制方法, 其特
征在于, 步骤S1中, 所述封闭机器人动力学模型, 具体为:
其中, M(q)为封闭机器人的未知惯性矩阵, 该矩阵对称且一致正定,
为封闭机器
人的未知科氏力和离心力矩阵, G(q)为封闭机器人的未知重力向量, u为封闭机器人内部速
度PI控制器, K为封闭机器人系统内部控制增益, 为未知常值对角正定矩阵。
4.根据权利要求1所述基于外环速度补偿 的封闭机器人任务空间学习控制方法, 其特
征在于, 步骤S1中, 所述封闭机器人运动学模型, 具体为:
x1=f(q)
其中, f(·)表示封闭机器人从关节空间角度到任务空间坐标的映射;
对该运动学模型求 导如下:
其中,
为封闭机器人末端在任务空间的速度, J(q,ak)为参数未知的雅可比矩阵。
5.根据权利要求1所述基于外环速度补偿 的封闭机器人任务空间学习控制方法, 其特
征在于, 步骤S1中, 所述期望的末端周期轨 迹, 具体为:
其中, xd2为封闭机器人末端期望的任务空间速度周期轨迹, f(xd1,xd2)为给定的连续周
期函数。
6.根据权利要求1所述基于外环速度补偿 的封闭机器人任务空间学习控制方法, 其特
征在于, 步骤S2中, 运用动态 布置神经 元的方式构建神经网络, 具体为:
S21、 定义 新增神经元参数:
P=<θp, ρp,Wp>
其中, θp, ρp,Wp分别为新增神经元的中心、 宽度和权值;
S22、 定义新增神经元的中心:
其中,
是神经元集合Cmin的平均中心位置, Cmin为由距离当前输入最近的l个神经元
构成的集 合, λ为决定新增 神经元与集合Cmin距离的可设计参数;
S23、 判断是否新增 神经元:
定义可调阈值ν, 当神将网络输入β 与神经元集合Cmin的平均中心位置
大于阈值时,
按照已设置的参数定义 新增神经元。
7.根据权利要求1所述基于外环速度补偿 的封闭机器人任务空间学习控制方法, 其特
征在于, 步骤S2中, 利用确定学习理论将收敛后的神经网络权值
保存为常值权值
具体权 利 要 求 书 2/3 页
3
CN 115122335 A
3
专利 基于外环速度补偿的封闭机器人任务空间学习控制方法、存储介质及机器人
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 16:11:31上传分享