logo资料库

机械手的rbf自适应控制建模与matlab程序仿真.doc

第1页 / 共18页
第2页 / 共18页
第3页 / 共18页
第4页 / 共18页
第5页 / 共18页
第6页 / 共18页
第7页 / 共18页
第8页 / 共18页
资料共18页,剩余部分请下载后查看
工作空间中机械手的神经网络自适应控制 通过对文[1]的控制方法进行详细推导及仿真分析,研究一类机器人力臂在工作空间内神经网络自适应 控制的设计方法。 针对工作空间中机械手的神经网络自适应控制,采用神经网络在线建模技术,既不需要逆动态模型的 估计值,又不需要耗时的训练过程。通过引入GL 矩阵及其乘法算子 "" ,通过采用直接辨识的参数得到控 制律,不需要雅可比矩阵的逆,通过鲁棒控制项来抑制神经网络建模误差和有界扰动。 1 工作空间直角坐标与关节角位置的转换 根据著作[2],将工作空间中的关节末端直角坐标 1, xx 2 转为二关节关节角位置 1,qq 2 的转换公式如 下: q 2  arccos 2 x 1   l 2 2 2 l 1 2 x  2 2 ll 21 q 1  arctan x 2 x 1  arctan l 1  l 1 2 机械手的神经网络建模 2 sin l q cos 2 2 q 2 考虑一个刚性 n 关节机械手,其动态特性为:      qGqqqCqqD       , (1) (2) (3) 其中, nRq  是表示关节变量的向量, nR 是执行机构施加的关节扭矩向量,   qD nnR  为对称正定 惯性矩阵,  qqC nnR ,  为哥氏力和离心力向量,   qG  为重力向量。 nR 假定机械手的工作性质与末端执行器的空间位置有关,因此,需要直接在工作空间中设计控制算法。 nRx  表示末端执行器在工作空间中的位置和方位,则机械手在工作空间的动态特性可表示为: 用 其 中   qD x  J T     JqDq 1  q ,  x  qqC ,   J  T   qGxqqCxqD      , x x         JqDqqCq     x ,  F x      JqJq   1 (4)  1  q ,   qG x  J T    qGq ,  J T  q 。   qJ nnR  F x 是由结构决定的雅可比矩阵,假定它在有界的工作空间Ω中是非奇异的。 机械手动态方程具有下面特性: 特性 1:惯性矩阵  qDx 对称正定;  特性2:矩阵   2 , D q C q q  是斜对称的。    x x 由于  qDx 和  qGx 仅仅是 q 的函数,因此,可采用静态神经网络对它们进行建模。  qDx 和  qGx 的神经网络模型为:   q d xkj   q g xk l   l  kjl kjl   q   dkj   q   kj T kj   q   dkj  q  kl kl   q   gk   q   k T k   q   gk  q
   为神经网络的权值,  其中 ,kjl kl R     , q q  gk 对于  qqC , ,用输入为 q 和 q 的动态神经网络进行建模,   是输入为向量 q 的径向基函数。 , kl dxkj 和  q gxk 的建模误差,并假定它们是有界的。  kjl  q  分别是 C xkj qq  , 的神经网络模型为:  dkj R R q q    c xkj  qq ,   kjl kjl   z   ckj l 是权值,   R   z kjl   z   kj T kj   z   ckj  z 是输入为向量 z 的径向基函数。 ckj  z 是  2 n R T   T T q q   z  qq  , 的建模误差,并假定它也是有界的。 kjl  , R 其中, cxkj 采用神经网络建模,则机械手在工作空间中的动态方程可写为: F   qGxqqCxqD          , x x x x (5) 其中 d c xkj   q  xkj   ,. qq   q   kj   q    z  kj   q T kj T kj T k  k  xk g  dkj  q  z  ckj  q gk   采用GL矩阵及其乘法操作,  qDx 可以写成:  qE D q 是GL矩阵,其元素分别为 kj 和  qkj 。    qE D     qD  x nn  R    T     q 其中   和   是元素为建模误差 (6)  q dkj 的矩 阵。 同样,对  qqC , 和  qGx ,有:  qqC  , x    T A    T B        zZ      qH    zE C  qE G   qG x  其中 A ,    zZ ,  B 和   qH 为GL矩阵和GL向量,其元素分别为 kj ,  zkj , k 。    zE C   qE G n  是元素分别为建模误差 R ckj  z 和  qgk 的矩阵。 3 控制器的设计 设  t xd 是在工作空间中的理想轨迹,则  t xd 和  t xd 分别是理想的速度和加速度。 定义   te  x d   t   tx    tx r   x d   t   te (7) (8) nn  R 和
其中  是一个正定矩阵。 引理1:设    tr te   th     tr     tx r     tx     te   te ,其中,*代表卷积,   th   sHL 1  且  sH 是一个 nn  阶的严格按指数稳 定的传递函数。如果 r nL 2 ,则 e  L n 2 L n  , nL 2 e , e 是连续的,当 t 时, 0e , 0r , 0e 。 其中 能量有限定义为:  L 2  f   0 2 2 f dt  ,finite energy  , 有界定义为: L      f  sup  0, t    f   ,bounded signal    。   ~ 采用  ˆ 代表   的估计值,定义   ˆ   ,则 ˆ , Aˆ 和 Bˆ 分别代表式   ,  A 和  B 的估计值。 控制器设计为: Fx T     ˆ       q   x r  T    ˆ A        zZ   x r  T    ˆ B        qH  Kr  k s sgn  r (9) 其中 , 0  nnRK 控制器前三项是基于模型的控制, K r 项相当于比例微分(PD)控制,控制律的最后一项为抑制神经 ks  , 。 E    r    xqEE r D    xzE C  qE G 网络建模误差的鲁棒项。 将(6)、(7)和(8)代入(5)得       E q x  D           q  T     T   A       Z z      E z C x     T   B    H q       E q G   F x T  将控制律(4)代入上式得                  ˆ           q q   T     E q x  D    ˆ A    T x  r T    A       Z z        x  r     Z z      ˆ B    T    x E z  C     H q   T    B     H q    E q G       r     Kr  k s sgn ,  x   x r   r 代入上式得 将  x   x   T         ˆ    T r r             q      q      ( E q D    ˆ A    T x  r x  r  T ) r        A       Z z   x  r  (          Z z E z   C       ˆ   Kr k B H q    s   x  r   T ) r   T    B    r sgn       H q     E q G 将上式化简得:   T                    T       q q      r E q  D     A    T x  r        把(4)、(5)和(6)代入上式得 T    A     Z z  Z z      x  r           B   T  k s sgn   r    H q  E z C   r Kr     E   
     rqqCrqD x   ~ T      , x     q     x r    k Kr    ~ T  A  s    sgn r      zZ   x r  T   ~  B        qH  E 系统(10)的稳定性由下面定理给出。 定理 对闭环系统(8),如果 0K , ks  ,且自适应律设计为 E  ˆ  k  ˆ  k  ˆ  k       x r  r k x r  r k      q  k   z   k   q r  k k k k Q k N (10) (11) 其中 0 k T k , Q  T k Q k 0 , N  T k N k 0 且 kˆ 和 kˆ 是元素分别为 kjˆ 和 kjˆ 的向量,则 kˆ , kˆ , kˆ  L 且 e  L n 2 L n  , e 是连续的,当 t , 0e 和 0e 。 证明: 考虑如下Lyapunov函数 V  1 2   T rqDr x  1 2 其中 k , kQ , kN 为正定对称矩阵。 则 ~ T  k n  k 1  ~ 1    k k  1 2 n  k 1  ~ T  k Q ~ 1   k k  1 2 n  k 1  ~ T  k ~ 1   k k N  V  T  rDr  T  rDr  1 2 n  ~ T  k ~ 1    k k k 1  是斜对称的,则  DrT   2 由于矩阵    qD x 代入上式得 2 qqC  x  , ~ ~ T  k k 1  Q k  n  k 1  ~ T  k ~ 1   k k N n   k  rC 1   0 ,即 T  rDr 1 2 T  Cr r  0 , 1 2 T rDr  T r Cr ,  V  T  rDr  r T Cr  T  rDr    Cr   n  k 1  n  1 k  ~ T  k ~ T  k ~  1   k k   n  k 1  ~ T  k Q ~  1   k k  ~  1   k k   n  k 1  ~ T  k Q ~  1   k k  n  k 1  n  1 k  ~ T  k ~ T  k ~  1   k k N ~  1   k k N 将(10)式代入,得  V   T r Kr  T k r s sgn   r  T     k    k    q x r  r k  n  k 1     T   k k 1  k  n  k 1    T r E  考虑 n  k 1       k 1  Q k T k  n  k 1     T   k k 1  k N     k  T k n  k 1     z x r  r k  n  k 1    k T k   q r k (12)
T r   ~  T      q     n    x r  ~  k T     k     rxq kr T r T   ~  A        zZ  1 k  n    r x k 1  ~   k  T    k     rxz kr T r T   ~  B        qH  n  ~ T k k k 1    k rq 并将自适应律(11)代入(12)式,并考虑到 ks  ,得: E  V T  r Kr 0 (13) 收敛性分析: (a)由(13)及 0K ,得 r nL 2 ,由引理得 e  L n 2 L n  nL 2 e , ,e 是连续的,则当 t 时, 0e ; (b)由  V T  r Kr 0 ,得到 0    tV  V  0 , 0t 。因此,当   tV  L 时,有 ~ ~ ,  k k ,~, k r  L ,即 ˆ, ˆ,ˆ  k k k  L 。 注意到 r nL 2 , x d ,  x d , n  x L d 且    q ,    zZ ,    qH 是有界基函数,则 nLr  。因此, r 是 一致连续的。 r 是一致连续的,且当 t 时, nLr 2  0r , 0e 。 如果 k 和 kQ 定义为  k Q k   1 k 0  0        1 Q  k  0     0     0 0 0  2 k  0  kn           0 0 0 Q 2 k  0 Q kn         其中 kj , kjQ ( j 1 n )是多维相容的矩阵块,则自适应律可表示为元素的形式:  ˆ  kj   kj  kj  ˆ   kj Q  kj kj    rxq  rj k    rxz rj k 4 仿真实例 考虑平面两关节机械手,机器人的动力学方程为
   qGqqqCqqD         ,   qD  m 1     m m 2  2  m 2 3 m 3 cos cos q 2 q 2 m 2  cos q 2      , qqC       qm  23  qm 13 sin q sin q 2 2    qm 1 3  q  0.0 sin q 2    m 3 m 2  2   qG     gm 4 gm 5 cos q 1  cos q 1   gm 5  q 2 cos  q 1  q 2     im 由式 LpPM l 给出的参数,有 mmM 2 m 3 m 4 1    p 1  2 l 1 P L p 2 l 2 2 p 3 p 4 ll 21 l 1 Tm 5 Tp 5 T 2 l lp 是有效载荷, 1l 和 2l 分别是关节1和关节2的长度。 p 是机器人自身的参数向量。雅可比矩阵  qJ 其中 为:   qJ   sin l q  1 1   cos l q 1 1      l   sin l q 2 1  cos q 2 1    q 2  q 2   sin q q   2 1 2    cos q q   2 1  l l 2 机器人力臂实际参数为 P   66.1 42.0 63.0 75.3 25.1  T 2 mkg  每个关节的长度为1m。假定不知道系统的任何先验知识,而且没有有效载荷,即 ˆ P  0.00.00.00.00.0  T  2 mkg  pl , 0.0 kg 在笛卡尔空间中,理想跟踪轨迹取   t xd 1  2.00.1  t  cos ,   t xd 2 t  sin2.00.1   该轨迹为一个半径为0.2m圆心在   xx 1 , 2  0.1,0.1 m的圆。 初始条件时,机器人静止,其末端执行器在圆的中心,即   0  x  0.10.1 m ,   0   x  0.00.0  / sm 由于要跟踪的轨迹是工作空间中的直角坐标,而不是关节空间中的角位置,且控制律也是在工作空间中 推导得到的,按(1)和(2)式,将工作空间中的关节末端直角坐标 1, xx 2 转为二关节关节角位置 1,qq 2 。 在仿真中使用工作空间中的动态方程:    x   qGxqqCxqD      , x x  F x 其中
  , qqC x  F x  T    ˆ         q   x r  且 1  q 1       JqJq  1   q x x T ,  J     T    qD     JqDq  J      JqDqqCq   qG    ˆ A   qGq      ˆ B       zZ   J  x r  T  T T       qH  Kr  k s sgn  r  l l 2  sin q q  2 1  cos q q  1 2 2        qJ      sin q l 1 1  cos q 1   l 1   l   sin q 2 1  cos q 1 l 2 2 q  q  2      qJ       l 1 l 1 cos sin  q 1  q 1     l l 2 2  cos q 1  sin q 1 1  J   q  1 sin q 2     l 1 ll 21 角速度为:      q 2  q 2 l 2 l 2  cos q l 1 1   cos l q  1 2  cos q 1  sin q 1        q 2 q 2  q 1       l 2 l 2  cos q 1  sin q 1     q 2 q 2  cos q 1  sin q 1        q 2 q 2  q 2 q  cos 2   q 1  sin q l 2 1   sin l q  1 2  q 2   l 1     q 2   l 2 l 2  q  2  sin q 1     q 1  q 2    1  J    q    x 1  x 2    1 sin q 2 ll 21     l 1  cos l q 1 1   cos l q  2 1  q  2  cos q 1  q 2   l 1  sin l q 2 1   sin l q  2 1  q  2  sin q 1         x 1  x 2     q 2 对  qDx 和  qGx 的每一个元素,使用10个节点的静态RBF神经网络,而对  qqC , 中的每一个元素,使用 10个节点的动态RBF神经网络。高斯参数分别取0.0和10.0。 控制器的增益选为 K  diag  0.10 ,  diag  0.5 为了测试控制器对载荷扰动的抑制能力,在 t 0.4 时加入一个 s pl 5.0 kg 的载荷。
1.3 1.2 1.1 1 0.9 0.8 1.3 1.2 1.1 1 0.9 0.8 0 1 2 3 4 5 time(s) 6 7 8 9 10 0 1 2 3 4 5 time(s) 6 7 8 9 10 图1 末关节节点的位置跟踪 s i x a x f o i g n k c a r t n o i t i s o p s i x a y f o i g n k c a r t n o i t i s o p s i x a x f o i g n k c a r t y t i l c o e v 3 2 1 0 -1 0 s i x a y f o i g n k c a r t y t i l c o e v 1.5 1 0.5 0 -0.5 -1 0 1 2 3 4 5 time(s) 6 7 8 9 10 1 2 3 4 5 time(s) 6 7 8 9 10 图2 末关节节点的速度跟踪
分享到:
收藏