工作空间中机械手的神经网络自适应控制
通过对文[1]的控制方法进行详细推导及仿真分析,研究一类机器人力臂在工作空间内神经网络自适应
控制的设计方法。
针对工作空间中机械手的神经网络自适应控制,采用神经网络在线建模技术,既不需要逆动态模型的
估计值,又不需要耗时的训练过程。通过引入GL 矩阵及其乘法算子 "" ,通过采用直接辨识的参数得到控
制律,不需要雅可比矩阵的逆,通过鲁棒控制项来抑制神经网络建模误差和有界扰动。
1 工作空间直角坐标与关节角位置的转换
根据著作[2],将工作空间中的关节末端直角坐标
1, xx
2
转为二关节关节角位置
1,qq
2
的转换公式如
下:
q
2
arccos
2
x
1
l
2
2
2
l
1
2
x
2
2
ll
21
q
1
arctan
x
2
x
1
arctan
l
1
l
1
2 机械手的神经网络建模
2
sin
l
q
cos
2
2
q
2
考虑一个刚性 n 关节机械手,其动态特性为:
qGqqqCqqD
,
(1)
(2)
(3)
其中,
nRq 是表示关节变量的向量,
nR
是执行机构施加的关节扭矩向量,
qD
nnR
为对称正定
惯性矩阵,
qqC
nnR
,
为哥氏力和离心力向量,
qG 为重力向量。
nR
假定机械手的工作性质与末端执行器的空间位置有关,因此,需要直接在工作空间中设计控制算法。
nRx 表示末端执行器在工作空间中的位置和方位,则机械手在工作空间的动态特性可表示为:
用
其 中
qD
x
J
T
JqDq
1
q
,
x
qqC
,
J
T
qGxqqCxqD
,
x
x
JqDqqCq
x
,
F
x
JqJq
1
(4)
1
q
,
qG
x
J
T
qGq
,
J
T
q
。
qJ
nnR
F
x
是由结构决定的雅可比矩阵,假定它在有界的工作空间Ω中是非奇异的。
机械手动态方程具有下面特性:
特性 1:惯性矩阵 qDx 对称正定;
特性2:矩阵
2
,
D q
C q q
是斜对称的。
x
x
由于 qDx 和 qGx 仅仅是 q 的函数,因此,可采用静态神经网络对它们进行建模。 qDx 和 qGx
的神经网络模型为:
q
d
xkj
q
g
xk
l
l
kjl
kjl
q
dkj
q
kj
T
kj
q
dkj
q
kl
kl
q
gk
q
k
T
k
q
gk
q
为神经网络的权值,
其中 ,kjl
kl R
,
q
q
gk
对于
qqC
, ,用输入为 q 和 q 的动态神经网络进行建模,
是输入为向量 q 的径向基函数。
,
kl
dxkj 和 q
gxk 的建模误差,并假定它们是有界的。
kjl
q
分别是
C xkj
qq
, 的神经网络模型为:
dkj
R
R
q
q
c
xkj
qq
,
kjl
kjl
z
ckj
l
是权值, R
z
kjl
z
kj
T
kj
z
ckj
z
是输入为向量 z 的径向基函数。
ckj
z
是
2
n
R
T
T
T
q q
z
qq
, 的建模误差,并假定它也是有界的。
kjl
,
R
其中,
cxkj
采用神经网络建模,则机械手在工作空间中的动态方程可写为:
F
qGxqqCxqD
,
x
x
x
x
(5)
其中
d
c
xkj
q
xkj
,.
qq
q
kj
q
z
kj
q
T
kj
T
kj
T
k
k
xk
g
dkj
q
z
ckj
q
gk
采用GL矩阵及其乘法操作, qDx 可以写成:
qE
D
q 是GL矩阵,其元素分别为 kj 和 qkj 。
qE
D
qD
x
nn
R
T
q
其中 和
是元素为建模误差
(6)
q
dkj
的矩
阵。
同样,对
qqC
, 和 qGx ,有:
qqC
,
x
T
A
T
B
zZ
qH
zE
C
qE
G
qG
x
其中 A ,
zZ , B 和
qH 为GL矩阵和GL向量,其元素分别为 kj , zkj , k 。
zE
C
qE
G
n
是元素分别为建模误差
R
ckj
z
和 qgk
的矩阵。
3 控制器的设计
设 t
xd 是在工作空间中的理想轨迹,则 t
xd
和 t
xd
分别是理想的速度和加速度。
定义
te
x
d
t
tx
tx
r
x
d
t
te
(7)
(8)
nn
R
和
其中 是一个正定矩阵。
引理1:设
tr
te
th
tr
tx
r
tx
te
te
,其中,*代表卷积,
th
sHL
1
且 sH 是一个 nn 阶的严格按指数稳
定的传递函数。如果
r
nL
2 ,则
e
L
n
2
L
n
,
nL
2
e
, e 是连续的,当
t
时,
0e
,
0r
,
0e
。
其中
能量有限定义为:
L
2
f
0
2
2
f dt
,finite energy
,
有界定义为:
L
f
sup
0,
t
f
,bounded signal
。
~
采用 ˆ 代表 的估计值,定义
ˆ
,则 ˆ , Aˆ 和 Bˆ 分别代表式 , A 和 B 的估计值。
控制器设计为:
Fx
T
ˆ
q
x
r
T
ˆ
A
zZ
x
r
T
ˆ
B
qH
Kr
k
s
sgn
r
(9)
其中
,
0
nnRK
控制器前三项是基于模型的控制, K r 项相当于比例微分(PD)控制,控制律的最后一项为抑制神经
ks ,
。
E
r
xqEE
r
D
xzE
C
qE
G
网络建模误差的鲁棒项。
将(6)、(7)和(8)代入(5)得
E q x
D
q
T
T
A
Z z
E z
C
x
T
B
H q
E q
G
F
x
T
将控制律(4)代入上式得
ˆ
q
q
T
E q x
D
ˆ
A
T
x
r
T
A
Z z
x
r
Z z
ˆ
B
T
x
E z
C
H q
T
B
H q
E q
G
r
Kr
k
s
sgn
,
x
x
r
r
代入上式得
将
x
x
T
ˆ
T
r
r
q
q
(
E q
D
ˆ
A
T
x
r
x
r
T
)
r
A
Z z
x
r
(
Z z
E z
C
ˆ
Kr k
B
H q
s
x
r
T
)
r
T
B
r
sgn
H q
E q
G
将上式化简得:
T
T
q
q
r
E q
D
A
T
x
r
把(4)、(5)和(6)代入上式得
T
A
Z z
Z z
x
r
B
T
k
s
sgn
r
H q
E z
C
r Kr
E
rqqCrqD
x
~
T
,
x
q
x
r
k
Kr
~
T
A
s
sgn
r
zZ
x
r
T
~
B
qH
E
系统(10)的稳定性由下面定理给出。
定理 对闭环系统(8),如果 0K ,
ks ,且自适应律设计为
E
ˆ
k
ˆ
k
ˆ
k
x r
r k
x r
r k
q
k
z
k
q r
k
k
k
k
Q
k
N
(10)
(11)
其中
0
k
T
k
,
Q
T
k Q
k
0
,
N
T
k N
k
0
且 kˆ 和 kˆ 是元素分别为 kjˆ 和 kjˆ 的向量,则 kˆ , kˆ ,
kˆ
L 且
e
L
n
2
L
n
, e 是连续的,当 t
, 0e 和
0e
。
证明:
考虑如下Lyapunov函数
V
1
2
T
rqDr
x
1
2
其中 k , kQ , kN 为正定对称矩阵。
则
~
T
k
n
k
1
~
1
k
k
1
2
n
k
1
~
T
k
Q
~
1
k
k
1
2
n
k
1
~
T
k
~
1
k
k
N
V
T
rDr
T
rDr
1
2
n
~
T
k
~
1
k
k
k
1
是斜对称的,则
DrT
2
由于矩阵
qD
x
代入上式得
2
qqC
x
,
~
~
T
k
k
1
Q
k
n
k
1
~
T
k
~
1
k
k
N
n
k
rC
1
0
,即
T
rDr
1
2
T
Cr
r
0
,
1
2
T
rDr
T
r
Cr
,
V
T
rDr
r
T
Cr
T
rDr
Cr
n
k
1
n
1
k
~
T
k
~
T
k
~
1
k
k
n
k
1
~
T
k
Q
~
1
k
k
~
1
k
k
n
k
1
~
T
k
Q
~
1
k
k
n
k
1
n
1
k
~
T
k
~
T
k
~
1
k
k
N
~
1
k
k
N
将(10)式代入,得
V
T
r Kr
T
k r
s
sgn
r
T
k
k
q x r
r k
n
k
1
T
k
k
1
k
n
k
1
T
r E
考虑
n
k
1
k
1
Q
k
T
k
n
k
1
T
k
k
1
k
N
k
T
k
n
k
1
z
x r
r k
n
k
1
k
T
k
q r
k
(12)
T
r
~
T
q
n
x
r
~
k
T
k
rxq
kr
T
r
T
~
A
zZ
1
k
n
r
x
k
1
~
k
T
k
rxz
kr
T
r
T
~
B
qH
n
~
T
k
k
k
1
k
rq
并将自适应律(11)代入(12)式,并考虑到
ks ,得:
E
V
T
r
Kr
0
(13)
收敛性分析:
(a)由(13)及
0K ,得
r
nL
2 ,由引理得
e
L
n
2
L
n
nL
2
e
,
,e 是连续的,则当
t
时,
0e
;
(b)由
V
T
r
Kr
0
,得到
0
tV
V
0
,
0t 。因此,当
tV
L
时,有
~
~
,
k
k
,~,
k
r
L
,即
ˆ,
ˆ,ˆ
k
k
k
L
。
注意到
r
nL
2 ,
x
d
,
x
d
,
n
x
L
d
且
q ,
zZ ,
qH 是有界基函数,则
nLr
。因此, r 是
一致连续的。 r 是一致连续的,且当 t
时,
nLr
2
0r
,
0e
。
如果 k 和 kQ 定义为
k
Q
k
1
k
0
0
1
Q
k
0
0
0
0
0
2
k
0
kn
0
0
0
Q
2
k
0
Q
kn
其中 kj , kjQ (
j 1
n
)是多维相容的矩阵块,则自适应律可表示为元素的形式:
ˆ
kj
kj
kj
ˆ
kj
Q
kj
kj
rxq
rj
k
rxz
rj
k
4 仿真实例
考虑平面两关节机械手,机器人的动力学方程为
qGqqqCqqD
,
qD
m
1
m
m
2
2
m
2
3
m
3
cos
cos
q
2
q
2
m
2
cos
q
2
,
qqC
qm
23
qm
13
sin
q
sin
q
2
2
qm
1
3
q
0.0
sin
q
2
m
3
m
2
2
qG
gm
4
gm
5
cos
q
1
cos
q
1
gm
5
q
2
cos
q
1
q
2
im 由式
LpPM
l
给出的参数,有
mmM
2
m
3
m
4
1
p
1
2
l
1
P
L
p
2
l
2
2
p
3
p
4
ll
21
l
1
Tm
5
Tp
5
T
2
l
lp 是有效载荷, 1l 和 2l 分别是关节1和关节2的长度。 p 是机器人自身的参数向量。雅可比矩阵 qJ
其中
为:
qJ
sin
l
q
1
1
cos
l
q
1
1
l
sin
l
q
2
1
cos
q
2
1
q
2
q
2
sin
q
q
2
1
2
cos
q
q
2
1
l
l
2
机器人力臂实际参数为
P
66.1
42.0
63.0
75.3
25.1
T
2
mkg
每个关节的长度为1m。假定不知道系统的任何先验知识,而且没有有效载荷,即
ˆ
P
0.00.00.00.00.0
T
2
mkg
pl
,
0.0
kg
在笛卡尔空间中,理想跟踪轨迹取
t
xd
1
2.00.1
t
cos
,
t
xd
2
t
sin2.00.1
该轨迹为一个半径为0.2m圆心在
xx
1
, 2
0.1,0.1
m的圆。
初始条件时,机器人静止,其末端执行器在圆的中心,即
0
x
0.10.1
m
,
0
x
0.00.0
/
sm
由于要跟踪的轨迹是工作空间中的直角坐标,而不是关节空间中的角位置,且控制律也是在工作空间中
推导得到的,按(1)和(2)式,将工作空间中的关节末端直角坐标
1, xx
2
转为二关节关节角位置
1,qq
2
。
在仿真中使用工作空间中的动态方程:
x
qGxqqCxqD
,
x
x
F
x
其中
,
qqC
x
F
x
T
ˆ
q
x
r
且
1
q
1
JqJq
1
q
x
x
T
,
J
T
qD
JqDq
J
JqDqqCq
qG
ˆ
A
qGq
ˆ
B
zZ
J
x
r
T
T
T
qH
Kr
k
s
sgn
r
l
l
2
sin
q
q
2
1
cos
q
q
1
2
2
qJ
sin
q
l
1
1
cos
q
1
l
1
l
sin
q
2
1
cos
q
1
l
2
2
q
q
2
qJ
l
1
l
1
cos
sin
q
1
q
1
l
l
2
2
cos
q
1
sin
q
1
1
J
q
1
sin
q
2
l
1
ll
21
角速度为:
q
2
q
2
l
2
l
2
cos
q
l
1
1
cos
l
q
1
2
cos
q
1
sin
q
1
q
2
q
2
q
1
l
2
l
2
cos
q
1
sin
q
1
q
2
q
2
cos
q
1
sin
q
1
q
2
q
2
q
2
q
cos
2
q
1
sin
q
l
2
1
sin
l
q
1
2
q
2
l
1
q
2
l
2
l
2
q
2
sin
q
1
q
1
q
2
1
J
q
x
1
x
2
1
sin
q
2
ll
21
l
1
cos
l
q
1
1
cos
l
q
2
1
q
2
cos
q
1
q
2
l
1
sin
l
q
2
1
sin
l
q
2
1
q
2
sin
q
1
x
1
x
2
q
2
对 qDx 和 qGx 的每一个元素,使用10个节点的静态RBF神经网络,而对
qqC , 中的每一个元素,使用
10个节点的动态RBF神经网络。高斯参数分别取0.0和10.0。
控制器的增益选为
K
diag
0.10
,
diag
0.5
为了测试控制器对载荷扰动的抑制能力,在
t
0.4 时加入一个
s
pl
5.0
kg
的载荷。
1.3
1.2
1.1
1
0.9
0.8
1.3
1.2
1.1
1
0.9
0.8
0
1
2
3
4
5
time(s)
6
7
8
9
10
0
1
2
3
4
5
time(s)
6
7
8
9
10
图1 末关节节点的位置跟踪
s
i
x
a
x
f
o
i
g
n
k
c
a
r
t
n
o
i
t
i
s
o
p
s
i
x
a
y
f
o
i
g
n
k
c
a
r
t
n
o
i
t
i
s
o
p
s
i
x
a
x
f
o
i
g
n
k
c
a
r
t
y
t
i
l
c
o
e
v
3
2
1
0
-1
0
s
i
x
a
y
f
o
i
g
n
k
c
a
r
t
y
t
i
l
c
o
e
v
1.5
1
0.5
0
-0.5
-1
0
1
2
3
4
5
time(s)
6
7
8
9
10
1
2
3
4
5
time(s)
6
7
8
9
10
图2 末关节节点的速度跟踪