中国科学: 技术科学 2015 年 第 45 卷 第 6 期: 559 ~ 572
论 文
www.scichina.com tech.scichina.com
多无人机协调自主控制专题
《中国科学》杂志社
SCIENCE CHINA PRESS
基于捕食逃逸鸽群优化的无人机紧密编队
协同控制
段海滨①*, 邱华鑫①, 范彦铭②
① 北京航空航天大学飞行器控制一体化技术重点实验室仿生自主飞行系统研究组, 北京 100191;
② 中国航空工业集团公司沈阳飞机设计研究所, 沈阳 110035
* E-mail: hbduan@buaa.edu.cn
收稿日期: 2015-04-15; 接受日期: 2015-05-12
国家自然科学基金重点项目(批准号: 61333004)、国家杰出青年科学基金项目(批准号: 61425008)、国家自然科学基金面上项目(批准号:
61273054)和中组部青年拔尖人才支持计划资助
摘要 提出一种基于捕食逃逸鸽群优化(pigeon-inspired optimization, PIO)的无人机(unmanned
aerial vehicle, UAV)紧密编队协同控制方法. 基于人工势场法设计了外环控制器, 将无人机紧
密编队转化成一种抽象的人造势场中的运动; 基于鸽群优化算法设计了内环控制器, 进行控制
量的优化求解. 在遵循鸽群优化基本思想的基础上, 对其结构进行调整, 并针对基本鸽群优化
易陷入局部最优的问题, 引入了捕食逃逸机制来改善鸽群优化总体性能. 最后, 将本文所提出
的改进鸽群优化算法与基本鸽群优化算法、粒子群优化(particle swarm optimization, PSO)算法进
行了系列对比实验, 实验结果验证了文中所提方法的可行性、有效性和优越性.
关键词
无人机
鸽群优化
紧密编队
粒子群优化
捕食逃逸
人工势场法
1 引言
无人机(unmanned aerial vehicle, UAV)是一种由
自 身 程 序 控 制 或 者 由 无 线 电 遥 控 的 , 用 来 执 行 特
定任务的无人驾驶飞行器, 具备机动性强、风险性
低、成本较低、可靠性高、适应性强、应用领域广
等特质[1].
随着军事、民用需求的提高和相关领域的技术推
动, 如何有效发挥无人机的作用, 已成为当今人们逐
渐关注的焦点. 无人机紧密编队是一种无人机间侧
向距离小于翼展的编队. 因其既可有效改善编队中
无人机的气动性能, 从而减少阻力, 节省燃油, 延长
续航, 又可在雷达屏上以一架超级大型运输机的信
息迷惑敌方防空系统, 达到出其不意的作战目的, 而
备受瞩目.
多无人机紧密编队控制具有极强的耦合性和非
线性[2], Pachter 等人[3,4], Proud 等人[5]和 Buzogany 等
人[6]建立了长机尾流影响下的僚机模型, 并设计了相
应的 PI 控制器, Singh 和 Pachter[7]采用自适应反馈控
制来解决无人机紧密编队的非线性控制问题, Binetti
等人[8]利用极值方法搜索方法, 解决无人机紧密编队
飞行中僚机所需动力最小化的问题, 左斌和胡云安[9]
也曾就该问题展开研究, Li 等人[10,11]利用鲁棒控制和
模糊逻辑等策略为紧密编队控制提供了新的思路,
陈春东等人[12]根据编队飞行实体试验的工程控制方
法, 采用经典 PID 控制设计了紧密编队控制系统, 赵
引用格式: 段海滨, 邱华鑫, 范彦铭. 基于捕食逃逸鸽群优化的无人机紧密编队协同控制. 中国科学: 技术科学, 2015, 45: 559–572
Duan H B, Qiu H X, Fan Y M. Unmanned aerial vehicle close formation cooperative control based on predatory escaping pigeon-inspired optimization
(in Chinese). Sci Sin Tech, 2015, 45: 559–572, doi: 10.1360/N092015-00125
段海滨等: 基于捕食逃逸鸽群优化的无人机紧密编队协同控制
峰等人[13]提出了一种包含级联回路和动态逆回路的
改 进 编 队 飞 行 控 制 技 术 — 局 部 综 合 制 导 与 控 制 ,
Caleb 等人[14]实验验证了五倍翼展间距下无人机自主
紧密编队的可实现性, Johnson 和Dasgupta[15]设计了针
对紧密编队长机控制及其跟随行为的 H-∞控制器并
分析了其鲁棒性.
本文采用内外环控制器来解决紧密编队协同控
制问题, 并选用人工势场法[16]设计外环控制器. 通过
合理设置势场函数, 人工势场法可用于解决三维空
间内的无人机紧密编队问题, 因此, 势场函数如何选
取是本文研究的核心内容之一. 其基本思路是通过
设定无人机间的“引力”和“斥力”, 利用合力控制无人
机的运动, 将无人机在环境中的飞行转化为一种抽
象的人造引力场中的运动.
由于模型输入存在强耦合, 并且性能指标与模
型参数并不存在直接映射关系, 因此紧密编队模型
控制输入的选取是一个关键技术难题. 而群体智能
优化算法对求解问题的性态没有特殊要求, 故在解
决 复 杂 问 题 时 具 有 明 显 优 势 . 继 遗 传 算 法 (genetic
algorithm, GA), 蚁 群 算 法 (ant colony optimization,
ACO), 粒子群算法(particle swarm optimization, PSO)
等较为成熟的优化算法后, Shi[17]基于人类的头脑风
暴过程提出了头脑风暴算法(brain storm optimization,
BSO), Pan[18]从果蝇觅食行为得到启发, 提出了果蝇
优 化 算 法 (fruit fly optimization algorithm, FOA),
Duan[19]针对鸽子独特的导航能力, 提出了鸽群优化
(pigeon-inspired optimization, PIO)算法.
ation, MPIO)来解决无人机紧密编队控制输入的求解
问题. Guilford 等人[20]认为鸽子会在寻的旅程的不同
阶段使用不同的导航工具, 前期依赖磁场, 后期依赖
地标. Whiten[21]认为太阳也是鸽子的一种导航工具,
太阳的高度会对鸽子的导航能力造成影响. 鸽群优
化就是针对上述鸽子导航行为, 通过模拟其特性, 来
寻找全局最优解. 但是, 基本鸽群优化算法易陷入局
部最优解. 为此, 本文通过引入捕食逃逸机制提出了
一种改进鸽群优化算法, 并用于优化无人机紧密编
队内环控制器的控制参数.
本文组织结构如下: 第 2 部分, 设计了一种基于
人工势场法的紧密编队外环控制器; 第 3 部分, 提出
了一种基于捕食逃逸机制的改进鸽群优化算法, 并
用于优化内环控制器的控制参数; 第 4 部分, 给出了
560
本文通过改进鸽群优化(pigeon-inspired optimiz-
考虑长机尾流干扰的无人机紧密编队模型; 第 5 部分,
在以上研究基础上, 给出了无人机紧密编队协同控
制的具体实现过程; 第 6 部分, 进行了系列仿真对比
和实验分析, 验证了所提方法的可行性.
2 基于人工势场法的外环控制器设计
考虑由 n 架无人机组成的紧密编队系统在 3 维的欧
式空间环境中进行无障碍飞行[22], 每架无人机可被视作
一个质点, 那么每架无人机的动力学模型描述如下:
i
P
i
i
i
i
3
3
u
,
i
,
1,
k v
i
v m v
i
i
n
, ,
iP , 表示无人机 i 的位置向量;
(1)
iv ,
3
式中,
表示无人机 i 的速度矢量; mi>0, 表示无人机 i 的质量;
iu , 表示作用在无人机 i 上的控制输入;
ik v 表
示速度阻尼项, 相当于无人机在空气中运动所受到的
空气阻力, 其中 ki 表示速度衰减增益,一般大于 0;
Pij=PiPj 表示无人机 i 与无人机 j 间的相对位置矢量.
为实现整个机群以期望速度并保持个体间恒定距
离运动, 需要控制每架无人机的速度, 使其趋于一致,
并趋于期望速度. 同时, 需要控制无人机间的距离, 使
其总势能达到最小, 此外还需要对速度的阻尼进行补
偿[23]. 综上, 无人机 i 的控制量 ui 可由下式表示:
(2)
i 表示无人机群中人工势场所产生的控制分量,
式中,
它来源于势函数 Vi(表征无人机 i 和其临近无人机相
i 表示使无人机 i 与其临近无人机速
对距离的函数);
度趋同的控制分量; i 表示无人机 i 速度趋于期望速
度的控制分量, 它依赖于长机的设定输入信号(期望
速度 v1).
i
i
k v
u
,
i
i
i
i
当||Pij||≤Rcomm 时, 无人机 i 与 j 视为临近,这里
可选取的无人机 i 与其临近无人机 j 之间的势函数为
ij
V
ij
P
ln
ij
P
2
R
2
desire
2
P
ij
,
(3)
式中, Rdesire表示无人机i 与其临近无人机j 间的期望距离.
僚机 i 的控制量 ui 包含 3 维, 前两维 ui
1,2 是水平
方向上的控制量, 第三维 ui
3 是垂直方向是控制量. 假
设所有无人机均可接收到外部的输入信号(长机的速
度状态), 可把无人机 i 的水平控制量 ui
1,2 定义为
j
v
1,2
i
u
1,2
i
v
1,2
K
K
V
(
)
ij
v
p
(
m v
i
i
1,2
ij
P
1,2
1
v
1,2
)
i
k v
i
1,2
,
(4)
式中, Kv, Kp>0, Kv 表示速度反馈增益因子, Kp 表示人
工势场的增益因子. 通过改变 Kp 和 Kv 这两个增益因
子的值, 可起到调节队形反馈力度和速度匹配反馈
力度的作用, 实质上就是速度匹配控制和调节队形
控制这两种控制作用的优先级.
3 的设置与 ui
垂直控制量 ui
1,2 略有差异, 可表示为
j
j
)
(5)
v
3
K P P
3
i
(
m v
3
i
i
k v
3
i
(
v
3
1
v
3
K
i
3
(
)
)
,
h
v
i
i
u
3
式中, Kh 表示高度反馈增益因子, 用来调节无人机形
成队形以及队形保持时高度反馈的力度.
3 基于改进鸽群优化的内环控制器设计
3.1 鸽群优化
鸽子具有特殊的导航能力, 它们使用太阳、地球
磁场和地标寻找路径, 并在旅程的不同阶段使用不
同的导航工具. 当鸽子开始飞行时, 会更多依赖于类
似于指南针的导航工具. 而在旅程的中间部分, 可将
导航工具切换到地标, 此时鸽群个体会重新评估所
经历的路线并进行修正[20].
基于鸽子在飞行过程中的特殊行为, 鸽群优化
借助两种不同算子模型来模仿鸽子飞行不同阶段所
使用的不同导航工具[19].
1) 地图和指南针算子(map and compass operator).
地图和指南针算子用于模仿太阳和地球磁场这两种
导航工具对鸽子的导向作用. 鸽子通过磁感来感受
磁场, 从而在大脑中绘制地图. 并把太阳当作指南针
来调整其方向. 随着鸽群越来越逼近目的地, 它们会
逐渐减少对太阳和磁性粒子的依赖.
2) 地标算子(landmark operator). 地标算子则是
模仿导航工具地标对鸽子的影响. 当鸽群接近目的
地时, 会依靠临近地标进行导航. 如果鸽子熟悉地标,
那么可径直飞向目的地. 反之, 如果不熟悉地标并且
远离目的地, 它们会跟随熟悉地标的鸽子飞行从而
到达目的地.
鸽群优化由 2 个独立的迭代循环组成. 首先是地
图和指南针算子. 在 D 维搜索空间随机初始化 N 只
鸽子, 鸽子的位置和速度分别记作 Xi=[xi1, xi2, ···, xiD]和
Vi=[vi1, vi2, ···, viD], 其中 i=1, 2, ···, N. 每只鸽子依据下
式更新其位置 Xi 及速度 Vi:
Nc
1
R Nc
V
i
X
Nc
Nc
i
V
i
X
1
e
Nc
i
V
i
Nc
,
rand
(
X
X
Nc
i
1
),
g
best
(6)
中国科学: 技术科学 2015 年 第 45 卷 第 6 期
式中, R 表示地图和指南针因数, 并且可以人为设定
成 0 到 1 之间的数. Nc 表示当前的迭代次数. Xgbest 表
示在 Nc1 次迭代循环后通过比较所有鸽子的位置而
得到的全局最好的位置, 相当于该次迭代循环中的
指南针上指示的位置. 以上迭代循环至要求次数后
停止, 至此地图和指南针算子的工作结束, 并将 Xi 移
交给地标算子继续工作.
地标算子将在每次迭代循环中将鸽子的总数 N
折半. 将每只鸽子的当前位置依据评价指标进行排
序, 排在后半段的鸽子被认为远离目的地并且不熟
悉地标, 从而被舍弃. 把余下鸽子的中心位置 Xcenter
当成地标作为飞行参考方向. 依据下式对鸽子的位
置 Xi 进行更新:
X
1
Nc
center
1
X
Nc
i
F X
(
Nc
i
1
)
N
Nc
1
1
i
N
Nc
1
N
Nc
1
1
i
,
F X
(
Nc
i
1
)
Nc
N
Nc
1
N
2
Nc
,
X
i
1
X
Nc
i
rand
(
X
1
Nc
center
X
Nc
i
1
),
(7)
0.
1
X
X
,
1
,
1
Nc
i
Nc
i
针于最小化问题
针对最大化问题
,
,
fitness
fitness
同样, 上述迭代循环至所设定的
式中
F X
(
Nc
i
1
)
fitness
iX
Nc
1
最大循环次数后, 地标算子停止运行.
3.2 改进鸽群优化
本文针对基本鸽群优化易陷入最优的问题, 从
两方面对基本鸽群优化模型进行了改进, 以提高其
在解决无人机紧密编队问题的可行性和准确性.
3.2.1 导航工具过渡因子
基本鸽群优化采用两个独立的迭代循环, 两个算
子分别作用于不同的循环中, 这里通过导航工具过渡
因子tr, 将两个算子的工作合并在一个迭代循环中(图1).
Nc
具体的更新方式如下所示:
N
V
i
N
,
dec
R Nc
Nc
1
1
Nc
N
e
V
Nc
i
tr
rand
tr
rand
X
V
Nc
1
i
i
X
Nc
i
(1 lg
lg
Nc
Nc
,
Nc
max
Nc
Nc
(
max
X
1
)
X
) (
g
best
X
Nc
1
center
X
Nc
i
),
Nc
1
i
(8)
561
段海滨等: 基于捕食逃逸鸽群优化的无人机紧密编队协同控制
图 1 (网络版彩图)合并算子的改进鸽群优化示意图
X
PP
ij
式中, Nedc 表示每次迭代循环中舍弃的鸽子数, Ncmax
表示最大迭代次数. 随着 Nc 增加, Xgbest 对 iX Nc 的影响
1NcX . 在导航工具过渡
逐渐降低,
iX Nc 会更加依赖于 center
因子 tr 的作用下, 2 个算子间的交接工作得以平稳过渡.
3.2.2 捕食逃逸
受动物界中捕食逃逸行为的启发,这里采用捕食
逃逸机制来改进基本鸽群优化模型[24,25]. 在改进后的
鸽群优化模型中, 鸽群分成两类, 捕食鸽子(predator
pigeons, PP)和逃逸鸽子(escaping pigeons, EP). PP 鸽
子和 EP 鸽子的行为将依据各自定义的简单规则加以
约束(图 2), 其中 PP 鸽子追捕 EP 鸽子的 Xgbest, 因而
对 EP 鸽子造成了不同的捕食奉献, 即 Xgbest 也可从
PP 鸽子获取相应信息, 从而实现群体的对称社会认
知. 当 EP 鸽子与 PP 鸽子的距离接近逃逸开始距离
(flight initiation distance, FID)时产生逃逸, 其逃逸速度
取决于能量状态(即适应度值), 能量愈大相应的逃逸
能力愈强; 若 EP 鸽子与 PP 鸽子的距离小于逃逸开始
距离, 则需要对 EP 鸽子进行确定性变异, 变异前后的
EP 鸽子优胜劣汰. 因而, 在进化前期, 算法具有很好的
全局搜索能力. 随着迭代次数的增加, 将逐步降低 PP
鸽子对 EP 鸽子的影响, 以强化群体的局部搜索能力.
对每个 PP 鸽子 i, 按照下式更新其速度和位置:
(
(
N Nc
(
1)
Nc
V
e
(
1)
PP
ij
X
tr
) (
rand
(1 lg
Nc
EP
Nc
g
j
best
max
X
Nc
tr
(
1)
rand
lg
Nc
PP
j
Nc
center
Nc
V
Nc
X
).
(
1)
(
PP
PP
ij
ij
1))
1) ,
Nc
(
(9)
对每个 EP 鸽子 i, 若 distancejFID, 按下式更新
N Nc
Nc
V
PP
ij
Nc
(
Nc
(
PP
ij
N
,
PP
dec
R Nc
X
PP
ij
X
)
)
PP
PP
)
max
EP
)
)
(
(
Nc
Nc
N
,
EP
dec
R Nc
其速度和位置:
N
N Nc
(
1)
EP
Nc
V
V
e
(
1)
EP
EP
ij
ij
tr
rand
1 lg
Nc
Nc
X
tr
lg
Nc
Nc
D
pr
sign
EP
j
P Nc
(
1
i
j
V
Nc
1)
(
EP
ij
rand
rand
X
max
X
(
EP
ij
Nc
EP
ij
X
EP
(
)
max
max
(
Nc
1)
EP
ij
X
Nc
EP
ij
E Nc
EP
i
(
(
1)
1)
X
X
EP
j
g
best
Nc
(
1)
EP
j
center
distance
1) ,
Nc
),
j
(10)
式中, distancej 表示 EP 鸽子 i 与第 j 维最近 PP 鸽子之
间 的 距 离 ; sign() 为 0~1 阀 值 函 数 , 当 且 仅 当
D
, 其余
distance )=1
时,
distance
sign(
D
0
EP
j
j
EP
j
j
情况, sign()的值均为 0; Xmaxj 表示第 j 维位置的最大取
值; pr 表示捕食影响因子. 需要补充定义如下.
1) 警觉距离(alert distance, AD)反映了一种普遍
的社群现象-EP 鸽子对 PP 鸽子的警惕能力, 其大小
随群体的规模以及群体的密度的增加而减小:
D
EP
j
FID 1
PP
N
N
EP
,
式中,
PP
N
X
EP
N
span
j
表示当前群体的局部密度,
表示第 j 维位置的跨度.
(11)
span
jX
图 2 (网络版彩图)PP 鸽子和 EP 鸽子二维示意图
562
2) 能量状态指 EP 鸽子当前的饥饿状态, 用该鸽
子的适应度(考虑最小化问题)与 EP 鸽子平均适应度
值的比值来表示, 即
E Nc
(
EP
i
)
fitness
EP
i
EP
fitness
avg
(
Nc
)
(
Nc
)
.
3) 捕食风险(捕食压力)表示在 EP 鸽子一定时间
内被捕食的概率, 即
中国科学: 技术科学 2015 年 第 45 卷 第 6 期
(12)
式中, q 表示平均动压, S 表示翼面积, m 表示总质量,
V 表示来流速度, 即机速. ( ,
x y z 表示紧密编队的
4
期望间距, 这里取 2 ,
b y
, b 表示翼展.
,
b z
0
x
)
,
EP
P Nc
i
(
式中,
i
exp
)
exp
distance
PP
N
k
i
Nc
max
Nc Nc
max
,
(13)
w, Vw 分别表示僚机在速度和航向角回路上的时间
常数, a, b 均表示无人机高度通道上小于 0 的时间常
, 表示 EP 鸽子 i 与 PP
数.
C
L
W
y
y
C
L
W
, 表示升力导数的变化
WLC 在 y
鸽子相遇的概率, 表示控制参数, k 表示 PP 鸽子攻
击 EP 鸽子的概率(固定为 1).
方向上的梯度,
C
D
W
z
z
C
D
W
, 表示阻力导数的变
4 长机尾流干扰下的紧密编队模型
无人机紧密编队不同于常规的松散编队, 是因
为长机对僚机的气动耦合及相对运动诱发的耦合将
被引入编队动态特性. 目前对紧密编队飞行时无人
机间气动影响的研究主要有两种: 一种是通过进行
编队飞行测试获得相关数据, 另一种是建立紧密编
队飞行下的气动影响模型. 前者通过飞行数据对气
动影响效果进行分析[26], 后者主要是对前方无人机,
也就是长机的尾流场进行建模, 分析处于尾流场中
的飞机, 也就是僚机所受的气动力及其力矩[5].
本文采用文献[5]中的模型及参数, 即在双无人机
L-W 模型基础上, 利用马蹄涡模型分析长机尾流对僚
机的气动影响, 进而建立长机尾流干扰下的僚机模型:
x
y
W
W
qSy
mV
x
W
qSx
mV
V
W
C
Y
W
y
z
;
V
W
V
L
y
W
W
C
C
Y
W
y
C
Y
W
z
y
V
W
;
W
C
z
x
W
y
C
Y
W
z
y
z
;
V
W
W
V
W
W
1
V
W
1
W
1
1
b
qS C
m
a
1
V
W
1
W
C
V
W
C
qS
m
qS
mV
1
a b
W
C
a b
1
z
y
,
L
Wy
z
;
D
Wz
C
Y
W
y
y
C
Y
W
z
z
;
h
W
C
1
a b
h
L
C
化
WDC
在 z 方 向 上 的 梯 度 ,
C
Y
W
y
y
C
Y
W
,
C
Y
W
z
z
C
Y
W
分别表示侧力导数的变化
WYC 在 y
和 z 方向上的梯度.
VW, W, hW 和 VWc, Wc, hWc 分别表示僚机速度,
航向角和飞行高度的实际值与控制输入值, VL, L, hL
和 VLc, Lc, hLc 分别表示长机的实际值与控制输入值.
x, y 和 z(z=hWhL)分别表示长机和僚机纵向, 横向以
及垂直方向的实际间距, hL, hw 分别表示长机和僚机
的飞行高度.
定 义 状 态 量 为
X
F
T
x y z V
[ ,
]
,
,
,
,
, 控 制 量
U
F
h
W
C
[
V
W
C
W
C
,
,
T
]
, 干 扰 量
X
L
W
h
L
[
V
L
W
,
,
L
T
]
, (14)
式可写为如下形式:
X
F
A X
B U
C X
.
L
F
F
(15)
前 3 部分别完成了内外环控制器的设计以及控
制对象模型研究, 基于此, 完成了无人机紧密编队协
同控制框架的设计.
由图 3 可见, 无人机紧密编队的控制框架由四部
分组成: 长机模型, 僚机模型, 外环控制器和内环控
制器. 由文献[1], 长机模型可简化为如下形式:
X
L
A X
'
B U
'
,
L
L
(16)
L
,
U
V
L
C
式 中,
h
,
表 示 长 机 和 的 控 制 输 入.
而外环控制器, 内环控制器和僚机模型已分别在第 2,
3 和 4 部分进行阐述.
L
C
L
C
同时, 需要补充说明的是, 外环控制器模型与内
563
(14)
5 紧密编队协同控制实现过程
段海滨等: 基于捕食逃逸鸽群优化的无人机紧密编队协同控制
J
(
X
i
F
X
i
F
T
)
P X
(
i
F
X
);
i
F
(18)
5) 将鸽群优化循环求得的最终控制输入 i
FU 输
入僚机 i 的模型, 由(15)式得到下一时刻的僚机状态
输出 i
FX ;
6) 返回第 1)步, 直至达到终止条件.
综上, 内外环控制方法解决无人机紧密编队协
同控制的基本思想是: 外环控制器以当前机群状态
作为控制器输入, 其输出为下一时刻所期望的僚机
状态, 即在实现紧密编队最终任务的同时, 也为内
环控制器提供了一个优化期望目标; 改进鸽群优化
的目的就是寻找最优的僚机控制输入, 使得在该输
入下, 僚机下一时刻的实际状态与期望状态之间的
差异尽可能的小. 在外环控制器不断提供僚机期望
状态的情况下, 内环控制器不断求解相应的僚机输
入, 如此反复, 实现无人机紧密编队协同控制.
6 仿真实验与结果分析
假设 5 架无人机(mi=1 kg)在三维空间中飞行, 其
中 包 含 一 架 长 机 , 4 架 僚 机 , 机 群 有 效 通 讯 范 围
Rcomm=100 m. 仿真共进行 160 s, 且采样时间为 0.05
s. 5 架飞机的初始状态(包括水平位置(xi, yi), 高度 hi,
水平速度 Vi, 航向角i 以及垂直速度i)如表 1 所示.
这里, 可设定长机的飞行状态分为三个阶段: 第
一阶段, 从仿真开始到 80 s, 长机处于匀速直线平飞
状态, 由于其航向角初始状态为 0, 所以长机在前 80
s 内始终沿着 xg 轴飞行; 第二阶段, 从 80.05 到 96 s,
长机以匀角速度偏转10°, 但水平速度 V1 不变; 第
三阶段, 从 96.05 s 到仿真结束, 长机继续处于匀速
直线平飞状态, 但与第一阶段相比, 航向不同. 需要
说明的是长机高度始终没有发生变化, h1=0, 始终在
水平面上飞行.
4 架僚机采用在第 5 部分中描述的紧密编队控制
器进行飞行控制. 外环控制器的参数设置如下: Kv=1,
Kp=150, Kh=1. 由于外环控制的策略选择, 故所形成
的编队队形不能预先设定, 仅可通过调节 Rdesire 改变
所形成的队形, 此处选取 Rdesire=20 m.
同时, 为进一步测试第 3 部分所设计的内环控制
器的有效性与稳定性, 选取基本鸽群优化和粒子群优
化, 作为对比参照, 替换改进鸽群优化, 应用到内环控
制器中, 用于寻找紧密编队模型的控制参数. 其参数设
图 3 无人机紧密编队协同控制框图
环控制对象模型应进行状态统一, 也就是说, 人工势
场模型应与紧密编队模型状态建立起对应关系, 具
体对应公式如下:
,
,
,
(17)
i
i
h P
= ,
1
L
3
x
P
P
i
i
1
1
1
y
P
P
i
1
2
2
P
z
P
i
1
3
3
v
v
,
i
i
1
3
3
v
V
(
)
i
i
1
i
arctan
2
) ,
2
,
(
v
i
2
v
i
1
v
i
2
式中,P1, v3
的速度.
1 分别表示长机的坐标及其在垂直方向上
综上, 可对无人机紧密编队协同控制过程进行
离散化设计, 具体过程如下.
1) 首先, 给定当前长机控制输入 UL, 经长机模
型, 由(16)式得到下一时刻的长机状态输出 XL;
2) 由
ijP
R
comm
, 求得僚机 i 的临近无人机集
合 Ni;
1iN
出(XL 或/和
由(1), (4)和(5)式得下一时刻僚机 i 的期望输出 'i
3) 僚机 i 的临近无人机 Ni 的下一时刻的状态输
FX ), 经基于人工势场的外环控制器,
FX ;
4) 采用基于捕食逃逸鸽群优化的内环控制器,
FU , 使得僚机 i 的实际输出
FX 一致性差异最小, 也就是代价 J
寻找僚机 i 的控制输入 i
FX 与期望输出 'i
最小, 即
i
564
表 1 机群的初始状态
表 2 改进鸽群优化、鸽群优化和粒子群优化的参数
中国科学: 技术科学 2015 年 第 45 卷 第 6 期
x(m)
y(m)
h(m)
V(m/s)
(°)
(m/s)
1
0
0
0
2
0
0
2
50
50
10
3
50
50
10
4
50
50
20
5
50
50
20
0.0172
0.9302
0.2594
0.6463
改进鸽群优化
0
0
0
0
0
0
0
0
算法
参数
描述
PP 数目
EP 数目
PP 每轮递减数目
EP 每轮递减数目
地图和指南针因数
导航工具过渡因子
捕食影响因子
数值
10
40
0
1
0.3
2
1
NPP
NEP
PP
decN
EP
decN
R
tr
pr
],
m
m s
[0,10
CWh
[ 20
CWV
[ 50 ,50 ],
置如表 2 所示, 解空间维数 D=3, 解空间搜索范围为
CW
].
为了比较的公平性, 需要保证三种算法在仿真过程
中评价解的次数相同, 即调用测试函数计算代价的
次数相同, 同时为了加强对比的可观性, 需保证三种
算法的最大迭代次数相同. 即在参数选取上需要满
足如下的公式:
, 20
m
PP
N
EP
N
Nc
max
N
EP
dec
Nc
max
PP
N
dec
2
max
Nc
1
Nc
max
1
N Nc
max
2
1
2
1
Num
Nc
max
.
(19)
图 4 为改进鸽群优化作为内环控制器时的仿真结
果, 图 5 为基本鸽群优化作为内环控制器时的仿真结
果, 图 6 为粒子群优化作为内环控制器时的仿真结果.
图中直线均表示长机(1 号无人机), ×线, 星形线, +字
线和虚线均为僚机, 分别表示 2~5 号无人机. 其中图
4~6 中子图(a)为无人机群三维空间的飞行轨迹, 子图
(b)为无人机群飞行轨迹的俯视图, 子图(c)为 5 架无
人机的水平速度变化曲线, 子图(d)为航向角的变化
曲线, 子图(e)为垂直速度的变化.
由仿真结果可见, 无论是改进鸽群优化, 基本鸽
群优化还是粒子群优化作为内环控制器时, 均可可
基本形成较为稳定编队. 但在长机状态改变时, 粒子
群优化不能实时跟随长机的动态变化进而无法保持
队形, 相比之下前两种内环控制器在这一方面表现较
为突出, 尽管基本鸽群优化始终处于不停的振荡中.
首先, 从形成编队的时间上, 三者存在差异. 在
水平速度变化方面, 改进鸽群优化在大约 50 s 时进
入稳定区, 粒子群优化次之, 落后大约 5 s, 但在后期
状态发散, 而基本鸽群优化状态始终未趋于一致, 仅
Nc1max 地图和指南针循环最大迭代次数
490
N
R
Num
w
c1
c2
鸽子数目
地图和指南针因数
粒子数目
惯性权重
认知学习因子
社会学习因子
305
0.3
300
0.5
2
2
鸽群优化
粒子群优化
仅在大约 55 s 时, 4 架僚机两两速度状态趋于一致,
而后又在长机状态发生变化时, 平衡被打破. 在航向
角变化方面, 三种内环控制器在稳定时间上, 表现较
为一致, 均大约在 50 s 时进入各自的平衡态, 尽管粒
子群优化后期出现发散. 在垂直速度变化方面, 改进
鸽群优化和粒子群优化表现较为突出, 仅用 5 s 就进
入了稳定区, 而基本鸽群优化在 45 s 时才最终稳定.
其次, 在形成编队的稳定程度上, 改进鸽群优化
优势明显. 对比三种内环控制器的水平速度, 航向角
以及垂直速度的变化曲线, 可见改进鸽群优化的曲
线变化最为平滑, 稳定区波动极小, 而粒子群优化表
现次之, 其稳定区呈现小幅度的波动, 曲线不够光滑,
毛刺很多, 并在长机状态变化时, 水平速度和航向角
的稳定状态被打破. 相比于前两者, 基本鸽群优化的
表现就明显处于劣势, 其稳定区呈现较宽的带状, 局
部放大后可见频率很高的波动, 虽然幅值不高, 但可
分析得到无人机的飞行状态极不稳定, 处于不断的
抖振中.
引入函数 Q 来衡量每一采样时刻, 形成编队的
准确度:
Q
n
3
2
i
j
1
u
i
j
,
(20)
565
段海滨等: 基于捕食逃逸鸽群优化的无人机紧密编队协同控制
(a) 机群三维飞行轨迹; (b) 机群飞行轨迹俯视图; (c) 水平速度变化曲线; (d) 航向角变化曲线; (e) 垂直速度变化曲线
图 4 (网络版彩图)仿真结果图(改进鸽群优化)
式中, 函数 Q 用来表示所有无人机外环控制器的三
维控制量绝对值和值. 当机群进入稳定编队位置, 并
且其状态与其临近无人机保持完全一致, 则其控制量
为零, 表示此时机群处于完全编队稳定状态. 因此,
控制量的大小, 可用来评价编队的稳定精度.
图 7 直观地展示了 160 s 仿真过程中编队准确度
Q 的变化曲线. 图 7(a)是正常坐标下的曲线, 可见当
改进鸽群优化作为内环控制器时, 其函数 Q 的变化
曲线(红色点划线)在大部分仿真时刻, 均位于基本鸽
群优化(黑色虚线)以及粒子群优化(蓝色实线)的下方,
566