基于捕食逃逸鸽群优化的无人机紧密编队协同控制.pdf

发布时间：2022-05-30 发布人：admin 分类：说明书资料大小：2.20M 资料格式：pdf 举报版权申诉

weixin_38614268-15682870-16359647575035789834.pdf-第1页.png

第1页 / 共14页

weixin_38614268-15682870-16359647575035789834.pdf-第2页.png

第2页 / 共14页

weixin_38614268-15682870-16359647575035789834.pdf-第3页.png

第3页 / 共14页

weixin_38614268-15682870-16359647575035789834.pdf-第4页.png

第4页 / 共14页

weixin_38614268-15682870-16359647575035789834.pdf-第5页.png

第5页 / 共14页

weixin_38614268-15682870-16359647575035789834.pdf-第6页.png

第6页 / 共14页

weixin_38614268-15682870-16359647575035789834.pdf-第7页.png

第7页 / 共14页

weixin_38614268-15682870-16359647575035789834.pdf-第8页.png

第8页 / 共14页

文本预览

中国科学: 技术科学 2015 年第 45 卷第 6 期: 559 ~ 572 论文 www.scichina.com tech.scichina.com 多无人机协调自主控制专题《中国科学》杂志社 SCIENCE CHINA PRESS 基于捕食逃逸鸽群优化的无人机紧密编队协同控制段海滨①*, 邱华鑫①, 范彦铭② ① 北京航空航天大学飞行器控制一体化技术重点实验室仿生自主飞行系统研究组, 北京 100191; ② 中国航空工业集团公司沈阳飞机设计研究所, 沈阳 110035 * E-mail: hbduan@buaa.edu.cn 收稿日期: 2015-04-15; 接受日期: 2015-05-12 国家自然科学基金重点项目(批准号: 61333004)、国家杰出青年科学基金项目(批准号: 61425008)、国家自然科学基金面上项目(批准号: 61273054)和中组部青年拔尖人才支持计划资助摘要提出一种基于捕食逃逸鸽群优化(pigeon-inspired optimization, PIO)的无人机(unmanned aerial vehicle, UAV)紧密编队协同控制方法. 基于人工势场法设计了外环控制器, 将无人机紧密编队转化成一种抽象的人造势场中的运动; 基于鸽群优化算法设计了内环控制器, 进行控制量的优化求解. 在遵循鸽群优化基本思想的基础上, 对其结构进行调整, 并针对基本鸽群优化易陷入局部最优的问题, 引入了捕食逃逸机制来改善鸽群优化总体性能. 最后, 将本文所提出的改进鸽群优化算法与基本鸽群优化算法、粒子群优化(particle swarm optimization, PSO)算法进行了系列对比实验, 实验结果验证了文中所提方法的可行性、有效性和优越性. 关键词无人机鸽群优化紧密编队粒子群优化捕食逃逸人工势场法 1 引言无人机(unmanned aerial vehicle, UAV)是一种由自身程序控制或者由无线电遥控的 , 用来执行特定任务的无人驾驶飞行器, 具备机动性强、风险性低、成本较低、可靠性高、适应性强、应用领域广等特质[1]. 随着军事、民用需求的提高和相关领域的技术推动, 如何有效发挥无人机的作用, 已成为当今人们逐渐关注的焦点. 无人机紧密编队是一种无人机间侧向距离小于翼展的编队. 因其既可有效改善编队中无人机的气动性能, 从而减少阻力, 节省燃油, 延长续航, 又可在雷达屏上以一架超级大型运输机的信息迷惑敌方防空系统, 达到出其不意的作战目的, 而备受瞩目. 多无人机紧密编队控制具有极强的耦合性和非线性[2], Pachter 等人[3,4], Proud 等人[5]和 Buzogany 等人[6]建立了长机尾流影响下的僚机模型, 并设计了相应的 PI 控制器, Singh 和 Pachter[7]采用自适应反馈控制来解决无人机紧密编队的非线性控制问题, Binetti 等人[8]利用极值方法搜索方法, 解决无人机紧密编队飞行中僚机所需动力最小化的问题, 左斌和胡云安[9] 也曾就该问题展开研究, Li 等人[10,11]利用鲁棒控制和模糊逻辑等策略为紧密编队控制提供了新的思路, 陈春东等人[12]根据编队飞行实体试验的工程控制方法, 采用经典 PID 控制设计了紧密编队控制系统, 赵引用格式: 段海滨, 邱华鑫, 范彦铭. 基于捕食逃逸鸽群优化的无人机紧密编队协同控制. 中国科学: 技术科学, 2015, 45: 559–572 Duan H B, Qiu H X, Fan Y M. Unmanned aerial vehicle close formation cooperative control based on predatory escaping pigeon-inspired optimization (in Chinese). Sci Sin Tech, 2015, 45: 559–572, doi: 10.1360/N092015-00125

段海滨等: 基于捕食逃逸鸽群优化的无人机紧密编队协同控制峰等人[13]提出了一种包含级联回路和动态逆回路的改进编队飞行控制技术 — 局部综合制导与控制 , Caleb 等人[14]实验验证了五倍翼展间距下无人机自主紧密编队的可实现性, Johnson 和Dasgupta[15]设计了针对紧密编队长机控制及其跟随行为的 H-∞控制器并分析了其鲁棒性. 本文采用内外环控制器来解决紧密编队协同控制问题, 并选用人工势场法[16]设计外环控制器. 通过合理设置势场函数, 人工势场法可用于解决三维空间内的无人机紧密编队问题, 因此, 势场函数如何选取是本文研究的核心内容之一. 其基本思路是通过设定无人机间的“引力”和“斥力”, 利用合力控制无人机的运动, 将无人机在环境中的飞行转化为一种抽象的人造引力场中的运动. 由于模型输入存在强耦合, 并且性能指标与模型参数并不存在直接映射关系, 因此紧密编队模型控制输入的选取是一个关键技术难题. 而群体智能优化算法对求解问题的性态没有特殊要求, 故在解决复杂问题时具有明显优势 . 继遗传算法 (genetic algorithm, GA), 蚁群算法 (ant colony optimization, ACO), 粒子群算法(particle swarm optimization, PSO) 等较为成熟的优化算法后, Shi[17]基于人类的头脑风暴过程提出了头脑风暴算法(brain storm optimization, BSO), Pan[18]从果蝇觅食行为得到启发, 提出了果蝇优化算法 (fruit fly optimization algorithm, FOA), Duan[19]针对鸽子独特的导航能力, 提出了鸽群优化 (pigeon-inspired optimization, PIO)算法. ation, MPIO)来解决无人机紧密编队控制输入的求解问题. Guilford 等人[20]认为鸽子会在寻的旅程的不同阶段使用不同的导航工具, 前期依赖磁场, 后期依赖地标. Whiten[21]认为太阳也是鸽子的一种导航工具, 太阳的高度会对鸽子的导航能力造成影响. 鸽群优化就是针对上述鸽子导航行为, 通过模拟其特性, 来寻找全局最优解. 但是, 基本鸽群优化算法易陷入局部最优解. 为此, 本文通过引入捕食逃逸机制提出了一种改进鸽群优化算法, 并用于优化无人机紧密编队内环控制器的控制参数. 本文组织结构如下: 第 2 部分, 设计了一种基于人工势场法的紧密编队外环控制器; 第 3 部分, 提出了一种基于捕食逃逸机制的改进鸽群优化算法, 并用于优化内环控制器的控制参数; 第 4 部分, 给出了 560 本文通过改进鸽群优化(pigeon-inspired optimiz- 考虑长机尾流干扰的无人机紧密编队模型; 第 5 部分, 在以上研究基础上, 给出了无人机紧密编队协同控制的具体实现过程; 第 6 部分, 进行了系列仿真对比和实验分析, 验证了所提方法的可行性. 2 基于人工势场法的外环控制器设计考虑由 n 架无人机组成的紧密编队系统在 3 维的欧式空间环境中进行无障碍飞行[22], 每架无人机可被视作一个质点, 那么每架无人机的动力学模型描述如下: i  P i i i i 3 3 u     , i , 1, k v i  v m v i i n , ,  iP  , 表示无人机 i 的位置向量; (1) iv  , 3 式中, 表示无人机 i 的速度矢量; mi>0, 表示无人机 i 的质量; iu  , 表示作用在无人机 i 上的控制输入; ik v 表示速度阻尼项, 相当于无人机在空气中运动所受到的空气阻力, 其中 ki 表示速度衰减增益，一般大于 0; Pij=PiPj 表示无人机 i 与无人机 j 间的相对位置矢量. 为实现整个机群以期望速度并保持个体间恒定距离运动, 需要控制每架无人机的速度, 使其趋于一致, 并趋于期望速度. 同时, 需要控制无人机间的距离, 使其总势能达到最小, 此外还需要对速度的阻尼进行补偿[23]. 综上, 无人机 i 的控制量 ui 可由下式表示: (2) i 表示无人机群中人工势场所产生的控制分量, 式中,  它来源于势函数 Vi(表征无人机 i 和其临近无人机相 i 表示使无人机 i 与其临近无人机速对距离的函数);  度趋同的控制分量; i 表示无人机 i 速度趋于期望速度的控制分量, 它依赖于长机的设定输入信号(期望速度 v1).    i i k v     u , i i i i 当||Pij||≤Rcomm 时, 无人机 i 与 j 视为临近，这里可选取的无人机 i 与其临近无人机 j 之间的势函数为 ij V  ij P   ln ij P 2  R 2 desire 2 P ij , (3) 式中, Rdesire表示无人机i 与其临近无人机j 间的期望距离. 僚机 i 的控制量 ui 包含 3 维, 前两维 ui 1,2 是水平方向上的控制量, 第三维 ui 3 是垂直方向是控制量. 假设所有无人机均可接收到外部的输入信号(长机的速度状态), 可把无人机 i 的水平控制量 ui 1,2 定义为  j v 1,2   i u 1,2 i v 1,2  K K  V ( ) ij v p  ( m v i i 1,2  ij P 1,2  1 v 1,2 )  i k v i 1,2  , (4)

式中, Kv, Kp>0, Kv 表示速度反馈增益因子, Kp 表示人工势场的增益因子. 通过改变 Kp 和 Kv 这两个增益因子的值, 可起到调节队形反馈力度和速度匹配反馈力度的作用, 实质上就是速度匹配控制和调节队形控制这两种控制作用的优先级. 3 的设置与 ui 垂直控制量 ui 1,2 略有差异, 可表示为     j j ) (5) v 3 K P P 3 i ( m v 3 i i k v 3 i ( v 3 1 v 3 K     i 3 ( ) ) , h v i  i u 3 式中, Kh 表示高度反馈增益因子, 用来调节无人机形成队形以及队形保持时高度反馈的力度. 3 基于改进鸽群优化的内环控制器设计 3.1 鸽群优化鸽子具有特殊的导航能力, 它们使用太阳、地球磁场和地标寻找路径, 并在旅程的不同阶段使用不同的导航工具. 当鸽子开始飞行时, 会更多依赖于类似于指南针的导航工具. 而在旅程的中间部分, 可将导航工具切换到地标, 此时鸽群个体会重新评估所经历的路线并进行修正[20]. 基于鸽子在飞行过程中的特殊行为, 鸽群优化借助两种不同算子模型来模仿鸽子飞行不同阶段所使用的不同导航工具[19]. 1) 地图和指南针算子(map and compass operator). 地图和指南针算子用于模仿太阳和地球磁场这两种导航工具对鸽子的导向作用. 鸽子通过磁感来感受磁场, 从而在大脑中绘制地图. 并把太阳当作指南针来调整其方向. 随着鸽群越来越逼近目的地, 它们会逐渐减少对太阳和磁性粒子的依赖. 2) 地标算子(landmark operator). 地标算子则是模仿导航工具地标对鸽子的影响. 当鸽群接近目的地时, 会依靠临近地标进行导航. 如果鸽子熟悉地标, 那么可径直飞向目的地. 反之, 如果不熟悉地标并且远离目的地, 它们会跟随熟悉地标的鸽子飞行从而到达目的地. 鸽群优化由 2 个独立的迭代循环组成. 首先是地图和指南针算子. 在 D 维搜索空间随机初始化 N 只鸽子, 鸽子的位置和速度分别记作 Xi=[xi1, xi2, ···, xiD]和 Vi=[vi1, vi2, ···, viD], 其中 i=1, 2, ···, N. 每只鸽子依据下式更新其位置 Xi 及速度 Vi: Nc  1   R Nc V i X Nc Nc i  V i  X   1 e  Nc i V i Nc ,  rand  ( X  X Nc i  1 ), g best (6) 中国科学: 技术科学 2015 年第 45 卷第 6 期式中, R 表示地图和指南针因数, 并且可以人为设定成 0 到 1 之间的数. Nc 表示当前的迭代次数. Xgbest 表示在 Nc1 次迭代循环后通过比较所有鸽子的位置而得到的全局最好的位置, 相当于该次迭代循环中的指南针上指示的位置. 以上迭代循环至要求次数后停止, 至此地图和指南针算子的工作结束, 并将 Xi 移交给地标算子继续工作. 地标算子将在每次迭代循环中将鸽子的总数 N 折半. 将每只鸽子的当前位置依据评价指标进行排序, 排在后半段的鸽子被认为远离目的地并且不熟悉地标, 从而被舍弃. 把余下鸽子的中心位置 Xcenter 当成地标作为飞行参考方向. 依据下式对鸽子的位置 Xi 进行更新: X  1 Nc center   1 X Nc i  F X ( Nc i  1 ) N Nc  1   1 i N Nc  1  N Nc  1   1 i , F X ( Nc i  1 ) Nc N  Nc  1 N 2 Nc , X i   1 X Nc i  rand  ( X  1 Nc center  X Nc i  1 ), (7)       0. 1 X X ,  1    , 1  Nc i Nc i 针于最小化问题针对最大化问题 , ,  fitness  fitness 同样, 上述迭代循环至所设定的式中 F X ( Nc i 1  ) fitness  iX Nc 1   最大循环次数后, 地标算子停止运行. 3.2 改进鸽群优化本文针对基本鸽群优化易陷入最优的问题, 从两方面对基本鸽群优化模型进行了改进, 以提高其在解决无人机紧密编队问题的可行性和准确性. 3.2.1 导航工具过渡因子基本鸽群优化采用两个独立的迭代循环, 两个算子分别作用于不同的循环中, 这里通过导航工具过渡因子tr, 将两个算子的工作合并在一个迭代循环中(图1). Nc 具体的更新方式如下所示: N V i N , dec R Nc     Nc 1  1  Nc N  e V Nc  i tr rand   tr rand   X V Nc 1   i i  X Nc i (1 lg   lg Nc  Nc , Nc max Nc Nc (  max X 1  ) X ) (  g best X Nc 1   center X Nc  i ), Nc 1  i (8) 561

段海滨等: 基于捕食逃逸鸽群优化的无人机紧密编队协同控制图 1 (网络版彩图)合并算子的改进鸽群优化示意图 X PP ij 式中, Nedc 表示每次迭代循环中舍弃的鸽子数, Ncmax 表示最大迭代次数. 随着 Nc 增加, Xgbest 对 iX Nc 的影响 1NcX  . 在导航工具过渡逐渐降低, iX Nc 会更加依赖于 center 因子 tr 的作用下, 2 个算子间的交接工作得以平稳过渡. 3.2.2 捕食逃逸受动物界中捕食逃逸行为的启发，这里采用捕食逃逸机制来改进基本鸽群优化模型[24,25]. 在改进后的鸽群优化模型中, 鸽群分成两类, 捕食鸽子(predator pigeons, PP)和逃逸鸽子(escaping pigeons, EP). PP 鸽子和 EP 鸽子的行为将依据各自定义的简单规则加以约束(图 2), 其中 PP 鸽子追捕 EP 鸽子的 Xgbest, 因而对 EP 鸽子造成了不同的捕食奉献, 即 Xgbest 也可从 PP 鸽子获取相应信息, 从而实现群体的对称社会认知. 当 EP 鸽子与 PP 鸽子的距离接近逃逸开始距离 (flight initiation distance, FID)时产生逃逸, 其逃逸速度取决于能量状态(即适应度值), 能量愈大相应的逃逸能力愈强; 若 EP 鸽子与 PP 鸽子的距离小于逃逸开始距离, 则需要对 EP 鸽子进行确定性变异, 变异前后的 EP 鸽子优胜劣汰. 因而, 在进化前期, 算法具有很好的全局搜索能力. 随着迭代次数的增加, 将逐步降低 PP 鸽子对 EP 鸽子的影响, 以强化群体的局部搜索能力. 对每个 PP 鸽子 i, 按照下式更新其速度和位置: ( ( N Nc ( 1)   Nc V e ( 1) PP   ij X tr ) ( rand (1 lg Nc EP       Nc g j best max  X Nc tr ( 1) rand lg Nc PP       j Nc center Nc V Nc X ). ( 1) ( PP PP   ij ij 1))  1) , Nc ( (9) 对每个 EP 鸽子 i, 若 distancejFID, 按下式更新 N Nc Nc V PP ij Nc (  Nc ( PP ij N , PP dec R Nc   X PP ij X   ) )   PP PP ) max EP ) ) ( (   Nc Nc N , EP dec R Nc   其速度和位置: N N Nc ( 1) EP   Nc V V e ( 1) EP EP   ij ij  tr rand 1 lg Nc     Nc  X tr lg Nc   Nc  D pr sign EP j  P Nc ( 1   i j V Nc 1) ( EP   ij rand rand  X  max X ( EP ij  Nc EP ij X  EP ( ) max max    ( Nc 1) EP  ij X Nc EP ij E Nc EP i ( (  1)  1)        X X EP j g best Nc ( 1) EP   j center  distance  1) ,  Nc ), j (10) 式中, distancej 表示 EP 鸽子 i 与第 j 维最近 PP 鸽子之间的距离 ; sign() 为 0~1 阀值函数 , 当且仅当 D  , 其余 distance )=1  时, distance sign( D 0 EP j j EP j j 情况, sign()的值均为 0; Xmaxj 表示第 j 维位置的最大取值; pr 表示捕食影响因子. 需要补充定义如下. 1) 警觉距离(alert distance, AD)反映了一种普遍的社群现象-EP 鸽子对 PP 鸽子的警惕能力, 其大小随群体的规模以及群体的密度的增加而减小: D EP j   FID 1    PP N N  EP ,    式中,   PP N X EP  N span j 表示当前群体的局部密度, 表示第 j 维位置的跨度. (11) span jX 图 2 (网络版彩图)PP 鸽子和 EP 鸽子二维示意图 562 2) 能量状态指 EP 鸽子当前的饥饿状态, 用该鸽子的适应度(考虑最小化问题)与 EP 鸽子平均适应度值的比值来表示, 即

E Nc ( EP i )  fitness EP i EP fitness avg ( Nc ) ( Nc ) . 3) 捕食风险(捕食压力)表示在 EP 鸽子一定时间内被捕食的概率, 即中国科学: 技术科学 2015 年第 45 卷第 6 期 (12) 式中, q 表示平均动压, S 表示翼面积, m 表示总质量, V 表示来流速度, 即机速. ( , x y z 表示紧密编队的  4 期望间距, 这里取 2 , b y  , b 表示翼展. , b z   0 x ) , EP P Nc i ( 式中,  i  exp    )  exp    distance PP  N  k i Nc  max Nc Nc max ,    (13) w, Vw 分别表示僚机在速度和航向角回路上的时间常数, a, b 均表示无人机高度通道上小于 0 的时间常     , 表示 EP 鸽子 i 与 PP 数.  C  L W y   y  C L W , 表示升力导数的变化 WLC 在 y 鸽子相遇的概率, 表示控制参数, k 表示 PP 鸽子攻击 EP 鸽子的概率(固定为 1). 方向上的梯度,  C D W z    z  C D W , 表示阻力导数的变 4 长机尾流干扰下的紧密编队模型无人机紧密编队不同于常规的松散编队, 是因为长机对僚机的气动耦合及相对运动诱发的耦合将被引入编队动态特性. 目前对紧密编队飞行时无人机间气动影响的研究主要有两种: 一种是通过进行编队飞行测试获得相关数据, 另一种是建立紧密编队飞行下的气动影响模型. 前者通过飞行数据对气动影响效果进行分析[26], 后者主要是对前方无人机, 也就是长机的尾流场进行建模, 分析处于尾流场中的飞机, 也就是僚机所受的气动力及其力矩[5]. 本文采用文献[5]中的模型及参数, 即在双无人机 L-W 模型基础上, 利用马蹄涡模型分析长机尾流对僚机的气动影响, 进而建立长机尾流干扰下的僚机模型:  x   y   W   W qSy mV x    W qSx mV   V          W    C  Y W  y   z  ;   V W  V L  y   W   W C C  Y W y    C Y W z y V    W  ;   W C    z x   W y    C Y W z y  z ;    V W     W         V W   W 1  V W 1   W 1 1      b qS C   m  a   1  V W 1   W        C    V W C qS m qS mV 1   a b   W C a b   1 z    y , L Wy  z ; D Wz C  Y W y y    C Y W z  z ;   h W C  1  a b h L C 化 WDC 在 z 方向上的梯度 ,  C Y W y    y  C Y W ,  C Y W z    z  C Y W 分别表示侧力导数的变化 WYC 在 y 和 z 方向上的梯度. VW, W, hW 和 VWc, Wc, hWc 分别表示僚机速度, 航向角和飞行高度的实际值与控制输入值, VL, L, hL 和 VLc, Lc, hLc 分别表示长机的实际值与控制输入值. x, y 和 z(z=hWhL)分别表示长机和僚机纵向, 横向以及垂直方向的实际间距, hL, hw 分别表示长机和僚机的飞行高度. 定义状态量为 X F  T x y z V   [ , ] , , , , , 控制量 U F h W C [ V W C W C , , T ] , 干扰量 X L W h L [ V L W , , L T ] , (14) 式可写为如下形式:  X F   A X   B U   C X . L F F (15) 前 3 部分别完成了内外环控制器的设计以及控制对象模型研究, 基于此, 完成了无人机紧密编队协同控制框架的设计. 由图 3 可见, 无人机紧密编队的控制框架由四部分组成: 长机模型, 僚机模型, 外环控制器和内环控制器. 由文献[1], 长机模型可简化为如下形式:  X L  A X '  B U ' , L L (16) L , U V  L C 式中, h  ,  表示长机和的控制输入.  而外环控制器, 内环控制器和僚机模型已分别在第 2, 3 和 4 部分进行阐述. L C L C 同时, 需要补充说明的是, 外环控制器模型与内 563 (14) 5 紧密编队协同控制实现过程

段海滨等: 基于捕食逃逸鸽群优化的无人机紧密编队协同控制 J  ( X i F  X  i F T ) P X ( i F  X );  i F (18) 5) 将鸽群优化循环求得的最终控制输入 i FU 输入僚机 i 的模型, 由(15)式得到下一时刻的僚机状态输出 i FX ; 6) 返回第 1)步, 直至达到终止条件. 综上, 内外环控制方法解决无人机紧密编队协同控制的基本思想是: 外环控制器以当前机群状态作为控制器输入, 其输出为下一时刻所期望的僚机状态, 即在实现紧密编队最终任务的同时, 也为内环控制器提供了一个优化期望目标; 改进鸽群优化的目的就是寻找最优的僚机控制输入, 使得在该输入下, 僚机下一时刻的实际状态与期望状态之间的差异尽可能的小. 在外环控制器不断提供僚机期望状态的情况下, 内环控制器不断求解相应的僚机输入, 如此反复, 实现无人机紧密编队协同控制. 6 仿真实验与结果分析假设 5 架无人机(mi=1 kg)在三维空间中飞行, 其中包含一架长机 , 4 架僚机 , 机群有效通讯范围 Rcomm=100 m. 仿真共进行 160 s, 且采样时间为 0.05 s. 5 架飞机的初始状态(包括水平位置(xi, yi), 高度 hi, 水平速度 Vi, 航向角i 以及垂直速度i)如表 1 所示. 这里, 可设定长机的飞行状态分为三个阶段: 第一阶段, 从仿真开始到 80 s, 长机处于匀速直线平飞状态, 由于其航向角初始状态为 0, 所以长机在前 80 s 内始终沿着 xg 轴飞行; 第二阶段, 从 80.05 到 96 s, 长机以匀角速度偏转10°, 但水平速度 V1 不变; 第三阶段, 从 96.05 s 到仿真结束, 长机继续处于匀速直线平飞状态, 但与第一阶段相比, 航向不同. 需要说明的是长机高度始终没有发生变化, h1=0, 始终在水平面上飞行. 4 架僚机采用在第 5 部分中描述的紧密编队控制器进行飞行控制. 外环控制器的参数设置如下: Kv=1, Kp=150, Kh=1. 由于外环控制的策略选择, 故所形成的编队队形不能预先设定, 仅可通过调节 Rdesire 改变所形成的队形, 此处选取 Rdesire=20 m. 同时, 为进一步测试第 3 部分所设计的内环控制器的有效性与稳定性, 选取基本鸽群优化和粒子群优化, 作为对比参照, 替换改进鸽群优化, 应用到内环控制器中, 用于寻找紧密编队模型的控制参数. 其参数设图 3 无人机紧密编队协同控制框图环控制对象模型应进行状态统一, 也就是说, 人工势场模型应与紧密编队模型状态建立起对应关系, 具体对应公式如下: , , , (17) i i h P = , 1  L 3  x P P i i 1    1 1  y P P i 1    2 2  P z P i 1    3 3  v v , i i 1     3 3  v V ( ) i i  1   i    arctan   2 ) , 2 , (  v i  2  v i  1 v i 2    式中，P1, v3 的速度. 1 分别表示长机的坐标及其在垂直方向上综上, 可对无人机紧密编队协同控制过程进行离散化设计, 具体过程如下. 1) 首先, 给定当前长机控制输入 UL, 经长机模型, 由(16)式得到下一时刻的长机状态输出 XL; 2) 由 ijP R comm , 求得僚机 i 的临近无人机集合 Ni; 1iN 出(XL 或/和由(1), (4)和(5)式得下一时刻僚机 i 的期望输出 'i 3) 僚机 i 的临近无人机 Ni 的下一时刻的状态输 FX  ), 经基于人工势场的外环控制器, FX ; 4) 采用基于捕食逃逸鸽群优化的内环控制器, FU , 使得僚机 i 的实际输出 FX 一致性差异最小, 也就是代价 J 寻找僚机 i 的控制输入 i FX 与期望输出 'i 最小, 即 i 564

表 1 机群的初始状态表 2 改进鸽群优化、鸽群优化和粒子群优化的参数中国科学: 技术科学 2015 年第 45 卷第 6 期 x(m) y(m) h(m) V(m/s) (°) (m/s) 1 0 0 0 2 0 0 2 50 50 10 3 50 50 10 4 50 50 20 5 50 50 20 0.0172 0.9302 0.2594 0.6463 改进鸽群优化 0 0 0 0 0 0 0 0 算法参数描述 PP 数目 EP 数目 PP 每轮递减数目 EP 每轮递减数目地图和指南针因数导航工具过渡因子捕食影响因子数值 10 40 0 1 0.3 2 1 NPP NEP PP decN EP decN R tr pr ], m m s [0,10 CWh   [ 20 CWV   [ 50 ,50 ], 置如表 2 所示, 解空间维数 D=3, 解空间搜索范围为 CW    ]. 为了比较的公平性, 需要保证三种算法在仿真过程中评价解的次数相同, 即调用测试函数计算代价的次数相同, 同时为了加强对比的可观性, 需保证三种算法的最大迭代次数相同. 即在参数选取上需要满足如下的公式: , 20 m PP N EP  N  Nc max       N EP dec      Nc max PP N dec 2  max Nc 1 Nc max  1 N Nc max       2 1 2  1     Num  Nc max . (19) 图 4 为改进鸽群优化作为内环控制器时的仿真结果, 图 5 为基本鸽群优化作为内环控制器时的仿真结果, 图 6 为粒子群优化作为内环控制器时的仿真结果. 图中直线均表示长机(1 号无人机), ×线, 星形线, +字线和虚线均为僚机, 分别表示 2~5 号无人机. 其中图 4~6 中子图(a)为无人机群三维空间的飞行轨迹, 子图 (b)为无人机群飞行轨迹的俯视图, 子图(c)为 5 架无人机的水平速度变化曲线, 子图(d)为航向角的变化曲线, 子图(e)为垂直速度的变化. 由仿真结果可见, 无论是改进鸽群优化, 基本鸽群优化还是粒子群优化作为内环控制器时, 均可可基本形成较为稳定编队. 但在长机状态改变时, 粒子群优化不能实时跟随长机的动态变化进而无法保持队形, 相比之下前两种内环控制器在这一方面表现较为突出, 尽管基本鸽群优化始终处于不停的振荡中. 首先, 从形成编队的时间上, 三者存在差异. 在水平速度变化方面, 改进鸽群优化在大约 50 s 时进入稳定区, 粒子群优化次之, 落后大约 5 s, 但在后期状态发散, 而基本鸽群优化状态始终未趋于一致, 仅 Nc1max 地图和指南针循环最大迭代次数 490 N R Num w c1 c2 鸽子数目地图和指南针因数粒子数目惯性权重认知学习因子社会学习因子 305 0.3 300 0.5 2 2 鸽群优化粒子群优化仅在大约 55 s 时, 4 架僚机两两速度状态趋于一致, 而后又在长机状态发生变化时, 平衡被打破. 在航向角变化方面, 三种内环控制器在稳定时间上, 表现较为一致, 均大约在 50 s 时进入各自的平衡态, 尽管粒子群优化后期出现发散. 在垂直速度变化方面, 改进鸽群优化和粒子群优化表现较为突出, 仅用 5 s 就进入了稳定区, 而基本鸽群优化在 45 s 时才最终稳定. 其次, 在形成编队的稳定程度上, 改进鸽群优化优势明显. 对比三种内环控制器的水平速度, 航向角以及垂直速度的变化曲线, 可见改进鸽群优化的曲线变化最为平滑, 稳定区波动极小, 而粒子群优化表现次之, 其稳定区呈现小幅度的波动, 曲线不够光滑, 毛刺很多, 并在长机状态变化时, 水平速度和航向角的稳定状态被打破. 相比于前两者, 基本鸽群优化的表现就明显处于劣势, 其稳定区呈现较宽的带状, 局部放大后可见频率很高的波动, 虽然幅值不高, 但可分析得到无人机的飞行状态极不稳定, 处于不断的抖振中. 引入函数 Q 来衡量每一采样时刻, 形成编队的准确度: Q n  3  2 i j  1 u i j , (20) 565

段海滨等: 基于捕食逃逸鸽群优化的无人机紧密编队协同控制 (a) 机群三维飞行轨迹; (b) 机群飞行轨迹俯视图; (c) 水平速度变化曲线; (d) 航向角变化曲线; (e) 垂直速度变化曲线图 4 (网络版彩图)仿真结果图(改进鸽群优化) 式中, 函数 Q 用来表示所有无人机外环控制器的三维控制量绝对值和值. 当机群进入稳定编队位置, 并且其状态与其临近无人机保持完全一致, 则其控制量为零, 表示此时机群处于完全编队稳定状态. 因此, 控制量的大小, 可用来评价编队的稳定精度. 图 7 直观地展示了 160 s 仿真过程中编队准确度 Q 的变化曲线. 图 7(a)是正常坐标下的曲线, 可见当改进鸽群优化作为内环控制器时, 其函数 Q 的变化曲线(红色点划线)在大部分仿真时刻, 均位于基本鸽群优化(黑色虚线)以及粒子群优化(蓝色实线)的下方, 566

分享到：

赞收藏

资料库

基于捕食逃逸鸽群优化的无人机紧密编队协同控制.pdf

相关推荐

开发技术

热门标签

最新资料