第29卷第4期
2008年7月
宇 航 学 报
JouⅡl且l of As缸D删tic8
、,01.29
No.4
J由2008
粒子滤波评述
程水英,张剑云
(电子工程学院,合肥230037)
摘要:以最优Bay朗iaIl滤波的求解为起点,综述了粒子滤波的发展历程、基本思想、算法的各个基本环节、基
本的滤波算法及其收敛性以及算法的多种重要衍变形式,包括辅助变量粒子滤波、自适应粒子滤波、实时粒子滤
波、分布式粒子滤波、m伊BkhUi8ed粒子滤波、免重采样粒子滤波和裂变自举粒子滤波,并通过一个复杂的递推
非线性滤波估计例子,用Mo—lte cado仿真实验的方法对几种典型的粒子滤波算法进行了比较研究。最后总结了粒
子滤波的应用并展望了进一步研究的方向。
关键词:最优Bay∞ia|l滤波;非线性;非高斯;粒子滤波;序贯MoIIte cado;重要性采样;重采样
中图分类号:’r量f911.7
文献标识码:A
文章编号:l∞m132812∞8)04.1099.13
l非线性最优Bayesi卸滤波及其近似
统计信号处理中的非线性滤波问题广泛存在于
自动控制、导航、跟踪、制导、数字通信、经济统计、概
率推理、人工智能、信息融合和故障检测等领域,其
但不幸的是,最优解p(屯I,M)仅在少数情况
才是解析和有限维的;如在模型线性以及噪声和初始
状态均为高斯独立分布时,递推Ba懈i锄滤波给出总
体最优的最小均方误差(MMsE:Milli咖m M咖Squa阳
E珊r)估计,也即线性高斯卡尔曼滤波器(KF:Kaln幽
基本任务就是要从受噪声污染的观测量中去递推地
Rlter)幢’31,此外就是在状态空间离散且状态数有限时
估计不可观测的系统状态,该系统被称为动态状态
所用的栅格法(GBM:Grid.Based Method8)HJJ。而对
空间(DSS:D)mamic Stale.sp∞e)模型。这里仅考虑
于一般的非线性Dss模型,上述最优解通常并不解
如下的离散形式,即离散的或离散化的…DsS模型:
析,而且随着时问的推移将趋于无穷维b1;因为“维数
屯+。=以以,叱)
y-=^(工I,缈I)
(1)
(2)
其中状态模型,(·,·)和观测模型||l(·,·)均为已
知,而且至少一个为非线性。我们的目的就是要递
推地在每次获得观测量儿后,估计状态量屯的条
件概率密度p(屯l y¨)。递推Baye8i锄滤波理论给
出了该问题的严格求解,它通过时间预测和测量更
新这两步的反复迭代,就可最优地估计出p(以I
,¨)的精确解。因为该后验密度包含了状态量屯
的所有统计信息,其它任何统计估计如均值、协方差
或斜度、峭度等高阶距信息都可以由它估计出来,并
可统一表示为如下的均值估计形式:
n气垒E[n(屯)],‘,‰)
广
灾难”以及运算量和存储量的急剧膨胀而使得该最优
解在物理上不可实现,在工程上也只需做某种近似即
可,即寻找上述问题的次优解。用的最多的次优算法
便是扩展卡尔曼滤波(EKF:Extended KF)心’3】,其基本
思路是对式(1)和(2)的非线性模型在状态向量的邻
域内进行酬or展开并取其一阶或二阶近似。EKF
的缺点是需要计算模型的JacIDbi龃矩阵因而实现起
来较为困难,而且在模型的非线性较强以及系统噪声
非高斯时估计的精度严重降低,并可能造成滤波器的
发散。近年来出现了一些无需J帕蝴肌矩阵计算的
免微分方法,如基于无味变换(UT:uIlscented伽n如卜
衄d∞)的无味卡尔曼滤波(UKF:U璐ce删KF)比’7],
与之本质等效的均差滤波器(DDF:Divided Di:雠眦鹏
Rlter)哺。和中心差分滤波器(CDF:ce曲fal Di腩r胁∞
Filter)一】,类似的还有G硼黯.Hemlite滤波器(GⅢ.)吲
等。它们均属于应用线性MMSE(圳MsE)估计子的
=I n(工。)p(工。I,I。I)d工I
收稿日期:加07罅∞; 修回日期:删l埘
基金项目:国家自然科学基金(∞7呦15);中国博士后科学基金(加07伽跏)
(3)
1lOO
宇航学报
第29卷
高斯滤波器,共同的问题是状态维数的增高会导致运
算量的迅速增大,而且滤波器传递的是一、二阶的统
计信息,在非线性、非高斯特性较强时滤波性能急剧
er.Vedag于2001年出版的论文集“序贯M∞te Cado
方法实践(作者:Doucet A,胁itas和Gord帆N J)”,
以及IEEE于2002年和2004年分别出版的关于“统
下降甚至会发散。其它的次优算法还有近似栅格法
计信号处理中的Mome Carlo方法”和“序贯状态估
(AGBM:Ap印砸mate GBM)HJ、高斯和滤波器(GsF:
G鹪8i锄sUm Fil时)u剖、假定密度滤波器(ADF:A与.
跗Ⅱ砖d De璐i钾Filter)饰1和矩匹配滤波器(MMF:Mo.
雠nts M砒chirIg Filter)b两1等等。而本文重点介绍的粒
子滤波器则有望克服上述方法存在的缺陷。
计”的两次特刊。
为了解决上述的非线性Bay鹤i彻滤波问题,粒
子滤波的关键思想是用一组加权随机样本(粒
子)z。={工:,二:}墨。来近似表征后验密度函数
p(工I I岁l:I)一;Ⅳ(工I I yI:。)
2粒子滤波
2.1粒子滤波的研究历程及其基本思想
粒子滤波(PF:P砒icle Filtering)或Monte Cado
粒子滤波(MCPF)称谓的正式提出只是1999年的
事¨“。该称谓已基本被业界所接受。其它的叫法还
有自举滤波(B00乜tmp FilteriIlg)或重要性采样重采样
(sIR:s刖mpling Impo砌nce Res舢曲ng)滤波【12】、条件
密度传播(CONDENSAlrION: CONditiorIal DENS畸
pmpagA,110N)算法【l引、交互粒子近似(hte瑚Icting Par.
dcle App厕matiom)、Metmpolis—H∞tin萨重要性重采
样滤波(MmRF)等等。从本质上说,粒子滤波采用
的是序贯Mo呲e Cado(SMC:Sequemial MC)方法,因
此又被称为SMC滤波;SMC的基础是重要性采样
(Is:InIpo栅lce S锄Ipling)和序贯重要性采样(SIS:
Seqll即ti8l IS)算法。早在上世纪五十年代,在统计
一
=∑二扮(屯一工:)
五了
(4)
其中权值满足归一化条件∑;::l,这种表征再
随着观测量的更新而递推更新。这样原先需要依据
后验密度函数进行的积分运算式(3)就可以转换为
依据加权样本的求和运算
历~一E[0(工I)];Ⅳ‘‘I,II.)
=Io(善。)∑劫(善。一工:)帆
.
o
一
‘=l
一
:∑;幻(工:)
i了
(5)
与上述各种次优Bay鹪i锄滤波算法相比,粒子
滤波的突出优势就在于对复杂问题的求解上,比如
高维的非线性、非高斯动态系统的状态递推估计或
概率推理问题;因为粒子滤波的算法性能在理论上
学【l引和理论物理n副领域就引人了SMC方法,六十
对这些都不敏感。
年代末在自动控制领域得到了应用¨副,七十年代则
受到了更为广泛和深入的关注【I引。所有这些还只
是采用了普通的SIs算法,多次迭代后常会导致“蜕
化(Degene眦y)”问题。更为重要的是,SMC所需的
巨大样本数对机器的运算能力提出了较高要求,由
于受当时计算能力的实际限制,所以SMC的研究也
被冷漠下来。进入九十年代,SMC的研究又逐步引
起了人们的重视【5’1¨;其中,Gord∞等人【12】提出的自
举粒子滤波(BPF)算法在SIS的基础上引入了重采
样以克服蜕化问题,成为SMC研究重新兴起的标志
性文献。而且,计算机运算能力的急剧增长。为SMC
的物理实现提供了客观条件。SMC的优越性能使得
非线性、非高斯、非平稳的状态递推估计问题研究摆
脱了困境。本世纪伊始,SMC在更为广泛的领域掀
起了更加深入的研究热潮,较具代表性的是spring.
2.2重要性采样与序贯重要性采样
在很多情况下,上述后验密度可能是多变量、高
维、多峰、非标准、非解析的,因而很难直接从这样的
密度函数中采样粒子,为此引入了重要性采样
(Is)‘4’5’1。舯m]。Is首先由M躺hall‘∞1提出,现已在各
种M∞te C盯lo方法中得到了广泛的应用。Is的基
本思路是避开较难采样的密度函数p(屯l,。;。),转
而从另一易于采样的密度函数g(屯l y。:。)中采样
粒子,该密度函数被称为重要性密度(I珥’onance
Densit)r)或提议分布(PrI叩硝al Di8tribud叩)。璐要求
二者满足
埘?垒埘毒I=p(j::。,,I:‘)/g(j::I I yI:I)
蕾p(j::。l,。:‘)/q(工::。I y。:I)垒面:
卅称为非归一化重要性权(【恻ized岍
(6)
第4期
程水英等:粒子滤波评述
110l
t锄∞w西加),二?=埘?/∑t‘,?为归一化重要性权,
酬为重要性比(I脚删衄lce Ratio),也可称为重要性权或
真重要性权(血圯IIIlpona眦e weig№)汹1。因此,
g(工o:I l yl:I)一;Ⅳ(善o:‘I,I:^)
屯
.
=吉∑艿(工呲一善∞ (7)
一^f厶”、。o:l一。o:I,
、’7
计算由于其权值过小而意义甚微。Kong等人∞】首
先引入了有效样本容量(E眠tive S唧le Si趵)的概
念(另见文献[4,5,24])来度量权值蜕化,其定义为
“
7、r
%=————2—丁=——-二∑了一≤Ⅳ,
其中:::≠罢拦
l+玩_(.1,.,。)(埘i)
层g(.I,¨)(埘:)2
g~工·l工I—l'J,I,
^,
(12)
p(工o:I
I yI:I)≈;Ⅳ(工o:I I,1:‘)
但上式难以实际计算,所以真正用到的是如下
屯
=∑二扮(工。:。一zo
一/J…●u、40:●一‘O:I,
的估计式
(8)
、q,
如果提议分布选取恰当,则应用Is,当样本数趋
于无穷时,根据上式所得到的估计式(5)是渐近无偏
的b】,其收敛特性由强大数定律保证。
从IS到sIS的目的是要在每次获得新的观测量
乩后,递推地将粒子集由瓢一。更新至Z。。假定提
议分布满足如下分解
一
砧=1/∑(面:)2
二T
(13)
其中;:为归一化重要性权。可以预先设计一个门限
Ⅳn,当轧≤%时,则表示蜕化较为严重,这时就需
要用到下面的“重采样(Res枷pHIlg)州t毛nm∞’丑驯技术,
也有少数文献称为“选择(Sehecti伽)m盘h或“再生(Reju.
靶Ilali∞)瞄"技术的。
g(工o:。I yI:。)2 g(工I I工o:。一l,yl:I)g(xo:I—l
I yl:。一1)
重采样的基本思想是抑制或剔除小权值粒子,对
(9)
于大权值粒子则依其权值大小进行复制,从而把处理
这样我们就可以在原先粒子工;m。一g(工。m。I
,。小。)的基础上扩展一个关于当前状态的粒子分量
资源按照粒子权值的大小进行分配;这有点类似于遗
传算法(GA:Ⅻc蛳枷哪)恤1中的“适者生存”原
工:一口(工I I工。m,,,M)即可构成当前粒子工:;I一
理。重采样的基本方法是对原粒子集靓中的每个粒
口(工。:。l,。:。);剩下的工作就是要对权值进行递推
子进行繁殖,各粒子子代繁殖的数目满足层(凡)=
更新。先进行变换
p(工o:I,yl:I)=p(yI l屯)p(工I I】屯一1)p(工o=‘一l,,l:I—1)
川tl,:,o≤Ⅳi≤川,∑Ⅳj=川,所有子代即构成新的
(10)
粒子集z。={石i,l/Ⅳ.}墨。;可见,新旧粒子集中粒子
进一步假定口(工-I工oml,yl:I)=g(屯I屯一l,
的拷贝关系满足概率Pr(工f=J:)=埘?。重采样后粒
几),这样就可以只作滤波估计p(工。l yM),并且
子集中各粒子的权值均为1,ⅣJ。重采样的方法有多
我们只需存储工:,而可以丢弃状态轨迹粒子工:...。
和历史观测y。小。。此时的权值更新如下:
硼::加:.。出生学掣(11)
硼‘2加¨—尕i五i丁u1’
口L工I I工I一1,y‘,
种,称谓也不尽相同,主要有:S耐埘或多项式重采样
(Multi∞lnial R£唧hIlg)拈瑚盘】,剩余重采样(R商dual
IIe:蛐叩h固D’嵋盘矧,最小方差采样(MiIli咖mⅧaI脱
娜119)或系统重采样(S),雠鲫嘶c№枷讪Ilg)¨’5瑚一。
归一化后便是粒子集Z。,之后我们就可以得到
比较而言,重采样后三类方法中魁的方差依次减小。
如式(4)所示的后验密度的估计。
2.4重采样的样本枯竭等问题及其克服方法
2.3
SIs的蜕化问题与重采样
SIS的一个严重缺陷是“蜕化(De护ne呻)”或
“权值蜕化(weight Degen啪Ic)r)”问题乜1盘3,即重要性
重采样带来的新问题是,由于权值越大的粒子
子代越多,相反则子代越少甚至无子代;这样重采样
后的粒子集多样性减弱,从而不足以用来近似表征
权的方差随着时间是递增的(证明见文献[23,24])。
后验密度;尤其是在过程噪声较小时问题更严重,最
直接的表现是经过多次迭代后,仅有某一个归一化
糟糕的情形就是新的粒子集实际都是某一个最健壮
重要权值趋于l,其它权值都趋于O而几乎可以忽
略;其直接后果是,关于粒子集中的绝大多数粒子的
粒子的子代,这就是“样本枯竭(sample I唧哪面8h.
残Int)”问题【4’1引。克服方法有多种,其中最简单的就
1102
宇航学报
第29卷
是直接增加足够多的粒子,但这常会导致运算量的
急剧膨胀。重采样一移动算法(Res甜Ipling-Move m.
妒rithm)H’5’1副则是在原SISR(SIs w汕Res帅pling)或
BPF等算法的重采样之后加上一步MCMC(Ma虫a、,
Chain Monte Cado)汹1移动处理使粒子集趋于平稳分
布,减弱粒子间的相关性。统计学中的Markov链通
常是已知转移概率而要求序列的极限平稳分布;而
这里则相反,已知平稳分布,寻找恰当的转移概率,
使得序列能由初始状态经过尽可能短的烧穿时间
(B哪一in Tim)后收敛于平稳分布,再用此后的
Marl【ov链作为后验密度的粒子。典型的MCMC算
法有M—H(Metmplolis.H船tin铲)算法和Gibbs采样;其
中后者可视为M.H算法的特例,针对的是多维且联
实现;其次是为了按照式(14)递推计算权值,我们必
须计算如下积分
p(j,。I工:.。)=Ip(yI I z。)p(工I I善:.1)dxI
r
J
(15)
而该积分通常是非解析的。但有两种情况采用上述
的最优提议分布是可行的[4’21’圳:一是状态屯的取
值空间为离散有限的;二是观测模型线性且状态噪
声和观测噪声均为加性高斯的。而在其它的一般情
况下,并不存在一种通用的提议分布选择,应该具体
情况具体分析。用得最早n副也是最多的就是先验
转移密度bJ8正h刎,即q(也I工:ml,岁¨)=p(工I I
工:一。),如著名的BPF算法和coNDENsA,110N算法
等,此时的权值递推关系为埘:=钾:一。p(儿I工:)。
合密度难以直接采样的情况。采用McMc移动方
这种提议分布的优点就是简单、易实现,即粒子的采
法的突出缺陷就是为了保证收敛所需概率转移次数
样和权值的递推计算都容易实现。其缺陷是常会导
大,算法增加的运算量大,而且收敛的判断也是个问
致较高的权值方差,原因在于没有计入最近的观测
题。核平滑(Ken地l SⅡ啪thing)或正则化(Regul鲥盟.
ti∞)H’5挪1方法则采用了另一种思路,即用核函数代
值信息,权值与似然函数成比例;特别是在状态的预
测值位于似然函数的尾部,而且状态噪声明显高于
替式(4)中的艿函数,重采样的近似密度函数也就变
观测噪声时权值蜕化问题严重。于是人们又不得不
为连续的,这就是正则化粒子滤波器(Regularized
PF);其问题在于高维时的正则化难以实现,而且重
采样后的粒子集不再是后验密度的渐近无偏估
设法将粒子向似然函数的峰值区移动【5J引,如“预编
辑(蹦or EditiIlg)¨2J,’法及类似的“取舍法(Accept/Re—
iect Procedure)¨。"采样;或者是选用其它更合适的提
计【4J1;因此主要用于样本枯竭较为严重时。另外,
议分布,如Chen zIlebl提出采用先验转移密度的退
3.7小节将要介绍的裂变BPF(FBPF:Fissi仰BPF)算
火形式作为提议分布。在弱观测噪声条件下,似然
法恤1也可用来克服样本枯竭问题。
函数外形尖锐,而且比先验转移密度更接近于目标
实际上重采样还会带来其它问题[4’5’21Ⅲ]。首
后验密度,于是可以设想用似然函数作为提议分布,
先是由于其对所有粒子的综合处理而限制了算法的
而用先验转移密度作为权值迭代的比例因子,这就
并行实现;其次是重采样后的状态粒子轨迹不再统
是似然粒子滤波(ukelih∞d PF)H’5】。用于克服尖锐
计独立而丢失了简单的收敛特性。但Cris锄和D伽.
型的似然函数与先验转移密度重叠区过小问题的提
c“矧证明了重采样后,算法在较弱的假设下仍然是
议分布还有桥接密度(BridgiIlg Den8ity)H’5】、分割采
几乎必然收敛的。
2.5提议分布的最优与次优选择
提议分布函数选择最优的标准是最小化重要性
权的方差,并有如下重要命题¨轧2L线刎:
命题1:g。(工I I x::。一l,,I:。)=p(工I I J:一I,,I)
样(P眦iti蛐ed SanlplirIg)¨¨、基于梯度的转移密度
(Gmdi朗t.B鹊ed’r舢8iti∞De啦ity)¨o;此外还有下面
将要讨论的用EKF或uKF将最近的观测信息计入
提议分布的扩展Kal咖粒子滤波(EKPF:E】c劬ted
Kalm蛐PF)‘2¨或uPF(un∞ented PF)‘2’13’191等等。
是最小化基于工:m。和,。:。的重要性权方差
2.6粒子滤波的基本算法及其收敛性
‰,f‘1.-‘...。.,M)(幻:)的最优提议分布。
取得最优时的权值更新如下:
综合上述各环节后的基本粒子滤波算法如下:
后=o时初始化,采样粒子工:。p(工o),埘:=l/Ⅳ.,
埘:=幻:一。p(,。I工:.1)
(14)
£=l,…,ⅣI。蠡=l,2,…时做以下循环迭代,①序
上述最优提议分布的选取至少存在两个缺陷:
贯重要性采样:i=1,…,M,采样粒子工:一g(以
首先必须从可能是非标准的分布中采样粒子而难以
I工:一。,儿),依据式(11)计算非归一化重要性权埘:,
第4期
程水英等:粒子滤波评述
1103
构成粒子集靓={工:,埘:}墨。。②权值归一化:f
=l,…,M,计算归一化重要性权加:,得到粒子
的重采样算法,那么就能保证粒子滤波的均方误差
收敛于零,并且收敛的速度为1,M。由式(16)可
集z。;{工:,二:}墨。。③结果输出:根据要求,由
见,由于收敛速率取决于所采用的粒子数Ⅳ』,而与
粒子集z。并依据式(5)估算所需的状态统计信息。
状态向量的维数肛无关,所以粒子滤波克服了维数
④权值蜕化监测与重采样:按照式(13)估算有效样
灾难问题;但事实并不总是如此。因为在某些情况
本容量Ⅳ矿,若舟面≤%则用前述的某种方法进行
下,CⅢ的值与维数札有关,而为了确保均方误差
重采样,得到新的粒子集i。={;:,二:=1/ⅣI}墨。;
否则直接返回步骤①。
为了避免重采样带来的估计误差,所以上述算
法中将统计结果输出放在了重采样之前。此外,若
重采样后出现严重的样本枯竭问题则还有可能在重
采样后采用MCMC移动等方法克服。
足够地小,我们就必须改变ⅣJ,也就是说粒子数Ⅳ.
通过CⅢ与维数肌发生了关系。cllen动e【51概略地
给出了粒子滤波的有效粒子数与维数的简单指数增
长关系。更进一步,Cris舳和D伽c“圳还讨论了粒
子滤波均方误差的一致收敛问题。此外需要说明的
是,定理2只讨论了n(也)为有界的情形,而这显
另外一个值得关注的问题就是粒子滤波的收敛
然不够;因为当n(屯)=毛时就不满足,而这恰恰
性问题bJ乳域‰圳。由于粒子间的交互作用使得统
是我们离不开的MMsE估计子E(以l y。:。)。
计独立的假设不再成立,所以粒子滤波算法收敛性
根据作者的大量仿真研究表明,在有限粒子数
的分析要复杂得多。以BPF算法为例,其收敛性有
的条件下,实际的收敛现象是:随着粒子数的增加,
如下两个重要定理(证明见文献[28]):
收敛的变化率非均匀;而且当粒子数越过某个限后,
定理l:假定p(屯I屯一。)为FeⅡer转移函数,
在粒子数增加有限的情况下,对滤波估计性能的影
p(儿I屯)连续、有界并严格为正;则当M一∞时,
BPF算法的估计;Ⅳ(毛I,。:。)几乎必然收敛于
p(JI I,I:-),记;_lv(工-I,t:I)一p(工I I yI:I)。
其中,用C。(肚)表示定义在足~上的连续有界函
数空间,则p(屯I屯一。)为F.euer转移函数,简单地
说就是应满足V n(屯.。)∈C5(肚)号p(屯I
屯一。)n(屯.。)∈G(肚)。
定理2:假定p(y。I屯)在肚上有界,则对于
所有后≥O和任意n(屯)∈风(肚),均存在一个
响很弱,或者说,由增加粒子数所获得的收益与付出
的运算量是不相称的。我们旧1将上述的粒子数限
称为粒子滤波算法的“有限收敛界(LcB:“n】ited
G叽vergence Bound)”。
定义l:假定某个粒子滤波算法的滤波估计在
有限粒子数时为有偏的,E,为描述算法估计误差的
某个指标(0 E,0>O),△ⅣI为某个足够大的粒子
数增量,矿表示粒子数为札时算法的统计估计误
差,E:表示粒子数自札增加至M+△凡后算法的
统计估计误差,相应地,E;表示粒子数自几减少至
独立于札的数G.。,使得BPF算法得到的估计
M一△Ⅳ.后算法的统计估计误差,根据粒子滤波算
;Ⅳ(屯I y。;。)满足如下的均方误差收敛关系:
法的性质显然有
E[<;Ⅳ(工I I yl:‘),n(工‘)>一
]2
≤c..。0 n(屯)II 2/Ⅳ.
(16)
其中风(舭)表示定义在肚上的Borel有界可测
函数空间,定义内积<;Ⅳ(屯I,.:。),n(屯)>垒
P
I o(屯);Ⅳ(以I,。:。)djrI,定义上确界范数
’
J
0 0(工。)0垒蛐E I n(屯)l。
’∈一-l
总之,只要重要性权有界,并采用前述某种基本
吒一充分大
0矿II川层:0一l,屯_.充分大
0层:II川E:0——,1
(17)
设艿。为某个足够小的正数,则定义粒子滤波算
法的有限收敛界‰为最小的见=‰,使得当
粒子数ⅣJ充分大时,
lim
‰~
1 0矿0/0 E:0一l I≤艿,,
‘
(18)
lim
‰’。
l
0 E:0/0 E:0—1 I≤以
其中‰表示Morne Cado统计中的实验次数,
1104
宇航学报
第29卷
“0·lI”表示向量范数,“I.I’’表示取绝对值。
密度的真值与估计值之间的误差限,这种误差限用
3粒子滤波算法研究的新进展
K.L距离表示。此外还有BoKc等人啪1提出的方法。
但作者认为其本质上还是一种基于似然函数的方
粒子滤波算法的诸多衍变形式都是为了解决基
法,因为其调整依据的多个指标实际都是似然函数
本算法中所存在的上述种种问题,其中有些我们在
前面已经有所阐述,这里再选择几种较有影响的算
法集中讨论。
3.1辅助变量粒子滤波
由Pitt和shephardmo提出的辅助变量粒子滤波
(AVPF:Amdliary V面able PF)或辅助粒子滤波(A呱.
iliar)r PF)是另一种逼近最优提议分布的方法。AVPF
虽然是由BPF演化而来,但其可以表征密度函数拖
的反映,只不过其粒子数的白适应改变是在重采样
阶段。L广栅’的优点是实现简单,缺点是权值方差
对确定粒子数影响很大,而且还会增强粒子间的相
关性,增加了高速并行实现的难度。Ⅺm.APF的缺
陷是实现较为复杂,尤其是为了简化支撑盒子数的
计算而需对提议分布预先进行离散近似。
3.3实时粒子滤波
上述的APF其实已有实时处理的背景,Kwok等
尾处的离群值,而普通的粒子滤波算法却难以做到。
人Ⅲ。则进行了更为深入的实验研究。实时处理主
AVPF通过引入辅助变量r来表示粒子集中的成分
要考虑的是传感器的高速数据率与处理器的有限处
索引f。与BPF等算法不同的是,AVPF将通常的粒
理能力的矛盾。通常的做法是:减少粒子集中的粒
子采样与重采样步骤颠倒。在重采样前,AVPF通过
子数、丢弃数据或组合数据。第一种方法可能会因
对原粒子集中的各个权值依据似然值的大小进行修
为粒子数的不足而导致滤波发散,第二种方法在状
正,使得重采样后的粒子向似然函数的高值区移动。
态剧变时会因为丢失有用数据而导致滤波发散,第
BPF实际是从滤波后验密度p(也I y。:。)中重采样,
而AVPF则是从平滑后验密度p(屯一。I,¨)中重采
样,更接近于状态的真值,因此可以获得更小的权值
方差。当状态噪声较小时,AVPF的性能优于BPF;
但当状态噪声较强时,由于从估计卢i¨中获取
p(毛l j:一。)的信息不足,所以此时AVPF的优越性
三种方法需要对传感器数据作特殊的假定。Kwok
等人设计的实时粒子滤波(R1w:Real—Ti眦PF)则
考虑通过扩展估计窗口,即每次滤波运算跨越多个
观测数据,将同样大小的粒子集按照观测数据数目
等分为若干个子粒子集,每个子粒子集分别进行粒
子滤波,但其结果需要进行加权融合处理,融合后的
难以保证【4’5】。由于在AvPF算法的一次迭代中,对
估计作为最后的结果输出。RPF的优点是不丢失任
于每个粒子需要计算两次似然函数和权值,所以其
何观测数据并无需对观测数据作任何可组合的假
计算量要大于BPF。另外,当似然函数位于先验转
移密度任意的尾部时,AVPF的估计精度要高于
BPF;但若似然函数与先验转移密度位置基本吻合
时,BPF将具有更高的估计精度【l引。
3.2自适应粒子滤波
定。为了进一步提高实时处理的效率,Kwok等人m】
还将上述的APF与RPF相结合,给出了自适应实时
粒子滤波(ARPF:Ad印tive鼬i聪PF),其中的粒子
数自适应改变算法采用的是KLD采样法。
3.4分布式粒子滤波
自适应粒子滤波(舭'F:Ad印tive PF)是指算法
所用的粒子数不再固定,而是随着信号环境的变化
文献中出现的分布式粒子滤波(DPF:Di蚵but.
ed PF)实际有两种:一是指分布式传感器系统中的
而自适应改变;其主要针对的是需要在线实时处理
粒子滤波【41矧,主要是用到了一些信息融合中技术;
的应用,因为冗余粒子数的剔除可以降低算法实现
而另一种是指粒子滤波算法的分布并行实现旧一】。
的复杂度和运算量。目前用于自适应改变粒子数的
本文关注的DPF则指的是后者,因为它对于算法的
方法主要有两类:基于似然函数的APF(L—
APF)汹省】,即所需的粒子数应能保证非归一化似然
值的和超过某一预定的门限;基于Ku】mack.kibler
(K.L)信息数或K-L距离(1(ID)采样的栅’(1凹.
APF)m灌】,即通过粒子数的自适应变化来保证后验
硬件实现更加重要。与DPF相对的是集中式粒子
滤波(CPF:ce曲捌PF),即粒子滤波的实现全部
依靠一个独立的处理单元集中实现。DPF通常是由
一个中心单元(cu:centnl u咄)、若干个处理元
(PE:Pr∞e够iI培Element)和连接网络(Inter嘲necti∞
第4期
程水英等:粒子滤波评述
1105
N咖orI【)组成。B鹊hi等人【训针对前述SIsR+M.H
(可选)的重采样一移动算法算法设计了三种DPF
算法:全局DPF(GDPF:Global DPF)、局部DPF(LD—
PF:Local DPF)和压缩DPF(CDPF:CoⅡIp瑚sed DPF)。
基本BPF算法并行分布式实现的困难在于重采样
处理,为此,Bohc等人Ⅲ1提出了两种分布处理算法:
比例分配重采样(m’A:Re蛐npliIIg witll脚nional
仙ocation)和非比例分配重采样(RNA:№a珥'Hng
w油N帆p玎Dpoftional仙ocati叩),并给出了分别应用
砒'A和RNA的两种DPF的fPGA(Field Pr嘴珥珊瑚Ue
Gate AJ嘲y)实现结构。
3.5毗伊BlackweUised粒子滤波
一类粒子滤波。GPF的关键是将p(也I yⅢ)和
p(工。I y。小。)均用高斯分布近似;若高斯假定为真,
当粒子数趋于无穷时,GPF是渐近最优的。GPF近
似认为;(屯I,。:。)=Ⅳ(jⅢ,只…),其中唯一确
定该分布的均值和协方差可直接由Z…估计,因而
无需重采样。GPF中的提议分布可以简单地选取
g(毛I y¨)=Ⅳ(萱Ⅲ一。,只….),此时权值计算如
BPF中那样简单,但也存在类似BPF中的问题。更
合适的选择是借助于EKF、uKF、CDF或GHF等方法
产生¨引,即选取g(屯I,。:I)=Ⅳ(譬Ⅲ,只…);因
为这样可以将最近观测值的影响计入,更为逼近理
虽然理想的粒子滤波估计精度与状态维数无关,
想的提议分布,相应的算法我们称之为EKGPF、UG.
但在维数较高时,滤波所需的实际粒子数仍随着维数
PF、CDGPF和GHGPF等(这是为了强调滤波算法的
的增高而迅速增长;这在算法收敛性的讨论中已经做
主体为GPF,也有称为EKPF、uPF、CDPF和GHPF
过说明,而且该现象已被众多实验所证实。RB粒子
等n钊,但易与已有称谓混淆旧1);此时甚至于可用
滤波(RBPF:R丑0.Blackweuised PF)或边缘化粒子滤波
El(I,F、UPF、CDPF和GHPF等的时间更新结果来作
(MPF:MaIginalized PF)胁澎弗3则试图从动态系统模型
本身去挖掘潜力,减小用粒子滤波估计的状态维数。
假设状态向量可以分解为两部分(屯)7=[(工芦)7,
(工≯)’]。髓PF认为p(工芦I JP,,,.:。)可以用通常
的线性卡尔曼滤波进行MMsE最优估计,而p(工P,I
,。:。)需用粒子滤波进行估计;由于维数的降低所以
同样的粒子数一般可以获得更好的性能。这里用下
标PPF(Pri面tive PF)来表示通常的粒子滤波算法估
计,则与通常的粒子滤波相比,关于RBPF的估计性
能有如下命题Ⅲ1成立:
命题2:当粒子数M有限时估计n麓和而孙均
为有偏的,当M一∞时,n‰———盈,而‰一
晚,并满足中心极限定理,即砼簖.Ⅳ(历。,
哳(n*)),而孙.Ⅳ(历。,哳(nk)),而且有
%r(Q孙)≤地r(n孙),忆r((二:)孙)
≤忆r((埘:)簖)
3.6免重采样粒子滤波——高斯与高斯和粒子滤波
为先验预测密度的近似,从而进一步减小运算量。
需要说明的是,Me眦等人也提出了uPF【引,后来还
将uPF和CDPF等统一归类并称为口点粒子滤波
(SPPF:Si舯a.Point PF)¨引,但不同的是,其中的uKF
或CDF(统称为SPKF:Si舒na-Point KF)是用来为每个
粒子生成提议分布,即,:一Ⅳ(屯;叠:…P毛。),除
重要性采样的其它部分则与基本的粒子滤波算法一
致;其缺陷是算法的运算量急剧增大。
考虑Dss模型状态估计中更为复杂的概率分
布情况,即上述用单一的高斯分布来近似p(以I
y。:。)或(和)p(屯I ym一。)远远不够时,甚至于DsS
模型中的加性状态或(和)观测噪声也为非高斯分
布,K0tech和Djuric[鹄1借用高斯和滤波器(GSF)的
思想旧瑚】:任何概率密度函数均可以用一组高斯密
度函数的加权和任意地逼近,结合粒子滤波算法提
出了GsPF算法。GsPF实际是一组G】)F的并行实
现,其关键是GPF数目及参数的确定以及GPF之间
的交互或加权系数的更新计算。类似的还有MeM
如前所述,重采样虽然解决了权值蜕化问题,但
和w衄【棚1提出的高斯混合口点粒子滤波(GMsPPF:
却又可能引起样本枯竭,并会影响算法的收敛特性
和并行实现;因此,免重采样粒子滤波(Iu唧:R髓a.
mplin乎№PF)便具有较强的吸引力,Kotecha和
Djuric提出的高斯粒子滤波(GJ下:G舢鹪i锄PF)M1与
高斯和粒子滤波(GsPF:G跚昭i卸S岫PF)旧1便是这
G肌聃i锄Mixt山陀sPPF),但GMsPPF不能看作是一组
SPPf’的并行实现,因为它不是用SPl汀为每个粒子
生成提议分布;GMSPPF实际上是综合了GsF与重
要性采样技术的PF,其中GsF中的每个高斯滤波器
实际采用的为SPKF,因此其运算量反而比他们所提
1106
宇航学报
第29卷
出的SPPF要,J、。
3.7裂变自举粒子滤波
机的采样生成,一种简单的做法就是选用以原粒子
为均值的高斯分布。此外我们还需对原粒子及再生
裂变自举粒子滤波(FBPF)旧1是对BPF算法的
粒子的权值进行调整,在容许的误差范围内为避免
改进,是专为克服样本枯竭问题而设计的。由于在
复杂的计算,可以直接将原父代粒子的高权值在原
权值蜕化严重时直接进行重采样会导致样本枯竭问
粒子及其再生粒子之间进行平均分配。裂变繁殖后
题,所以我们提出在重采样前对存在权值蜕化的粒
再对粒子集的权值进行归一化。这就是整个的预处
子集进行预处理。具体操作为,将粒子集中的权值
理过程,可概括为“权值排序(SortiIIg)一裂变繁殖
一粒子对按照权值递增顺序排队,参照有效样本容
(Fi8si叩)一权值归一(No皿ali五IIg)”,或简称为“SFN”
量选取一定数目的高权值粒子进行裂变繁殖,繁殖
预处理过程,如图l所示。SFN预处理后再按照通
后再生的粒子自粒子集权值的低端依次覆盖原低权
常的方法进行重采样。由于在预处理中对高权值粒
值的粒子,裂变繁殖的子代粒子数则正比于父代粒
子的权值进行了重新分配,所以权值的方差减小,权
子的权值。这里的裂变繁殖不同于传统的粒子复
值蜕化减弱;由于进行了裂变繁殖,所以粒子集的多
制,可以理解为对与原粒子相关的某种分布进行随
样性增强,这就避免了样本枯竭问题。
注。”I-恍J(向下取整),%为用于裂变复制的总的父代粒子教,-9一。‘岈。2岬,肼..
图1
sFN预处理过程:权值排序一裂变繁殖一权值归一
Fig.1
1he SFN prep眦嘲includillg啪iglItB鲥thlg,p硎cle mpmduciIlg by‰i帆蚰d雠ight8砌瑚瞄唱
4粒子滤波的应用
踪是当前一个热门的研究领域,粒子滤波因其较强
的非线性处理能力而被成功地应用到了该领
可以说凡是需要用到非线性、非高斯递推
域【13J¨。粒子滤波用于人工智能的一个热点就是用
Bayesi如估计的地方都可以应用粒子滤波,所以粒
来解决机器人定位问题bL弧钟’训。
子滤波的应用领域极为广泛。本文不可能穷举出粒
D{uric呻1详细讨论了粒子滤波在无线通信中的
子滤波的所有应用,而只能简单列举出用的较多的
应用,包括盲均衡、平坦衰落信道中的盲检测、多用
一些场合。首先粒子滤波在定位、跟踪领域得到了
深入的研究。GIls‰等人Ⅲ1综述了粒子滤波在
户检测和衰落信道中空时编码的估计与检测等等。
此外还有讨论通信中的盲解卷胁1及信号解调
定位、导航与跟踪中的几种应用,主要包括通过地图
的m脚】。语音信号是一种典型的非高斯、非平稳信
匹配或射频测量的汽车定位、汽车防撞、通过地图匹
号,因此粒子滤波可以用来进行语音识别旧】、语音
配或地形辅助导航的飞机定位、综合导航以及测角、
增强与消噪处理m】,还可用来进行语音信号的盲分
测距或测速跟踪等。尤其是测向跟踪以其鲜明的非
离旧】,即解决所谓的。鸡尾酒会”问题。类似的还有
线性而在粒子滤波应用中受到了广泛的关
用粒子滤波增强地震信号汹】。作为一种非线性的
注【11’域挣I滞椰朋】。国内关于粒子滤波在导航、跟踪
Baye8i姐概率推理方法,粒子滤波可用于一般的非
中的应用也有报导【61’训。作者旧3则对粒子滤波在
线性、非高斯序列的估计【4J。’2L训。粒子滤波可用于
空对海单站无源跟踪中的应用进行了深入研究。文
目标识别Ⅲ】、系统辨识,参数估计和模型确认以及系
献[57,58]专门讨论了粒子滤波在多目标跟踪中的
统的自动控制旧】。文献[59]则致力于研究将粒子滤
应用,此外文献[24,27,41]等也有所涉及。视觉跟
波应用于动态系统中的故障检测。粒子滤波的应用