第
卷 第
31
2018
年
1
1
月
期
模式识别与人工智能
Pattern Recognition and Artificial Intelligence
Vol.31 No.1
2018
Jan.
目标跟踪算法综述
卢湖川1
李佩霞1
王 栋1
.
.
尽管现在已有大量研究,但是仍然存在很多问题亟待解决,如光照变化
为了更清楚地梳理现存的算法,文中对典型的目标跟踪算法进行分析总结
摘 要 作为计算机视觉领域的一个重要课题,在线目标跟踪在导弹制导
有重要作用
动等
作
来的研究趋势
关键词 目标跟踪,相关滤波,深度学习
引用格式 卢湖川,李佩霞,王 栋
然后,从传统算法和深度学习算法两方面对经典算法进行概述和分析
模式识别与人工智能,
.
.
.
目标跟踪算法综述
.
.
2018
DOI
10.16451 / j.cnki.issn1003-6059.201801006
Visual Object Tracking
:
A Survey
LU Huchuan1,
LI Peixia1,
WANG Dong1
视频监控
、
无人机跟踪等众多领域中具
、
尺度变化
遮挡和相机移
、
、
首先,简单介绍研究意义及相关工
最后,讨论算法目前存在的问题,给出未
形变
、
.
,
31
(
) :
1
61-76.
ABSTRACT Online object tracking is a fundamental problem in computer vision and it is crucial to
application in numerous fileds such as guided missile
video surveillance and unmanned aerial vehicle.
,
,
,
,
Despite many studies on visual tracking
there are still many challenges during the tracking process
including illumination variation
rotation
scale change
deformation
occlusion and camera motion. To
make a clear understanding of visual tracking
visual tracking algorithms are summarized in this paper.
,
Firstly
classified
the meaning and the related work are briefly introduced. Secondly
,
summarized and analyzed from two aspects
:
traditional algorithms and deep learning
,
the typical algorithms are
,
,
,
algorithms. Finally
the problems and the prediction of the future of visual tracking are discussed.
,
Ke y Words Object Tracking
,
,
LU H C
LI P X
Citation
,
Correlation Filter
,
Deep Learning
WANG D. Visual Object Tracking
,
,
) :
(
Artificial Intelligence
2018
31
1
61-76.
:
A Survey. Pattern Recognition and
.
”
感知
计算机视觉是研究如何让计算机从图像或视频
的科学,它可以看作是人
中获取信息并进行
“
近二十年来,随着计算机硬件
类视觉和感知的延伸
水平
图像视频处理技术及人工智能技术的迅猛发
、
展,计算机视觉技术在智能控制( 如机器人
无人机
、
检测和识别系统等)
等)
信息
、
、
检索( 如多媒体数据查询
图像搜索引擎等)
人机
、
交互等许多关系到人类活动和生活领域均得到广泛
决策系统( 如监控
、
、
收稿日期:
2017-09-19
; 录用日期:
,
2017-12-05
;
Manuscript received September 19
2017
,
accepted December 5
本文责任编委 高新波
2017
Recommended by Associate Editor GAO Xinbo
大连理工大学 信息与通信工程学院 大连
1.
116024
,
1.School of Information and Communication Engineering
Dalian
University of Technology
Dalian 116024
,
应用
.
.
在计算机视觉领域中,基 于 视 频 的 目 标 跟 踪
( 也称为视觉跟踪) 一直都是一个重要课题和研究
热点
视觉跟踪通过在连续的视频图像序列中估计
形状或所占区域,确定目标的运动
跟踪目标的位置
、
方向及轨迹等运动信息,实现对运动目标行为
速度
、
的分析和理解,以便完成更高级的任务
目标跟踪无
论在军事国防还是民用安全方面都具有重要的研究
意义和广阔的应用前景
具体研究和应用包括:
.
1
) 智能视频监控
目前,视频监控是目标跟踪技
.
视频监控系统通过对视
术最活跃的应用领域[
]
1-6
.
跟踪及更高级的语义分
频中的目标进行自动识别
、
析处理,从而实现对特定场所( 如军事部门
政府机
、
住宅区等) 进行监控和
车站
关
、
、
通过对视频的分析和理解,智能视频监控能自
预警
动提取对监控和预警有用的关键信息,尽可能地减
机场
、
银行
校园
、
、
.
.
26
模式识别与人工智能(
)
PR&AI
第
31
卷
.
.
少人为干预,提高监控效率,同时减轻人的工作负
作为智能视频监控的关键技术,视觉跟踪算法的
担
研究具有巨大的产业价值
.
.
.
2
) 现代化军事
无人机侦察
、
如在精确制导方面,早在
视觉跟踪技术是当今以及未来
],主要集中在精确制导
现代化军事的研究热点[
7-8
、
靶场测量及武器观测瞄准等
飞行控制
、
方面
年代之
前,美国就开始研制视频制导导弹和炸弹,并在越南
战争和第四次中东战争中用于实战,取得引人注目
的作战效果
红
、
因此,对
外线及其它射线等相结合的视觉跟踪技术
于应对现代化局部战争,视觉跟踪技术的研究也具
有重要意义
现在大多数制导导弹均采用可见光
世纪
20
70
.
.
.
3
]
9
10-11
“
、
表情[
”.
12-13
对话
手势[
) 基于视频的人机交互
基于视频的人机交互
技术通过对由摄像头或其它采集设备拍摄的视频进
行分析,实现人与计算机之间的
计算机软件
可以对人的眼神[
姿态及
]
]等进行分析和理解,从而完成目标跟
身体动作[
踪
一个完整的目标跟踪系统通常包括目标的检测
提取
情
脸
人机交互的重要环节之一
、
计算机想要获得如表
姿态等高级语义信息,必须首先实现对人
、
因此,视觉跟踪也是
识别和跟踪
、
手势
、
人眼及人体的定位和跟踪
、
个环节
、
、
14-15
4
]
.
.
.
.
.
4
) 智能交通系统
随着目前城市机动车辆的逐
渐增多和车流密度的逐渐增大,智能交通系统成为
智能交通系统利用
辅助交通调度不可或缺的工具
],对车辆进行实时检测和
目标检测和跟踪技术[
跟踪,进一步自动获取车辆的流量
车流密度
车速
、
、
、
道路拥塞状况等信息,辅助交通调度
所以,在视频
中快速定位和跟踪目标是智能交通的关键
16-18
.
.
.
.
5
) 智能视觉导航
随着摄像机硬件设备和视频
处理技术的快速发展,基于计算机视觉的智能导航
技术具有较广泛的应用( 如智能机器人
无人驾驶
汽车及无人驾驶飞机等)
智能导航技术利用摄像头
或其它传感器对周围环境和运动物体进行检测和跟
],使机器能安全运转及获取有用信息进行特
踪[
殊的作业或任务
如何在摄像机运动时快速精确地
实现检测和跟踪是智能视觉导航的关键
、
19-20
.
.
.
]
6
21-22
、
城市建模[
) 三维重建
基于视频图像序列的三维重建( 如
]等)
人体三维运动和姿态重构[
一直是计算机视觉领域的一个研究热点,是数字博
物馆
人机交互等诸多应用
、
的关键技术
视觉跟踪技术能够计算摄像头或人体
各个关键部分的运动参数,为后续的三维重构提供
支持
医
、
除此之外,视觉跟踪技术还在航空航天[
计算机动画
、
智能导航
、
23-24
]
25
.
.
.
]
26-27
虚拟现实[
、
]
28
增强现实[
、
]等方面应用
29
疗诊断[
广泛
.
目标跟踪
1
在线视觉跟踪的基本框架如图
所示
1
.
一般在
运动
、
.
.
个基本组成部分: 特征提取
线视觉跟踪具有
模型
外观模型
、
特征提取
4
在线更新机制
、
在线视觉跟踪算法要求提取的视觉
常见
纹理特
、
超像
]
34
特征既能较好地描述跟踪目标又能快速计算
的图像特征有灰度特征[
征[
矩形特征[
素特征[
颜色特征[
兴趣点特征[
、
、Haar-like
、
]
]等
、
]
]
]
30
31
32
33
35
.
.
.
)
运动模型(
Motion Model
运动模型旨在描述帧
与帧目标运动状态之间的关系,显式或隐式地在视
频帧中预测目标图像区域,并给出一组可能的候选
区域
经典的运动模型有卡尔曼滤波(
) [
Kalman Filte-
37-38
]等
Particle Filtering
.
ring
]
.
) [
外观模型
36
粒子滤波(
、
.
外观模型的作用是在当前帧中判决
候选图像区域是被跟踪目标的可能性
提取图像区
域的视觉特征,输入外观模型进行匹配或决策,最终
个基
确定被跟踪目标的空间位置
本组成中,外观模型处于核心地位,如何设计一个鲁
棒的外观模型是在线视觉跟踪算法的关键
在视觉跟踪的
4
.
.
.
在线更新机制
为了捕捉目标( 和背景) 在跟踪
过程中的变化,在线视觉跟踪需要包含一个在线更
新机制,在跟踪过程中不断更新外观模型
常见的外
观模型更新方式有模板更新
增量子空间学习算法
、
及在线分类器等
如何设计一个合理的在线更新机
制,既能捕捉目标( 和背景) 的变化又不会导致模型
退化,也是在线视觉跟踪研究的一个关键问题
.
.
.
.
图
1
在线视觉跟踪的基本框架图
Fig.1 Basic framework of online visual tracking
第
1
期
卢湖川 等: 目标跟踪算法综述
36
以前目标跟踪的研究更多局限于在可控条件
光照均匀等) 下对特定目标( 如人脸
( 如静态背景
、
、
车辆等) 实施跟踪,而在线视觉跟踪旨在对现
行人
、
实场景中的任意目标进行跟踪
由于现实场景的复
杂性和目标物的不确定性,实现在线视觉跟踪存在
诸多挑战,部分在线视觉跟踪的挑战如图
所示
.
2
.
(
(
f
)
f
) 运动模糊
Motion blur
图
2
在线视觉跟踪的挑战
Fig.2 Challenge for online visual tracking
、
、
遮挡
运动模糊
这些挑战主要可分为由目标内在变化引发的挑
形状变化等) 和由外在因素引发的
战( 如姿态变化
、
挑战( 如光照变化
背景杂乱等) ,
、
它们为实现在线视觉跟踪造成很多困难: 如姿态和
形状变化会造成被跟踪目标外观在不同帧之间存在
较大的差异; 光照通常会引起被跟踪目标外观的明
暗变化并带来不可预知的阴影; 遮挡会造成目标外
观的不完整或给目标区域引入背景干扰; 目标的快
速运动会造成运动模糊,使被跟踪目标变得不易分
辨; 在杂乱的背景中,跟踪算法难以较好地鉴别目标
和周围的背景,容易发生跟踪漂移
.
在线目标跟踪算法
2
.
子空间算法等
、
子块跟踪算法
、
在线目标跟踪算法一般由人工设计特征和浅层
外观模型构成,旨在利用简单有效的视觉特征和浅
层匹配或分类模型设计快速鲁棒的跟踪算法,如早
期均值偏移算法
这
些算法能在有效计算资源情况下取得一定的跟踪效
果和速度,但通常不够鲁棒
稀疏表示理论在计算机
视觉方面的成果应用使研究学者不断尝试利用稀疏
表示模型和稀疏特征编码解决在线目标跟踪问题,
取得非常卓越的效果
但稀疏表示模型计算复杂度
.
较高,难以实时处理
鉴于外观模型在传统视觉跟踪
的核心地位,下面从外观模型建立和决策过程的角
度对传统视觉跟踪算法进行概述
2.1 基于均值偏移的目标跟踪
.
.
.
39
) [
Mean Shift
作为一种典型的非参 数 统 计 工 具 ,均 值 偏 移
(
]算法本质上是基于梯度上升的局部
寻优算法,广泛应用于模式识别
数字图像处理和计
、
算机视觉等领域
跟踪算法一直是目标跟
踪领域研究的一个热点,很多研究学者不断进行改
进,使其更加稳定和鲁棒
]最先将
.Mean Shift
等[
,
36
31
. Comaniciu
(
) 形状变化
Deformation
a
)
(
a
) 姿态和光照变化
(
b
Gesture and illumination variation
(
)
b
) 光照和尺度变化
(
c
Illumination and scale variation
(
)
c
(
)
d
(
) 遮挡
d
Occlusion
) 背景杂乱
(
e
Background cluttered
(
)
e
46
模式识别与人工智能(
)
PR&AI
第
31
卷
.
、
,
) [
现高维特征空间到低维空间的映射,保持或获得某
种属性( 如保留整体或局部距离
提取判决性的特
征等)
子空 间学 习算 法有 基 于重 构准 则的主成分
分析(
基于
、
判决准则的线性判决分析(
Principal Component Analysis
Local Preserving Projection
Linear Discriminant Anal-
具有流形和图论背景的局部保持映
、
基于向量
,
) 框
由于子空间学习算法的输入特征都是向量形
除此之外,子
ysis
射(
子空间 算 法 的 图 嵌 入 (
架[
式,所以称其为一维(
空间算法还包括多维子空间算法
Graph Embedding
) 子空间算法
PCA
LDA
LPP
) [
) [
GE
,
,
1D
、
]
]
]
]
49
50
52
51
.
.
.
.
Wang
Mean Shift
为了解决局部遮挡问题,
算法用于跟踪领域,实现简单,速度较快,
Mean Shift
对目标的非刚性变化
旋转等挑战都具有较好的鲁
、
棒性,但是不能较好地解决遮挡
尺度变
、
化等挑战
等[
]提出
44
的跟踪算法,通过不同分块对
基于分块
中心位置的加权投票,降低被遮挡的目标区域对跟
踪结 果 的 影 响
) 理论和
] 结 合 尺 度 空 间 (
背景杂乱
、
Scale
算法,在一定程度上提升
算法对目标尺度变化的稳定性
考虑到
是一个局部寻优算法,容易陷入局部最小
等[
]通过在多个尺度上选择最稳定的核
此外,也有学者结合局
算法和全局寻优的粒子滤波
Mean Shift
值,
宽,减少局部最小值的影响
部寻优的
(
],快速寻找全局最优值
Mean Shift
Mean Shift
Mean Shift
) 算法[
. Collins
Hager
Space
等[
41
40
42
.
.
Particle Filtering
.
.
.
.
43
基于
Mean Shift
Mean Shift
的跟踪算法属于基于模板匹配
的跟踪算法,主要通过
非参数局部寻优
在目
工具搜索和目标模板相似度最大的候选区域
标跟踪领域,基于模板匹配的跟踪算法在当前仍较
活跃,如何设计有效的目标描述机制和鲁棒的相似
度函数或距离函数是此类算法的关键
2.2 基于分块的目标跟踪
. Wang
Frag Track
]提出子块跟踪(
跟踪框架,提出基于分块
早期的目标跟踪算法常采用简单有效的全局直
方图,但这会丢失特征的空间位置信息,导致跟踪算
法在 遮 挡 或 背 景 杂 乱 等 情 况 下 容易 失 败
. Adam
) ,利用分块-联合机
等[
) 对遮挡敏
制克服传统模板跟踪算法( 如
Mean Shift
受到子块跟踪算法的启发,在视频跟踪领
感的问题
域,越来越多的学者考虑采用分块的方式,引入特征
的空 间 位 置 信 息
] 将 分 块 的 思 想 引 入
的跟
Mean Shift
通过不同分块对中心位置的加权投票降低
踪算法
被遮挡的目标区域对跟踪结果的影响
]提出
基于分块多核学习的跟踪算法,利用多个分块灰度
直方图描述目标,并利用在线多核学习选择具有判
决性的分块
]采用由随机分块组成的词包
) 描述被跟踪目标,提出基于词包学
(
除此之外,基于局部图像块稀疏
习的视觉跟踪算法
编码特征的跟踪算法[
]目前也取得较好的效果
.
在具体跟踪算法设计中,如何选择分块的方式和分
块的大小仍需研究和探索
2.3 基于子空间的目标跟踪
Bag-of-Words
Mean Shift
线性子空间学习( 简称子空间学习) 算法是模
式识别和机器学习领域的一个研究热点,基于线性
子空间的目标跟踪可看作是子空间学习算法在视觉
通过学习一组线性投影,实
跟踪领域的延伸和扩展
.Yang
等[
等[
等[
.Jia
47-48
44
45
46
.
.
.
.
.
为此,
Incremental Visual Tracking
目标在跟踪过程中可能出现较大的变化,单一
子空间可能不足以描述所有的变化
Yu
PCA
]提出增量多流形子空间模型,相比增量视觉跟
等[
53
) 中仅使用一
踪器(
子空间在线学习外观模型,该算法可利用若
个
子空间,用于分段线性近似跟踪过程中目
干个
标的非线性变化
尽管该模型在处理目标的非线性
变化上具有一定的优势,但由于算法复杂,导致跟踪
的速度较慢
PCA
PCA
IVT
,
.
通常子空间算法都会假设数据服从高斯分布或
局部高斯分布,但在跟踪问题中背景分布较混乱,难
以满足子空间算法的假设
所以基于判决性子空间
的跟踪算法往往结果不稳定,未达到很好的效果
.
.
.
.
]提出基于
.
2
未来基于子空间的跟踪算法的研究主要集中在
个方面: 如何构造一个子空间使之能更好地
如下
描述被跟踪目标的外观变化; 如何处理遮挡等异常
噪声情况
2.4 基于稀疏表示的目标跟踪
]完成较严密的理论工作后,压
缩感知和稀疏表示算法在很多计算机视觉应用领域
都得到广泛研究,包括图像去噪
图像去
、
模糊
图像修复
、
Donoho
等[
自
超分辨重建等[
、
]
54
55
.
56
l1
Mei
等[
最小化的目标跟踪算法,
首次将稀疏表示理论用于解决跟踪问题
假设被跟
踪的目标能由目标模板和遮挡模板组成的字典稀疏
表示,其中目标模板动态更新以捕捉目标在跟踪过
程中的变化,而遮挡模板用于描述目标可能遭遇的
遮挡,如图
所示,其中遮挡模板由正负琐碎模板组
) 为好的和差的跟踪候选的稀疏表示系数的
成
差别,左侧显示当前视频帧的图像,紫红色曲线框内
显示当前存储的目标模板,红色和蓝色框分别表示
一个好的和一个差的目标候选,右侧显示好的和差
可看出,好的候选
的候选图像区域的稀疏表示系数
表示系数明显稀疏于差的候选表示系数,这说明稀
3
b
(
.
.
第
1
期
卢湖川 等: 目标跟踪算法综述
56
) 目标模板和琐碎模板
(
a
Target template and trivial templates
(
)
a
) 候选图像区域的稀疏表示系数
(
b
Good and bad sparse representation coefficients for candidate image area
(
)
b
图
3
好的和差的候选图像的区别
Fig.3 Differences between good and bad candidate images
.
疏限制有利于定位好的目标候选,获取精确的跟踪
结果
57
等[
Yang
]开始探索基于稀疏表示的目标跟踪
算法,最常用的是利用稀疏表示建模目标的外观
如
何合理地选择目标模板和遮挡模板建模跟踪目标及
如何设计快速有效的跟踪算法是这类算法的关键
.
.
47
48
取[
]及运动状态建模[
在视觉跟踪中,稀疏表 示 算 法 还 用 于 特 征 提
]
特征选择[
、
基于稀疏表示的跟踪算法是未来在线视觉跟踪
领域的一个研究热点,如何更好地结合稀疏表示等
理论与跟踪问题的先验知识仍是未来研究趋势
2.5 基于判别学习的目标跟踪
]等方面
58
.
.
基于判别学习的目标跟踪算法将目标跟踪看作
一个二分类问题,试图从周围的背景中鉴别跟踪目
标,因此目标跟踪的准确性和稳定性很大程度依赖
在跟踪过程
于在特征空间上目标与背景的可分性
中,被跟踪的目标和周围背景的外观一般都会发生
变化,导致判别性的特征集合也会发生变化
因此,
在线建立能适应目标和背景外观变化的判别模型是
基于判别学习的目标跟踪算法基
这类算法的关键
本包含基于像素或超像素级分类的跟踪和基于检测
的目标跟踪这两大类
.
.
.
.
基于像素或超像素级分类的跟踪算法通过分类
当前图像帧中搜索区域内的像素或超像素,形成一
个关于跟踪目标的置信图,然后利用
等
Mean Shift
模态搜索算法精确定位目标
算法的流程图如图
法速度较快,可以提供对目标的软分割(
基于像素分类的跟踪
基于像素分类的跟踪算
所示
4
.
.
Soft Segmen-
) ,但是不能处理遮挡和背景杂乱的情况
tation
.
图
4
基于像素分类的跟踪算法流程图
Fig.4 Flowchart of tracking algorithm based on pixel
classification
基于检测的目标跟踪算法将目标跟踪当作一个
局部搜索区域内的检测问题,通过在线学习分类器
实现目标跟踪
受到人脸检测和使用检测实现跟踪
的启发,学者们开始使用
算法建立外观模
型,用 于 视 觉 跟 踪
]提 出 在 线 的
) 用于视觉跟
)
随后又将半监督学习(
Adaboost
踪
Online Adaboost
等[
,
. Grabner
Boosting
算法(
OAB
59
.
Semi-supervised Learning
.
66
模式识别与人工智能(
)
PR&AI
第
31
卷
算法与
极大地提高跟踪算法的鲁棒性和适应性
相结合,提出
Semi-Boost
OAB
跟踪算法[
],
60
.
.
.
总体上,基于检测的跟踪算法和机器学习的分
类器算法联系紧密
未来基于判决学习的目标跟踪
算法将是在线视觉跟踪研究的一个热点方向
机器
学习算 法 的 发 展 仍 会 成 为 该方 向 发 展 的 重 要 推
动力
.
除此之外,比较活跃的在线视觉跟踪算法研究
) 或水平集
)
) 的目标
) 的目标跟
方向还有: 基于主动轮廓(
Active Contour
(
) 的目标跟踪[
]
的目标跟踪[
跟踪[
踪[
基于图割(
、
基于兴趣点(
、
基于度量学习(
、
Metric Learning
Interest Point
Graph Cuts
Level Set
]等
]
]
63
64
62
61
.
相关滤波算法
3
.
.
Correlation Filter
目标跟踪运用各种方法根据已知观测图像估计
当前图像中目标物体的位置
使用目标图像训练的
滤波器对图像进行滤波处理,在响应图像中寻找最
大值位置,即图像中对应的目标位置
在这种情况下
可把目标跟踪的过程近似地看成对搜索区域图像进
) 的过程,寻找目标位
行相关滤波(
置也就是寻找滤波器响应图像的最大值位置
下面
从基础算法以及对基础算法改进的角度概述相关滤
波算法,并给出简要分析
3.1 基础算法
等[
) 用
Bolme
于目标跟踪
基于输出结果的最小均方误差训练滤
波器,作用于搜索区域,可以得到响应图像,值越大
说明该位置处的图像与初始化目标相关性越大,提
与此同时,算法采用灰
高滤波器的准确度和稳定性
.
度特征,速度超过
这种相关滤波跟踪算法
即是常说的平方误差最小滤波器(
]提出相关滤波(
Correlation Filter
600
帧
/ s.
65
.
.
.
Minimum Output
],可以算得上最早
) [
65
Sum of Squared Error
关于相关滤波的算法
MOSSE
,
.
Tracking by Detection
随着基于检测跟踪算法(
)
的广泛应用,相关滤波得到进一步发展
在相关滤波
跟踪算法中,关键部分是训练一个具有判别性的相
关滤波器,用于区分前景和背景
]针
对相关滤波中样本数量不足对分类器结果的影响,
创新循环密集采样方法
利用中心图像块循环移位
近似窗口移位,如图
. Henriques
所示
等[
66
.
.
5
.
(
a
5
图
) 中间为中心图像块,位于它左右的图像
块是中心图像块沿
个像素得
到的图像块,位于它上下的图像块是中心图像块沿
轴分别左右移动
10
x
.
.
(
b
10
轴分别移动
个像素得到的图像块
) 是中心
y
矩阵循环移位后对应的图像相应地上下左右偏移,
在训练滤波器时,利
循环采样粒子可组成循环矩阵
用循环矩阵时域和频域的特殊性质,将优化求解中
的复杂矩阵求逆转变为简单矩阵点除
在进行目标
跟踪时,将滤波器与粒子的相关性操作变成频域内
的点乘操作,大幅减少计算量,显著提高训练速度
.
算法采用单通道灰度特征,可以实现简单跟踪,但当
遇到目标遮挡
目标旋转及尺度变化等情
背景复杂
、
、
况时,容易发生跟踪漂移
.
.
) 中心图像及移位后图像
(
a
Central image and images after shift
(
)
a
) 二维循环矩阵示例
(
b
Examples of two-dimensional circular matrices
(
)
b
图
5
循环样本及循环矩阵示例
Fig.5 Examples of circulate samples and circulate matrices
3.2 特征改进
为了提升算法性能,
Henriques
等优化
[
]
66
CSK
的特 征 部 分,提 出 基 于 颜 色 空 间 的 算 法 (
Color
,
) [
67
]
对
颜色空间进行扩展,提出
.
CN
CN
RGB
Name
空间,该空间通道数为
绿
、
橙
空间内提取的图像特
征代入原训练公式,对每个通道进行快速傅里叶变
白和黄)
、
( 包括黑
11
将
紫
、
红
、
粉
、
CN
灰
蓝
棕
、
、
、
、
.
第
1
期
卢湖川 等: 目标跟踪算法综述
76
.
.
.
68
PCA
除了对颜色空间进行改进之外,
虽然对算法精度有所帮助,但
为了降低
降维的方法提取更有效
换,并进行特征加和
多通道特征使运算量加大,影响算法速度
运算量,作者提出使用
的特征
Henriques
]在相关滤波中引入核空间,同时提出将多通道
等[
采 用 方 向 梯 度 直 方 图
特征融入相关滤波 的 方 法
(
) 特征,通过核
函数将原来线性空间中的脊回归映射到非线性空
间,在非线性空间中求解一个对偶问题和某些常见
的约束,同样可以利用循环矩阵傅里叶空间对角化
简化计算
Histogram of Oriented Gradient
HOG
,
.
.
HOG
特征对运动模糊
. Bertinetto
光照变化及颜色变化等
、
颜色特征对形变鲁
种特征
.
很鲁棒,但对形变的鲁棒性较差
棒性较好,但对光照变化不够鲁棒
如果将
进行有效结合,将会提升跟踪算法的精度
等[
]提出
(
69
.
2
.
.
.
.
.
HOG
利用
STAPLE
Complementary Learners for Real-
) ,从特征融合方面入手,改进跟踪算
Time Tracking
特征训练相关滤波器,得到跟踪得分,
法
并融合使用颜色直方图得到的统计得分进行,得到
最后的响应图像并估计目标位置
两种特征的融合
提高跟踪算法的准确度,但也使得计算略微复杂
3.3 多核算法
除了采用多种颜色特征之外,还有一些算法将
) 应用到相关滤波中,取得不
多核方法(
Multi-kernel
核函数可以将原本线性空间内不可分的
错的效果
样本映射到高维空间,增加样本的可分性
单核学习
中,核函数的选择通常根据经验人为设定,这样的核
函数不一定最优,而多核学习旨在通过多个核函数
按权重融合或自适应的选择解决人工设定带来的不
合理性
]提出多核相关滤波器(
Kernelized Correlation Filter
Multi Ker-
) ,在核化相关滤波
nelized Correlation Filter
) [
,
器(
]中引入多
KCF
核,并提出优化求解方法
等[
]融合多特征与
71
多核,将多个滤波器进行有效整合,并通过最后的跟
踪结果判断特征与核的权重,使算法具有自适应选
]对其进行改进,
择特征及核的能力
提 出 注 意 力 机 制 相 关 滤 波 网 络 (
Attention Network
Attentional
) ,使用注意力网络
Correlation Filter Network
(
) 选择合适的相关滤波器,使算法
能根据跟踪情况自适应调整选用的特征与核函数
.
同特征改进相同,单一特征或单一的核函数很难适
应所有的跟踪情况,因此多特征及多核之间的联合
作用通常起到较好的效果
3.4 尺度估计
继而,
.Zhang
MKCF
ACFN
.Tang
Choi
等[
等[
,
,
72
68
70
尺度变化是目标跟踪中一个较常见的问题,但
.
.
.
当目标尺度缩小
前述算法中都无法进行尺度估计
时,会造成选取图像块中包含大量背景信息,当目标
尺度扩大时,会造成选取图像块中只包含目标的局
部信息,这两种情况都会引起跟踪漂移
为了解决尺
度变化对跟踪的影响,自适应尺度变化的相关滤波
跟踪器(
Scale Adaptive Kernel Correlation Filter Tra-
.
,
) [
]和判断尺度空间跟踪器(
73
68
74
7
,
) [
cker
SAMF
. SAMF
[
KCF
DSST
使用
Discrimi-n-
]的基
]在
ative Scale Space Tracker
个较粗的尺度,使
础上引入尺度估计
用平移滤波器在多尺度图像块上进行检测,选取响
应值最大处对应的平移位置和目标尺度
分别
.DSST
训练平移滤波器和尺度滤波器,使用
个较精细的
尺度,先使用平移滤波器进行位置估计,然后在该位
置处使用尺度滤波器进行尺度估计
以后的算法中
经常使用这两种尺度估计的算法
3.5 分块算法
33
.
.
.
.
Key Point
此外,跟踪过程中的物体通常使用一个矩形框
选取,由于跟踪的物体一般不为矩形,目标图像块不
可避免地引入背景信息,导致跟踪不准确
为了解决
这一问题,可以采用分割算法(
) 或关键
Segmentation
点算法(
) 表示目标
基于分割的物体表示
虽然能较好地表示目标形状,但计算量过大,影响跟
而基于关键点的目标表示难以获取
踪算法的速度
跟踪目标的整体特征,也不是一个很好的方法
为了
解决这一问题,
]提出选取有效局部图像块表
Li
示物体结构,利用每个局部图像块的响应图像计算
所示,这些响应图像按一定方法组
其置信度
合后可大致表示图中物体的形状
算法采用霍夫投
票的方法融合多个响应图像,估计目标位置和尺度
如图
等[
6
75
.
.
.
.
.
图
6 RPT
局部图像块表示目标物体示意图
Fig.6
Schematic diagram of representing target object via PRT
local image block
.
76
Liu
等[
将目标区域分为
]提出使用分块的相关滤波算法增强跟
部分,每部
踪器对遮挡的鲁棒性
分 分 别 训 练 相 关 滤 波 器,将 得 到 的 响 应 图 像
) 按权重加和,得到最终的响应图,由
(
根据每个滤波器的权重判断跟踪
此估计目标状态
好坏,决定是否进行模板更新
]将整体与局
部相结合进行目标跟踪,提出局部全局相结合的相
Response Map
.Fan
等[
5
77
.
86
模式识别与人工智能(
)
PR&AI
第
31
卷
.
)
,
,
2×2
LGCF
ADMM
. Lukeicˇ 等[
Local-Global Correlation Filter
关滤波器(
将
的图像块,在相关滤波优
整个目标区域平分成
化方程中加入整体和局部的优化方程,使用交替方
向乘 子 算 法 (
Alternating Direction Method of Multi-
) 进行优化求解
]利用整
pliers
体与局部相结合的思想,提出可形变分块相关滤波
器 (
) ,与
Deformable Parts Correlation Filter
]不同的是,按照图像关键部分选取该算法
[
LGCF
个局部图像块,不是平均分成,在新一帧的估计
的
中按照系统能量优化的原则重新寻找关键部分,并
与整体结合计算新位置
3.6 样本标签改进
DPT
,
4
77
78
.
.
.
79
,
Bibi
等[
CF +AT
在相关滤波算法中,通过样本循环移位构造密
集采样,这样样本对应的二分类标签一般采用高斯
当上一帧目标跟踪不准时,由于当前帧
分布的标签
的标签是以上一帧中心点为中心产生,会导致错误
的累积,发生跟踪漂移现象
其次,这种标签帧间独
立,忽略跟踪过程中物体时间上的关联,并不可靠
.
为了克服上述问题,
]提出目标响应自适应
相关滤波跟踪算法 (
Target Response Adaptation for
) ,将原来固定的
Correlation Filter Tracking
高斯型标签变为自适应的样本标签,在
]的优
化方程中同时加入滤波器学习和样本标签先验的学
习,根据样本标签先验信息,计算每帧的自适应标
签,并提出快速求解的方法
这种自适应样本标签用
于相关滤波算法中,可以提升算法的抗干扰能力,具
有理论上的合理性和实践上的有效性
相同的思想
,
也出现在鲁棒相关滤波器(
Robust Correlation Filter
提出现有的相关
RCF
损失项对应的响应为各向同
滤波优化方程中的
性,较易受遮挡或光照等因素的影响,通过引入稀疏
性的损失项探索各向异性的响应对跟踪结果的影
响,算法也通过实验证明这种响应更准确鲁棒
3.7 边界效应
]中,但做法有所不同
[
KCF
.RCF
) [
L2
68
80
.
.
.
.
5
边界效应也是影响滤波器性能提升的一个主要
在训练阶段,由于密集样本是经过中心图像块
原因
循环移位得到,如图
所示,只有中心样本准确,其
它的样本都会存在位移边界,导致训练的分类器在
大部分算法的解决
物体快速移动时不能准确跟踪
方案是在图像上加上余弦窗,弱化图像边界对结果
的影响,这样只要保证移位后图像中心部分合理即
虽然增加合理样本的数量,但仍不能保证所有训
可
另外,加入余弦窗也会使跟踪器屏
练样本的有效性
蔽背景信息,只接受部分有效信息,降低分类器的判
在目标检测阶段,当物体处于搜索区域的边
别能力
.
.
.
.
在
SRDCF
.
的基础上,
Danelljan
等[
]提出连续
83
为了克服边界效应,
界时,余弦窗的加入使物体信息弱化甚至清除,导致
跟踪失败
]采用
较大尺寸的检测图像块和较小尺寸的滤波器,提高
真实样本的比例,并采用
迭代求解
Galoogahi
等[
81
.
ADMM
. Danell-
等[
]提出空间约束相关滤波器(
82
,
jan
SRDCF
Spatially Regu-
) ,采用更大的检测
larized Correlation Filter
区域,在滤波器系数上加入权重约束,越靠近边缘权
重越大,越靠近中心权重越小,使滤波器系数主要集
中在中心区域
由于滤波器在整个搜索区域内移动
检测图像块的相关性,因此在克服边界效应的同时
不会忽略边缘物体的检测
.
域卷积相关滤波算法(
.
.
.
.
.
.
84
85
)
)
3
,
ECO
CCOT
. CCOT
Danelljan
继而,
Continuous Convolution Opera-
,
将原来时域离散的
tors for Visual Tracking
位置估计转换为时域连续的位置估计,使位置估计
此外,算法还在相关滤波算法中融合分辨率
更准确
不同的图像特征,将多种传统特征与深度特征相结
合,提升算法精度
中对待高维特征的方法是
每个通道训练一个相关滤波器,使算法存在大量的
冗余,也影响算法速度
] 改 进
个方
等[
滤波器系数和模板更新
、
,从训练样本
CCOT
面去除冗余,提出高效卷积操作(
Efficient Convolu-
算法指出,相邻帧之间的样本
tion Operators
具有很多冗余信息,影响样本多样性,限制分类器性
使用高斯混合模型对样本建模,可以有效增强算
能
同时,训练代表性滤波器,并用线性组合表
法性能
示其它滤波器,每隔
帧更新一次,大幅降低计算
量
]提出可靠通道与空间的批判性相关
滤波器(
.Lukeicˇ 等[
Discriminative Correlation Filter with Channel
) ,利用空域可靠性
and Spatial Reliability
得到二值掩膜,作用于滤波器上,自适应地选择更易
跟踪的目标区域,减少边界效应
通道间采用加权求
和的方法进行融合
]指出用于相关滤波训
练的负样本只通过正样本循环移位得到,训练的分
类器对背景的判别能力有限,因此在训练时引入正
样本周围采集的负样本,提高跟踪准确度
3.8 结合其它算法
[
.CF+CA
CSR-DCF
,
6
,
SVM
支持向量机(
一些算法结合循环矩阵与其它方法,提高速度
)
和精度
Support Vector Machine
能准 确 区 分 目 标 和 背 景,但 粒 子 滤 波 (
) 的框架导致算法速度较慢
Particle
相关滤波算法得
Filter
益于循环矩阵的特殊性质,能将运算转换到频域进
与循环矩阵,提出支持
行简化
相关滤波器(
) ,并给
,
Support Correlation Filter
出优化方程在频域中的简化计算方法
]
]结合
SVM
.Zuo
等[
等[
SCF
87
88
86
.
.
.
.
. Wang