logo资料库

论文研究-AVS运动估计算法的一种改进 .pdf

第1页 / 共6页
第2页 / 共6页
第3页 / 共6页
第4页 / 共6页
第5页 / 共6页
第6页 / 共6页
资料共6页,全文预览结束
中国科技论文在线 http://www.paper.edu.cn AVS 运动估计算法的一种改进 李朋,张刚** (太原理工大学信息工程学院,太原 030024) 5 摘要:运动估计是 AVS 视频编码的重要环节,提高运动估计的速度和精度有利于实现高质 量实时编码器。针对几种 AVS 运动估计搜索过程不能很好地兼顾速度和精度,引入了自适 应搜索选择的算法。通过不同视频序列实验表明,该搜索方案较好克服了现有算法不足,对 运动剧烈程度不同的视频序列具有较好的编码速度和适应性。 关键词:AVS; 运动估计; 运动搜索; 块匹配 中图分类号:TN919.8 10 An improved algorithm for AVS motion estimation Li Peng, Zhang Gang 15 (College of Information Engineering, Taiyuan University of Technology, Taiyuan 030024) Abstract: Motion estimation is an important part of AVS video coding, improve the speed and precision of motion estimation is conducive to the realization of high quality real-time code encoder. In view of the AVS motion estimation can't several traditional search model using a good balance between speed and accuracy of search algorithm is introduced for adaptive selection. Through the AVS encoder different video sequence experiments show that, the search scheme overcomes the shortcomings of traditional search model, the severe degree of different video sequences of movement has better coding speed and adaptability. Key words: AVS; motion estimation; motion search;block matching 20 25 0 引言 我国自主知识产权的音视频标准 AVS(Audio Video coding Standard)是第二代信源编码 标准[1]。运动估计是 AVS 视频编码的重要模块,视频编码中超过 60%的编码时间由运动估 计占据。因此,提高运动估计的速度和精度对于实现编码器高质量实时编码具有重要意义。 30 运动估计的研究重点集中于宏块的模式选择、匹配准则、初始搜索点的确定、提高运动搜索 速度等方面[2]。运动估计算法的难点在于保证码率和质量的同时,提高搜索速度。 AVS 视频编码器包括全搜索(Full Search,FS),钻石搜索(Diamond Search),六边形 搜索(Hexagon Search),非对称十字形多层次六边形格点搜索[3](UMHexagonS)等搜索 算法,通过参数设置指定运动搜索模型。考虑到不同视频序列具有不同的运动幅度,同一视 频序列的运动幅度往往也会变化,因此单一搜索模型处理不同视频序列时性能会出现波动, 35 使得这种设置有着一定的局限性。本文针对这一问题提出了基于空间相关性的搜索算法自适 应选择,提高了编码器对不同运动幅度视频序列的运动估计的适应性。 1 运动估计 帧间预测利用运动图像邻近帧中景物存在相关性,找出目标宏块在临近帧的匹配块,依 据两者的空间位置计算出运动矢量,此过程称为运动估计[4-5]。运动估计按照确定搜索模型, 40 选择最佳帧间模式的顺序计算和保存运动矢量。合理的选用适合视频序列的搜索模型,确定 作者简介:李朋(1987-),男,硕士研究生,主要研究方向视频编解码 通信联系人:张刚(1953-),男,教授,博士生导师,主要研究方向为图像信号,语音信号处理的基础理 论研究,基于嵌入式系统多媒体应用开发研究. E-mail: 13552854638@163.com - 1 -
中国科技论文在线 http://www.paper.edu.cn 最佳的帧间模式可以有效提高运动估计的速度。 AVS 运动搜索主要使用块匹配法的 SAD 作为匹配准则,在搜索区域中搜索与当前块最 佳的匹配块作为预测块[6]。相比于其他准则,SAD 只涉及加法运算,复杂度低,便于硬件实 现。SAD 的准则表达式如(1)式: 45 (1) AVS 帧间预测模式主要包括 16x16、8x8、8x16、16x8 以及 skip 共计 5 种模式,流程图 如图 1 所示。对于 P 帧而言,AVS 参考前向已编码的 2 帧图像。AVS 帧间预测模式是按照 顺序计算 16x16、8x8、8x16 和 16x8 代价值并从 16x16 模式开始将最小代价值和模式存储起 来,顺序比较其他模式计算的代价值,最终输出最小代价值与最佳模式。 50 图 1 帧间预测模式流程图 Fig. 1 a flowchart of the inter prediction mode 2 基于空间相关性的自适应选择搜索算法 2.1 对 AVS 现有搜索模型的分析 55 AVS 视频编码器包含全搜索(Full Search,FS),钻石搜索(Diamond Search),六边形 搜索(Hexagon Search),非对称十字形多层次六边形格点搜索(UMHexagonS Search)等 算法。全搜索通过逐像素点计算 SAD 找到最小点,从而确定最优运动矢量。因其在搜索窗 - 2 - |),(),(|),(111inimfnmfjiSADkkNnMm16X16模式在临近帧0得代价值cost0_16X16,在帧1得代价值cost1_16X16,代价值较小的一帧为该宏块参考帧,记为cost_16X16,存入i_cost。 在确定的参考帧中搜索8X8 模式,cost_8X8,小于i_cost则把cost_8X8赋值给i_cost搜索16X8得到 cost_16X8,小于i_cost则把cost16X8赋值给i_cost搜索8X16得到cost_8X16 ,小于i_cost则把cost_8X16赋值i_cost开始输出最小的代价值i_cost与最佳模式结束
中国科技论文在线 http://www.paper.edu.cn 内遍历搜索,运动估计最为准确,但计算开销大,不利于实现视频实时编码。钻石搜索又称 菱形搜索,依据步长不同,可分为小菱形搜索,大菱形搜索。钻石搜索依据视频块的运动主 60 要集中于垂直与水平方向的基本规律,搜索速度较全搜索明显提高,但其对所有视频序列无 区别搜索,造成不必要的计算开销。六边形搜索易于实现,搜索简单,较之钻石搜索兼顾了 更多方向上的运动,但没有充分利用中心偏移特性,易造成额外的计算开销。UMHexagonS 包含多种搜索模型,有着良好的编码效果,但其搜索模块过多,模块相对复杂,制约了编码 的实时性。 65 2.2 空间相关性预测 MV 搜索起始点对于确定最佳运动矢量具有重要意义。从运动图像自身图像性质考虑,视频 图像帧临近宏块运动具有极强的相关性。据此判断,空间域相邻宏块的运动矢量也将反映这 种相关性[7]。由此,邻近已编码的 MV 可以预测当前块 MV,这是空间相关性在 MV 预测上 考虑的出发点。 70 AVS 视频编码中采用临近块中值预测[8]和原点预测预测搜索起始点。具体来说,中值预 测取当前块 E 相邻的左边块 A,上边块 B 以及右上边块 C 中值作为当前块 E 的预测 MV, 用 MVEPred 表示。在 AVS 编码器中函数 xavs_mb_predict_mv_16x16 计算得到中值预测 MVEPred,分别在 MVEPred(mx,my)该点和原点(0,0)计算代价值并保留最小的代价值和 该点坐标。 75 图 2 相邻宏块空间位置关系 Fig. 2 neighboring macroblock spatial positional relationship 空间相关性,空间相邻块的运动矢量也具有一定相关性。基于运动矢量的空间相关性, 80 本文提出的算法中,将临近已编码的左边块A,上边块B以及右上边块C处运动矢量指向点加 入起始搜索点候选点,加上原点与中值点,共有5个候选点。其中最小代价值点确定为最终 的起始搜索点。 原点开始预测适用于运动幅度较小的视频序列,而加入了临近编码块作为候选点,有利 于克服因运动程度不同在原点预测带来的额外搜索开销。 85 运动矢量偏离原点的程度可以反映运动幅度大小,运动缓慢时幅度小,零矢量成为起始 搜索点的可能最大;当运动剧烈时幅度较大,运动矢量以更高的可能性偏离原点。因此,本 文提出通过考察起始搜索点相对于搜索块运动矢量的模值的大小来反映这种运动幅度的大 小。运动幅度与对应区间划分如下: 搜索起始点对应块和当前块对应的矢量记为 MV_F,|MV_F|表征当前块运动幅度大小。 90 |MV_F|判决区间划分为:[0,1]、(1,4]和(4,+∞]。即当 0≤|MV_F|≤1 时,代表当前块运动幅度 小;当 1<|MV_F|≤4 时,代表当前块运动幅度中等;当|MV_F|>4 时,代表当前块运动幅度大。 - 3 -
中国科技论文在线 2.3 自适应选择搜索算法流程 http://www.paper.edu.cn 结合 AVS 编码器包含的搜索算法的特点,在当前块运动幅度小时选用钻石搜索;在当 前块运动幅度中等时选用六边形搜索;在当前块运动幅度大时选用非对称十字型多层次六边 95 形搜索。自适应选择搜索算法流程如图 3 所示。 图 3 自适应选择搜索算法流程 Fig.3 adaptive search algorithm selection process 100 自适应选择搜索算法搜索起始点对应块和当前块对应矢量 MV_F,计算其模值|MV_F|, 用以衡量块运动幅度大小,一般地认为,当模值较小(小于 1)时,块运动较为平缓,此时 选用钻石搜索在起始点周围搜索;当模值中等(1 到 4)时,块运动幅度较大,此时选用六 边形在更多方向搜索;而当模值超过 4 时,认为块运动幅度较大,此时选用更适合大范围搜 索的非对称十字形多层次六边形模型搜索。 105 3 实验仿真与结果分析 实验从平均峰值信噪比(PSNR)、帧率(FPS)和码率(Bit Rate)三个方面将改进的自适应 选择搜索算法和 AVS 三种典型搜索算法进行了比较。参数设置:I 帧的 QP 设为 28,P 帧的 - 4 - 开始结束当前块的左边块A,上边块B,右上边块C中值预测得MVEPred(mx,my)确定搜索起始点候选点集合(mv0,MVEPred,mvA,mvB,mvC)计算5点SAD值,SAD最小的点确定为搜索起始点,计算当前块与起始点对应块的运动矢量,记为MV_F,模值记为|MV_F||MV_F|≤1?DIA搜索UMHexagonS搜索HEX1<|MV_F|≤4?yesnoyesno
中国科技论文在线 http://www.paper.edu.cn QP 设为 30,编码序列为 IPPP 格式。本实验视频序列选用 CIF 格式,运动幅度有较大差异 的经典测试序列,运动幅度较小的 bridge 测试序列,运动幅度中等的 bus 测试序列,运动幅 110 度较大的 football 测试序列。峰值信噪比、码率和帧率的变化结果在表 1 给出。搜索自适应 选择的新算法与 AVS 经典算法测试数据进行比较。 表 1 实验数据显示,三种不同运动幅度的视频序列 AVS 编码器的最佳搜索模型不同。 bridge 序列采用 DIA 钻石搜索效果最佳;bus 序列采用 HEX 六边形搜索效果最佳;而运动 幅度最大的 football 序列则在 UMH 搜索下效果最佳。本文提出的自适应选择搜索算法可以 115 根据视频序列的运动幅度选择不同的搜索模型,实验结果表明该算法可以在保持信噪比和码 率基本不变的情况下提高编码帧率。表 1 中同时给出了自适应搜索算法的编码结果,可知对 于三种运动幅度不同的序列,本文的自适应选择搜索算法的帧率,比现有 AVS 其它算法均 有提高。其中 football 序列提高了 5.37fps;bus 序列提高了 9.21fps,bridge 序列提高 2.13fps。 表 1 自适应选择搜索算法与 AVS 经典搜索模型测试结果 120 Tab.1 Adaptive search algorithm choice and AVS classic search model test results 区别 参数 本文 测试序列 UMH HEX DIA bridge bus football PSNR(db) 码率(kb/s) 帧率(fps) PSNR(db) 码率(kb/s) 帧率(fps) PSNR(db) 码率(kb/s) 38.416 1150.16 39.61 39.09 1818.21 48.86 39.305 1748.53 38.366 1289.82 35.5 39.082 1830.12 32.01 39.304 1748.64 38.312 1283.78 33.86 39.086 1818.19 39.65 39.201 1808.72 38.415 1148.38 37.48 39.079 1824.23 38.85 39.204 1819.23 +0.001db +1.78% +2.13fps +0.004db -0.02% +9.21fps +0.001db -0.11% 帧率(fps) 37.74 32.37 28.21 26.54 +5.37fps 为了进一步验证自适应选择搜索算法的改进效果,提取 AVS 最佳搜索算法和本文算法 的第二帧图像进行比较,如图 4 所示。可以看到,图像质量没有明显变化,证明本文提出的 算法在处理图像主观质量没有改变。 125 bridge 最佳搜索 bridge 自适应选择搜索 - 5 -
中国科技论文在线 http://www.paper.edu.cn bus 最佳搜索 bus 自适应选择搜索 130 football 最佳搜索 football 自适应选择搜索 图 4 测试图像对比 Fig. 4 test image comparison 4 结论 本文利用相邻宏块运动矢量的的空间相关性,增加了搜索起始点的候选点;同时,提出 135 并实现了基于当前块和搜索起始点对应块运动矢量的搜索算法自适应选择,在基本不改变平 均峰值信噪比和码率的情况下,对不同运动幅度的视频测试序列均提高了编码速度,主观图 像质量与 AVS 最优算法相当,具有较强的实用性。 [参考文献] (References) 140 145 150 [1] AVS 专家组,GB/T20090.2-2006.信息技术.先进音视频编码.第二部分:视频[S],2006. [2] 徐晗路.基于 H.264 的运动估计算法研究[D].成都:电子科技大学,2009. [3] 林永,杨印根,杨柳等.运动估计中 UMHexagonS 的研究与改进[J].计算机工程与应用,2013,49(13):207-210. [4] 刘 英 哲 , 王 进 祥 .H.264 中 一 种 基 于 搜 索 范 围 自 适 应 调 整 的 运 动 估 计 算 法 [J]. 电 子 与 信 息 学 报,2013,35(6):1382-1387. [5] 陈辉,AVS 视频压缩运动估计算法研究[D].成都:电子科技大学,2010. [6] ZHU S,MA K K.A new diamond search algorithm for fast block matching motion estimation[J].IEEE Trans on Image Processing,2000,9(2):287-290. [7] 卢 紫 微 , 吴 成 东 , 陈 东 岳 等 . 基 于 空 间 相 关 预 测 的 快 速 块 匹 配 运 动 估 计 算 法 [J]. 东 北 大 学 学 报,2014,(4):470-473. [8] 王烨华,江冰,李光云等.基于多模式搜索的运动估计研究[J].计算机工程与设计,2013,34(5):1725-1728. - 6 -
分享到:
收藏