2
2
2
2
第 15 卷 第 9 期
2007 年 9 月
文章编号 1004
924X(2007) 09
1451
05
光学 精密工程
Optics and Precision Engineering
Vol. 15 No. 9
Sep . 2007
多 DSP 图像压缩实时并行处理系统
赵 峰1 ,2 ,袁东风1 ,张海霞1 ,许廷发3
(1. 山东大学 信息科学与工程学院 ,山东 济南 250100 ;
2. 桂林电子科技大学 ,广西 桂林 541004 ;3. 北京理工大学 光电工程系 , 北京 100081)
摘要 :针对图像实时高速压缩 、传输的需求 ,设计了一套新型的多 DSP 图像压缩实时并行处理系统 。选择整数 CDF
(2 ,2) 双正交小波变换结合改进的 SPIH T 算法作为系统的实现方案 ,利用整数 CDF (2 ,2) 双正交小波变换实现图像变
换 ,提高了运算速度 ,便于硬件实现 。根据各个子图像的不同特点 ,改变扫描路线 ,采用四路并行分块处理的方法对
SPIH T 算法加以改进 ,提高编码速度 ,降低了编解码过程的运算复杂度和时间消耗 。根据系统的实时性要求 ,使用四片
DSP 处理器构建了一个兼有紧耦合并行系统和松耦合并行系统优点的图像压缩实时并行处理系统 。仿真实验表明 ,基
于并行系统的图像压缩算法与传统的压缩算法相比 ,压缩的峰值信噪比 ( PSNR) 提高了 10 %左右 ,压缩时间达到 30 ms 。
关 键 词 :图像压缩 ;多 DSP ;实时并行处理系统
中图分类号 : TP391. 4 文献标识码 :A
Multi
DSP real
time parallel processing system for image compression
ZHAO Feng1 ,2 , YUAN Dong
feng1 , ZHAN G Hai
xia1 ,XU Ting
fa3
(1. S chool of
I n f orm ation S cience an d En gi neeri n g , S han don g U ni versit y , J i’nan 250100 , Chi na;
2. Guili n U ni versit y of Elect ronic Technolog y , Gui li n 541004 , Chi na;
3. De p artment of O ptical En gi neeri n g , B ei j i n g I nstit ute of Technolog y , B ei j i n g 100081 , Chi na)
DSP real
Abstract : A new multi
time parallel p rocessing system for image comp ression is designed to
time image comp ression and t ranslation. The system scheme is realized by
meet t he demand of real
combining a imp roved SPIH T algorit hm wit h integer CDF (2 ,2) bi
ort hogo nal wavelet t rasformation ,
which imp roves comp uting speed and makes hardware platform easy. According to t he different char
acteristics of each subimage , t he scan pat h is changed and t he SPIH T algorit hm is imp roved wit h t he
parallel p rocessing met hod of fo ur divided blocks , so t hat t he coding speed is increased and t he opera
tion complicacy and time consumption of coding and decoding are reduced. To meet t he need of real
time , t he parallel p rocessing system for image comp ression is compo sed of four DSPs wit h bot h merit s
of tight coupled parallel system and loo se coupled parallel system. The experiment s show t hat
t he
Peak Signal Noise Ratio ( PSN R) of t his met hod based on parallel system raises 10 % , and comp ressio n
time is 30 ms , co mpared wit h t raditional image comp ression algorit hm.
Key words : image comp ression ; multi
time parallel p rocessing system
DSP ; real
收稿日期 :2007
基金项目 :国家自然科学基金资助项目 (No. 60672082)
10 ;修订日期 :2007
01.
06
04
l
q
q
l
2541
光学 精密工程
第 15 卷
1 引 言
研究一种更高压缩比和快速的图像压缩编码
方法和系统 ,在视频传输 、医学诊断 ,遥感技术等
应用中是非常重要的 。一般无损图像压缩编码 ,
即使压缩倍数在一倍左右 ,压缩速度也不能满足
实际系统的需要 。Daubeches 等人[ 1 ] 深入阐述了
整数到整数的可逆双正交小波变换理论 ; H. Kim
等人[ 2 ] 利用 CDF (2 ,2) 双正交小波变换的提升方
案研究了零树量化加霍夫曼和算术编码的图像压
缩方法 ;乔世杰等人[ 3 ] 对文献 [ 2 ] 提出了改进意
见 ,但是 ,文献[ 3 ]给出的是一个有损压缩的整数
到整数的小波变换过程 ;解成俊等人[ 4 ] 提出了提
升方案与 SPIH T 算法相结合用于图像的无损压
缩方法 。但是 ,以上文献的无损压缩方法存在着
压缩速度慢的问题 ,没有真正在图像压缩系统中
实时实现 。
本文针对图像数据实时高速压缩 、传输的需
求 , 以及图像压缩系 统的特 点 , 设计 了一套 多
DSP 图像压缩并行处理系统 。选择整数 CDF (2 ,
2) 双正交小波变换 ,结合改进的 SPIH T 算法作
为系统的实现方案 ,根据系统的实时性要求 ,使用
四片 TMS320C6416 处理器构建了一种新型的图
像压缩并行处理系统 。实验结果表明 ,多 DSP 并
行系统的图像压缩算法与传统的压缩算法相比 ,
压缩的峰值信噪比 ( PSN R) 提高了 10 %左右 。压
缩时间达到 30 ms 。
2 适合并行系统的改进图像压缩算法
2. 1 整数双正交小波变换
本文采用整数 CDF (2 ,2) 双正交小波实现图
像的小波变换[ 4 ] 。
CDF (2 ,2) 双正交小波定义 :
CDF (2 ,2) :
g (2 , 2) :
2
4
(1 , - 2 , 1) ;
h (2 , 2) :
( - 1 ,2 ,6 ,2 , - 1) ;为了实现整数运算 ,将
2
8
g (2 ,2) ,
g (2 ,2) : ( 1
2
h (2 ,2) 变形为 :
, - 1 ,
1
2
) ;
h (2 ,2) :
1
8
( - 1 ,2 ,6 ,2 , - 1) ;
由 Mallat 快速算法给出 CDF (2 ,2) 双正交小波基
于整数运算的快速算法 :
正变换 :
d ( n) = x (2 n + 1) - x (2 n) + x (2 n + 2)
2
s ( n) = x (2 n) + d ( n - 1) - d ( n)
4
逆变换 :
x (2 n) = s ( n) - d ( n - 1) + d ( n)
4
x (2 n + 1) = d ( n) - x (2 n) + x (2 n + 2)
2
, (1)
.
(2)
式中 x ( n) 是原始数据 , s ( n) , d ( n) 分别为小波变
换的低频和高频分量 。式 (1) 、(2) 采用常规的对
称延拓就可以实现基于整数运算的可逆双正交小
波变换 。
2. 2 SPIHT 算法原理
设{ Ci , j} 表示小波变换系数的集合 , 对于给
定的 n ,如果| Ci , j | ≥2 n ,则称 Ci , j 是重要的 ,
否则称 Ci , j 是不重要的 。对于系数坐标集合 Θ,
用 S n (Θ) 来 表 明 集 合 Θ 的 重 要 性 , 如 果 max
{ | Ci , j | } ≥2 n ,则 S n(Θ) = 1 ,说明Θ重要 ; 否则
S n(Θ) = 0 , 说 明 Θ 不 重 要 , 对 单 点 集 合 , 将
S n({ ( i , j) } ) 简记为 S n ( i , j) 。用 O ( i , j) 表示节
点 ( i , j) 所有子坐标的集合 ; 用 D ( i , j) 表示节点
( i , j) 所有后代坐标的集合 ; H 表示小波变换最大
尺度 的 变 换 系 数 坐 标 的 集 合 , 即 L L J , HL J ,
L H J , H H J ( J 为最大尺度) 的系数坐标的集合 ,
L ( i , j) = D ( i , j) - O ( i , j) 。在实现时 ,使用了三
个链表 :不重要集合链表 (L IS) ,不重要像素链表
(L IP) ,重要像素链表 (L SP) 。在 L SP 、L IP 中 ,
( i , j) 表示单个像素 , L IS 中 , 代表集合为 L ( i , j)
或 D ( i , j) 。为了区分这两种集合的类型 ,如果是
D ( i , j) ,则称 L IS 的表值为 A 型 ,如果是 L ( i , j) ,
则称 L IS 的表值为 B 型 。编码过程分为排序和
细化两部分 。排序过程将空间方向树上的节点分
类 ,分别将其坐标信息存入 L IS ,L IP , L SP 三个
链表中 ,其中 L IS 为不重要集合链表 ,保存未扫
描的树根节点坐标 ;L IP 为不重要像素链表 ,保存
小波系数绝对值小于当前阈值的坐标 ;L SP 为重
要像素链表 ,保存小波系数绝对值大于当前阈值
的坐标 。细化过程是对重要像素链表 L SP 中的
每一个表项 { Ci , j} 进行的 ,对于阈值 T i 来说 ,输
出| Ci , j | 二进制表示的第 i 位有效位 。然后将
第 9 期
赵 峰 ,等 :多 DSP 图像压缩实时并行处理系统
3541
阈值减半 , 重复排序和细化过程 , 直到编码结束 。
传统的 SPIH T 扫描顺序如图 1 (a) 。
(a) 原顺序 (b) 新顺序
(a) Original order (b) New order
图 1 扫描顺序对比
Fig. 1 Comparison of scanning orders of SPIH T al
gorithm and improved algorithm
2. 3 改进的 SPIHT 算法
SPIH T 算法存在以下两方面缺陷[ 5 ] :
(1) 图像各部分统一编码 ,编码过程中需要
占用大量内存 。随着阈值的降低 ,扫描次数的增
加 ,排序过程中的 L IS , L IP , L SP 三个链表需要
越来越大的存储空间 ;
(2) 在排序过程中存在大量的重复操作 。每
次变换阈值时 ,对上次遗留的非重要元素需要逐
个与新阈值比较 ,增加了编码时间 。
针对图像各部分统一编码不利于并行优化的
问题 ,根据各个子图像的不同特点 ,改变原来的扫
描路线 ,采用四路并行分块处理的方法 ,提高编码
速度 。原扫描路线是从最低频子带开始 ,结束于
最高频子带 。在移到下一子带之前 ,要把当前子
带的系数全部扫描完 。
改进的算法对扫描路线做了一些调整 ,首先
把小波变换后的图像分成四块 (以 3 级小波分解
为例) : 低 频 平 滑 部 分 ( L L3 ) 、水 平 边 缘 细 节
( HL3 、HL2 、HL1) 、垂直边缘细节 ( L H3 、L H2 、
L H1) 和对角线边缘细节 ( H H3 、H H2 、H H1) ,
再分别对每一块进行扫描编码 ,如图 1 (b) 所示 。
这样改进的好处是可以针对不同块分别处
理 ,对信息量高的块采用低压缩比 、高保真编码方
法 ;而对信息量低的块进行大压缩比压缩 ,在压缩
比和峰值信噪比相当的情况下 ,提高恢复图像的
人眼视觉质量 。另外 ,改进后的编码将图像分为
四块处理 ,同时将原不重要像素链表 (L IP) 、不重
要集合链表 (L IS) 的储存量分布到各个部分 ,化
整为零 ,提高了处理速度 ,且有利于硬件实现 。
3 多 DSP 图像压缩并行处理系统
3. 1 系统工作原理
设计的基于四片 TMS320C6416 的并行系统
框图如图 2 所示 。前端 16 bit 的 L VDS 电平图像
数据经电平转换后 ,在控制信号下 ,经由 CPLD
进行时序转换后写入前端缓冲 FIFO ,这一速度
可达 266 MB/ s 。在 DSP
A 的 DMA 控制器作用
下 ,前端数据缓冲 FIFO 中的数据被不断地转移
到同步四口 SRAM 中 ,然后各个 DSP 分别或者
同时读取要处理的数据 。因为前端 FIFO 和同步
A 的 B 口总线上 ,因
四口 SRAM 都挂接在 DSP
A 本身算法的
此数据分配过程不会打扰到 DSP
执行 , 甚 至 不 会 干 扰 到 DSP
A 对 其 外 接 的
SDRAM 存储器的读写操作 。各个 DSP 协同完
成整个图像压缩算法 ,过程中可能会存在相互之
间的通信或者数据交换 , 这同样通过同步四口
SRAM 完成 ;相互之间的握手则通过连到 CPLD
上的各个 DSP 的中断 、通用 I/ O 管脚来实现 。4
片 DSP 通过自带的 PCI 口挂接在一个 PCI
to
PCI 桥的次侧 PCI 总线上 ,整个系统以标准 PCI
长卡形式插在计算机上 。
初始化时 ,计算机通过 PCI 总线将各个 DSP
的程序分别下载到各自的代码空间和数据空间 ;
处理完成后 ,再不断地通过 PCI 总线将处理的结
果分别读出 。图像压缩并行处理系统的基本性能
指标如表 1 所示 :
表 1 系统基本性能指标
Tab. 1 Basic performance benchmark of system
Single
processor
f requency
Single
processor
performance
Local
memory
bandwidth
Local
memory
capability
720 M Hz
p rocessor
number
4
5760 MIPS
PSNR
performance
23040
MIPS
1064 MB/ s
Data input
bandwidth
266 MB/ s
32 MB
All
memory
capability
128 MB
+ 128 kB
4541
光学 精密工程
第 15 卷
图 2 4 片 DSP 并行系统框图
Fig. 2 Block diagram of four
DSP parallel processing system
3. 2 并行算法的实现
选取 Lena 灰度图像 512 pixel ×512 pixel ×8
bit 作为实验对象 ,整数 CDF (2 ,2) 双正交小波变
换的实现时间为 8 ms 左右 。做 3 级小波变换后 ,
把图像分成四块 ,低频平滑部分 ( L L 3) 、水平边缘
细节 ( HL3 、HL2 、HL1) 、垂直边缘细节 ( L H3 、
L H2 、L H1 ) 和 对 角 线 边 缘 细 节 ( H H3 、H H2 、
H H1) ,再分别对每一块进行扫描编码 。DSP
A
B 负 责
负责 小 波 变 换 和 L L3 块 的 编 码 , DSP
C 负 责 L H3 块 的 编 码 ,
HL3 块 的 编 码 , DSP
D 负责 H H3 块的编码 。本文方法与 CDF
DSP
(2 ,2) 结合传统的 SPIH T 编码方法相比较 ,压缩
的峰值信噪比 ( PSN R) 提高了 10 %左右 ,如表 2 ,
压缩时间能达到 30 ms ,如表 3 。
表 2 Lena 图像实验的峰值信噪比( PSNR) 比较
Tab. 2 Comparison of PSNR in Lena image experiment
Compression
PSNR (dB)
rate
8
16
32
CDF (2 ,2) + SPIH T CDF (2 ,2) + ISPIH T
30. 15
28. 54
20. 76
33. 87
30. 12
23. 07
表 3 Lena 图像实验的压缩时间比较
Tab. 3 Comparison of compression time in
Lena image experiment
Comp ression
Compression time (ms)
rate
CDF (2 ,2) + SPIH T CDF (2 ,2) + ISPIH T
8
16
32
90. 5
61. 7
50. 26
35. 5
32. 1
29. 8
4 结 论
为满足日益复杂的大规模图像的压缩算法
的需要 ,采用四片 TMS320C6416 芯片 ,设计了一
套通用的高性能图像压缩并行处理系统 。该系统
采用 PCI 插卡方式 ,可以作为计算机协处理板而
存在 ,能较快地完成以前一台计算机需要长时间
才能完成的任务 。运用 CDF (2 , 2) 结合改进的
SPIH T 算法对系统进行了验证 ,该系统完全能够
实现图像的实时压缩 ,为下一步实现超大规模遥
感图像实时压缩打下了良好的基础 。
第 9 期
赵 峰 ,等 :多 DSP 图像压缩实时并行处理系统
5541
参考文献 :
[ 1 ] DAUB EC H IES I , SWEL ENS W. Factoring wavelet transforms into lifting step s [J ]. J . Fourier A nal . A p pl. ,
1998 ,4 (3) :247
269.
[ 2 ] KIM H , L I C C. Lossless and lo ss image compression using biorthogonal wavelet s with multiple operations [J ].
I E E E T rans . Ci rcuit an d S ystem I I : A nalog and Di gital S i gnal Processi ng , 1998 , 48 (8) : 1117
1118.
[ 3 ] 乔世杰 ,智贵连. 一种快速的小波变换图象编码算法[J ]. 中国图形图象学报 ,2001 ,6 (5) :434
438.
Q IAO SH J , ZH I G L . A fast wavelet transform image coding[J ]. J ournal of
434
438. (in Chinese)
I m a ge and Gra p hic , 2001 , 6 (5) :
[ 4 ] 解成俊 ,宋建中. 基于提升方案与 SPIH T 算法相结合用于图像的无损压缩 [J ]. 光学 精密工程 ,2002 ,10 (6) :564
568.
XIE C H J ,SON G J ZH. Research on the application of lifting scheme in image lo ssless compression[J ]. O pt. Pre
cision Eng . , 2002 ,10 (6) :564
568. (in Chinese)
[ 5 ] 柯丽 ,黄廉卿. 改进的快速 SPIH T 算法[J ]. 红外与激光工程 ,2004 ,33 (5) :509
512.
KE L , HUAN G L Q.
512. (in Chinese)
Improved fast SPIH T algorithm [J ]. I nf rare d an d L aser Engi neeri n g , 2004 ,33 (5) : 509
[ 6 ] TMS320C6414/ 15/ 16 Fixed
[ 7 ] 陈国良. 并行计算[ M ]. 北京 :高等教育出版社 ,2003.
point Digital Singal Processors Databook[ M ]. Tex as I nst rument ,2001.
C H EN G L . Parallel Com p uti n g [ M ]. Beijing : Higher Education Press ,2003. (in Chinese)
[ 8 ] 马姝琳 ,钟先信 ,姚富光. 基于 DM642 EVM 的 PCI 总线实时数据通信技术[J ]. 光学 精密工程 ,2005 ,13 (增)
:196
200.
MA SH L , ZHON G X X , YAO F G. Real
cision Eng . , 2005 ,13 (Supp . ) : 196
200.
time data communication based on PCI of DM642 EVM [J ]. O pt. Pre
(in Chinese)
作者简介 :赵 峰 (1974 - ) ,男 ,山东大学讲师 ,博士研究生 ,主要研究方向为信息理论和信道编码技术 、O FDM 、MIMO
等 。E
mail : zhaofeng @guet . edu. cn