多DSP图像压缩实时并行处理系统.pdf

发布时间：2022-06-09 发布人：admin 分类：说明书资料大小：0.22M 资料格式：pdf 举报版权申诉

hsongjiang-3760910-16359647379740585330.pdf-第1页.png

第1页 / 共5页

hsongjiang-3760910-16359647379740585330.pdf-第2页.png

第2页 / 共5页

hsongjiang-3760910-16359647379740585330.pdf-第3页.png

第3页 / 共5页

hsongjiang-3760910-16359647379740585330.pdf-第4页.png

第4页 / 共5页

hsongjiang-3760910-16359647379740585330.pdf-第5页.png

第5页 / 共5页

文本预览

2 2 2 2 第 15 卷　第 9 期 2007 年 9 月　　　　　　　　　　文章编号　1004 924X(2007) 09 1451 05 　光学精密工程　Optics and Precision Engineering 　　　　　　　　 Vol. 15 　No. 9 　　 Sep . 2007 多 DSP 图像压缩实时并行处理系统赵　峰1 ,2 ,袁东风1 ,张海霞1 ,许廷发3 (1. 山东大学信息科学与工程学院 ,山东济南 250100 ; 2. 桂林电子科技大学 ,广西桂林 541004 ;3. 北京理工大学光电工程系 , 北京 100081) 摘要 :针对图像实时高速压缩、传输的需求 ,设计了一套新型的多 DSP 图像压缩实时并行处理系统。选择整数 CDF (2 ,2) 双正交小波变换结合改进的 SPIH T 算法作为系统的实现方案 ,利用整数 CDF (2 ,2) 双正交小波变换实现图像变换 ,提高了运算速度 ,便于硬件实现。根据各个子图像的不同特点 ,改变扫描路线 ,采用四路并行分块处理的方法对 SPIH T 算法加以改进 ,提高编码速度 ,降低了编解码过程的运算复杂度和时间消耗。根据系统的实时性要求 ,使用四片 DSP 处理器构建了一个兼有紧耦合并行系统和松耦合并行系统优点的图像压缩实时并行处理系统。仿真实验表明 ,基于并行系统的图像压缩算法与传统的压缩算法相比 ,压缩的峰值信噪比 ( PSNR) 提高了 10 %左右 ,压缩时间达到 30 ms 。关　键　词 :图像压缩 ;多 DSP ;实时并行处理系统中图分类号 : TP391. 4 　　文献标识码 :A Multi DSP real time parallel processing system for image compression ZHAO Feng1 ,2 , YUAN Dong feng1 , ZHAN G Hai xia1 ,XU Ting fa3 (1. S chool of I n f orm ation S cience an d En gi neeri n g , S han don g U ni versit y , J i’nan 250100 , Chi na; 2. Guili n U ni versit y of Elect ronic Technolog y , Gui li n 541004 , Chi na; 3. De p artment of O ptical En gi neeri n g , B ei j i n g I nstit ute of Technolog y , B ei j i n g 100081 , Chi na) DSP real Abstract : A new multi time parallel p rocessing system for image comp ression is designed to time image comp ression and t ranslation. The system scheme is realized by meet t he demand of real combining a imp roved SPIH T algorit hm wit h integer CDF (2 ,2) bi ort hogo nal wavelet t rasformation , which imp roves comp uting speed and makes hardware platform easy. According to t he different char acteristics of each subimage , t he scan pat h is changed and t he SPIH T algorit hm is imp roved wit h t he parallel p rocessing met hod of fo ur divided blocks , so t hat t he coding speed is increased and t he opera tion complicacy and time consumption of coding and decoding are reduced. To meet t he need of real time , t he parallel p rocessing system for image comp ression is compo sed of four DSPs wit h bot h merit s of tight coupled parallel system and loo se coupled parallel system. The experiment s show t hat t he Peak Signal Noise Ratio ( PSN R) of t his met hod based on parallel system raises 10 % , and comp ressio n time is 30 ms , co mpared wit h t raditional image comp ression algorit hm. Key words : image comp ression ; multi time parallel p rocessing system DSP ; real 　　收稿日期 :2007 　　基金项目 :国家自然科学基金资助项目 (No. 60672082) 10 ;修订日期 :2007 01. 06 04

l q q l 2541 　　　　　光学　精密工程　　　　　第 15 卷　 1 　引　言　　研究一种更高压缩比和快速的图像压缩编码方法和系统 ,在视频传输、医学诊断 ,遥感技术等应用中是非常重要的。一般无损图像压缩编码 , 即使压缩倍数在一倍左右 ,压缩速度也不能满足实际系统的需要。Daubeches 等人[ 1 ] 深入阐述了整数到整数的可逆双正交小波变换理论 ; H. Kim 等人[ 2 ] 利用 CDF (2 ,2) 双正交小波变换的提升方案研究了零树量化加霍夫曼和算术编码的图像压缩方法 ;乔世杰等人[ 3 ] 对文献 [ 2 ] 提出了改进意见 ,但是 ,文献[ 3 ]给出的是一个有损压缩的整数到整数的小波变换过程 ;解成俊等人[ 4 ] 提出了提升方案与 SPIH T 算法相结合用于图像的无损压缩方法。但是 ,以上文献的无损压缩方法存在着压缩速度慢的问题 ,没有真正在图像压缩系统中实时实现。本文针对图像数据实时高速压缩、传输的需求 , 以及图像压缩系统的特点 , 设计了一套多 DSP 图像压缩并行处理系统。选择整数 CDF (2 , 2) 双正交小波变换 ,结合改进的 SPIH T 算法作为系统的实现方案 ,根据系统的实时性要求 ,使用四片 TMS320C6416 处理器构建了一种新型的图像压缩并行处理系统。实验结果表明 ,多 DSP 并行系统的图像压缩算法与传统的压缩算法相比 , 压缩的峰值信噪比 ( PSN R) 提高了 10 %左右。压缩时间达到 30 ms 。 2 　适合并行系统的改进图像压缩算法 2. 1 　整数双正交小波变换本文采用整数 CDF (2 ,2) 双正交小波实现图像的小波变换[ 4 ] 。 CDF (2 ,2) 双正交小波定义 : CDF (2 ,2) : g (2 , 2) : 2 4 (1 , - 2 , 1) ; h (2 , 2) : ( - 1 ,2 ,6 ,2 , - 1) ;为了实现整数运算 ,将 2 8 g (2 ,2) , g (2 ,2) : ( 1 2 h (2 ,2) 变形为 : , - 1 , 1 2 ) ; h (2 ,2) : 1 8 ( - 1 ,2 ,6 ,2 , - 1) ; 由 Mallat 快速算法给出 CDF (2 ,2) 双正交小波基于整数运算的快速算法 : 正变换 : d ( n) = x (2 n + 1) - x (2 n) + x (2 n + 2) 2 s ( n) = x (2 n) + d ( n - 1) - d ( n) 4 逆变换 : x (2 n) = s ( n) - d ( n - 1) + d ( n) 4 x (2 n + 1) = d ( n) - x (2 n) + x (2 n + 2) 2 , (1) . (2) 式中 x ( n) 是原始数据 , s ( n) , d ( n) 分别为小波变换的低频和高频分量。式 (1) 、(2) 采用常规的对称延拓就可以实现基于整数运算的可逆双正交小波变换。 2. 2 　SPIHT 算法原理设{ Ci , j} 表示小波变换系数的集合 , 对于给定的 n ,如果| Ci , j | ≥2 n ,则称 Ci , j 是重要的 , 否则称 Ci , j 是不重要的。对于系数坐标集合 Θ, 用 S n (Θ) 来表明集合 Θ 的重要性 , 如果 max { | Ci , j | } ≥2 n ,则 S n(Θ) = 1 ,说明Θ重要 ; 否则 S n(Θ) = 0 , 说明 Θ 不重要 , 对单点集合 , 将 S n({ ( i , j) } ) 简记为 S n ( i , j) 。用 O ( i , j) 表示节点 ( i , j) 所有子坐标的集合 ; 用 D ( i , j) 表示节点 ( i , j) 所有后代坐标的集合 ; H 表示小波变换最大尺度的变换系数坐标的集合 , 即 L L J , HL J , L H J , H H J ( J 为最大尺度) 的系数坐标的集合 , L ( i , j) = D ( i , j) - O ( i , j) 。在实现时 ,使用了三个链表 :不重要集合链表 (L IS) ,不重要像素链表 (L IP) ,重要像素链表 (L SP) 。在 L SP 、L IP 中 , ( i , j) 表示单个像素 , L IS 中 , 代表集合为 L ( i , j) 或 D ( i , j) 。为了区分这两种集合的类型 ,如果是 D ( i , j) ,则称 L IS 的表值为 A 型 ,如果是 L ( i , j) , 则称 L IS 的表值为 B 型。编码过程分为排序和细化两部分。排序过程将空间方向树上的节点分类 ,分别将其坐标信息存入 L IS ,L IP , L SP 三个链表中 ,其中 L IS 为不重要集合链表 ,保存未扫描的树根节点坐标 ;L IP 为不重要像素链表 ,保存小波系数绝对值小于当前阈值的坐标 ;L SP 为重要像素链表 ,保存小波系数绝对值大于当前阈值的坐标。细化过程是对重要像素链表 L SP 中的每一个表项 { Ci , j} 进行的 ,对于阈值 T i 来说 ,输出| Ci , j | 二进制表示的第 i 位有效位。然后将

第 9 期　　　　　　赵　峰 ,等 :多 DSP 图像压缩实时并行处理系统 3541 阈值减半 , 重复排序和细化过程 , 直到编码结束。传统的 SPIH T 扫描顺序如图 1 (a) 。 (a) 原顺序　　　　　　　　 (b) 新顺序 (a) Original order 　　　　　　(b) New order 图 1 　扫描顺序对比 Fig. 1 　Comparison of scanning orders of SPIH T al gorithm and improved algorithm 2. 3 　改进的 SPIHT 算法 SPIH T 算法存在以下两方面缺陷[ 5 ] : (1) 图像各部分统一编码 ,编码过程中需要占用大量内存。随着阈值的降低 ,扫描次数的增加 ,排序过程中的 L IS , L IP , L SP 三个链表需要越来越大的存储空间 ; (2) 在排序过程中存在大量的重复操作。每次变换阈值时 ,对上次遗留的非重要元素需要逐个与新阈值比较 ,增加了编码时间。针对图像各部分统一编码不利于并行优化的问题 ,根据各个子图像的不同特点 ,改变原来的扫描路线 ,采用四路并行分块处理的方法 ,提高编码速度。原扫描路线是从最低频子带开始 ,结束于最高频子带。在移到下一子带之前 ,要把当前子带的系数全部扫描完。改进的算法对扫描路线做了一些调整 ,首先把小波变换后的图像分成四块 (以 3 级小波分解为例) : 低频平滑部分 ( L L3 ) 、水平边缘细节 ( HL3 、HL2 、HL1) 、垂直边缘细节 ( L H3 、L H2 、 L H1) 和对角线边缘细节 ( H H3 、H H2 、H H1) , 再分别对每一块进行扫描编码 ,如图 1 (b) 所示。这样改进的好处是可以针对不同块分别处理 ,对信息量高的块采用低压缩比、高保真编码方法 ;而对信息量低的块进行大压缩比压缩 ,在压缩比和峰值信噪比相当的情况下 ,提高恢复图像的人眼视觉质量。另外 ,改进后的编码将图像分为四块处理 ,同时将原不重要像素链表 (L IP) 、不重要集合链表 (L IS) 的储存量分布到各个部分 ,化整为零 ,提高了处理速度 ,且有利于硬件实现。 3 　多 DSP 图像压缩并行处理系统 3. 1 　系统工作原理设计的基于四片 TMS320C6416 的并行系统框图如图 2 所示。前端 16 bit 的 L VDS 电平图像数据经电平转换后 ,在控制信号下 ,经由 CPLD 进行时序转换后写入前端缓冲 FIFO ,这一速度可达 266 MB/ s 。在 DSP A 的 DMA 控制器作用下 ,前端数据缓冲 FIFO 中的数据被不断地转移到同步四口 SRAM 中 ,然后各个 DSP 分别或者同时读取要处理的数据。因为前端 FIFO 和同步 A 的 B 口总线上 ,因四口 SRAM 都挂接在 DSP A 本身算法的此数据分配过程不会打扰到 DSP 执行 , 甚至不会干扰到 DSP A 对其外接的 SDRAM 存储器的读写操作。各个 DSP 协同完成整个图像压缩算法 ,过程中可能会存在相互之间的通信或者数据交换 , 这同样通过同步四口 SRAM 完成 ;相互之间的握手则通过连到 CPLD 上的各个 DSP 的中断、通用 I/ O 管脚来实现。4 片 DSP 通过自带的 PCI 口挂接在一个 PCI to PCI 桥的次侧 PCI 总线上 ,整个系统以标准 PCI 长卡形式插在计算机上。　　初始化时 ,计算机通过 PCI 总线将各个 DSP 的程序分别下载到各自的代码空间和数据空间 ; 处理完成后 ,再不断地通过 PCI 总线将处理的结果分别读出。图像压缩并行处理系统的基本性能指标如表 1 所示 : 表 1 　系统基本性能指标 Tab. 1 　Basic performance benchmark of system Single processor f requency Single processor performance Local memory bandwidth Local memory capability 720 M Hz p rocessor number 4 5760 MIPS PSNR 　 performance 23040 MIPS 1064 MB/ s Data input bandwidth 266 MB/ s 32 MB 　 All memory capability 128 MB + 128 kB

4541 　　　　　光学　精密工程　　　　　第 15 卷　图 2 　4 片 DSP 并行系统框图 Fig. 2 　Block diagram of four DSP parallel processing system 3. 2 　并行算法的实现选取 Lena 灰度图像 512 pixel ×512 pixel ×8 bit 作为实验对象 ,整数 CDF (2 ,2) 双正交小波变换的实现时间为 8 ms 左右。做 3 级小波变换后 , 把图像分成四块 ,低频平滑部分 ( L L 3) 、水平边缘细节 ( HL3 、HL2 、HL1) 、垂直边缘细节 ( L H3 、 L H2 、L H1 ) 和对角线边缘细节 ( H H3 、H H2 、 H H1) ,再分别对每一块进行扫描编码。DSP A B 负责负责小波变换和 L L3 块的编码 , DSP C 负责 L H3 块的编码 , HL3 块的编码 , DSP D 负责 H H3 块的编码。本文方法与 CDF DSP (2 ,2) 结合传统的 SPIH T 编码方法相比较 ,压缩的峰值信噪比 ( PSN R) 提高了 10 %左右 ,如表 2 , 压缩时间能达到 30 ms ,如表 3 。表 2 　Lena 图像实验的峰值信噪比( PSNR) 比较 Tab. 2 　Comparison of PSNR in Lena image experiment Compression PSNR (dB) rate 8 16 32 CDF (2 ,2) + SPIH T CDF (2 ,2) + ISPIH T 30. 15 28. 54 20. 76 33. 87 30. 12 23. 07 表 3 　Lena 图像实验的压缩时间比较 Tab. 3 　Comparison of compression time in Lena image experiment Comp ression Compression time (ms) rate CDF (2 ,2) + SPIH T CDF (2 ,2) + ISPIH T 8 16 32 90. 5 61. 7 50. 26 35. 5 32. 1 29. 8 4 　结　论　　为满足日益复杂的大规模图像的压缩算法的需要 ,采用四片 TMS320C6416 芯片 ,设计了一套通用的高性能图像压缩并行处理系统。该系统采用 PCI 插卡方式 ,可以作为计算机协处理板而存在 ,能较快地完成以前一台计算机需要长时间才能完成的任务。运用 CDF (2 , 2) 结合改进的 SPIH T 算法对系统进行了验证 ,该系统完全能够实现图像的实时压缩 ,为下一步实现超大规模遥感图像实时压缩打下了良好的基础。

第 9 期　　　　　　赵　峰 ,等 :多 DSP 图像压缩实时并行处理系统 5541 参考文献 : [ 1 ] 　DAUB EC H IES I , SWEL ENS W. Factoring wavelet transforms into lifting step s [J ]. J . Fourier A nal . A p pl. , 1998 ,4 (3) :247 269. [ 2 ] 　KIM H , L I C C. Lossless and lo ss image compression using biorthogonal wavelet s with multiple operations [J ]. I E E E T rans . Ci rcuit an d S ystem I I : A nalog and Di gital S i gnal Processi ng , 1998 , 48 (8) : 1117 1118. [ 3 ] 　乔世杰 ,智贵连. 一种快速的小波变换图象编码算法[J ]. 中国图形图象学报 ,2001 ,6 (5) :434 438. Q IAO SH J , ZH I G L . A fast wavelet transform image coding[J ]. J ournal of 434 438. (in Chinese) I m a ge and Gra p hic , 2001 , 6 (5) : [ 4 ] 　解成俊 ,宋建中. 基于提升方案与 SPIH T 算法相结合用于图像的无损压缩 [J ]. 光学精密工程 ,2002 ,10 (6) :564 568. XIE C H J ,SON G J ZH. Research on the application of lifting scheme in image lo ssless compression[J ]. O pt. Pre cision Eng . , 2002 ,10 (6) :564 568. (in Chinese) [ 5 ] 　柯丽 ,黄廉卿. 改进的快速 SPIH T 算法[J ]. 红外与激光工程 ,2004 ,33 (5) :509 512. KE L , HUAN G L Q. 512. (in Chinese) Improved fast SPIH T algorithm [J ]. I nf rare d an d L aser Engi neeri n g , 2004 ,33 (5) : 509 [ 6 ] 　TMS320C6414/ 15/ 16 Fixed [ 7 ] 　陈国良. 并行计算[ M ]. 北京 :高等教育出版社 ,2003. point Digital Singal Processors Databook[ M ]. Tex as I nst rument ,2001. C H EN G L . Parallel Com p uti n g [ M ]. Beijing : Higher Education Press ,2003. (in Chinese) [ 8 ] 　马姝琳 ,钟先信 ,姚富光. 基于 DM642 EVM 的 PCI 总线实时数据通信技术[J ]. 光学精密工程 ,2005 ,13 (增) :196 200. MA SH L , ZHON G X X , YAO F G. Real cision Eng . , 2005 ,13 (Supp . ) : 196 200. time data communication based on PCI of DM642 EVM [J ]. O pt. Pre (in Chinese) 作者简介 :赵　峰 (1974 - ) ,男 ,山东大学讲师 ,博士研究生 ,主要研究方向为信息理论和信道编码技术、O FDM 、MIMO 等。E mail : zhaofeng @guet . edu. cn

分享到：

赞收藏

资料库

多DSP图像压缩实时并行处理系统.pdf

相关推荐

课程资源

热门标签

最新资料