logo资料库

DSP芯片在实时图像处理系统中的应用.pdf

第1页 / 共7页
第2页 / 共7页
第3页 / 共7页
第4页 / 共7页
第5页 / 共7页
第6页 / 共7页
第7页 / 共7页
资料共7页,全文预览结束
爵霆鱼稔疆 Postgraduate Forum DSP芯片在实时图像处理系统中的应用 柯丽-,:黄廉卿- (1.中国科学院长春光学精密机械与物理研究所,吉林长春130033; 2.中国科学院研究生院,北京100039) 【摘要】在通用计算机上用软件实现图像处理,要占用CPU几乎全部的处理能力,且速度相对较慢。数字信 号处理器fDSP)的可编程性和强大的处理能力使其可用于快速实现各种数字信号处理算法,在图像处理领 域。尤其在实时图像处理系统中得到了广泛应用和发展。本文介绍了DSP芯片及其在实时图像处理系统中 的开发、应用及发展方向。 关键词:DSP芯片:图像处理系统;实时处理 中图分类号:TP391.41 DSP chip and its application in real-time image processing system KE Lil·2 HUANG Lian-qin91 (1.Changehun Institute of Optics,Fine Mechanics and Physics,Chinese Academy of Sciences,Changchun 130033,China; 2.Graduate School of Chinese Academy of Sciences,Beijing 100039,China) Abstract:All operation capacity of CPU will be taken up if image is processed on general computer by software,re— suting slow processing speed.Digital signal process(DSP)can be used to implement all kinds of algorithms of digital signal processing with its powerful processing capacity.DSP chip is applied and developed widely in the field of im— age processing,especially in real-time image processing.The paper introduces DSP chip,its development and appli· cation in real-time image processing system. Key words:DSP chip;image processing system;real-time processing 1 引 言 压缩。图像处理技术尤其是实时处理,现已成为一 随着计算机及通信技术的发展,图像和视频的 热门的研究课题。 应用愈加J1泛。大部分图像数据在实际应用前皆需 实现图像处理的主要方式有: 进行有针对性的处理.如根据图像数据特点和应用 f1)在通用计算机上用软件实现图像处理; 领域对图像进行增强、除噪、锐化和识别等。此 f2)在通用计算机系统中加入专用的加速处理 外.为了有效实时地传输信息,还必须对图像进行 模块; 』!J鲨an塑u碘arHyllll2仉00c0591。_l!三 l—————————— ˝ • ‰ ˚
褥纛蠹镳鬣 Postgraduate FOrum f3)利用通用单片机: f4)利用专用DSP芯片; f5)利用通用可编程DSP芯片。 DSP芯片采用不同于普通单片机的体系结构,具有 ---·些显著特点。 2.1 哈佛结构”I 在众多图像处理方式巾,最常用的是第1种, 传统计算机采用传统的冯·诺伊曼(Von 但此种方式要占用CPU几乎全部的处理能力,速 Neumannl结构,其程序和数据共用一个存储空间 度相对较慢,不适于实时处理,需要对其加以改 和单一的地址及数据总线,处理器要执行任何指令 进;而其他几种方式各有不足,如第2种方式不适 时,都要先从储存器巾取出指令解码,再取操作数 于嵌入式应用,专业性较强,应用受到限制;第3 执行运算,即使单条指令也要耗费几个甚至几十个 种方式适于数字控制等不太复杂的数字信号处理, 周期.在高速运算时。在传输通道上会出现瓶颈敛 不适合计算较大的图像数据处理;第4种方式洲为 应。 采用的是专用DSP芯片,故其廊用范围受限,系 所有的DSP芯片均采用哈佛(Harvard)结构。 统不够灵活,无法进行算法的升级与更新;第5种 哈佛结构是~种并行体系结构,它的主要特点是将 方式必须要用能充分考虑DSP内部并行性的_7r:编 程序和数据存储在不同的存储空问中.即程序存储 语0‘进行编制DSP程序,具有一定困难。但是,TI 器和数据存储器是两个相瓦独立的存储器,每个存 公司为了解决这个问题.推出了一个开放、具有强 储器独立编址、独立访问。与两个存储器相对应的 大集成能力的开发环境(CCS)罔。它采用了由先进 是系统中的4套总线:程序的数据总线与地址总 的开发_:_[具组成的直观系统,使用CCS提供的工 线,数据的数据总线与地址总线。这种分离的程序 具.开发者可以非常方便地对DSP软件进行设计、 总线和数据总线可允许在一个机器周期内同时获取 编码、编译、调试、跟踪和实时性分析,可有效减 指令字f来自程序存储器)和操作数(来自数据存 少DSP编程时问。 储器),从而提高了执行速度,使数据的吞吐率提 综上所述,利用通用可编程DSP芯片[[-21实现 高了1倍。又由f程序和数据存储器在两个分开的 图像处理较之其他方式具有一定的优越性,而且 空间巾,闪此取指和执行能完全重叠。图1给出了 DSP芯片的可编程性和强大的处理能力.使其可用 冯·诺伊曼结构和哈佛结构的比较。 于陕速地实现各种数字信号处理算法,成为目前图 像处理系统的最佳选择。 2 DSP芯片 数字信号处理器fDSP)f1。21是一类具有专门为数 字信号处理任务而优化设计的体系结构和指令系统 的通用处理器件.具有处理速度快和有复合功能的 单周期指令等特点,在高速图像处理中得到了越来 越多的应用。 地址总线 数据总线 (a)冯-诺伊曼结构f单存储器) 线 、’ 线 DM地址总线 DM数据总线 DSP芯片内部采用程序和数据分开存储和传输 (b)哈佛结构(双存储器) 的哈佛结构.具有专门硬件乘法器,广泛采用流水 图1冯·诺伊曼结构与哈佛结构的比较 线操作.提供特殊的DSP指令.可用来快速地实 2_2流水线技术[1】 现各种数字信号处理算法,加之集成电路的优化设 计,使其处理速度比最快的CPU还快lO一50倍。 !曼噶急 与哈佛结构相似,DSP芯片广泛采用流水线以 减少指令执行时间.从而增强J’处理器的处理能 ˝ • ‰ ˚
舔蠹鱼镳趣 Postgraduate FOrum 力。 量。DSP中设计有一个特殊的硬件算术单元——地 流水线处理器是由一系列处理电路组成.这些 址产生器。地址计算由这个专门的硬件来负责.不 处理电路称为片断或部分。操作数流经每个片断, 需要耗费额外的时间。现在的某些微处理器中也有 即每个片断对操作数进行部分处理,操作数经过所 独立的地址产生单元,对于一些特殊的地址运算不 有片断后才能得到最后结果。流水线操作即把一条 需要耗费额外的CPU时问。但是DSP的地址运算 指令分成一系列步骤来完成,不同步骤完成不同的 单元更强大,支持如比特翻转寻址和循环寻址,可 任务,一条指令只有经过所有步骤才能得到结果.。 极大加快运算速度,而对于非哈佛结构的处理器可 这些步骤可以独立进行,这样就可以实现多条指令 能需要更多的处理周期。 在不同步骤上的重复运行,从而加快运行速度。 2.5并行处理结构[21 流水线分为指令流水线和算术流水线。指令流 图像处理中的运算量巨大,单个处理器无法满 水线是指取指令和执行指令的不同阶段在流水线上 足实时处理的需求,需要多处理器并行处理。 进行:算术流水线是指算术操作的不同阶段在流水 DSP内部一般都集成多个处理单元。如硬件乘 线上进行.DSP芯片一般采用指令流水线方法。 法器(MUL)、累加器(ACC)、算术逻辑单元 由丁采用了流水线技术,DSP芯片可以单周期 (AIJU)、辅助算术单元(ARAU)以及DMA控制器 完成乘法累加运算。大幅提高了运算速度,减少了 等。它们都可以并行地在同一个周期内执行不同的 指令执行的时间,从而增强r处理器的处理能力。 任务,例如辅助算术雎元能为卜一次的运算做好准 处理器可以并行处理2~4条指令。每条指令处于流 备.适于完成连续的乘加运算。芯片内部还包括其 水线的不同阶段。 2.3特殊的硬件结构【1-2】 他总线,如DMA总线等.可实现数据的后台传输 而几乎不影响主CPU的性能。 数字信号处理中最重要的基本运算足乘法和累 为了提高并行处理能力,现代DSP芯片通常采 加运算,它们占用了大量运算时间,是最主要和最 用单指令多数据流结构(SIMD)、超长指令字结构 耗时的运算。DSP中设置了硬件乘法器和乘法并累 fⅥ.IW)、超标星体系结构、多DSP核体系结构和 加(MAC),这些操作往往可以在单周期内完成, DSP/MCU混合结构,这些并行处理机制碌著提高 大幅提高了DSP作乘法和累加的速度。因此,单 了DSP芯片的性能。 周期的硬件乘法器和MAC是DSP芯片实现快速运 3 DSP的发展历程和方向 算的保证。现代高性能的DSP芯片甚至具有两个 3.1 DSP发展历程 以上的硬件乘法器以提高运算速度。数据宽度也从 DSP发展历程Ⅲ大致分3个阶段:20世纪70年 16位增加到32位。 代埠论先行.20世纪80年代产品普及,20世纪 数学运算消耗的时问往往少于存储器的操作。 90年代突飞猛进。 DSP芯片在片内集成了大容量的ROM和RAM来分 在DSP出现之前,数字信号处理只能依靠微处 别存放程序和数据,程序在片内执行的效率远远高 理器(MPU)来完成,但MPU的低处理速度无法 于相同规格的通用微处理器,这样既降低了产品的 满足高速实时的要求,因此直到20世纪70年代. 体积和成本.又加快了处理速度。 才有人提出了DSP的理论和算法基础。那时的DSP 2.4特殊的寻址方式[1l 仅停留在教科书上,即便是研制出来的DSP系统 在数字信号处理中要遇到大量的地址运算,在 也是由分立元件组成的,其应用领域仅局限于军 某些情况下.地址运算量甚至超过了数据的运算 事、航空航天部门。 塑Ja型nua型r翱!皇y 2005 ■——二————————一 ˝ • ‰ ˚
麝黧壁镳錾 Postgraduate FOrum 随着大规模集成电路技术的发展,1982年, 于电子设备的个人化和客户化趋势,DSP必须追求 世界上诞生了首枚DSP芯片。这种DSP器件采用 更高更快的运算速度,才能跟上电子没备的更新步 微米工艺NMOS技术制作.虽功耗和尺寸稍大,但 伐。DSP运算速度的提高主要依靠新j二艺改进芯片 运算速度却比MPU快了几十倍,尤其在语音合成 结构。目前,Ⅱ的TM320C6X芯片由于采用超长指 和编码解码器中得到了广泛应用。DSP芯片的问世 令字(VLlw)结构设计,其处理速度已高达 足个里程碑.它标志着DSP应用系统由大型系统 2000MIPS。当前的DSP器件大都采用0.5— 向小型化迈进了一大步。到20世纪80年代中期, 0.351xmCMOS工艺,按照CMOS的发展趋势,DSP 随着CMOS技术的进步与发展,第2代基于CMOS 的运算速度完全可能再提高100倍(达到 工艺的DSP芯片应运而生.其存储容量和运算速 1600CIPS)。 度都得到成倍提高,成为语音处理和图像硬件处理 (3)可编程性。可编程DSP给生产厂商提供了 技术的基础。 很大的灵活性。生产厂商可在同一个DSP平台上 20世纪80年代后期,第3代DSP芯片问世, 开发出各种不同型号的系列产品,以满足不同用户 运算速度进一步提高,其应用范围逐步扩大到通信 的需求。同时,可编程DSP也为广大用户提供了 和计算机领域。 易于升级的良好途径。人们已经发现,许多微控制 20世纪90年代,DSP发展最快,相继出现了 器能做的事情,使用可编程DSP能做得更好更便 第4代和第5代DSP器件。现在的DSP属于第5代 宜,例如冰箱、洗衣机这些原来装有微控制器的家 产品,与第4代相比,其系统集成度更高,并将 电如今皆已换成可编程DSP来进行大功率电机控 DSP芯核及外罔元件综合集成在单一芯片上。这种 制。 集成度极高的DSP芯片不仅在通信和计算机领域发 f4)支持高级编程语言的DSP开发软件。使用 挥重要作用.而且逐渐渗透到人们日常的消费领域。 高级语言进行DSP软件开发可缩短软件开发的周 3,2 DSP发展方向[11 期.加快DSP产业的发展。 现在DSP产品的应用已扩大到人们的学习、 (51并行处理结构。并行结构所带来的好处是 工作和生恬的各个方面,并逐渐成为电子产品更新 显而易见的,各DSP厂家纷纷在器件中引入并行 换代的决定因素:而半导体技术和超大规模集成电 机制,主要分为片内并行和片间并行。 路的发展为DSP的推陈出新提供了物理基础,用 (6)功耗低。 户的需求又为DSP的发展指出了方向。总体而言, 4图像处理系统中DSP芯片的选择 DSP技术将向以下几个方面发展: 对图像处理技术而言,由于要处理的数据量 (1)系统级集成。缩小DSP芯片尺寸始终是 大,计算复杂,计算中间结果精度要求高,因此需 DSP的技术发展方向。当前的DSP多数基于精简指 要选择合适的DsP芯片。DSP。墨片的选择应根据实 令集计算(RISC)结构,这种结构的优点是尺寸 际的应用系统需要而确定。一般来说,选择DSP 小、功耗低和性能高。各DSP厂商纷纷采用新工 芯片时应考虑如下诸多因素: 艺,改进DSP芯核,并将几个DSP芯核、MPU芯 (1)确定选择定点或浮点DSPt”。数字信号处理 核、专用处理单元、外围电路单元和存储单元集成 算法的数据格式有定点和浮点之分,而数字信号处 在一个芯片上,成为DSP系统级集成电路。 理系统采用的数据格式决定了它所处理信号的处理 f2)更高的运算速度。目前一般的DSP运算速 精度、动态范围和信噪比.且不同数据格式的易用 度为100MIPS,即每秒钟可运算1亿条指令,但由 兰Q崃器一 性和开发难度也不一样。选择定点或浮点DSP,白‘ ˝ • ‰ ˚
露鳃鳖镳龌 Postgraduate Forum 先要看模数转换时需要的比特数.如果图像的每个 字信号处理器的工作频率可达200MHz,每秒可完 像素小于16bit,则用16bit定点DSP即可:如果大 成1.6G次操作。该结构包括定点的C62x、浮点的 于16bit,则需要用浮点DSP来捕捉更大的动态范 C67x和新的C64x。C64x和C62x代码兼容.但结 围。其次考虑算法的复杂度和经济问题。一般说 构有显著的加强,其初期的工作频率可达750MHz。, 来,浮点DSP芯片的运算精度高,动态范围大, C67x在C62x 8个功能块中的6个上增加了浮点功 寻址空问大,指令运算能力较强,但功耗大、成本 能,因此其指令集是不同的。 高、体积较大。定点DSP芯片的运算精度与浮点 将TMS320C6000系列的数字信号处理器用于 DSP芯片相同(数据位数和浮点芯片相同的情况 图像处理系统开发中。势必使技术水平得到进一步 下),而功耗、成本、体积与浮点DSP芯片相比较 的提高。 小,且易于实现,稳定性好。 5基于DSP的图像处理软件开发 (2)根据DSP芯片运算速度选择具体芯片【”。 TI公司针对TMS320C6000系列芯片推出了一 运算速度是DSP芯片的-个最重要的性能指标. 种CCS集成开发软件。CCS(Code Composer Studio)t1I 也是选择DSP芯片时所需考虑的一个主要因素。 是一个开放、具有强大集成能力的开发环境,它采 DSP芯片的运算速度一般采用DSP的指令周期、单 用了ftl先进的开发T具组成的直观系统,可大幅减 周期的乘加次数或采用数字信号处理中的基准程 小DSP编程时问,并能在极短的时间内消除实时 序,如用F丌和数字滤波等的执行时间来测评DSP 工作中的间歇。CCS包括TMS320C6200代码生成 芯片的速度性能。 工具、集成开发环境IDE、DSP/B10s插件和应用程 f31其他考虑因素[。。在硬件方面还应考虑芯片 序接几实时数据交换(AP[、RTDS)插件和主机接 的外部总线结构、片上存储器结构、DMA功能、 口等部分。使用CCS提供的工具,开发者可以非 串行通信lYI和芯片间通信能力等因素,在软件方面 常方便地对DSP软件进行设计、编码、编译、调 主要足开发软件的功能性和时间要求等因素。 试、跟踪和实时性分析。DSP软件开发11]流程图如图 目前。应用最为广泛的是TI fTexas Instrumentsl 2所示。 公司TMs320c6000[1-3I系列的数字信号处理器。美 DSP软件开发包括3个阶段: 国德州TI公-J自1982年推出第l代数字信号处理 (1)第l阶段是指图2中“C代码优化”之前 器以来,现已相继推出了多代数字信号处理器.成 为世界上最大的DSP芯片供应商√rMS320C6000 的部分。在第l阶段丰要是在CCS环境下用C6000 的代码产生工具,编译产生在C6000内运行的代 系列是.I’I公司于1997年推出的高端系列的DSP。 码,证明其功能正确,然后再用CCS调试工具, 该系列的DSP在芯片没计上,最初主要是针对多 分析确定代码中可能存在的影响性能的低效率段, 通道无线通信和有线通信的应用领域,但由于其优 进入第2阶段。 异的高速处理性能和出色的对外接口能力,使它也 (2)图2巾从“C代码优化”开始至“线性汇 很适用于图像处理领域。 编”之前为第2阶段。这一阶段主要是利用优化方 TMS320C6000是基于超长指令字(VLIW)结 法改进C语言代码,主要使用内联函数、数据打包 构的通用DSP系列,具有超长指令字处理能力。 处理、软件流水线技术以及展开循环结构代码等优 其内部有8个并行处理单元,8条指令组成一个指 化手段,然后反复检查C代码性能,优化C代码, 令包, ·个指令包的总字长为256位。它可在一个 如果仍不能达到所期望的效率,进入第3阶段。 时钟周期内并行执行8条指令。这种高速高性能数 (3)其余部分为第3阶段。在这一阶段从C语 竺J堕an型uar 1堂爿竺!y 2005 ■二 ˝ • ‰ ˚
C代码的编写 代码编译 褥纛鸯罐蕊 Postgraduate Forum 用,可使代码效率高达95%以上。 6基于DSP的图像处理系统 基于DSP的图像处理系统"1的主要思想是利 用C6000这样具有强大运算能力的DSP来满足图 像处理技术中运算速度和处理的实时性要求。以 DSP为核心部什的图像处理系统具有以下特点: (1)接El方便。DSP系统与其他以现代数字技术为 基础的系统或设备均相互兼容,同这样的系统接El 来实现某种功能要比模拟系统与这样的系统接口要 容易的多;(2)编程方便。DSP系统中的可编程DSP 芯片可使设计人员在开发过程中灵活方便地对软件 进行修改和升级;(3)稳定性好。DSP系统以数字处 理为基础,受环境温度及噪声的影响较小.可靠 性高;(4)精度高。16位数字系统的精度可达10~; (5)可重复性好。模拟系统的性能受元器件参数性 能变化的影响较大。而数字系统基本上不受影响, 因此数字系统便于测试、调试和大规模生产;(6)集 成方便。DSP系统中的数字部件有高度的规范性, 便于大规模集成。 图像处理系统一般由图像采集模块、图像处理 模块和数据通讯模块三部分组成(如图3所示)。 图像 网一网一降 L—j I模块1 L——J 待处理 I模块 模块 L—J i Y <◇ 罔2 DSP软件开发流程图 网3 冈像处理系统组成 图3中的图像处理模块接收来自采集模块的数 宁图像数据,刘其进行相应处理,是系统的丰体部 言程序中抽出对性能影响很大的程序段,使用线性 分.其核心是用来实现处理算法的DSP芯片,如 汇编语言重新编写.井使,}=}j汇编优化器优化该段代 r兀公司TMS320C6000系列芯片。 码。 图像处理计算量大且实时性要求高,虽然DSP 最后可用EVM板或其他开发硬件.根据实时 芯片对提高处理速度有一定的优越性.但对如遥感 性的要求反复优化C程序和线性汇编程序,直到系 图像等大型且重要的图像数据却常常不能达到实时 统符合实时性和代码长度的要求。在这种CCS集 处理。因此需要采用多个DSP并行处理方式14“j,进 成开发软件的环境下,C编译器的效率可达80%, 一步提高算法的运行速度,达到真正的实时处理。 若将新的线性『L编语言和C6000 i_厂:编优化器配合使 丝—裟笋繁 日前比较常用的是双DSP结构㈣。两片DSP芯片交 ˝ • ‰ ˚
褥窕鳖锤辘 Postgraduate FOrum 替进行采集和处理工作,可以实现数据采集和图像 DSP将是未来集成电路中发展最快的电子产品,并 压缩的并行操作.降低处理时间:而在一片DSP 将成为电子产品更新换代的决定因素。将DSP芯 内,也可将数据缓冲区分为两部分.同时进行数据 片川于图像处理系统可大幅提高图像的处婵速度, 读取和编码,实现片内并行操作,进一步节省时 满足实时性需求,而且DSP系统具有接几方便、 间。 7 结 论 易于编程、稳定性好、精度高、可重复性好和集成 方便等特点.因此可以说基于DSP的图像处理系 在当今数字化时代的背景下.DSP已成为通 统是图像处理领域的发展方向。(No.7) 信、计算机、消费类电子产品等领域的基础器件。 参考文献: [1】刘党辉,沈兰荪.DSP芯片及其在图像技术中的应用….测控技术,2001,20(5):16—23. [2]赵训威.基于TMS320C6200系列DSP芯片的应用与开发【MJ,北京:人民邮电出版社,2002. [3】徐盛,陈健.TMS320C6201数字信号处理器在图像处理中的应用…,电if-&术应用,1999,(1):70—72. 【4】Wang Y H,Zhang T X,Yah T.x.Modularized nmhi—DSP real-time image processing system『J]SPIE,4552:12—15. 【5]Haskell B G.Image and video coding-eme晒ng standards and beyond[J].IEEE Trans Oil Circui如and Systems扣r yi如o Teehn01.,1998,8(7):8 14—837. [6]朱伯春,国澄明,土兆华,舣片TMS320C40并行实时图像处理系统[J].通信学报,1998,19(1):39—44. 快速粮食成份光电分析仪 由长春光枧所应用光学国家覆点塞验窒薅僦的壤遴搬黉戚髂糍电努析仪是-种髓够快速、 准确地定最分析农产品(包括谷物、油料、饲料等)威份的仪器,是根据粮食在近红外光谱长 波段吸收信息丰富,结合化学计量学及统计数学等手段可在极短的时间内同时获得样晶的多种 成份含量的原理而研制豹。该仪器鑫分析样品时茏需样晶进弦冗繁的化学预处理,样品制各简 单快捷、无污染,在不超过五分钟的时间内即可完成粮食样品多种成努C如蛋白质、脂肪、淀 粉、纤维、水分等)的同劳测量,被称为是绿色的分析仪器。,该类仪器已强国辨粮食深加工生 产的质量控制、粮油黟晶的嚣质监测、种子发放时的成分检测等蠹面得到较为广泛的使用。 快速粮食成份光电藏褥彼霸蕊制,充分考虑到了国内近红辨分析仪用癌的使用要求,3t:菇 在软件设计上完全符合巾镧瓣现窦魉季终蠢藏翱使用习惯0谶嫂器在蠢拣镶农辩虢巍囊瓣≯番 林德大有限公司油脂厂和羲毒滚威寨豢麓发蠹穰鏊霹灌,黪煮地瘴麓蠢藏荔j繁獯蓼,撩簿黪德嫦效 果。浚仪器的研制成功将使豢期簿雾藜零霉藜藜鬻磐鬻鬻纛簟戆鬻》峨壤矮矧麟鬻。 旦J竺anu塑ar堕!生堕也——y 2005 [二—— ˝ • ‰ ˚
分享到:
收藏