DSP原理及结构.ppt
第六章 DSP原理及结构,6.1 DSP技术概述,数字信号处理(Digital Signal Process,DPS)是利用计算机或专用处理设备,以数字形式对信号进行采集、变换、滤波、估值、增强、压缩、识别等处理,以得到符合人们需要的信号形式。,一、数字信号处理的实现方法1、在通用计算机上用软件(如Fortran、C语言)实现;2、在通用计算机系统中加上专用的加速处理机实现;3、用通用的单片机实现,这种方法可用于一些不太复杂的数字信号处理,如数字控制等;,4、用通用的可编程DSP芯片实现。与单片机相比,DSP芯片具有更加适合于数字信号处理的软件和硬件资源,可用于复杂的数字信号处理算法;5、用专用的DSP芯片实现,在一些特殊的场合,要求的信号处理速度极高,用通用DSP芯片很难实现,例如专用于FFT、数字滤波、卷积等算法的DSP芯片,这种芯片将相应的信号处理算法在芯片内部用硬件实现,无需软件编程。,二、DSP系统1、DSP系统的构成典型DSP系统,2、DSP的主要特点(1)普遍采用数据总线和程序总线分离的哈佛结构,允许取指令和执行指令进行全部重叠进行;可直接在程序和数据空间之间进行信息传送,减少访问冲突,从而获得高速运算能力。,(2)大多采用流水技术,即每条指令都由片内多个功能单元分别完成取指、译码、取数、执行等步骤,从而在不提高时钟频率的条件下减少了每条指令的执行时间。DSP通常有三级以上的流水线。,(3)在每个时钟周期执行多个操作。针对滤波、相关、矩阵运算等需要大量乘法累加运算的特点,DSP大都配有独立的乘法器和加法器,使得在同一周期内可以完成相乘、累加两个运算。有的DSP可以同时进行乘、加、减运算,大大加快了FFT的蝶形运算速度。,(4)片内有多种总线可以同时进行取指令和多个数据存取操作,并且有辅助寄存器用于寻址,它们可以在当前访问前/后自动修改内容以指向下一个要访问的地址(自动变址),并且支持循环寻址和位反序寻址。(5)具有软、硬件等待功能,能与各种存储器接口。,(6)许多DSP芯片带有DMA通道控制器,以及串行通信口等,配合片内多总线结构,数据块传送速度大大提高。(7)具有功能强大的DSP指令,如乘法指令(MPY)、倍乘累加指令(MAC)等。,3、DSP系统的应用领域(1)通用数字信号处理:数字滤波、卷积、相关、FFT、自适应滤波、波形发生等。(2)通信领域:高速调制解调器、编/译码器、传真、程控交换机、卫星通信、IP电话等。(3)语音处理:语音识别、合成、矢量编码、语音信箱等。,(4)自动控制:磁盘、光盘、发动机控制等。(5)仪器仪表:测量数据谱分析、自动监测及分析、暂态分析等。(6)图形/图像处理:三维图像变换、模式识别、图像增强等。(7)医学电子:CT扫描、超声波、核磁共振等。,(8)军事与尖端科技:雷达和声纳信号处理、雷达成像、导弹制导等。(9)计算机与工作站:计算机加速卡、图形加速卡。(10)消费电子:数字电视、图形/声音压缩解压装置。,4、DSP产品的现状定点DSP有200多种,浮点DSP有100多种。主要生产:TI 公司、AD公司、Lucent、Motorola和LSI Logic公司。主导产品:TI 公司的TMS320C54xx(16bit 定点)、TMS320C55xx(16bit 定点)、TMS320C62xx(32bit 定点)、TMS320C67xx(16bit 浮点)Motorola公司的DSP68000系列,三、DSP系统的设计流程,1、器件选择16bit定点DSP:最早以TMS320C10/C2X为代表,现在以TM320C2XX/C54XX为代表。32 bit浮点DSP:代表产品ADSP21020、TMS320C3X,通用DSP芯片的代表性产品包括TI公司的TMS320系列、AD公司ADSP21xx系列、MOTOROLA公司的DSP56xx系列和DSP96xx系列、AT&T公司的DSP16/16A和DSP32/32C等单片器件。TI的三大主力DSP产品系列为C2000系列主要用于数字控制系统;C5000(C54x、C55x)系列主要用于低功耗、便携的无线通信终端产品;C6000系列主要用于高性能复杂的通信系统。C5000系列中的TMS320C54x系列DSP芯片被广泛应用于通信和个人消费电子领域。,器件选择时应考虑的因素:(1)速度指标:DSP最基本的速度指标是MIPS(百万条指令每秒)和MFLOPS(百万次浮点运算每秒),还有FFT和FIR滤波器的速度及除法、求平房根等特殊运算的速度。,TI公司DSP芯片,(2)输入输出的带宽 在运算速度达到要求时,还要考虑DSP输入/输出数据的速度是否足够快。(3)精度和动态范围:精度和动态范围由DSP的数据字宽和定点/浮点数据格式决定。(4)特定功能:若DSP上集成了多种上电加载功能、同步/异步串口、A/D、D/A、片内语音处理功能、编解码等,可以方便设计,降低成本。,(5)片内存储器 DSP片内存储器可用来放程序和数据,当程序和数据都放在片内时,DSP的运行速度要高得多,所以片内存储器越多越好。(6)DSP开发工具 选择DSP芯片时必须注意其开发工具的支持情况,包括硬件和软件。,(7)功耗问题和硬件封装问题(8)成本问题 定点DSP较便宜,功耗较低,但运算精度稍低。浮点DSP稍贵,功耗较高,但运算精度高,C语言编程调试方便。,2、软件、硬件设计 软件是指将包括信号处理算法的程序用DSP的汇编语言或通用的高级语言(C语言)编写出来并进行调试。这些程序是要放在DSP片内或片外存储器中进行的。在程序工作时,DSP会执行与DSP外围设备传递数据或互相控制的指令。,硬件设计涉及较多的电路设计技术。由DSP构成的电路一般包括:EPROM/FLASH、RAM、A/D、D/A、同步/异步串口、电源模块、电平转换模块、FPGA、接口电路、仿真接口等。,3、调试 对DSP的调试更多地依赖于仿真器,而示波器或逻辑分析仪等测量仪器主要用于外围器件的信号测量等。当软件、硬件联调满足要求后,还需要将程序固化到系统中,脱离仿真器工作。,6.2 DSP芯片的基本结构,一、DSP芯片的基本结构TMS320系列DSP芯片的基本结构包括:(1)哈佛结构(2)流水线结构(3)专用的硬件乘法器(4)快速的指令周期,1、哈佛结构 哈佛结构将程序存储器和数据存储器分开,每个存储器独立编址,独立访问。与两个存储器相对应的是系统中设置了程序总线和数据总线两条总线,从而使数据的吞吐率提高了一倍。,TMS320系列DSP芯片在基本哈佛结构的基础上作了改进:一是允许数据存放在程序存储器中,并被算术运算指令直接使用,增强了芯片的灵活性;二是指令存储在高速缓冲器中,当执行此指令时,不需要再从存储器中读取指令,节约了一个指令周期的时间。,2、流水线结构 与哈佛结构相关,DSP芯片广泛采用流水线以减少指令执行时间,从而增强了处理器的处理能力。三级流水线操作中,取指、译码和执行操作可以独立执行。,3、专用的硬件乘法器 在通用的微处理器中,乘法指令是由一系列加法来实现的,故需要许多个指令周期来完成。而DSP芯片中有一个专用的硬件乘法器,使乘法可以在一个指令周期内完成。,4、快速的指令周期 以上的几种结构可使DSP芯片的指令周期在200ns以下。TMS320系列处理器的指令周期已经从第一代的200ns降至20ns以下。快速的指令周期使DSP芯片能够实时实现许多DSP应用,二、TMS320系列DSP的结构,1、多总线结构 由哈佛结构决定了具有独立的程序总线和数据总线,以及独立的程序存储器和数据存储器,这样就可以同时获得指令字和操作数互不干扰,即一个指令周期内可以同时准备好指令和操作数。,实际DSP由四套或更多的总线例如TMS320内部由6条独立的总线 程序读总线PRDB 程序地址总线PAB 数据读总线PRDB 数据写总线DWEB 数据存储器读地址总线DRAB 数据存储器写地址总线DWAB,6.3 硬件电路设计,1、电源电路设计(1)电源电压要求 DSP芯片大部分采用低电压供电方式,这样可以大大降低DSP芯片的功耗。内核电源CVdd:对内部逻辑进行供电,一般为3.3V或2.5V,甚至更低。I/O电源DVdd:给外部逻辑(扩展接口逻辑)供电,一般为3.3V。,(2)电流要求电流消耗取决于器件的激活度。CVdd 消耗的电流主要决定于CPU的激活度。外设消耗的电流决定于正在工作的外设的数量及速度,以及在这些输出上的负载电容。,(3)加电次序 理想情况下,两个电源应同时加电,但在一些场合很难做到。不同型号器件上电顺序不一样。,TMS320VC5402与大多数DSP芯片的上电顺序:低电压电源CVdd先上电;高电压电源DVdd后电压;高电压电源DVdd先断电;低电压电源CVdd后断电;*若不遵照此次序,那么CVdd与DVdd的差值必须小于2.8V。TMS320VC549具有静电保护结构,所以上电顺序与上相反。,(4)电源解决方案从5V产生双电源,从3.3V产生双电源,单3.3V电压输出:TI公司的TPS7133、TPST7233单电源可调电压输出:TI公司的TPS7101、TPST7201双电源输出(两路输出的芯片):TPS73H301、TPS73H325、TPS73H318,(5)3.3V和5V混合逻辑系统设计各种电平转换标准,3.3V和5V电平转换的4种情形:A)5V TTL器件驱动3.3V TTL器件 由于5V TTL和 3.3V TTL电平转换标准相同,只要3.3V器件能够承受5V电压,直接相接从电平上来说完全可以。,B)3.3V TTL器件驱动5V TTL器件 不需要额外器件可以直接相接,只要读入是有效电平即可。C)5V COMS器件驱动3.3V TTL器件 虽然转换标准不同,但是能够承受5V电压的3.3V器件能够正确识别5V器件送来的电平值。采用能够承受5V的LVC器件,5V器件的输出可以直接与3.3V的输入端相接。,D)3.3V TTL(LVC)器件驱动5V COMS器件 由于3.3V LVC的VOH为2.4V(可以高到3.3V),而5V CMOS器件要求的VIH为3.5V,所以3.3V LVC器件的输出不能直接与5V CMOS器件的输入相接。在这种情况下,可以采用双电压(一边为3.3V 供电,一边为5V供电)的驱动器。如TI的SN74ALVC16245、SN74LVC64245等。,2、最小系统设计,由DSP器件为核心构成的最小系统包括电压调整器、复位电路、晶体振荡器以及程序存储器和数据存储器(一般利用DSP器件的内部资源)。,时钟电路(1)利用DSP芯片内部提供的晶振电路,在DSP芯片的X1、X2之间连接晶体振荡器。(2)将外部时钟源直接输入X2/CLKIN引脚,X1悬空。,2、确定DSP的工作方式(以TMS320VC2812为例)由复位时MP/MC管脚的值决定TMS320VC2812的两种工作方式:微控制器工作方式微处理器工作方式,MP/MC=1 微控制器工作方式,复位结束后,CPU从外部程序存储器3FFC00h处开始执行用户程序。MP/MC=0 微处理器工作方式,复位结束后,CPU跳到片外ROM开始执行自举加载程序,将用户程序从外部存储器EPROM、串行口或I/O口引导到程序空间中全速运行。,3、等待状态的设置 选取存储器要考虑的因素:存取时间、容量和类型。若选取慢速存储器件则必须用软件或硬件方法为DSP插入等待状态,以保证存储器的速度能跟上DSP的读写速度。,(1)插入等待状态数的确定 DSP存储器的读操作是最快的,只要一个机器周期,且存储器的数据在机器周期的后半个周期读出,这就要求存储器的存取时间t AA小于60的机器周期。例如TMS32VC5402工作速度为100MIPS,对应的机器周期为10 ns,如果不插入等待状态,则要求存储器的t AA小于6 ns。,如果存储器的t AA大于6 ns,则必须插入一定数目的等待状态,其具体关系如表618。,(2)插入等待状态的实现方法 软件实现:用软件可编程等待发生器实现插入状态,但最多不超过7个。以VC5402为例,复位时SWWSR(软件等待寄存器)=7FFFh,所有程序、数据和I/O空间都被插入7个等待状态。复位后,用STM指令修改SWWSR值,以获得期望的等待状态数。,硬件实现:用硬件产生的等待信号去控制DSP的READY管脚来实现。可以把/MSC的输出接到READY,就能实现在软件等待状态结束之后插入一个外部等待状态(如图6.35)。若在/MSC与READY之间插入一个硬件等待发生器,就能插入一个以上的等待状态。,6.4 DSP在测控系统应用中的硬件结构,DSP芯片在测控系统中的3种应用方式:(1)根据控制对象要求设计DSP芯片控制器电路和有关的输入和输出接口硬件。(2)在微型计算机上插入DSP芯片开发扩展板及输入/输出扩展板,利用现有微机的操作环境开发算法软件。(3)根据控制对象的需要,实现DSP与MCU双处理系统。,通用的智能测控系统一般由处理器、数据采集前后向通道、人机接口以及异步串行通信单元等组成。,1、A/D和D/A接口 DSP与A/D间的连接线通常包括数据线、读/写线、片选线。数据线连接有并行、串行两种方式。,DSP的数据总线为16位或32位,比A/D数据宽,在接法上有两种:一是将A/D的数据线与DSP的高位数据对齐,DSP的低位数据不连,这样省去了DSP对数据进行符号扩展的预处理。二是将A/D的数据线与DSP的低位连接,如果DSP的数据线高位不连,DSP就要用指令将数据左移,使数据的符号位扩展到高位。,DSP与A/D间数据通信的方式有两种:一种方式是DSP用指令从A/D读数,DSP必须定期地访问A/D。可以在A/D和DSP之间加入一个FIFO,这样可以使DSP不必在每次A/D转换之后都访问A/D。另外DSP以DMA的方式从A/D取数据,并自动放到指定的数据地址上,这样DSP可以全速进行数据处理的其他操作。,DSP与A/D间连接方式和A/D类似,2)人机接口 最常用的就是键盘、数码管以及液晶显示器。由于器件较慢,所以需加入接口电路。可采用CPLD进行人机接口的设计。具体设计见前面的设计。,3)串口 DSP广泛采用同步串口的传输方式,最高传输速度可以达到40Mb/s,需要6根信号线。只有TMS320C2XXX系列的DSP带有与RS232标准一致的异步串口(UART)。设有异步串口的DSP为了能够与计算机等的RS232串口通信,可以采用DSP上的一些通用I/O管脚,用软件的方法形成RS232串口通信协议,也可以利用8250、8251、160等异步串口通信芯片,完成DSP的并行数据总线与RS232串行线间的数据转换。,TMS320C5000系列的串行接口外部管脚,同步串口的CLKX/CLKR、FSR/FSX都可以由DSP内部设备提供,也可以由外部输入,其速率由内/外时钟基准按任意分频比例产生,传送字长可以设置位多种位宽。,DSP串口有两种工作方式:脉冲串方式以及SPI相兼容的方式。(1)脉冲串方式:发送接收脉冲(CLKX和CLKR)只要启动后一直有,并用同步脉冲(FSR和FSX)来指示有效数据的开始。,(2)SPI相兼容的方式 SPI协议是以主从方式工作的,这种模式通常有一个主设备和多个从设备。其接口包括:串行数据输入(MISO)串行数据输出(MOSI)串行移位时钟(SCK)从使能信号(SS),SPI相兼容的方式只有当有数据发送时,CLKX管脚才有脉冲,FSX用作从器件的使能信号,外部不用CLKR、FSR,它们由内部分别连接到CLKX和FSX。,4)DSP与串行A/D D/A接口设计 TLV1572是一种高速10位逐次逼近式模数转换器,它的串口可以与DSP串口直接连接,无须使用另外的连接逻辑。,*串行通信 TMS320VC5402的串行口是同步口,可配置为SPI口。可利用89C51的三条口线作为SPI的SCLK、MOSI以及MISO,并用软件来实现SPI协议。,还可以利用TMS320VC5402的通用I/O口的XF和/BIO作为异步串行通信的TXD和RXD,以软件来实现RS-232通信协议。,DSP软件开发过程 DSP软件设计可以通过汇编语言或高级语言(C语言)实现。,6.5 DSP在测控系统应用中的软件设计,一般来说,不同公司的DSP芯片所提供的汇编语言是不同的,即使同一公司的芯片,由于类型不同、芯片的升级其适用的汇编语言是不同的。,各个DSP芯片公司推出了相应的高级语言(如C语言)的编译器,使得DSP芯片的软件可以直接使用高级语言编写成的,从而使DSP芯片的开发速度大大提高,也使程序的修改和移植变得十分方便。,但是某些情况下C语言代码的效率还是无法与汇编代码的效率比,如FFT程序,也无法在所有的情况下最合理地利用DSP芯片所提供的各种资源。C语言编程容易、调试快速、可读性好,但编译生成的代码运行速度较慢,且无法实现某些低级操作。所以可应用汇编语言和C语言混合编程。,CCS运行主窗口,一般情况下,首先将C语言的源程序经优化编译器进行优化和编译,得到COFF格式(Common Object File Format)的目标文件,而后将COFF目标文件通过连接器(Linker)连接后得到可执行的COFF文件。,如果是混合编程,对C语言源程序进行编译、汇编和连接,生成可执行代码。汇编语言直接进行汇编和连接即可得到可执行代码,然后将两个模块连接起来,用公用转换程序将可执行的COFF文件转换成标准的十六进制格式的文件,该文件可以利用编程器写入EPROM、EEPROM或FLASH存储器,最后将固化的程序导入DSP的程序存储器中。,TI公司已经将开发DSP的软件集成化,使文本输入、编译、连接、调试、下载均在一个环境下完成。针对TMS320C54X有CCS软件;TMS320C2XX有CC软件,