《dsp设计基础》PPT课件.ppt
1,第二章 DSP设计基础,一、DSP芯片的选择二、DSP系统的设计思路,2,一、DSP芯片的选择,选择原则:根据实际应用系统需要、应用场合、目的,选择满足所需功能、成本低、耗电小、使用方便、有技术支持、升级方便的芯片。,3,1TI公司的DSP芯片 TI公司常用的DSP芯片可以归纳为三大系列:(1)TMS320C2000系列,称DSP控制器,集成了flash存储器、高速A/D转换器以及可靠的CAN模块及数字马达控制的外围模块,适用于三相电动机、变频器等高速实时工控产品等需要数字化的控制领域。(2)TMS320C5000系列,这是16位定点DSP。主要用于通信领域,如IP电话机和IP电话网关、数字式助听器、便携式声音/数据/视频产品、调制解调器、手机和移动电话基站、语音服务器、数字无线电、小型办公室和家庭办公室的语音和数据系统。,主要的DSP芯片种类,4,(3)TMS320C6000系列DSP 采用新的超长指令字结构设计芯片。其中的C64x,在时钟频率为1.1GHz时,可达到8800MIPS以上,即每秒执行90亿条指令。其主要应用领域为:1)数字通信 完成FFT、信道和噪声估计、信道纠错、干扰估计和检测等。2)图像处理 完成图像压缩、图像传输、模式及光学特性识别、加密/解密、图像增强等。,5,TMS320DM648等建立在 TI 的 TMS320C64x+TM DSP内核基础上,为基于 TMS320DM642 的现有视频处理应用提供了无缝移植路径,在降低整体成本的同时使性能翻了一番。全新处理器集成了新功能,并使视频系统材料清单(BOM)成本降低DM648 的性能比 DM642 处理器翻了一番,C64x+内核的工作周期性能提高了 20%,代码密度提高了 20-30%,每周期执行的 16 位MMAC 翻了一番,EDMA 带宽提高了三倍,而且代码与 C64xTM内核完全兼容。DM648 采用集成的视频与影像协处理器(VICP),提高了时钟速度,加快了 H.264 处理,能以同DM642 基本相当的价格提供更高性能。,(4)达芬奇(DaVinciTM)系列-2007,6,是一款面向多操作系统(包括PalmOS5.0,PocketPC2002和通信领域的Symbian)的高性能低功耗。它集成了包括一个数字协处理器在内的多媒体单元,并且加入GSM/GPRS接口和蓝牙无线协议等一些当前的高级功能。优点:支持接口全面,并且具有较低的功耗和不错的性能表现。其在Palm OS5系统上的运用很好地延续了Palm一向给人的省电,程序效率高的印象。缺点:耗电基本和旧款的彩色机型持平,但想要达到昔日的辉煌是不可能了。而且面对处理MPEG流和一些解码动作的“硬杀伤”应用的时候,其绝对性能还是要逊于StrongARM等。代表产品:Palm Tungsten T|1,T|2。Palm Zire 71(该款OMAP310不具备内置协处理器,多媒体的解码是由软件完成的)。,(4)OMAP系列,7,2AD公司的DSP芯片 特点:系统时钟一般不经分频直接使用。定点DSP芯片的程序字长为24位,数据字长为16位。一般具有2个串行口、1个内部定时器和3个以上的外部中断源,此外还提供8位EPROM程序引导方式。浮点DSP芯片,程序存储器为48位,数据存储器为40位,支持32位单精度和40位扩展精度的IEEE浮点格式,内部具有3248位的程序Cache,有3至4个外部中断源。,8,AD的BLACKFIN ADSP-21535,9,3AT&T公司的DSP芯片 定点DSP芯片的程序和数据字长均为16位,有2个精度为36位的累加器,具有1个深度为15字的指令Cache,片内具有2K字的程序ROM和512字的数据RAM。浮点DSP芯片,80/100ns的指令周期,片内具有3个512字的RAM块,或2个512字的RAM块加1个4K字的ROM块。可以寻址4M字的外部存储器。具有4个40位精度的累加器和22个通用寄存器。,10,LUCENT用STARCORE开发的新DSP,11,4Motorola公司的DSP芯片定点DSP芯片程序和数据字长为24位,有2个精度为36位的累加器。浮点DSP芯片,累加器精度达96位,可支持双精度浮点数,该芯片的指令周期为50/60/74ns。内部具有10个96位或32位基于寄存器的累加器。适合于自适应滤波的专用定点DSP芯片,程序字长和数据字长分别为24位和16位,累加器精度为40位。,12,13,5其他公司NEC公司的PD77C25、PD77220定点DSP芯片和PD77240浮点DSP芯片等。LUCENT的DSP1600等,INTEL也有自己的DSP产品。,INTEL&AD 的新DSP CORE,14,1DSP芯片的运算速度 MAC时间:一次乘法和一次加法的时间。大部分DSP芯片可在一个指令周期内完成一次乘法和一次加法操作。FFT执行时间:运行一个N点FFT程序所需时间。由于FFT运算在数字信号处理中很有代表性,因此FFT运算时间常作为衡量DSP芯片运算能力的一个指标。MIPS:每秒执行百万条指令。MOPS:每秒执行百万次操作。MFLOPS:每秒执行百万次浮点操作。BOPS:每秒执行十亿次操作。,选择芯片考虑的因素,15,2DSP芯片的价格 如果采用价格昂贵的DSP芯片,即使性能再好,其应用范围也受到一定限制,尤其是民用产品。3DSP芯片的硬件资源 不同DSP芯片所提供的硬件资源不同,如片内RAM、ROM的数量,外部可扩展的程序和数据空间,总线接口、I/O接口等。4DSP芯片的运算精度 一般的定点DSP芯片字长为16位,少数24位。浮点芯片的字长一般为32位,累加器为40位。,16,5DSP芯片的开发工具 在DSP系统的开发过程中,如果没有开发工具的支持,要想开发一个复杂的DSP系统几乎是不可能的。功能强大的开发工具,可使开发时间大大缩短。6DSP芯片的功耗 便携式的DSP设备、手持设备、野外应用的DSP设备等对功耗有特殊的要求。7其他因素 除了上述因素外,还要考虑到封装形式、质量标准、供货情况、生命周期等。,17,一般地讲:定点DSP芯片的价格较便宜,功耗较低,但运算精度稍低。浮点DSP芯片的优点是运算精度高,用C语言编程调试方便,但价格稍高,功耗较大。DSP应用系统的运算量是确定选用DSP芯片处理能力的基础。运算量小,则可选用处理能力不是很强的DSP芯片,降低系统成本。如果单片DSP芯片达不到要求,则需选用多个DSP芯片并行处理。,18,二、DSP系统的设计思路,输入,抗混叠滤波器,A/D,D/A,DSP芯片,平滑滤波器,输出,典型的DSP系统,19,1.总体方案设计,DSP系统设计前:明确设计任务 给出设计任务书 功能描述准确 功能描述清楚 描述的方式 人工语言 流程图 算法描述 将设计任务书转化为量化的技术指标。,20,技术指标的确定,系统采样频率,信号频率,最复杂的算法所需最大时间,对实时程度的要求,片内、外RAM的容量,数量及程序的长短,16、32位定点、浮点运算,系统所要求的精度,输入输出端口要求,计算、控制,选定DSP芯片型号,21,成本供货能力技术支持开发系统体积功耗工作环境温度,DSPA/DD/ARAM,性能指标,其它因素的考虑,22,总体设计,算法仿真,高级语言Matlab,最佳算法,初步参数,软件,系统初步分工,硬件,23,2.软件设计阶段,源程序,汇编器汇编,目标文件,链接器连接,调试器调试,代码转换,C语言汇编语言混合语言,代码写入EEPROM,可执行文件,软件仿真,反复,24,3.硬件设计阶段,硬件实现方案,确定最优硬件实现方案画出硬件系统框图,性能指标工期成本等,器件的选型,DSP芯片、A/DD/A、内存、电源、逻辑控制、通信、人机接口、总线等,25,DSP芯片,根据是用于控制还是计算目的,选择:不同的厂商不同系列不同工作频率不同工作电压不同工作温度采用定点或浮点型芯片,器件的选型原则 1,26,A/D变换,根据采样频率、精度:确定A/D型号是否要求片上自带采样保持器多路器基准电源等。,器件的选型原则 2,D/A变换,根据信号频率、精度:是否要求基准电源多路器输出运放等。,27,存储器,RAM、EPROM(或EEPROM、Flash Memory),主要考虑:工作频率内存容量位长(8位/16位/32位)接口方式(串行/并行)、工作电压(5V/3.3V或其他)。,器件的选型原则 3,28,逻辑控制,先确定所用器件,如PLD、EPLD或FPGA;再根据自己的特长和公司芯片的特点决定采用哪家公司的哪一系列产品;最后根据DSP芯片的频率决定芯片的工作频率,并以此来确定使用的芯片。,器件的选型原则 4,29,通信接口,根据与其他系统通信的速率决定采用的通信方式:串口并口总线,器件的选型原则 5,30,总线选择,根据使用场合、数据传输速率的高低(总线宽度、频率高低、同步方式等)选择:PCIISA现场总线,器件的选型原则 6,31,人机接口,可以通过单片机构成通信,也可在DSP的基础上直接构成。键盘显示器等,器件的选型原则 7,电源选取,主要考虑电压的高低和电压的大小。电压高低要匹配电流容量要足够,32,必须清楚了解器件的使用和系统的开发,对于关键环节要做仿真。,原理图设计,PCB板设计,要求DSP系统设计人员既要熟悉系统工作原理,又要清楚布线工艺和系统结构设计。,软、硬件调试,借助仿真工具或开发工具进行软、硬件仿真调试时,往往要反复多次调试。,33,1.设计一个DSP系统应考虑哪些问题?2.选择DSP芯片的依据是什么?3.比较不同种类DSP芯片的区别是什么?,思考题,