DSP技术原理及应用(ppt课件).ppt
《DSP技术原理及应用(ppt课件).ppt》由会员分享,可在线阅读,更多相关《DSP技术原理及应用(ppt课件).ppt(340页珍藏版)》请在三一办公上搜索。
1、DSP技术原理及应用,目录,第1章 绪论第2章 TMS320C54x的结构原理第3章 TMS320C54x硬件系统设计第4章 TMS320C54x指令系统第5章 DSP软件开发与设计第6章 TMS320C54x的开发应用,教学目的1、理解数字信号处理及数字信号处理器的基本概念;2、了解数字信号处理器的发展现状、发展趋势及应用;3、了解TI公司三大系列DSP芯片的主要特点及应用;4、掌握定点DSP的数据格式。 教学重点1、数字信号处理及数字信号处理器的基本概念;2、TI公司三大系列DSP芯片的主要特点及应用;3、定点DSP的数据格式。教学难点定点DSP的数据格式。,第一章 绪论,课外作业,1、课
2、本P26作业1.2,1.42、若x=1.4,y=0.2(1)将x用Q14格式表示,将 y用Q15格式表示;(2)再求x+y。3、y=-0.328,将其表示成Q15格式的定点数。4、已知7000H是定标为Q12的定点数。求其对应的浮点数。,DSP有两种理解:,一、广义的理解:digital signal processing数字信号处理,二、狭义的理解:digital signal processor数字信号处理器,1.1数字信号处理: 他是利用计算机或专用处理设备,以数字形式对信号进行采集、变换、滤波、估值、增强、压缩、识别等处理,得到符合需要的信号形式。,在通用的计算机上用软件实现。在通用计
3、算机系统上加上专用的加速处理机实现。用通用的单片机实现。用通用的可编程DSP芯片实现。用专用的DSP芯片实现。用/CPLD/FPGA实现。,数字信号处理的实现方法:,TMS320VC5402管脚图,数字信号处理系统的一般组成,抗混叠滤波器将输入信号X(t)中比主要频率高的信号分量滤除,避免产生信号频谱的混叠现象。A/D将输入的模拟信号转换为DSP芯片可接收的数字信号。DSP芯片对A/D输出的信号进行某种形式的数字处理。D/A经过DSP芯片处理的数字样值经D/A转换为模拟量,然后进行平滑滤波得到连续的模拟信号。,数字信号处理系统的一般设计过程,数字信号处理器DSP,DSP:是一种特别适合于进行数
4、字信号处理运算的微处理器,其主要应用是实时快速地实现各种数字信号处理算法。,DSP的主要特点:,哈佛结构 :,冯诺依曼结构:将指令、数据存储在同一个存储器中,统一编址,译稿指令计数器提供的地址来区分是指令还是数据。取指令和取数据都访问统一存储器,数据吞吐率低。,基本哈佛结构:程序和数据存储在不同的存储空间,程序存储空间和数据存储空间是两个相互独立的存储空间,每个存储空间独立编址,独立访问。,冯诺曼结构,基本哈佛结构,改进哈佛结构,多总线结构对DSP来说,总线越多,可以完成的功能就越复杂。流水线结构如四级流水线的操作图:,DSP主要特点续,多处理单元 DSP内部一般都包括有多个处理单元,如算术逻
5、辑运算单元(ALU)、辅助寄存器运算单元(ARAU)、累加器(ACC)以及硬件乘法器(MULT)单元等。它们可以在一个指令周期内同时进行运算。,利用这种流水线结构,加上执行重复操作,保证了数字信号处理中用得最多的乘法累加运算可以在单个指令周期内完成。,DSP主要特点续,特殊的DSP指令 在DSP的指令系统中,设计了一些特殊的DSP指令。例如TMS320C54x中的FIRS和LMS指令,则专门用于系数对称的FIR滤波器和LMS算法。,指令周期短DSP广泛采用亚微米CMOS制造工艺,如TMS320C54x,其运行速度可达100MIPS。TMS320C6203的时钟为300MHz,运行速度达到2 4
6、00 MIPS。,运算精度高DSP的字长有16位、24位、32位。为防止运算过程中溢出,累加器达到40位。此外,一批浮点DSP,例如TMS320C3x、TMS320C4x、 TMS320C67x、 ADSP21020等,则提供了更大的动态范围。,DSP主要特点续,硬件配置强新一代DSP的接口功能愈来愈强,片内具有定时器、串行口、主机接口(HPI)、DMA控制器、软件控制的等待状态产生器、锁相环时钟产生器以及实现在片仿真符合IEEE 1149.1标准的测试仿真接口,使系统设计更易于完成。另外,许多DSP芯片都可以工作在省电方式,大大降低了系统功耗。,DSP的分类,按基础特性分:DSP芯片的工作时
7、钟(主频)和指令类型,DSP的分类有三种方式:按基础特性分、按数据格式分、按用途分,静态DSP芯片:该类型在某时钟频率范围内都能正常工作,除计算速度有变化外,没有性能上的下降。如日本OKI电器公司的DSP和TI公司的TMS320C2XX系列;,一致性DSP:两种或更多的DSP芯片,其指令集、机器代码及管脚结构相互兼容。如美国TI公司的TMS320C54X。,DSP的分类, 按数据格式分:DSP对数据的处理有两种格式:定点数据格式和浮点数据格式。,定点DSP芯片:数据以定点格式参加运算。浮点DSP芯片:数据以浮点格式参加运算。不同浮点DSP所采用的浮点格式可能不同。,按用途分: 通用型:适合普通
8、的DSP应用。 专用型:为特定的功能、运算而设计的。如数字滤波、卷积、FFT等。如TMS320C24x适合自动控制;MOTOLORA公司的DSP56200专用于数字滤波。,DSP的选择,选择DSP芯片时应考虑如下几个因素:,DSP芯片的运算速度:运算速度可以用以下几种性能指标来衡量; 指令周期:即执行一条指令所需要的时间,通常以ns为单位。 MAC时间:即完成一次乘法和一次加法时间。 FFT执行时间:即运行一个N点FFT程序所需时间。 MIPS:每秒执行百万条指令。 MOPS:每秒执行百万次操作。 MFLOPS:每秒执行百万次浮点操作。 BOPS:每秒执行十亿次操作。 DSP芯片的硬件资源;
9、DSP芯片的运算精度:参加运算的数据字长越长精度越高。 DSP芯片的功耗; DSP芯片的开发工具; DSP芯片的价格;DSP芯片发展迅速,价格下降也很快。 其它。封装形式、质量标准、供货情况、生命周期等。,1.3 定点DSP的数据格式,在定点处理器中,数据采用定点表示方法,定点表示并不意味着就一定是整数表示。它有两种基本表示方法:整数表示方法和小数表示方法。整数表示方法主要用于控制操作、地址计算和其他非信号处理的应用。小数表示方法则主要用于数字和各种信号处理算法的计算中。,8位定点整数表示方法:,8位定点小数表示方法:,结果=2-1+2-2+2-3=0.875,结果=26+24+22+21+2
10、0=87,数的补码表示,例:求-3.25的补码。用8位二进制数表示。解:方法1+3.25的二进制数为:0011.0100,这也就是+3.25的补码。则-3.25的原码为:1011.0100-3.25的 反码为:1100.1011,最末位加1得补码1100.1100方法2将+3.25的补码0011.0100所有位取反得到1100.1011,最末位加1得补码1100.1100求一个数的补码的补码,就得到这上数的相反数的补码。,定点数有两种表示法:(1)Q表示法;(2)S表示法。Q表示法的Qn表示小数点在数据第n位之后(也就是小数位数有n位), Qn中的n也称为Q值,写为Q=n。例如,Q0,表示小数
11、点在第0位之后,即Q=0,显然,Q表示法的Q0实际上表示一个整数。Q15表示小数点在第15位之后,显然,Q15实际上表示一个纯小数。S表示法的Sm.n表示有m位整数,n位小数(即小数点在第n位之后),且m+n=15。显然,S表示法的Sm.n 与Q表示法的Qn相同。例如,S0.15与Q15相同,S15.0与Q0相同。,定点数的表示法,几种常用的Q表示法的格式:,Q0格式:Q0格式(S15.0)的字长为16位。,定点数的整数形式。最高位为符号S,接下来的Ix为15位2补码的整数 ,表示数的范围为(-215215-1),最小的分辨率为1。,Q12 格式: Q12 格式(S3.12)的字长为16位。,
12、最高位为符号S,接下来的3位为2补码的整数位,高位在前,后面的12位为2补码小数位。Q12 格式表示数的大致范围为(-8,7),小数的最小分辨率为2-12 。,Q15(或S0.15) 格式Q15格式的字长为16位,其每位的具体表示如下:,最高位为符号S,接下来的为2补码的15位小数位,小数点紧接着符号位,无整数位。Q15格式表示数的范围为(-1,1),小数的最小分辨率为2-15 。 对于16位的定点处理器TMS320C54x来说,Q15是在程序设计中最常用的格式。TI公司提供的数字信号处理应用程序库DSPLIB就主要采用这种数据格式。,定点格式表示数的范围(动态范围)和数据的精度是确定的。表示
13、数的范围越大,数据的精度越低,也就是说,数的范围与精度是一对矛盾。对16位的数据来说,动态范围最大的格式为整数Q0,精度(或分辨率)最高的格式为Q15。,2.定点数和浮点数的转换关系,浮点数A转换成定点数B:B =(int)(A2Q)定点数A转换成浮点数B:B =A2Q例一:浮点数 x 0.5,定标在Q15,则相应的定点数为 Xq 0.5 215 =0.5 32768 16384=4000H例二:一个Q15表示的定点数13107对应的浮点数为 x=13107 2-15 =0.3999939例三:y=-0.625,将其表示成Q15格式的定点数。解: Yq =-0.625215 =-20480=-
14、5000H求-5000H的补码:将其绝对值5000H的所有位取反(得AFFFH)后加1得到补码为B000H。B000H就是-0.625的Q15格式表示的定点数。 例四:已知6000H是定标为Q12的定点数。求其对应的浮点数。解:6000H=24576,对应的浮点数为x=245762-12=6,定点格式数据的转换,若一个数已经是某种动态范围较小的Qn格式,为了与动态范围较大的Qn格式数进行(加、减)运算,要将其转换为动态范围较大的格式的数。动态范围小的格式就是整数位数较少,如果整数位数比动态范围大的格式少k位,则将动态范围小的数右移k位,右端移出去的k位去掉不要,左端进行符号位扩展(扩展k位),
15、这样就把动态范围较小的格式的数转换为动态范围较大的格式的数,例如,5.625+0.625=6.25,5.625和结果6.25需要采用Q12格式才能保证其动态范围,若0.625原来用Q15格式表示,则需要先将他表示成Q12后,再进行计算,自然,最后的结果也为Q12。转换过程分析如下:5.625 212 = 5.625 4096 23040=5A00H0.625 215 =0.625 32768 20480=5000H将5000H右移3位。由于5000H为正数,所以5000H右移时左端补0。5000H右移3位后变为0A00H。5A00H+ 0A00H=6400H=25600,对应的浮点数为 256
16、00 2-12 =6.25,练习:1、已知5000H是Q15格式的定点数,请将其写为二进制数,并标上小数点.他对应的十进制数是多少?若为Q12格式,再完成上面的要求。2、求-1.5的补码,用8位二进制数表示。,1.4 DSP芯片的发展及应用,信号处理系统:数字滤波(FIRIIR)、自适应滤波器、快速付立叶变换、相关运算、谱分析、卷积、加窗、波形产生等。通信:调制解调器、自适应均衡、数据加密、数据压缩、回波抵消、多路复用、波形产生等。语音:语音编码、语音合成、语音识别、语音增强、语音邮件、语音存储等。图形/图像:二位/三维图形处理、图像压缩与传输、图像增强、动画、机器人视觉等。军事:保密通信、雷
17、达处理、声纳处理、导航、导弹制导等。仪器仪表:频谱分析、函数发生、锁相环、地震处理等。自动控制:引擎控制、声控、自动驾驶、机器人控制、磁盘控制等。医疗:助听、超声设备、诊断工具、病人监护等。 家用电器:高保真音响、音乐合成、音调控制、玩具与游戏、数字电话/电视等。,C2000系列DSP产品规划,TMS320LF2407DSP与TMS320C28x DSP的方框图,TMS320C28x是到目前为止用于数字控制领域性能最好的DSP芯片。32位的定点DSP核,最高速度可达400MIPS,可以在单个指令周期内完成3232位的乘累加运算,具有增强的电机控制外设、高性能的模/数转换能力和改进的通信接口,具
18、有8GB的线性地址空间,采用低电压供电(3.3V外设/1.8V CPU核),与TMS320C24x源代码兼容。该系列芯片已投放市场。,C5000系列DSP产品规划,TMS320C5000系列特性比较,C6000系列DSP产品规划,DSP性能推动革新,OMAP,TI增强型ARM 925,TI的TMS320C55x DSP,DSP/BIOS Bridge,用户接口 先进的操作系统,MPEG 4编解码器 H263 编解码器,AMR 编解码器 MP3 编解码器,非实时任务,OMAP平台对数字信息终端的意义,实时任务,所针对多媒体应用 无线视频和图像处理 无线高级语音应用 无线音频处理 图形和视频显示加
19、速处理 因特网网页生成接入 无线数据处理 全球卫星定位系统(GPS ) 短距离无线通信应用(SDW) ARM 和DSP 操作系统,教学目的1、了解TMS320C54x的内部结构和主要特性。2、掌握存储器系统及其使用方法。3、了解CPU各组成部分的特点和作用。4、掌握定时器和时钟发生器的工作原理及使用方法。5、了解McBSP多通道缓冲串口。6、掌握中断系统的工作原理及使用方法。教学重点1、存储器系统及其使用方法。2、定时器和时钟发生器的工作原理及使用方法。3、中断系统的工作原理及使用方法。教学难点1、定时器和时钟发生器的工作原理及使用方法。2、McBSP多通道缓冲串口的工作原理。3、重新映射中断
20、向量地址。,第二章TMS320C54x的结构原理,1、课本P114作业2.4,2.5,2.7,2.8,2.10,2.11,2.13,2.4,2.152、希望将程序放在C54x DSP片内RAM中运行,要怎么设置?3、写出将状态寄存器ST1中的SXM位置为1的指令。4、一个16位的二进制数送入ALU后将成为40位的二进制数。现将8000H送入ALU,并放在第15-第0位,写出下面两种情况下得到的40位二进制数: (1)SXM=0;(2)SXM=15、若CPU时钟频率为32MHz,用定时器定时500微秒,求TDDR和PRD的值。6、已知输入时钟CLKIN的频率为16MHz,若希望DSP时钟频率为3
21、2MHz,设计相应的程序。假设已求得PLLCOUNT的值为20h。,课外作业,第二章TMS320C54x的结构原理,2.1 TMS320C54x的内部结构及主要特性,2.1.1 TMS320C54x的内部结构,(1)CPU:包括算术逻辑单元、乘法器、累加器、移位寄存器、各种专门用途的寄存器、地址发生器以及内部总线;,(3)片内的外设:包括片内的定时器、各种类型的串口、主机接口、片内的锁相环(PLL)时钟发生器以及各种控制电路;JTAG接口。,(2)存储器系统:包括1624位外接存储器接口、片内的程序ROM、片内的单访问的数据RAM和双访问的数据RAM;,2.1.2 TMS320C54x的主要特
22、性,CPU先进的多总线结构,具有1条程序存储器总线、3条数据存储器总线和4条地址总线;40位算术逻辑单元(ALU),包括40位的桶形移位寄存器和2个独立的40位的累加器;17位乘17位的并行乘法器与一个40位的专用加法器结合在一起,用于单周期乘累加操作;比较、选择和存储单元(CSSU),用于Viterbi操作(一种通信的编码方式)中的加/比较选择;指数编码器用于在单周期内计算40位累加器的指数值;2个地址生成器,包括8个辅助寄存器和2个辅助寄存器算术单元。,2.1.2 TMS320C54x的主要特性续,(2) 存储器系统具有16位192 K的基本可寻址空间:64 K字程序空间,64 K字数据和
23、64 K字的I/O空间;片内的存储器结构及容量根据芯片的型号有所不同(见表2-1)(3) 在片外设和专用电路软件可编程等待状态产生器;可编程的存储器体转换逻辑;片内的锁相环(PLL)时钟发生器,可采用内部振荡器或外部的时钟源;外部总线关断控制电路可用来断开外部数据总线、地址总线和控制信号;数据总线具有数据保持特性;可编程的定时器;直接存储器访问(DMA)控制器;可与主机直接连接的8位并行主机接口(HPI),有些产品(见表2-1)还包括:扩展的8位并行主机接口(HPI8)和16位并行主机接口(HPIl6);片内的串口根据型号不同分以下类型(见表2-1):全双工的标准串口,支持8位和16位数据传送
24、、时分多路(TDM)串口、缓冲串口(BSP)以及多通道缓冲串口(McBSP)。,2.1.2 TMS320C54x的主要特性续,(4) 片内的引导功能除TMS320C5420外,所有的芯片都具有片内的引导功能,能从片外的存储器将程序引导装入指定的存储器位置。(5) 指令系统单指令重复和块重复操作指令;用于程序和数据管理的存储器块传送指令;32位长操作数指令;同时读入2个或3个操作数的指令;并行存储和装入的算术指令;条件存储指令;快速从中断返回的指令;具有延迟转移和调用指令;指令的执行采用指令预提取、指令提取、指令译码、访问操作数、读取操作数、执行等6级流水线并行结构,大大提高了指令的执行速度。,
25、2.1.2 TMS320C54x的主要特性续,(6) 执行速度单指令周期时间分为:25/20/15/12.5/10 ns;每秒指令数:40/50/66/80/100/200 MIPS。(7) 电源和功耗可采用5 V,3.3 V,3.3 V和1.8或2.5 V的超低电压供电,在型号中分别用C、LC 、UC和VC指明,如,TMS320C54x,TMS320LC54x和TMS320UC54x;可采用功耗下降指令IDLE 1,IDLE 2和IDLE 3控制芯片的功耗;可控制禁止CLKOUT信号。 (8) 片内的仿真功能具有符合IEEE 1149.1标准的在片仿真接口,可与主机连接,用于系统芯片开发应用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DSP 技术 原理 应用 ppt 课件

链接地址:https://www.31ppt.com/p-1376033.html