DSP课程设计实验报告语音压缩、存储和回放.doc
《DSP课程设计实验报告语音压缩、存储和回放.doc》由会员分享,可在线阅读,更多相关《DSP课程设计实验报告语音压缩、存储和回放.doc(22页珍藏版)》请在三一办公上搜索。
1、DSP课程设计实验报告 语音压缩、存储和回放指导教师:实验课程:DSP课程设计 实验名称:语音压缩、存储和回放 小组成员:自动化0605班 自动化0605班 目录一、 概述.3二、 算法原理及硬件要求 .4三、 程序及说明.11四、 程序的调试及结果.18五、 总结.20六、 参考文献.21一 概述语音压缩、存储和回放语音信号是信息的重要形式, 语音信号处理有着广泛的应用领域,而语音压缩在语音信号的传输、存储等方面有非常广泛的作用,而且在通信领域中已经有较成熟的发展和广泛应用。本设计要求采用DSP及其A/D、D/A转换器进行语音信号的压缩、存储和回放。1.设计要求及目标基本部分:(1)使用DS
2、P实现语音压缩和解压缩的基本算法,算法类型自定,例如可以采用G.711、G.729等语音压缩算法。(2)采用A/D转换器从MIC输入口实时采集语音信号,进行压缩后存储到DSP的片内和片外RAM存储器中,存储时间不小于10秒。(3)存储器存满之后,使用DSP进行实时解压缩,并从SPEAKER输出口进行回放输出。(4)使用指示灯对语音存储和回放过程进行指示。发挥部分:使用多种算法进行语音的压缩、存储和解压缩,比较它们之间的优缺点。2.设计思路 语音信号的幅度(发音强度)并非均匀分布,由于小信号占的比例比大信号大很多,因此可以进行非均匀量化。达到这一目标的基本做法是,对大信号使用大的量化间隔,而小信
3、号则使用小的台阶。ITU-T G.711建议的PCM A律和律语音压缩标准可以分别将13比特和14比特压缩为8比特,达到语音压缩的目的。3.设计内容1使用DSP实现语音压缩和解压缩的基本算法,算法类型采用G.711的a律压扩算法。2采用A/D转换器从MIC输入口实时采集语音信号,进行压缩后存储到DSP的片内RAM存储器中,存储时间约为10秒。3但采样数据达到规定次数后,使用DSP进行实时解压缩,并从SPEAKER输出口进行回放输出。4使用DSK板的指示灯对语音存储和回放过程进行指示:循环闪烁:板子自检,程序开始LED0亮:录音(10秒钟左右)LED0灭:放音二 算法原理1实验原理分析如下:语音
4、信号的幅度并非均匀分布,由于小信号占的比例比大信号大得多,因此可以进行非均匀量化。达到这一目标的基本做法是,对大信号是用大的量化间隔,而小信号则是用小的量化间隔。ITU-T G.711建议的PCMA律A律语音压缩标准可以分别将13位和14位的线性语音压缩编码压缩为8位,达到语音压缩的目的。在主程序中通过A/D抽样量化,可以得到16位的线性编码,再由编码表通过16位线性编码,再由编码表通过软件计算得到8位A律编码。将8位的压缩结果存储到系统RAM中进行缓存,根据抽样率、语音存储时间以及系统RAM的容量设置语音存储缓冲区的大小,待采样达到一定次数后,将缓存区内的数据进行解压缩,然后输出到SPEAK
5、ER接口输出端。2相关理论知识准备:(1)DSK系统基本结构:5402 DSK主要包括100MHz VC5402 DSP,1个软件等待周期的64K字的外部SRAM存储器,256K字的FLASH存储器,内嵌的并口仿真器,模拟输入/输出音频接口,以及扩展板接口。其结构如下图:DSK的主要硬件资源包括:DSP主芯片1枚:100 MHz TMS320VC5402 DSPRAM 1枚:1个软件等待的64K16bit的SRAM(CY7C1021V33)FLASH 1枚:256K16bit 的 FLASH存储器(AM39VF400A)接口2个:用于仿真的JTAG测试总线控制器 和一个连接到PC机并口的主机端
6、接口HPI信号采集和输出端口:麦克风/耳机音频接口 下面分别介绍:aDSP芯片DSK 支持TMS320VC5402 DSP,工作频率可以高达100MHz,工作的内核电压为1.8V,I/O 电压为3.3Vb外部数据存储器DSK提供了64字SRAM。可以使用的外部数据存储器的大小取决于DROM 的设置。如果DROM0,那么0x40000xFFFF(48K words)的空间是外部存储器(FLASH 或SRAM)。如果DROM1,外部存储器只能使用0x40000xEFFF。是否可以访问板上或扩展板存储器取决于DMSEL 控制寄存器位。如果DMSEL0(缺省),那么可以使用板上的数据存储器。如果DMS
7、EL1,那么可以使用扩展板存储器,并且地址开始于0x8000。数据存储器空间资源也取决于MP/MC 状态。c外部程序存储器DSK提供了256K字的FLASH。外部程序存储器的可用大小取决于OVLY 位的设置和MP/MC# 跳线的设置。如果 OVLY位0 、MP/MC#0,那么程序存储器的空间0x00000xEFFF(60K words)映射到外部存储器,是FLASH 还是SRAM 决定于控制寄存器的FLASHENB 状态位。在上电状态,FLASHENB位置位是为了允许从FLASH 引导。然后软件清除此位,使具有1个等待状态的SRAM 使用这个相同的存储器空间。如果MP/MC = 1 并且 OV
8、LY = 0,那么0x00000xFFFF 空间是分配给外部存储器( FLASH 或SRAM )。使用 FLASH 存储器的情况下(FLASHENB=1),总线的速率为100MHz,访问FLASH需要7个等待状态。在SRAM 情况下(FLASHENB=0),总线速率为100MHz 时,访问SRAM需要1 个等待状态。如果MP/MC = 1并且OVLY = 1,则只有x40000xFFFF 是映射到外部存储器的。dI/O空间存储器I/O空间由2部分组成,一部分是系统基于CPLD的控制空间,另一部分是扩展板存储器空间。DM_SEL位是外部存储器存取控制寄存器位,能够控制I/O空间的访问。如果DSP
9、向此位写1,那么扩展板存储器的I/O空间是不能被访问的。如果向此位写0,那么扩展板存储器的I/O空间可以被访问。 e模拟输入/输出音频接口音频接口使用了2 个标准的3.5mm 的连接器:一个连接麦克风(J5)的音频输入一个连接耳机(J6)的音频输出麦克风的输入信号最大允许标准是500mVp。在DSK上有10dB前置放大器增益。当接入信号源的输入时,需要使用隔直电容(0.1u)。音频输入可以编程控制,在软件的控制下,可以提供0dB、+6dB、+12dB的增益。音频输出也是可以编程控制的,在软件的控制下,可以提供0dB、-6dB、-12dB的增益。DSK板上使用了AD50 CODEC作为A/D和D
10、/A的转换设备。它是内部集成了16位的A/D和D/A转换器以及抗混叠滤波器,采样速率最高可达22.05kHz。 此外,ADC之后有一个抽取滤波器以提高输入信号的信噪比,在DAC之前有一个插值滤波器以保证输出信号平滑输出。 AD50与DSP芯片通过同步串行通信接口(MCBSP1)相连。(2)TLC320AD50C的内部结构及初始化程序TLC320AD50C是TI公司生产的一个SIGMA-DELTA型16位串行A/D、D/A转换电路。采样速率可通过DSP编程来设置,最高可达22.05 kHz。内含抗混叠滤波器和重构滤波器。在DAC之前有一个插值滤波器:保证输出信号平滑,在ADC之后有一个抽取滤波器
11、:提高输入信号的信噪比A/D、D/A转换器的初始化编程:/* 获取设置A/D和D/A的句柄 */hHandset = codec_open(HANDSET_CODEC);/* 设置CODEC的工作参数 */* DAC和ADC工作在15+1bit模式 */codec_dac_mode(hHandset, CODEC_DAC_15BIT); codec_adc_mode(hHandset, CODEC_ADC_15BIT);/* ADC模拟增益设置为6dB */ codec_ain_gain(hHandset, CODEC_AIN_6dB); /* 设置DAC模拟输出增益为-6dB */codec
12、_aout_gain(hHandset, CODEC_AOUT_MINUS_6dB);/* 设置抽样频率为8KHz */codec_sample_rate(hHandset,SR_8000);(3)McBSP的结构及寄存器部分配置McBSP:多通道缓冲串行口(Multi-channel Buffered Serial Port),是串行口的一种。它既可以利用DSP提供的DMA功能实现自动缓存功能,又可以实现时分多路通信功能。TMS320C5402有两个McBSP串口,分别为McBSP0、McBSP1。McBSP由引脚、接收发送部分、时钟及祯同步信号产生、多通道选择以及CPU中断信号和DMA同步
13、信号组成。引脚中我们用到的只有两个: DR和DX,通过这两个引脚实现DSP与外部设备的通信和数据交换。DR用来接收数据,DX完成数据的发送。这两个引脚分别对应两个寄存器DRR和DXR,如果准备就绪,从这两个寄存器中就可以读取数据了。(注:两个McBSP串口,所以两个寄存器分别用DRR1、DXR1、 DRR2、DXR2表示)那么如何判断接收器和发送器是否准备就绪呢?这就采用了SPCR1、SPCR2控制位来判断。当RRDY=0时,接收器未就绪;当RRDY=1时,接受器就绪,可以从DDR1或2种读取数据。当XRDY=0时,发送器尚未就绪;当XRDY=1时,发送器就绪,可以从XDR1或2种发送数据。所
14、以在实际实验中我们采用以下语句命令:a接收数据时while (!MCBSP_RRDY(HANDSET_CODEC) ; /查询、等待接收handset处的采样data = *(volatile u16*)DRR1_ADDR(HANDSET_CODEC); /从handset处读取采样b发送数据时while (!MCBSP_XRDY(HANDSET_CODEC) ; *(volatile u16*)DXR1_ADDR(HANDSET_CODEC) = data1;/a律解压完成后,DSP将数据通过串行口McBSP1发送(4)均匀量化、非均匀量化如果采用相等的量化间隔对采样得到的信号作量化,那么这
15、种量化称为均匀量化。均匀量化就是采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化,如图2所示。均匀量化PCM就是直接对声音信号作A/D转换,在处理过程中没有利用声音信号的任何特性,也没有进行压缩。该方法将输入的声音信号的振幅范围分成个等份(B为量化位数),所以落入同一等份数的采样值都编码成相同的B位二进制码。只要采样频率足够大,量化位数也适当,便能获得较高的声音信号数字化效果。为了满足听觉上的效果,均匀量化PCM必须使用较多的量化位数。这样所记录和产生的音乐,可以达到最接近原声的效果。当然提高采样率及分辨率后,将引起储存数据空间的增大。 PCM的编码规律PCM: Pulse Code
16、Modulation 脉冲编码调制,一般速率为64kbps,是指对语音信号直接采样量化的一种编码办法,采样速率为8000Hz,每样点用8bit表示。CD 用16bit 44.1kHz采样的PCM。 数字电话用的也是PCM,PCM是非线性编码,根据G.711建议,编码结束后需要做偶数位翻转。即如果编码后结果是 0110 1001 则在发送的时候需要经过偶数位翻转得到: 0011 1100 。PCM码的压缩分a律u律,在中国使用a律。PCM码有很多种,网络上主要有4种:MANCHESTER码,差分Manchester码,AMI码,HDB3码,2B1Q码。分别用于以太网,ISDN,DDN,电话。A律
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DSP 课程设计 实验 报告 语音 压缩 存储 回放
链接地址:https://www.31ppt.com/p-2392019.html