毕业设计(论文)基于MATLAB的语音共振峰的估计.doc
《毕业设计(论文)基于MATLAB的语音共振峰的估计.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)基于MATLAB的语音共振峰的估计.doc(16页珍藏版)》请在三一办公上搜索。
1、题 目: 基于MATLAB的语音共振峰的估计 英文题目: MATLABBASED ESTIMATES OF FORMANTS 院 系: 电子工程学院 专 业: 通信工程 姓 名: 年 级: 二零零六级 指导教师: 二零零九年十二 月 摘要语音是人类相互之间进行交流时使用最多最自然最基本也是最重要的信息载体在高信息化得今天,语音处理的一系列技术及其应用几经成为信息社会部可或缺的最重要组成部分。语音编码算法利用语音信号的冗余信息及某些人耳不敏感的信息,可以在低比特率上获得较高质量的重建语音,压缩编码一直是通信中的关键技术。语音信号研究者们一直在寻求一种在保持语音质量不显著下降的情况下使语音信号的编
2、码比特率最小的方法,特别地,低比特率语音编码体制(比特率在4.8 kbs以下)因其广泛的需求而得到研究者的重视。语音编码器的性能常常用比特率、延时、复杂度和质量4个属性来进行衡量,因此,在分析语音编码器的性能时,主要应该考虑这些属性。值得注意的是,这些属性之间不是孤立的,而是相互紧密联系的,例如,低比特率的编码器一般比高比特率的编码器有更大的延时、更高的算法复杂度和较低的语音质量。因此在对各种编码算法进行取舍时,应根据实际应用环境,在这些属性之间进行权衡。 共振峰参数编码算法在低码率的音频编码中应用越来越广泛。与基于时域波形的压缩算法相比,他在传输的过程中只需要传输构造信号所用的基频和共振峰参
3、数,因此可以大大地降低传输的码率,实现低码率下的多媒体通信。而且,基于共振峰参数的算法无须严格限制信号的结构,他可以灵活地描述音频信号的特征。这一灵活性决定了基于共振峰参数的算法,可以满足对音频信号进行方便访问和控制的需要。关键字:共振峰 线性预测 ABSTRACTThe human voice to communicate with each other using the most natural and the most fundamental and most important information carriers in high-information that today,
4、a series of voice processing technology and its application several times in the information society available to the Department or the lack of the most important component of the . Speech coding algorithm using speech signals redundant information and some peoples ears are not sensitive information
5、, you can gain at low bit-rate reconstruction of a high-quality voice compression coding has been the communication of key technologies. Speech Signal researchers have been looking for a way to maintain voice quality in asignificant decline in the case of voice signals in the smallest bit rate codin
6、g methods, in particular, the low bit rate speech coding system (bit-rate of 4.8 kb / s or less) because of its wide range of demands to be researchers attention. The performance of speech coding devices often use bit rate, delay, complexity and quality of the four attributes to measure, therefore,
7、in analyzing the performance of speech coder, the main consideration should be given these attributes. It is noteworthy that among these attributes are not isolated, but closely interrelated, for example, low bit rate encoder in general than high bit-rate encoder greater delay, higher algorithm comp
8、lexity and the lower voice quality. Therefore, various coding algorithms to choose should be based on the actual application environment, in the trade-off between these attributes. Formant parameter coding algorithm at low bit-rate audio coding more and more widely applied. Time-domain waveform base
9、d on the compression algorithm, the process of transmission, he need only transmit the signal structure used for the base frequency and formant parameters, it can greatly reduce the transmission rate, low bit-rate multimedia communication. Moreover, the algorithm based on formant parameters do not s
10、trictly limit the signal structure, he has the flexibility to describe the audio signal characteristics. This flexibility determines the parameters of formant-based algorithms, to meet the audio signal to facilitate access and control needs. KEY WORDS:第一章 语音信号处理基础1.1语音信号处理概述 语音编码算法利用语音信号的冗余信息及某些人耳不敏
11、感的信息,可以在低比特率上获得较高质量的重建语音,压缩编码一直是通信中的关键技术。语音信号研究者们一直在寻求一种在保持语音质量不显著下降的情况下使语音信号的编码比特率最小的方法,特别地,低比特率语音编码体制(比特率在4.8 kbs以下)因其广泛的需求而得到研究者的重视。 语音编码器的性能常常用比特率、延时、复杂度和质量4个属性来进行衡量,因此,在分析语音编码器的性能时,主要应该考虑这些属性。值得注意的是,这些属性之间不是孤立的,而是相互紧密联系的,例如,低比特率的编码器一般比高比特率的编码器有更大的延时、更高的算法复杂度和较低的语音质量。因此在对各种编码算法进行取舍时,应根据实际应用环境,在这
12、些属性之间进行权衡。共振峰参数编码算法在低码率的音频编码中应用越来越广泛。与基于时域波形的压缩算法相比,他在传输的过程中只需要传输构造信号所用的基频和共振峰参数,因此可以大大地降低传输的码率,实现低码率下的多媒体通信。而且,基于共振峰参数的算法无须严格限制信号的结构,他可以灵活地描述音频信号的特征。这一灵活性决定了基于共振峰参数的算法,可以满足对音频信号进行方便访问和控制的需要。 1.2语音信号处理的发展及应用 1.3语音与常用的语音分析方法 1.3.1语音的基本特性 1.3.2常用语音信号分析方法 1.4 语音共振峰估计的现状 第二章语音共振峰估计技术2.1基础知识 在语音信号分析技术中,表
13、征语音信号主要特征的是两个最基本的语音参数,即共振峰和基频。通常,共振峰定义为声道脉冲响应的衰减正弦分量,在经典的语音信号模型中,共振峰等效为声道传输函数的复数极点对。对平均长度约为17cm 声道(男性) ,在3kHz 范围内大致包含三个或四个共振峰,而在5kHz 范围内包含四个或五个共振峰。高于5kHz 的语音信号,能量很小。根据语音信号合成的研究表明,表示浊音信号最主要的是前三个共振峰。一个语音信号的共振峰模型,只用前三个时变共振峰频率就可以得到可懂度很好的合成浊音。共振峰信息包含在语音信号的频谱包络中,谱包络的峰值基本上对应与共振峰频率。因此一切共振峰估计都是直接或间接地对频谱包络进行考
14、察,关键是估计语音频谱包络,并认为谱包络中的最大值就是共振峰。与基音提取,共振峰估计也是表面看很容易但实际上又为许多问题所困扰。包括:虚假峰值、共振峰合并、高基音语音。语音信号共振峰估计,在语音信号合成、语音信号自动识别和低比特律语音信号传输等方面都起着重要作用。 由于实际的语音是准周期信号和实际上是短时间信号的频率分析,其频谱序列不是周期性冲激函数序列的采样,而是近似三角脉冲的采样,所以其傅里叶变换的幅度谱呈现高频衰减性质。从图3中可以观察到频谱序列的幅度谱是周期信号和高频衰减信号的乘积。实际语音分析过程中各时刻频谱序列的傅里叶变换后衰减幅度差异很大,低频部分有时会出现分支脉冲的幅值大于下一
15、个周期主脉冲的幅值,这对信号周期地分辨产生一定的干扰,而无法准确估计基频值。所以本文在确定基频时利用高频部分衰减幅度差异较小的特点,分析其周期特性并用来计算语音基频。共振峰参数包括共振峰频率、频带宽度和幅值,共振峰信息包含在语音频谱的包络中。因此共振峰参数提取的关键是估计语音频谱包络,并认为谱包络中的最大值就是共振峰。利用语音频谱傅里叶变换相应的低频部分进行逆变换,就可以得到语音频谱的包络曲线。依据频谱包络线各峰值能量的大小确定出第1第4共振峰,如图1所示。图1 (根据频谱包络确定共振峰)2.2语音信号的倒谱分析 语音的产生模型实际是一个激励信号与声道冲激响应的卷积。对于浊音,激励信号可以有周
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 论文 基于 MATLAB 语音 共振 估计
链接地址:https://www.31ppt.com/p-3926496.html