基于基音周期模型的语音识别.docx
《基于基音周期模型的语音识别.docx》由会员分享,可在线阅读,更多相关《基于基音周期模型的语音识别.docx(41页珍藏版)》请在三一办公上搜索。
1、基于基音周期模型的语音识别攀枝花学院本科毕业设计(论文) 摘要 摘要 基音周期是表征语音信号本质特征的参数,属于语音分析的范畴,只有准确分析并且提取出语音信号的特征参数,才能够利用这些参数进行语音识别处理。语音识别率的高低,都依赖于对语音信号分析的准确性和精确性,因此基音周期的研究在语音信号的处理应用中具有十分重要的作用。本论文通过两种算法在Matlab上实现基音周期的检测,分别是短时自相关函数法和短时平均幅度差函数法。通过实验得到的基音周期结果的分析来识别不同的人的语音信号。 论文首先介绍了语音基音检测算法在语音识别方面的研究背景极其重要意义。其次对现有的基音检测算法进行了归纳和总结,并详细
2、的介绍本文将用的两种基本基音检测算法的基本原理及实现。最后在Matlab上对语音信号进行基音周期的检测。 本设计为语音信号的基音周期检测,采集语音信号,对语音信号进行处理,区分清音浊音,并通过对采样值进行滤波、分帧、求短时自相关函数,得到浊音的基音周期。 关键词:预处理,基音检测,自相关函数法,平均幅度差函数法,基音轨迹 ,语音识别 I 攀枝花学院本科毕业设计 Abstract Abstract pitch is characterization parameters of speech signal characteristics, belongs to the category of sp
3、eech analysis, only the accurate analysis and extract the characteristic parameters of speech signal can use these parameters to speech recognition processing. voice recognition rate of high and low, are dependent on the accuracy of the analysis of speech signal and accuracy, so the pitch period of
4、the study on speech signal processing plays an important role in application.in this paper, through the two algorithm in Matlab pitch period detection, respectively is short-time autocorrelation method and short time average magnitude difference function method. Pitch period is obtained by the exper
5、iment results of speech signal analysis to identify the different people. The curriculum design of pitch detection of speech signals, speech signal, the speech signal processing, distinguish between the voiced and unvoiced speech has different samples values in the filtering, framing, asks the short
6、-time autocorrelation function, have voiced sound pitch period. The thesis first introduces the research background of speech pitch detection algorithm is very important. Next to the existing algorithm for pitch detection are summarized, and a detailed introduction to this article will use the two k
7、inds of basic pitch detection algorithm is the basic principle and realization. Finally in Matlab on speech signal pitch period detection. Keywords: pretreatment,pitch detection ,autocorrelation function; the average magnitude difference function method; pitch contrail,Speech recognition II 攀枝花学院本科毕
8、业设计 目录 目 录 摘要 . I Abstract . II 1 绪论 . 1 1.1引言 . 1 1.2基音周期检测对语音识别的意义 . 2 1.3基音周期检测现状 . 3 1.4论文的结构安排 . 4 2 基音检测常用的算法 . 5 2.1引言 . 5 2.2 常用的基音检测算法及其原理 . 5 2.2.1 自相关函数法 . 5 2.2.2 平均幅度差函数法 . 8 2.3 本章小结 . 10 3 基于Matlab基音周期的检测 . 11 3.1 语音文件的录制与读入 . 11 3.2 语音信号的采样和分帧 . 12 3.3 语音信号基音周期的检测 . 16 3.3.1 短时自相关函数法
9、检测基音周期 . 16 3.3.2 短时平均幅度差函数法检测基音周期 . 17 3.4 基音周期检测的后处理 . 19 3.5 滤波后的基音周期检测 . 23 3.6 本章小结 . 25 4 语音识别结果分析 . 26 5 展望与应用 . 30 附录 . 33 致 谢 . 39 攀枝花学院本科毕业设计 1 绪论 1 绪论 1.1引言 通过语言相互传递信息是人类最重要的基本功能之一。语言是人类特有的功能,它是创造和记载几千年人类文明史的根本手段,没有语言就没有今天的人类文明。同时语言又属于声学范畴,是相互传递信息最重要的手段,是人类最重要,最有效,最常用和最方便的交换信息的形式。语音中除了包含实
10、际发音内容的语音信息外,还包括发音者是谁及喜怒哀乐的各种信息。语音识别技术是一项集声学,语音学,计算机,信息处理,人工智能计算机接口的范畴。现在的电脑网络技术的普及和完善,对于语音信号处理技术发挥着越来越重要的作用。语音识技术是用来设计一种会听话的计算机,只要对着麦克风讲话,便可以指挥计算机动作,也就是要实现“芝麻开门”声控计算机的梦想,当然现在这已经不是梦想。语音信号处理的一系列技术及其应用已经成为信息社会中不可或缺的组成部分,促进了信息社会的发展。语音信号中的情感信息是一种很重要的信息资源,它是人们在感知事物时的一种独特的信息,就比如,虽然是同样的语音内容,不同的人就会表现出不同的情感,也
11、会有不用的意思。在听别人说话时,不仅要听还要看,这些语音特征在研究时很重要的。语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,它是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科,其中包括语音识别只是其中的一个分支。但其前提和基础是对语音信号的分析,语音识别率的高低取决于对语音信号分析的准确性和精度。只有将语音信号分析成其本质的特性参数,才能建立用于识别的模板或知识库。语音信号处理和认知科学、心理学、语言学、计算机科学、模式识别和人工智能等学科联系紧密。 基音周期检测也称为基频检测(Pitch Detection) ,它的目标是找出和声带振动频率完全一致的基音
12、周期变化轨迹曲线,或者是尽量相吻合的轨迹曲线。基音频率的检测和共估值在语音编码,语音合成和语音识别中有着广泛的应用。它的准确性及实时性对系统起着非常关键的作用,影响着整个系统的性能。 因为清音信号没有周期性,所以就将浊音信号的周期称为基音周期, 它是声带振动频率的倒数。基音检测是语音处理中的一项重要技术之一, 也是语音处理中最困难的工作之一,而且是语音处理领域最具挑战的任务之一。着眼于基音的检测方法,开展了一下三个方面的研究:1)稳定并提取准周期性信号的周期性方法;2)因周期混乱,采取基音提取误差补偿的方法;3)消除声道影响的方法。在基音提取时,容易错误的提取真正基频两倍的频率和基频一 1 攀
13、枝花学院本科毕业设计 1 绪论 半的频率,至于产生哪种错误随抽取方法而变化,本论文中会介绍两种比较好的算法来进行基音检测。 要准确地提取语音信号的特征参数,对语音信号的处理分析很重要。因此,表征语音特征参数的获取,是利用它们进行准确语音识别的关键。在这些参数中,基音周期的提取显得更重要些,其提取的准确与否直接影响到语音识别是否真实再现原始语音信号的频谱。 1.2基音周期检测对语音识别的意义 基音周期是语音信号最重要的参数之一,它描述了语音激励源的一个重要特征。基音周期是指发浊音时声带震动所引起的周期运动时间间隔。语音信号是十分复杂的非平稳信号,它不仅包括语义信息,还有个人特征信息,对于语音信号
14、特征参数的研究是语音识别的基础。特征参数应能完全,准确地表达语音信号,那么特征参数也应能完全,准确地表达语音信号所携带的全部信息。实验语音学给出的语音信号的特征参数本质上讲是客观,合理的,存在的问题是不够完全。仅对元音的特征进行了深入的研究,辅音的领域就比较薄弱,最难的元辅音的过渡就更是空白,但偏偏这一部分所含的信息量大,最难处理的。准确可靠的对基音周期进行检测将直接影响整个语音处理系统的性能。声带的声学功能是为语音提供主要的激励源,由声带的振动产生声音,是形成声音的基本声源。根据声带是否震动可以将语音信号分为清音跟浊音两种。语音由声带震动或不经声带震动来产生,其中由声带震动产生的音统称为浊音
15、,而不由声带震动产生的音统称为清音。携带者语言中大部分的能量,浊音在时域上呈现出明显的周期性。发浊音时,气流通过声门使声带产生张弛震荡式振动,产生准周期的激励脉冲串。这种声带振动的频率称为基音频率,相应的周期就成为基音周期。在基音检测的方法中,对每帧语音信号只进行一次清浊判决,若判决为浊音,则以基音周期间隔的脉冲序列作为该帧的激励信号;若为清音,则以随机噪音作为该帧的激励信号,实际中,清浊信号的过渡段是很难区分的,且激励信号也常常含有类噪音成分,很难以帧加以区分。 基音周期与先天个人的声带条件还有后天的个人说话习惯都有关系,在很大程度上反应了个人的语音特征。语音信号还是随着一些因素在变化的,男
16、人声音低,就基音频率低,女基音频率还跟随着人的性别、年龄不同而有所不同。一般来说,男性说话者的基音频率较低,大部分在70200Hz的范围内,而女性说话者和小孩的基音频率相对较高,在200450Hz之间。 2 攀枝花学院本科毕业设计 1 绪论 基音周期的估计称谓基音检测,基音检测的最终目的是为了找出和声带振动频率完全一致或尽可能相吻合的轨迹曲线。 基音是指发浊音时声带震动所引起的周期性,基音周期是指声带震动频率的倒数。基音周期信息的应用很广发,如:语音识别,说话人识别,语音分析与综合以及低码率语音编码,发音系统疾病的诊断,听觉残障者的语言指导等。汉语是一门讲声调的语言,基音周期的变化恰好就是声调
17、,它携带的信息的辨别作用很重要,具有区别功能,声调对于汉语语音的理解极为重要。在使用汉语进行谈话时,我们可以说话人的语调来了解其中的意思,也可以是用元音和辅音来辨识说话人的意思,但是,由于汉语中常常会出现多音字,就是一个字它有不同的读音和不同的意义,所以,能够准确并且可靠地进行基音周期检测对汉语语音信号的处理相当重要,同时对于语音识别有十分重要的意义。 1.3基音周期检测现状 自从进行语音信号分析研究以来,基音检测一直是一个重点研究的课题。基音周期是声带震动频率F0的倒数,对于语音产生的数字模型中激励源来说,也是一个重要参数。虽然目前基音检测的方法有很多种,但是这些方法都有其局限性。到目前为止
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 基音 周期 模型 语音 识别
链接地址:https://www.31ppt.com/p-3385142.html