语音数据与语音合成.ppt
《语音数据与语音合成.ppt》由会员分享,可在线阅读,更多相关《语音数据与语音合成.ppt(44页珍藏版)》请在三一办公上搜索。
1、,语音音库与合成江源2009-6-11,语音合成技术,什么叫语音合成Text To Speech过程,简称TTS作用:将文本状态的文字信息转化为可听的声音信息“电脑会说话”,发声机理,语音产生的生理过程,总纲,1.数字语音信号2.语音合成技术3.数据制作与合成4.合成效果测听,数字语音信号,什么是数字语音信号语音:说话,声波传递的语言语音信号:记录下来的声波振动模拟语音信号:(磁带,唱片)数字语音信号:模拟信号数字化(wav mp3 CD)-计算机应用的需要如何数字化取样:采样率(时间尺子,8K,16K,44K,每秒样点数量)量化:量化精度(幅度尺子,16bit,-3276732768范围),
2、数字语音信号,取样和量化,数字语音信号,波形不能说明内容,数字语音信号,频域介绍一段任意波形可以由一系列正弦波形组合而成离散傅里叶变换数学表示:最高值,采样率的一半(16K wav;max freq=8K Hz)人可听辨的频率范围:(20Hz 20kHz)电话语音信道的频率范围(60Hz 3400Hz),数字语音信号,语谱图,数字语音信号,清音和浊音浊音:声带的快速振动,声带能够将稳定气流转换成振动振动频率称为基频,准周期性清音:紊乱气流,肺部气流通过声道中的狭窄处产生爆破音:突然爆破,数字语音信号,声学特征如此杂乱多变的信号,如何描述,如何恢复?语音信号产生的数字模型(源-滤波器模型),数字
3、语音信号,声学特征基频:发浊音时声带振动引起的周期变化,我们听感音调高低主要由基频决定,中文声调还用于区分语义谱参数:描述声道和口唇辐射共振峰,LPC,倒谱参数,总纲,1.数字语音信号2.语音合成技术3.数据标注与合成4.合成效果测听,语音合成技术,主流技术路线基于统计规则的大语料库拼接语音合成系统基于HMM的参数语音合成系统基于HMM的语料库拼接语音合成系统两条道路:要么是波形切分再拼合起来,要么是声学参数转化出来,语音合成技术,基于统计规则的大语料库拼接语音合成系统传统大语料库合成,InterPhonic 5.0之前单元挑选波形拼接超大规模音库制作语料设计,音库录制,精细切分,韵律标注规则
4、统计,针对不同发音人的细致调整优点:音质最佳,正常句子的自然度也很好缺点:非常依赖音库的规模大小和制作质量,存在一定稳定性问题,不能应用在小型设备中样例:,输入文本,拼音信息和韵律结构信息,每个单元将取多个候选s1 s2 s3 s4,目标代价挑选候选单元,词典等文本分析知识,大规模语音库,再考虑连接代价决定最后选定单元s1 s2 s3 s4 s5 s6,输出语音,语音合成技术,InterPhonic系统处理流程,语音合成技术,基于HMM的参数语音合成系统首先进行语音特征参数的提取以音素为单位(中文为声韵母),使用HMM(Hidden Markov Model)对自然语流的频谱特征参数进行建模采
5、用基于决策树的聚类方法对上下文相关模型进行聚类,以提高模型的鲁棒性,得到预测参数最后生成参数输入合成器,得到合成语音优点:所需音库规模小,标注精度要求相对降低,自然度高,系统小,灵活度高,ViviVoice,AiSound缺点:音质相对较差,带有合成器风格样例:,语音合成技术,参数语音合成系统框架,语音合成技术,HMM参数建模用声学参数针对音素建模为什么要建模?描述的音素特征变化隐马尔科夫模型(Hidden Markov Model-HMM),语音合成技术,决策树模型聚类有了模型怎么使用?来一句话怎么预知用哪个模型?基于上下文的信息的决策树聚类,语音合成技术,基于HMM的语料库拼接语音合成系统
6、利用HMM目标模型和连接模型来指导单元挑选结合参数训练模型的数学统计模型优势和波形拼接的高音质,相对以前的大语料库技术在自然度上有较大提升自主原发,意义重大优点:拥有明确目标和度量准则,音质好,自然度高,系统搭建自动化程度高,InterPhonic 5.5以上版本缺点:仍然需要很大规模的语料库,计算量较大样例:,语音合成技术,基于HMM的单元挑选系统结构图,总纲,1.数字语音信号2.语音合成技术3.数据制作与合成4.合成效果测听,数据制作与合成,数据与合成的关系音库数据是合成系统的基石,离开了音库谈合成就是“无源之水 无本之木”一份音库的制作质量,直接决定了该发音人合成系统的能达到什么效果,数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 数据 合成

链接地址:https://www.31ppt.com/p-5841497.html