【教学课件】第三讲语音合成概述.ppt
《【教学课件】第三讲语音合成概述.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第三讲语音合成概述.ppt(31页珍藏版)》请在三一办公上搜索。
1、第三讲 语音合成概述,背景目标基本问题技术历程典型系统,第三讲 语音合成概述,背景目标基本问题技术历程典型系统,背景,计算机的普及人机自然语言交互语音合成在人机交互系统中的作用语音合成的其它应用,第三讲 语音合成概述,背景目标基本问题技术历程典型系统,目标,“让计算机像人一样说话”从文字到语音TTS(Text-To-Speech)从概念到语音CTS(Concept-To-Speech)从意念到语音ITS(Intention-To-Speech)现阶段-TTS前瞻性-CTS等待时机-ITS,第三讲 语音合成概述,背景目标基本问题技术历程典型系统,基本问题,原因从语音到文字的信息缺失从文字到语音(
2、TTS)从文字到发音描述发什么音如何发音从发音描述到语音合成,第三讲 语音合成概述,背景目标基本问题技术历程典型系统,技术历程,1937,Voder,Bell Lab.,H.Dudly1962,级联共振峰,KTH,G.Fant1970s,混合共振峰,MIT,D.Klatt1986,PSOLA,F.Charpentier2000s,Unit-selection,N.Campbell&A.Black,技术历程,1937,Voder,Bell Lab.,H.Dudly1962,级联共振峰,KTH,G.Fant1970s,混合共振峰,MIT,D.Klatt1986,PSOLA,F.Charpentie
3、r2000s,Unit-selection,N.Campbell&A.Black,音色,孤立音段音色,孤立音段音色,孤立词音色、韵律,语句韵律,语句,第三讲 语音合成概述,背景目标基本问题技术历程典型系统,典型系统,基于单元挑选的TTS系统构成(韵律导向)两个模块前端:文本处理,从文字到发音描述后端:语音处理,从发音描述到语音合成一个接口,发音描述数据库,合成单元,典型系统,例:北京交通大学成立于1896年。Text Normalization:北京交通大学成立于1896年,典型系统,例:北京交通大学成立于1896年。Text Normalization:北京交通大学成立于1896年Parse
4、r:北京(npr)交通(ng)大学(ng)成立(vgo)于(pg)1896年(t),POS(Part Of Speech),典型系统,例:北京交通大学成立于1896年。Text Normalization:北京交通大学成立于1896年Parser:北京(npr)交通(ng)大学(ng)成立(vgo)于(pg)1896年(t)Prosodic Event:OutPut PWord Layer:北京 ng 交通 ng 大学 ng 成立于 vg_pg 一八九六年 tOutPut PPhrase Layer:#北京交通大学#成立于#一八九六年OutPut IPhrase Layer:#北京交通大学成立
5、于一八九六年OutPut Sentence Layer:#北京交通大学成立于一八九六年,典型系统,例:北京交通大学成立于1896年。Text Normalization:北京交通大学成立于1896年Parser:北京(npr)交通(ng)大学(ng)成立(vgo)于(pg)1896年(t)Prosodic Event:OutPut PWord Layer:北京 ng 交通 ng 大学 ng 成立于 vg_pg 一八九六年 tPhonetizer:北 bei3 京 jing1(BL:北京)交 jiao1(BL:交通)通 tong1(BL:交通)大 da4(BL:大学)学 xue2(BL:大学)成
6、 cheng2(BL:成立)立 li4(BL:成立)于 yu2(BL:于)一 yi1(BL:一八九六年)八 ba1(BL:一八九六年)九 jiu3(BL:一八九六年)六 liu4(BL:一八九六年)年 nian2(BL:一八九六年),典型系统,例:北京交通大学成立于1896年。Interface:2 1 2%0 0 2%0 ng 2%0 ng 2%0 ng 2%0 0 0 2%0 vg_pg 2%0 0 0 2%0 t 2%0 0 1 2,典型系统,例:北京交通大学成立于1896年。Prosodic Acoustic Predictor:GMM(bei3)GMM(jing1)GMM(jiao1
7、)GMM(tong1)GMM(da4)GMM(xue2)GMM(cheng2)GMM(li4)GMM(yu2)GMM(yi1)GMM(ba1)GMM(jiu3)GMM(liu4)GMM(nian4)Segment Acoustic Predictor:occ(bei3)occ(jing1)occ(jiao1)occ(tong1)occ(da4)occ(xue2)occ(cheng2)occ(li4)occ(yu2)occ(yi1)occ(ba1)occ(jiu3)occ(liu4)occ(nian4),典型系统,例:北京交通大学成立于1896年。Prosodic Acoustic Predic
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 第三 语音 合成 概述

链接地址:https://www.31ppt.com/p-5661290.html