欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    音频信息及处理.ppt

    • 资源ID:6233506       资源大小:381.50KB        全文页数:35页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    音频信息及处理.ppt

    7 数字音频和合成音乐,陈乐,声音也许是世界上中最动人心弦的元素。任何的语言都离不开声音;尤其是那些悦耳的音乐,能深深触动人们内心的情感,带来美妙的感受。能否利用好声音,是一件多媒体作品成败与否的重要因素,本章中我们就来学习一下数字化的声音。,春江花月夜,一、数字音频基础什么是声音、声音信号的特征声音信号的数字化、音频文件的格式二、电子合成音乐(MIDI)MIDI和WAVE的比较、MIDI演奏、WAVE转MIDI三、数字音频的编辑和处理如何压缩和转换声音格式如何在电脑上录音、如何编辑声音四、语言合成和语音识别技术,第七章 数字音频和合成音乐,7.1.1 什么是声音?,声音:当空气中某物体通过前后位移产生振动,它将引起压力波,当它到达人耳时,我们会感受达到这种压力的变化(振动),这就是声音。,一、数字音频基础,音频是一种连续变化的模拟信号,可用一条连续的曲线来表示,称为声波。因声波是在时间和幅度上都连续变化的量,我们称之为模拟量。下面用声音录制软件记录的英文单词“Hello”的语音波形,一、数字音频基础,模拟音频信号有两个重要参数:频率和幅度。声音的频率体现音调的高低,声波幅度的大小体现声音的强弱。一个声源每秒钟可产生成百上千个波,我们把每秒钟波峰所发生的数目称之为信号的频率,单位用赫兹(Hz)或千赫兹(kHz)表示。信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大,声音越强。对音频信号,声音的强度用分贝(dB)表示,分贝的幅度就是音量。,模拟音频信号的两个重要参数,一、数字音频基础,7.1.2 声音的频率和幅度,多媒体技术处理的声音主要是人耳可听到的2020kHz的音频信号。言语(speech)/语音:人说话的声音,其频率范围约为3003400Hz全频带声音:音乐声、风雨声、汽车声等其他声音,其带宽可达到2020kHz,一、数字音频基础,声音信号的数字化:将模拟声音信号转换成数字编码形式以便于计算机进行处理的过程声音信号数字化的过程:取样量化编码,7.1.3 声音信号的数字化,一、数字音频基础,声音信号的数字化(动画),模拟声音信号,取 样,量 化,编 码,数字声音,声音信号的数字化,一、数字音频基础,取样频率:44.1kHz量化位数:16Bit声道数目:Stereo或Mono数码率(bit rate):指的是每秒钟的数据量,也称比特率、码率,波形声音的主要参数,一、数字音频基础,码率采样频率量化位数声道数 单位:bit(位)/秒 1Byte8bit,课堂习题:,例:已知数字激光唱盘(CD Audio)的标准采样频率为44.1 kHz,量化位数为16 位,立体声。请问一分钟 CD-DA 音乐所需的存储空间为多少?,码率采样频率量化位数声道数时间(单位)44.1kHz 16 b260 s 84672 kb 10584 kB 10.3 MB,一、数字音频基础,做一做,想一想,一个256M的MP3播放器能够储存采样频率为44.1KHz、16位、立体声的WAV音乐多长时间?一张650M的CD光盘一般有几首歌?一个512M的MP3可以储存几首MP3音乐?,一、数字音频基础,几种常见数字声音的主要参数,一、数字音频基础,7.1.4 音频格式介绍1,CDA 是CD Audio的缩写。音乐光碟片里面的音乐格式,是音乐CD片最常用的档案格式WAV波形声音文件,是最早的数字音频格式,可以精确记录各种声音但WAV格式对存储空间需求太大,不便于交流和传播,一、数字音频基础,7.1.4 音频格式介绍2,MP3 由WAV文件经压缩而来,音质略低于CD和WAV格式,但这种差异用耳朵难以分辨。压缩比1:10WMA 音质可以与MP3相比,而大小只有MP3格式的一半,也适用于网络,音质要好于RA格式。RA 适用于网络的“流式文件”,可一边下载一边播放,压缩比达 1:96,文件比MP3格式小,只是音质较差。,一、数字音频基础,7.1.4 音频格式介绍3,MIDI 存储的不是声音信号,而是各种乐器的发音命令,播放时系统根据这些命令合成乐曲,midi文件的优点是非常小。,一、数字音频基础,走进MIDI的世界,7.2 电子合成音乐MIDI,MIDI和WAVE的比较电子合成音乐(MIDI)的原理MIDI与WAVE的相互转换,7.2.1 MIDI和WAVE的比较,长度:3分30秒,长度:3分30秒,二、电子合成音乐MIDI,7.2.2 电子合成音乐(MIDI)的原理,二、电子合成音乐MIDI,MIDI(Musical Instrument Digital Interface)采用音乐符号记录和解释乐谱,并合成相 应的音乐。MIDI不是把音乐的波形进行数字化采样和 编码,而是将数字式电子乐器的弹奏过程记录 下来,如按键、力度、时间多度等等。当需要 播放这首乐曲时,根据记录的乐谱指令,通过 音乐合成器生成音乐声波,经放大后由扬声器 播出。,7.2.2 电子合成音乐(MIDI)的原理,二、电子合成音乐MIDI,FM(Frequency Modulation)合成 通过硬件产生正弦信号,再经处理合成音乐。一般声卡采用的方式,音色与硬件有关,音 色较单薄,波形表(Wavetable)合成 专业声卡采用的方式。在声卡的ROM中预 存各种实际乐器的声音采样,通过调用相应的 实际声音数据合成乐音。ROM存储器的容量越 大,合成的效果越好。,7.3 数字音频的编辑和处理,如何转换音频文件的格式StreamBox Ripper MP3工具包(toolkit)如何在电脑上录音电脑Mic的使用Windows录音机专业音频处理软件Cooledit,5.7.1.如何使用StreamBox Ripper转换文件格式,三、数字音频的编辑和处理,5.7.2 如何使用Mic录音,三、数字音频的编辑和处理,5.7.3 专业音频处理软件,GoldWaveCoolEditAdobe Audition,三、数字音频的编辑和处理,基本编辑操作声音的剪辑(删除、移动或复制一段声音,插入空白等)声音音量调节(提高或降低音量,淡入、淡出处理等)声音的反转、消除噪音声音的效果处理包括混响、回声、和声效果、动态效果、升降调、颤音等格式转换功能,声音编辑软件的功能,三、数字音频的编辑和处理,Cooledit软件功能及界面简介 多轨音频编辑软件,最多可支持128个音轨,能高质量地完成录音、编辑、合成等多种任务,三、数字音频的编辑和处理,CoolEdit音频处理实验,1、安装CoolEdit2.0 Pro2、从网上下载一首歌曲和配乐(MP3格式)。3、将歌曲和配乐插入的音轨14、在音轨2中录下自己的声音5、单独编辑音轨2,去除噪音(效果噪音消除降噪器)。6、通过“效果变调/变速变速器”试听自已的声音升高和降低音调以后的效果。7、返回多轨界面,校正音轨2使其与音轨1同步。8、对前后进行剪切后,将前2轨混缩到第3轨,将第3轨另存为码率为64kbps的MP3,改文件名后提交。,三、数字音频的编辑和处理,作业范例,5.4.1 语音合成,语音合成(Speech synthesis):根据语言学和自然语言理解的知识,使计算机模仿人的发声,自动生成语音的过程。目前主要是按照文本(书面语言)进行语音合成,这个过程称为文语转换(Text-To-Speech,简称TTS)。文语转换过程文本分析韵律分析语音生成,语音合成,文语转换过程,对计算机合成的语音希望能达到的要求:发音清晰可懂语气语调自然说话人可选择语速可变化等,语音合成,计算机合成语音的应用:股票交易、航班动态查询、电话报税等业务有声E-mail服务CAI课件或游戏解说词的自动配音文稿校对、语言学习、语音秘书、自动报警、残疾人服务等,语音合成,语音合成技术演示,中文(科大讯飞)英文http:/demos/http:/http:/demos/,语音输入技术演示,IBM ViaVoice(中文)Scansoft Drangon Naturally Speaking,音效库(推荐),http:/(国外),内容回顾:计算“金色的麦田-窦鹏.mp3”压缩前的大小?,码率采样频率量化位数声道 44.1kHz16bit2 1411kb/s(176.4kB/s)文件大小码率 时间长度 176.4*(3*60+41)kB=37.9 MB,

    注意事项

    本文(音频信息及处理.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开