多媒体音频处理技术.ppt
《多媒体音频处理技术.ppt》由会员分享,可在线阅读,更多相关《多媒体音频处理技术.ppt(52页珍藏版)》请在三一办公上搜索。
1、第4章 多媒体音频处理技术,4.2 音频编码技术,4.4 音频素材的编辑,4.1 音频技术简介,4.3 音频素材的获取,4.1 音频技术简介,4.1.1 数字音频基础,1声音 声音是一种由机械振动产生的波,叫声波。声音的强弱体现在声波振动的幅度大小上,音调的高低体现在声波振动的频率上,人们可以使用麦克风(话筒)把声波转换成电信号,即音频信号。音频信号是一种频率范围为20Hz20KHz的波形信号,它有两个基本的参数:频率和幅度。电压的幅度表示声音的强弱,频率表示声音的音调,它是一种在时间和幅度上都是连续的模拟信号。,4.1.1 数字音频基础,2数字音频,模拟音频信号主要有下述几点缺点:一、抗干扰
2、能力差二、噪声会累积三、无法使用计算机进行存储,不能在计算机网络中传输,4.1.1 数字音频基础,由于模拟音频信号存在上述难以克服的缺点,为了使人们能够获得更好的声音质量,更加便捷的处理方式,随着数字电子技术的发展,数字音频技术逐渐出现在音频应用的各个领域,并成为多媒体技术及应用的核心。音频是连续变化的模拟信号,而数字音频是一个数据序列,在时间上是断续的。把模拟音频信号通过采样和量化转换成用由许多“0”、“1”表示的数字信号,这个过程就是音频的数字化。在这一处理技术中,涉及到音频的采样、量化和编码。,1采样 模拟音频信号实际上是连续信号,或称连续时间函数x(t)。数字化时,必须先对连续信号采样
3、,即按一定的时间间隔(T)取值,得到x(nT)(n为整数)。T称采样周期,1/T称为采样频率,x(nT)是离散信号。虽然数字音频信号可以克服模拟音频的缺点,但是在播放声音的时候,数字音频必须重新还原为模拟音频,为了保证还原的音频信号不失真,数字化时采样频率必须满足采样定理的要求。采样定理:在进行模拟/数字信号的转换过程中,为保证还原后的信号不出现失真,采样频率至少是信号最高频率的2倍;采样定理又称奈奎斯特定理。常用的音频采样率有:8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz。,4.1.2 数字音频的采样、量化和编码,2量化 采样后的信号
4、x(nT),其幅值仍然是连续变化的数值,为了便于在计算机中处理,必须将取样值量化成一个有限个幅度值的集合x(nT)。量化的过程如下:量化器先将整个幅度划分成为有限个小幅度(量化间隔)的集合,把落入某个间隔内的样值归为一类,并赋予相同的量化值。量化间隔的数目,称为量化级。量化过程存在量化误差,在还原信号的D/A转换后,这种误差作为噪声再生,称为量化噪声。量化级数越多,量化误差就越小,质量就越好。增加量化级数能够把噪声降低到无法察觉的程度,但随着信号幅度的降低,量化噪声与信号之间的相关性变得更加明显。,4.1.2 数字音频的采样、量化和编码,3编码 编码是根据一定的协议或格式把模拟信息转换成二进制
5、比特流的过程。多媒体信息数字化的过程中,最简单的编码方式就是直接用量化后的二进制数作为输出的数字信号,这种编码方式也就是PCM(脉冲代码调制)编码。多媒体信息的一个特点是存在各种冗余信息,具有很大的压缩潜力。因为在多媒体数据中,存在着空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余统计冗余等,它们为数据压缩技术的应用提供了可能的条件。因此,在多媒体系统中可以采用数据压缩技术对数字信号进行压缩,在保证人的主观感受不变的前提下,使得存储的数据量大大下降。采用不同的压缩技术,也即采用了不同的编码技术。,4.1.2 数字音频的采样、量化和编码,4数字音频文件的存储量 以字节为单位,模拟波形声音被数字化
6、后未被压缩的音频文件的存储量为:存储量=采样频率量化位数/8声道数时间 其中,声道是指处理的声音是单声道还是立体声。单声道在声音处理过程中只有一个数据流,而立体声则需要左右声道两个数据流。,4.1.2 数字音频的采样、量化和编码,WAV文件,WMA文件,RA文件,4.1.3 数字音频文件格式,AIF或AIFF文件,PCM文件,MPl、MP2、MP3文件,MIDI文件,CD-DA文件,MP4,1WAV文件 WAV文件也叫作波形文件,是Microsoft公司开发的一种声音文件格式,存储文件扩展名为“.wav”。WAV格式文件的数据是直接来源于对声音模拟波形的采样。用不同的采样频率对声音的模拟波形进
7、行采样可以得到一系列离散的采样点,以不同的量化位数(864bit)把这些采样点的值转换成二进制数,然后存入磁盘,这就产生了声音的WAV文件,WAV文件所需要的存储容量很大,如果对声音质量要求不高的话,可以通过降低采样频率、采用较低的量化位数或利用单声道来录制WAV文件,此时的WAV文件大小可以大大减小。WAV文件数据没有经过压缩,数据量大,但音质最好。大多数压缩格式的声音都是在它的基础上经过数据的重新编码来实现的,这些压缩格式的声音信号在压缩前和回放时都要使用WAV格式。,4.1.3 数字音频文件格式,2AIF或AIFF文件 AIF是音频交换文件格式(Audio Interchange Fil
8、e Format)的英文缩写,是Apple公司开发的一种声音文件格式,被Macintosh平台及其应用程序所支持,Netscape Navigator浏览器中的LiveAudio也支持AIFF格式,SGI平台及其他专业音频软件包也同样支持这种格式。Windows的Convert工具可以把AIF格式的文件转换成Microsoft的WAV格式的文件。,4.1.3 数字音频文件格式,3WMA文件 WMA就是Windows Media Audio编码后的文件格式,由微软开发,ASF和WMA都是微软公司为了和Real Networks公司竞争而开发的网上流式数字音频压缩技术,可以一边下载一边播放,因此W
9、MA可以很轻松的实现在线广播。这种压缩技术同时兼顾了保真度和网络传输的需求,微软声称,在只有64kbps的码率情况下,WMA可以达到接近CD的音质。WMA支持防复制功能,通过Windows Media Rights Manager 加入保护,可以限制播放时间和播放次数甚至于播放的机器等等。由于是微软的杰作,因此,微软在Windows中加入了对WMA的支持,WMA有着优秀的技术特征,在微软的大力推广下,这种格式被越来越多的人所接受。,4.1.3 数字音频文件格式,4RA文件 RA文件是Real Networks公司开发的一种流媒体音频文件,在网络上非常流行,在低速率的广域网上实时传输音频信息。网
10、络连接速率不同,客户端所获得的声音质量也不尽相同。对于传输速率为14.4kbit/s的网络连接,可获得调幅(AM)质量的音质;对于传输速率为28.8kbit/s的网络连接,可以达到广播级的声音质量;如果拥有ISDN或更快的线路连接,则可获得CD音质的声音。和WMA一样,RA不但都支持边下载边播放,也同样支持使用特殊协议来隐匿文件的真实网络地址,从而实现只在线播放而不提供下载的欣赏方式。这对唱片公司和唱片销售公司很重要,在各方的大力推广下,RA和WMA是目前互联网上,用于在线试听最多的音频媒体格式。,4.1.3 数字音频文件格式,5PCM文件 PCM文件是模拟的音频信号经模数转换直接形成二进制序
11、列的文件,该文件没有附加的文件头和文件结束标志。在声霸卡提供的软件中,可以利用VOC-HDR程序,为PCM格式的音频文件加上文件头,而形成VOC格式。Windows的Convert也具有将PCM音频文件转换成Microsoft的WAV格式的功能。,4.1.3 数字音频文件格式,6MPl、MP2、MP3文件 MPl、MP2和MP3文件是指MPEG运动图像专家组所制定的音频文件格式,根据压缩质量和编码复杂程度的不同分为3层,分别对应MPl、MP2和MP3三种声音文件。MPEG音频文件的压缩是一种有损压缩,MPEG音频编码具有很高的压缩率,MPl、MP2的压缩率为4:18:1,而MP3的压缩率则高达
12、12:1,也就是说1分钟CD音质的音乐,未经压缩需要10MB存储容量,而经过MP3压缩编码后不到1MB。MP3的特点是体积小、有较好的声音质量,所以MP3是目前最为流行的一种音乐文件。,4.1.3 数字音频文件格式,7MIDI文件 MIDI是数字音乐电子合成乐器的统一国际标准,它规定计算机音乐程序、电子合成器和其他电子设备之间交换信息与控制信号的方法。MIDI文件中包含音符、定时和多达16个通道的乐器定义,每个音符包括键、通道号、持续时间、音量和力度等信息,可以模拟大提琴、小提琴和钢琴等常见乐器。当播放MIDI音乐的时候,其实就是将各种预先设计好的声音元素按乐谱合成为一首音乐。MIDI的数据容
13、量很小,适合作为音乐背景音响效果,用来播放长时间的、高质量的音乐。MIDI文件的扩展名是MID和RMI。,4.1.3 数字音频文件格式,8CD-DA文件 CD-DA文件是CD光盘采用的文件格式,在大多数播放软件的“打开文 件类型”中,都可以看到该格式,一个CD音频文件是一个.cda文件,这只是一个索 引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。注意:不能直接复制.cda文件到硬盘上播放,需要使用抓音轨软件把CD格式的文件转换成WAV。,4.1.3 数字音频文件格式,9MP4 MP4并不是MPEG-4或者MPEG-1Layer4,它的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 音频 处理 技术
链接地址:https://www.31ppt.com/p-6560973.html