数字音频处理技术二.ppt
数字音频处理技术,第 3 章,3.1 基本概念 声音概念 声音三要素 声音质量 数字音频文件的种类3.2 声音数字化 采样 量化 编码,3.3 数字音频文件的格式3.4 编码3.5 MIDI和音乐合成3.6 声卡及其配置与选用3.7 音频的采样与编辑 录音 Goldwave软件简介,1.什么是MIDI,2.MIDI系统组成,4.MIDI文件的特点,3.5 MIDI与音乐合成,3.MIDI的工作过程,1.什么是MIDI,MIDI是由软件和硬件部分组成的系统规范,这个规范定义了MIDI设备间数字传送时电缆硬件接口和协议。规定定制的目的时使各生产乐器厂家之间通过统一的MIDI交换信息及控制信号,从而完成音乐的合成。这样,任何电子乐器,只要有处理MIDI信息的处理器和适当的硬件接口都能变成MIDI装置。,MIDI是数字音乐接口(Musical Instrument Digital Interface)的缩写。或者说MIDI是用来连接电子乐器,或将MIDI设备与电脑连接成系统的一种通信协议。通过它,各种MIDI设备都可以准确传送信息。,2.MIDI系统的组成,MIDI设备就是处理MIDI信息所需的硬件设备,其基本组成包括:,(1).MIDI端口,(2).MIDI键盘,(3).音序器(Sequencer),(4).合成器,(1).MIDI端口,一台MIDI设备可以有一至三个MIDI端口,分别称为MIDI In、MIDI Out、MIDI Thru。它们的作用是:MIDI In:输入口,接收来自其它MIDI设备的MIDI信息。MIDI Out:输出口,发送本设备生成的MIDI信息到其它设备。MIDI Thru:传送口,将从MIDI In端口传来的信息转发到相连的另一台MIDI设备上。,(2).MIDI键盘,MIDI键盘是用于MIDI乐曲演奏的,MIDI键盘本身并不发出声音,当作曲人员触动键盘上的按键时,就发出按键信息,所产生的仅仅是MIDI音乐消息,从而由音序器录制生成MIDI文件。,(3).音序器(Sequencer),用于记录、编辑、播放MIDI的声音文件,音序器有以硬件形式提供的,目前大多为软件音序器。音序器可捕捉MIDI消息,将其存入MIDI文件,MIDI文件扩展名为.MID。音序器还可编辑MIDI文件。,(4).合成器,合成器自诞生以来,其概念已发生了很多变化。其实最早的合成器是真正意义上的合成器,它通过人为地调制各种波的参数来自己合成音色,锯齿波,方型波,滤波器,截止频率,人们每天就和它们打交道,每个演奏者都不象艺术家而象数学家,而合成器的模样也给人感觉是机器怪物而不是乐器。在那时看来,合成器就是一个用来发怪声音的东西。以后合成器经过了FM,采样音色等发展阶段,到现代,合成器的概念已经不是一个人为合成音色的东西,它拥有大量真实的采样音色可供演奏使用,它拥有自己的音序器可以录制编辑音乐,它拥有MIDI接口可以与其他设备交换信息,有时侯我们可以认为现代的合成器是这样意义上的“合成”,即集音源,音序器,MIDI键盘于一身的设备。,(4).合成器,你只要拥有一台带音序器的合成器,就可以自己制作MIDI音乐,进行现场演奏等等。然而随着软件音序器的普及和占据市场,合成器的硬件音序器由于它的繁琐而魅力大减,音源,音序器,键盘三位一体的方式受到挑战,商家认识到电脑制作MIDI是将来的趋势,便不失时机地推出了一系列适合为电脑配套的合成器,它们省去了音序器,音序任务由软件完成,合成器只提供键盘和音色,这就降低了合成器的成本,受到市场欢迎。又随着独立的硬件音源和和采样技术的普及,有人觉得合成器的音色也是多余的,因为独立音源可以提供更好的音色,于是不带音序器和音色的MIDI控制键盘也随即产生,这类键盘有较强的控制功能,音色用音源的,音序器用软件的,可谓是专物专用,而且只要添加音源或采样器就可以得到更多的音色,更换音序软件就可以使用更强的功能。所以这种“三权分立”的方法是目前最常用的也是最实惠的。,1).MIDI合成方式,MIDI合成方式主要有调频合成(FM)和波形表合成(Wave Table)两种方式。调频合成方式,其原理是根据傅立叶级数而来。波形表合成的原理是ROM中已存储着各种实际乐器的声音采样,合成时以查表方式调用这些样本将其还原回放。,2).硬波形表合成与软波形表合成,硬波表合成方式的数字声音样本被保存在ROM内或RAM(可动态更换)内。而软波表的数字化样本保存于系统主存中,合成运算靠CPU完成,最终的音频合成靠声卡上的WAVE合成器来完成。软波表实际上是针对合成MIDI音乐而开发的一套软件,其主要作用是控制高速CPU来完成波表MIDI合成器的部分功能。现在高档的MIDI合成器还可同时支持多音符,那么合成器支持的最多音符数,被称为复音,如一个能以六个复音合成五种乐器的声音的合成器,可以同时表现分布与这五个乐器上的六个音符。,音源,由于音乐艺术最终要以声音的形式表现出来,所以做为电脑音乐系统中产生声音的设备,音源音色的数量、品种和质量都将对最终音乐作品的好坏产生巨大的影响。现在市场的音源种类很多,有适合做流行音乐的,有适合做管弦乐作品的,还有适合于做电子音乐的。另外,不同牌子的音源往往也会各有优劣之处,购买时应认真加以比较挑选。除音色的好坏可以直接听到外,选购音源还应注意其音色数、操作的难易程度和音色的编辑能力等等 音源也分硬件和软件两种.,3.MIDI文件的特点,(1).由于MIDI文件只是一系列指令的集合,因此它比数字波形文件小得多,大大节省了存储空间。(2).使用MIDI文件,其声音卡上必需含有硬件音序器或者配置有软件音序器。(3).MIDI声音适于重现打击乐或一些电子乐器的声音,利用MIDI声音方式可用计算机来进行作曲。(4).对MIDI的编辑很灵活,在音序器的帮助下,用户可自由地改变音调、音色以及乐曲速度等,以达到需要的效果。,声卡,随着技术的发展和时代的进步,电脑正在取代传统家电成为家庭的多媒体娱乐中心,作为多媒体应用的一部分,电脑音频也越来越受人们的关注。相对于传统的音响设备,电脑具有多方面无可比拟的优势。因此,在电脑上听歌也逐渐成为人们欣赏音乐的主要方式。自从Windows 95推出,人们可以比较方便的在电脑上听音乐以来,在各种媒体和网络上关于声卡音质的对比评论就不绝于耳。从Creative SoundBlaster AWE64 Gold讨论到Diamond MX200,再到Creative SB Live!、Creative SB Audigy、Creative SB Audigy 2。直到现在的M-AUDIO Audiophile 2496、Lynx Two。,声卡是一台多媒体计算机的重要设备之一,一般说来有板载声卡和独立声卡之分,板载声卡较独立声卡需要更多处理器资源协同处理音频流数据,因而也给人们留下了性能低下的印象,它的型号和功能主要取决于板载的音效芯片。在板载音效芯片处理能力的不断提升、主流处理器频率在2GHz以上的配置下,板载声卡和普通独立声卡之间的性能差异越来越小了。对于大部份的非专业用户来说,板载声卡已经绰绰有余,声卡的结构与功能,声卡一般由Wave合成器、MIDI合成器、混合器、MIDI电路接口、CD-ROM接口、DSP数字信号处理器等组成。,(1).Wave合成器Wave合成器的模/数转换和数/模转换是声卡上数据处理器件。,(2).MIDI合成器标准的多媒体计算机通过MIDI合成器播放MIDI文件。,(3).混音器声卡上的混音器芯片可以对以下音源进行混合:数字化声音(DAC),调频FM合成音乐(FM)CD音频(CD-ROM),线路输入(AUX),话筒输入(MIC)及PC声音输出(SPK)。,(4).MIDI接口声卡能够接收、录制及输出MIDI信号,MIDI接口完成电子音乐设备与声卡之间的信号传输通道,通过软件控制可以将MIDI音乐设备演奏,反之,也可以将电子音乐设备上演奏的音乐录制成MIDI数据文件,在计算机中进行模拟演奏或修改。,(5).CD-ROM接口CD-ROM接口提供了从CD-ROM的CD-DA的输出信号到声卡音源输入的通路,CD-ROM播放CD唱盘的音频时,将音频信号直接通过声卡的功放送到扬声器,通过调节声卡的音量控制,即可控制CD唱盘的音量。,(6).DSP数字信号处理器用作对数字音频信号的实时压缩和解压缩,以及用于语音朗读、语音识别等特殊音频信号的处理。,了解了声卡的组成及工作原理后,可总结出声卡有以下主要功能:(1).录制与播放波形音频文件。(2).编辑与合成波形音频文件。(3).MIDI音乐录制和合成。(4).文语转换和语音识别。,声卡的安装,(1).硬件安装步骤1 关闭计算机电源,拔下供电电源和所有 外接线插头。步骤2 打开机箱外壳,选择一个空闲的16位扩 展槽并将声卡插入扩展槽。步骤3 连接来自CD-ROM驱动器的音频输出线到 声卡的CD IN针形输入线上;步骤4 盖上机箱外壳,并将电源插头插回。步骤5 声卡与其它外设的连接,按下页图进行。,LINE IN,LINE OUT,SPK OUT,MIDI,录音机、CD唱机等线性输出,话筒,扬声器,线性输入立体声放大器,MIC IN,(2).软件安装对不同的声卡,软件的安装方法不完全相同,需要按照说明书安装。1).安装驱动程序声卡的驱动程序是控制声卡工作的必要程序,不同的声卡驱动程序是不同的。2).安装应用程序安装声卡的应用程序,例如混音器、录音师和MIDI编辑软件等。,安装测试,声卡安装完成后,即可对声卡进行测试,以检查声卡能否正常工作,可以使用Windows 98的“媒体播放机”进行测试。如果测试时,没有声音播出,可能有两种情况:一是插孔接触不良,请检测扬声器插孔、音量开关等;二是配置产生冲突,进入控制面板的“系统”设置查看是否有冲突。,语 音 识 别 技 术,语音识别技术目前也已经不是什么新鲜东西了,从实质上讲,它是计算机发展的必然产物。本身通讯使用语言就是人类的习惯,和计算机用语言进行交流也是人类很早就有的梦想。其中包括以下几项技术:语音编码、语音合成、语音识别、语种识别、说话人识别(鉴定)。语音识别技术应用于需要以语音作为人机交互手段的场合,主要是实现听写和命令控制功能,在特殊场合也用做对声纹进行鉴定,以识别确定说话人的身份。,语音识别的发展,语音识别想其他技术一样都是在经历了风雨之后,才见到今天的彩虹。从上个世纪50年代在美国和我国对于语音识别就开始研究,并有所收获。到了70年代后期,语音技术沿着三个不同的发展方向前进:特定人向非特定人扩展、孤立词向连接词扩展、小词汇量向大词汇量扩展。到了80年代有了长足的进步和实质性的进展。出现了一个标志HMM模型和一大批语音识别系统,其中美国的CMU的Sphinx是一个经典作品。发展方向:朝着非特定人、大词汇量、连续语音的听写机系统发展,目前已有一些比较成熟的商业产品了。,分 类 情 况,多种分类原则,多个分类标准,自然就有多种情况出现,目前比较流行的分类办法有:1。按可识别的词汇量的多少分类大、中、小三种情况。2。按语音输入的方式分类孤立词、连接词、和连续语音三种。3。按发音人是否有限制分为特定人、限定人、非特定人三种。4。是否是对人的声纹进行识别指的是用声音来确定说话人的识别,自然分类情况是能或否。,板载声卡介绍,说到板载声卡,就不能不提到AC97 标准了。很多用户会发现,板载声卡一般都标有 AC97 字样,那么什么是 AC97 声卡呢?AC97标准是由Intel、Creative Labs、NS、Analog Device与Yamaha共同提出的Audio Codec97(简称 AC97“音效多媒体数字信号编解码器”)的规格标准,其中主要的一个创新就是使得数/模、模/数两种信号的转换尽可能地脱离系统,这样就可以避免大部分数字/模拟信号转换时所产生的杂波,从而得到较好的音效品质。AC97并非实实在在的声卡型号。目前 AC97 最新的版本已经达到了2.3。与之前的产品不同,AC97 V2.3更具有智能化和人性化的一面。最为显著的就是Jack Sensing 技术,一种智能引导技术。当用户接入外部音频设备(如:音箱、麦克风等等)时系统会为用户以图例的方式标出每种设备的外部接口位置,对于入门级的朋友会比较容易上手。,我们再来看看市场上板载音效芯片的种类。板载音效芯片的种类相当多,如:Analog Device、VIA、瑞昱(RealTek)、C-Media、乃至 NVIDIA以及ATI等等。对于板载音效芯片来说,目前其家族可谓非常之壮大,从支持2.1声道到支持7.1声道的产品,庞大得令人有眼花。不过目前除了少数“硬声卡”芯片之外,大部分“软声卡”,即“CODEC”芯片之间的性能相差并不大。,支持 AC97 规范的主流板载声卡芯片,AD系列AC97 CODEC芯片在主板整合声卡中一直是使用得最广泛的CODEC芯片之一。由于Analog Devices本身为SoundMax标准的制定厂商之一,所以AD系列 AC97 CODEC芯片最大的特点即为支持SoundMax驱动程序,可以随着SoundMax驱动程序的升级而得到性能的提升。目前最新的产品为AD 1980/1985,均为支持6声道输出,支持5.1环绕立体声音效的CODEC芯片。其中,AD1980支持SoundMax3,而AD1985更是支持最新推出的SoundMax4。华硕的P4P800-VM主板就是采用AD1985的音效芯片。,AD 1980/1985,Realtek ALC 650/658,ALC系列AC97 CODEC芯片由Realtek推出,它支持AC97 2.2标准,是目前功能最丰富、音质最好的6声道解码芯片之一,具有良好的DAC信噪比和Mixer信噪比。ALC650/650E外接24.576MHz标准晶振,精度极高,频率偏差仅为30ppm(百万分之三十)。而最新的ALC 658更支持AC97 2.3标准,除了提供6声道输出之外,还提供了对D3D、A3D、EAX1.0&2.0等3D特效的支持。华硕的P4V800-X主板就是采用ALC 650的音效芯片。,VT1616,采用0.22微米生产工艺,支持AC97 2.2规范,支持18bit的数模转换精度以及1Hz的采样频率,它可以提供6声道输出,并拥有数字环绕、光纤和SPDIF输出功能。采用VT1616R主板有技嘉的GA-8VM533M-RZ主板。,VIA VT1616,C-Media CMI9739A,骅讯电子(C-Media)的CMI9739A音效芯片,CMI9739 系列是大家非常熟悉的CMI8738系列的后续产品,它支持六声道AC97 输出,支持骅讯的C-Media Xear 3D Sound 技术,兼容AC97V2.2 规范,支持各种主流3D音频规范,音质相当出色。磐正的EP-4PCAI主板就是采用这种声效芯片。,