多媒体技术教程-第四章.ppt
《多媒体技术教程-第四章.ppt》由会员分享,可在线阅读,更多相关《多媒体技术教程-第四章.ppt(133页珍藏版)》请在三一办公上搜索。
1、第四章多媒体硬件环境,在现有计算机系统中,要解决的首要问题是对各种媒体的数字化。图像、音频、视频信号只有以数字数据形式进入到计算机的存储器设备中,计算机软件才能够对它们进行有效处理。完成这些工作的首先是各种硬件环境和设备,如:光存储、音频接口、视频接口、多媒体I/O设备和多媒体计算机等。,4.1 光存储设备,概述,文 本,动 画,图 形,影 像,声 音,4.1.1 光存储的类型,只读型光存储系统只读型光盘包括LV和CD-ROM等。CD-ROM(Compact Disc-Read Only Memory)只读式压缩光盘,其技术来源于激光唱盘,形状也类似于激光唱盘,能够存储650MB左右的数据。用
2、户只能从CD-ROM读取信息,而不能往盘上写信息。其内容在光盘生成时就已经决定,而且不可改变。,4.1.1 光存储的类型,只读型光存储系统,只读型光驱,只读型光盘,4.1.1 光存储的类型,一次写型光存储系统一次写(WORM:Write Once Read Many)光存储系统可一次写入,任意多次读出。与CD-ROM相比,它具有由用户自己确定记录内容的优点。,一次写型光驱,一次写型光盘,4.1.1 光存储的类型,可重写型光存储系统可重写光盘(E-R/W,Rewritable或Erasable)像硬盘一样可任意读写数据。分为两种磁光型(Magnetic Optical,简称MO)相变型(Phas
3、e Change,简称PC),4.1.1 光存储的类型,可重写型光存储系统,磁光型可重写光驱,相变型可重写光驱与光盘,4.1.2 光存储系统的技术指标,尺寸LV的直径为12英寸(300mm)CD激光唱盘和CD-ROM为4.72英寸(120mm)WORM一次写光盘为14.12英寸和5.25英寸可擦写光盘向小尺寸方向发展,主要尺寸为5.25英寸和3.5英寸,4.1.2 光存储系统的技术指标,容量 格式化容量格式化容量是指按某种光盘标准进行格式化后的容量。对于SONY的SMO-D501光盘,若格式化使每个扇区为1024B,格式化容量是325MB,而采用每扇区为512B,格式化容量只有297MB。,4
4、.1.2 光存储系统的技术指标,容量 用户容量用户容量是指盘片格式化后允许对盘片执行读写操作的容量。CD-ROM的容量为550MB和680MB。由于光盘外圈5mm区容易出错,所以有些CD-ROM 的容量标为550MB。,4.1.2 光存储系统的技术指标,平均存取时间平均存取时间是指从计算机向光盘驱动器发出命令开始,到光盘驱动器在光盘上找到需读/写的信息的位置并接受读/写命令为止的一段时间。把平均寻道时间、平均等待时间和读/写光学头稳定时间相加,就得到平均存取时间。平均寻道时间是指光学头沿半径移动全程1/3长度所需的时间为平均寻道时间。,4.1.2 光存储系统的技术指标,平均存取时间平均等待时间
5、 盘片旋转半周的时间为平均等待时间。,4.1.2 光存储系统的技术指标,数据传输率 数据传输率数据传输率一般是指单位时间内光盘驱动器送出的数据比特数。该数值与光盘转速和存储密度有关。CD-ROM,其数据传输率已从初期的150KB/s提高到6MB/s。数据传输率也指控制器与主机之间的传输速率。它与接口规范和控制器内的缓冲器大小有关。同步传输率、异步传输率和DMA传输率 SCSI接口的同步传输率为4MB/s,异步传输率为1.5MB/s。AT总线规定的DMA方式的传输率为1MB/s。,4.1.2 光存储系统的技术指标,数据传输率 突发传输率 光盘驱动器或控制器中都包含有一个64K、256K或512K
6、的缓冲存储器。为了提高数据传输率,读数据过程中先把数据存入缓冲器,再进行集中传送;如果下次读取同一内容,就不必从光盘上去读取,直接把缓冲器中的数据传送给主机就可以了,这种传输率称为突发传输率。,4.1.2 光存储系统的技术指标,数据传输率 持续传输率 当传送的数据量很大时,缓冲器就起不到提高传输率的作用了,这时的传输率称为持续传输率。,4.1.2 光存储系统的技术指标,误码率 采用复杂的纠错编码可以降低误码率。误码率对不同的多媒体要求不同,如存储数字或程序对误码率的要求高,存储图像或声音数据对误码率的要求较低。CD-ROM要求的误码率为10-1210-16。平均无故障时间(MTBP)要求达到2
7、5000小时。,4.1.3 光存储格式标准和类型,什么是CD-DACD-DA(CD-Digital Audio)是为激光数字音频唱盘制定的规格。它是CD标准的第一个文本,属于红皮书(Red Book)规格。什么是CD-ROMCD-ROM逻辑格式,1988年正式作为国际标准IS09660,黄皮书(Yellow Book)。什么是CD-GCD-G(CD-Graphics)是1985年出现的遵循红皮书规格的光盘,主要用于存储静止画面。,4.1.3 光存储格式标准和类型,什么是CD-WORMCD-WORM(CD-Write Once Read Many)属于蓝皮书(Blue Book)规格,实现了光盘
8、的一次写多次读的功能。什么是CD-ICD-I(CD-Interactive)属于绿皮书(Green Book)规格。它在CD-ROM规格的基础上补充了音频、视频和计算机程序方面的规定。1988年出现了CD-I交互式光盘系统,1992年底出现了第二代CD-I,可播放互动式电影。,4.1.3 光存储格式标准和类型,什么是CD-VCD-V(CD-Video)与CD-G一样,是红皮书标准的延伸,用于影碟机,其视频信号可以输出到电视机上。什么是CD-ROM XA(Extended Architecture)它是Philips、SONY和Microsoft制定的CD-ROM扩展结构。CD-ROM XA扩充
9、了对数字音频信号的编码,目的是为了弥补推出CDI规格带来的问题。该规格也称为黄皮书的第二组标准。,4.1.3 光存储格式标准和类型,什么是CD-RCD-R(CD-Recordable)属于橙皮书(Orange Book)规格。它在黄皮书的基础上增加了可写入的多种CD格式标准。是一种可刻录光盘,可以多次在CD空余部分写入数据。什么是Photo CDPhoto CD是一种像片光盘,允许多段追入记录,属于白皮书(White Book)标准。该规格也称为黄皮书的第二组标准。,4.1.3 光存储格式标准和类型,4.1.4 CD-ROM光存储系统,光存贮原理光反射,4.1.4 CD-ROM光存储系统,CD
10、-ROM盘片的物理结构与数据存储,商标面,铝反射层,漆保护层,聚碳酸衬底,CD-ROM螺旋型光道,4.1.4 CD-ROM光存储系统,CD 盘的结构,15mm,46mm,50mm,116mm,117mm,120mm,数据记录区,导出区,导入区,CD-ROM数据存储与读出原理,10111010 11011010 11100010,字节数据,字节数据,字节数据,4.1.4 CD-ROM光存储系统,光学读出头的基本结构与读出原理,4.1.4 CD-ROM光存储系统,通道编码:“1”:由凹凸或由凸凹,光线由强到弱或由弱到强的变化(散射)。“0”:持续一定时间的光强无论是凹槽还是凸起问题:连续出现“1”
11、如何表示,例如,11110000EFM(Eight-Fourteen Modulation:使用改进的调频制(MFM:Modified Frequency Modulation)将8位数据变成14位的通道编码,8-14即EFM,即两个1之间必须间隔两个“0”,建立对照表。即28214共有16384种,从中选出两个连续“1”之间有两个“0”的共有267种然后再选256种与8位的256种建立一一对应的关系,建立一张表。目前国际上用17位,而DVD用16位。以上操作叫光盘为处理。,4.1.4 CD-ROM光存储系统,光盘结构:光道结构:(注:磁盘:同心圆柱、磁道、扇区)。整个光盘由一根连续的载有凹槽
12、和凸起的螺旋线式的光道,长达3英里(5km)将连续的物理光道划分成若干逻辑光道(99)扇区:按螺旋线等间距弧长划分,每个扇区的大小一样。在光盘中要保证光头读取每个扇区的速度一样,则要保证每个扇区的线速度一样,但角速度要变。寻址方式:光盘用时间来寻址:1分=60秒,1秒=75扇区,扇区是最小单位,4.1.4 CD-ROM光存储系统,扇区 光道从内向外等长分段,一段为一个扇区采用分、秒、扇区号表示 1分60秒,1秒75个扇区 例:2分13秒25区光道上第10000个扇区 采用ISO 9660标准 扇区格式 Mode1:对误码率要求高的数据 Mode2:误码率要求不高的数据 CD-ROM XA:可读
13、取CD-I格式数据,4.1.4 CD-ROM光存储系统,CD-ROM驱动器的系统方框图,4.1.4 CD-ROM光存储系统,光头:光头(optical pickup)是CD-ROM驱动器的关键部件。聚焦伺服:为使激光束的聚点落在光盘的信息面上,CD-ROM驱动器采用自动聚焦伺服系统来实现。EFM解调:从聚焦伺服系统输出的数据信号是经过EFM调制后的信号,EFM解调过程是EFM调制过程的逆过程。,4.1.4 CD-ROM光存储系统,道跟踪伺服:为了确保聚焦光束能沿着道间距为16um、凹坑宽为0.5um左右的螺旋形光道正确读出信息,CD-ROM采用径向光道跟踪技术,以克服光盘可能多达300um的偏
14、心,使道跟踪精度达到0.1um。聚焦伺服:CLV伺服:由于CD-ROM盘要以恒定线速度(CLV)旋转,这就意味着,驱动光盘旋转的驱动马达的速度要随光头所处的位置而变化。,4.1.5 CD-R光存储系统,CD-R盘片的物理层次 CD-R光盘将反射用的铝层改用24K黄金层(也可以是纯银材料),另外再加上有机染料层和预置的轨道凹槽。,4.1.5 CD-R光存储系统,CD-R的刻录和读取原理 CD-R刻录是将刻录光驱的写激光聚焦后,通过CD-R空白盘的聚碳酸脂(polycarbonate)层照射到有机染料(通常是箐蓝或酞箐蓝染料)的表面上,激光照射时产生的热量将有机染料烧熔,并使其变成光痕(mark)
15、。当CD-ROM驱动器读取CD-R盘上的信息时,激光将透过聚碳酸脂和有机染料层照射镀金层的表面,并反射到CD-ROM的光电二极管检测器上。光痕会改变激光的反射率,CD-ROM驱动器根据反射回来的光线的强弱来分辨数据0和1。,4.1.6 磁光MO存储系统,磁光盘是利用(激)光和磁进行数据读、写和擦除的一种光存储系统。数据记录时使用激光和磁场;读取时仅用激光;激光和磁场分别位于盘片的两面。磁光盘的物理层次磁光盘片用树脂做基盘,其上集积了保护层(氮化硅)、记录层(铽、铁钴合金)和反射层(铝合金)而构成。,4.1.6 磁光MO存储系统,磁光存储系统擦写原理写入数据:利用凸透镜进行聚焦,将高功率激光以极
16、小的光点照射在磁光盘记录层上,在其表面温度上升到约300的居里点时,用外部磁场改变其原磁化方向。然后中止激光光束让记录层冷却,形成不受外磁场影响的牢固记录层。数据重写:需经过“擦”和“写”两步,先利用中功率激光照射介质段区中的所有数据,使段区中的数据点都沿著与介质表面垂直的方向均匀磁化,即通过写入“0”来抹去原有数据。然后再根据要求用高功率激光在“0”位置写入数据“1”,这样就完成了数据的重写。,4.1.6 磁光MO存储系统,磁光存储系统读原理数据的读取是利用低功率激光探测盘片表面,通过分析反射回来的偏振光的偏振面方向是顺时针或是逆时针,来决定读取的数据是“1”还是“0”。,4.1.7 相变(
17、PD)光存储系统,CD-RW相变记录方式利用物质的状态变化即所谓的相变进行数据的读、写和擦除,相变型光盘用在基盘上沉积电介质层、相变记录层、冷却层和保护层等形成多层结构。,4.1.8 DVD光存储系统,VCD与DVD光盘技术VCD光盘VCD,SVCD,CVD DVD光盘与CD盘外观相同 四种结构(按单/双面与单/双层结构的组合)最低4.7GB(约为CD-ROM的7倍)误码率10-20,4.1.8 DVD光存储系统,DVD(Digital Video Disk)的用途及分类数字视频光盘或数字影盘它利用MPEG 2的压缩技术来储存影像DVD-ROM:电脑软件只读光盘DVD-Video:家用的影音光
18、盘DVD-Audio:音乐盘片DVD-R(或称DVD-Write-Once):限写一次的DVDDVD-RAM(或称DVD-Rewritable):可多次读写的光盘,4.1.8 DVD光存储系统,DVD盘片的物理结构分类:单面单层、单面双层、双面单层、双面双层;容量:4.7GB17GB;最小凹坑长度仅为0.4m,道间距为0.74m,采用波长为635nm650 nm的红外激光器读取数据;DVD盘由两片基底组成,每片基底的厚度为0.6mm,因此DVD的厚度为1.2mm。对于单面盘而言,只有下层基底包含数据,上层基底没有数据;而双面盘的上下两层基底上均有数据。,单面单层,单面双层,4.1.8 DVD光
19、存储系统,DVD光盘存储新技术,“蓝光盘”技术9家公司于2002年2月19日推出使用蓝激光刻录和读取单面密度盘27GB,将来达到100GB全息记录技术InPhase公司,2000年12月由贝尔实验室分离成立2002年4月8日,展出100GB的光盘使用全息记录技术用照射角度不同的两种激光:信号光和参照光,两光交叉,产生干涉图案同一位置,激光入射角不同,数据不同,4.1.9 光盘库系统,4.2 音频接口,4.2.1 音频卡的工作原理,音频卡处理音频信号的PC插卡是音频卡(Audio Card),又称声音卡,声音卡处理的音频媒体有数字化声音(Wave)、合成音乐(MIDI)、CD音频。,4.2.1
20、音频卡的工作原理,声音是怎样工作的?,4.2.1 音频卡的工作原理,音频卡的功能 音频的录制与播放编辑与合成:对声音文件进行多种特殊处理;MIDI接口和音乐合成文语转换和语音识别CD-ROM接口游戏接口支持全双工功能:能同时录音和放音;,音频卡的连接方式,4.2.1 音频卡的工作原理,音频卡的体系结构音频卡由下列部件组成:MIDI输入/输出电路;MIDI合成器芯片;用来把CD音频输入与线输入相混合电路;带有脉冲编码调制电路的模数转换器,用于把模拟信号转换为数字信号以生成波形文件;用来压缩和解压音频文件的压缩芯片;用来合成语音输出的语音合成器;用来识别语音输入的语音识别电路;输出立体声的音频输出
21、或线输出的输出电路等。,4.2.1 音频卡的工作原理,数字化声音处理,4.2.1 音频卡的工作原理,混音器,可以对多种音频源进行混合;可以选择声音I/O模式,即单声道或立体声模式;从话筒、CD或线路输入中选择输入源;可选I/O滤波器,实现对声音的过滤处理。,4.2.1 音频卡的工作原理,合成器 用来播放MIDI文件。波形表(Wave Table)合成 频率调制FM合成,频率调制FM合成,利用频率调制产生各种乐器的音色,FM合成器对声音的音色提供简捷而有效的控制。音色在很大程度依赖于其谐波的频率和振幅。FM合成器包含18个操作单元。调频合成需要两个操作单元:调制单元和载波单元。每个单元有三个基本
22、功能:脉冲产生器、包络产生器和正弦表。,4.2.2 音频合成和MIDI接口规范,MIDIMIDI(Musical Instrument Digital Interface)是指乐器数字接口,是数字音乐的国际标准。MIDI消息实际上就是乐谱的数字描述。MIDI的音乐符号化过程实际上就是产生MIDI协议信息的过程。协议信息将由状态信息和数据信息组成。音乐合成器是电脑音乐系统中最重要的设备之一。,4.2.2 音频合成和MIDI接口规范,衡量声卡的音乐合成器的性能好坏的参数主要有:音色数目 音色越多,音乐的表现力就越强。发音数 决定了声卡同时最多能发出多少个音符。音乐的兼容性 音色在排列顺序上的兼容性
23、。,4.2.2 音频合成和MIDI接口规范,MIDI接口MIDI In(输入口)接收从其他MIDI装置传来的消息。MIDI Out(输出口)发送某装置生成的原始MIDI消息。向其他设备发送MIDI消息。MIDI Thru(转发口)传送从输人口接收的消息到其他MIDI装置。向其他设备发送MIDI消息。,4.2.2 音频合成和MIDI接口规范,MIDI接口,4.2.3 语音合成,概述实现计算机语音输出有两种方法:录音/重放文语转换计算机话语输出按其实现的功能来分,可以分为以下两个档次:有限词汇的计算机语音输出 基于语音合成技术的文字-语音转换(TTS),4.2.3 语音合成,合成方法 发音器官参数
24、语音合成对人的发音过程进行直接模拟 声道模型参数语音合成基于声道截面积函数或声道谐振特性合成语音 波形编辑语音合成技术波形编辑语音合成技术是直接把语音波形数据库中的波形相互拼接在一起,输出连续语流。PSOLA(Pitch Synchronous Overlap Add)方法,4.2.3 语音合成,语音基元数据库的构建 基元的选择 选择音节 选择双音素和三音素 语音数据的存储形式 波形存储方式存储数字化的语音波形数据 参数存储方式存储从语音信号中提取的参数,常用的有LPC参数、LSP(LSF)、共振峰参数等,4.2.3 语音合成,韵律模拟 自然语言中的韵律特征语调、节奏和重音等能表达说话者的语义
25、和感情,是自然语流的重要组成部分 韵律合成及方法超音段特征(音高、音长、音强及频率分布的变化)的修改构成了韵律合成的基础方法:修改基频模式、共振峰模式、PSOLA算法等 韵律模拟的问题需解决韵律规则、韵律描述、计算模型和修改算法等问题,4.2.4 语音识别,概述语音识别是将人发出的声音、字或短语转换成文字、符号,或给出响应,如执行控制、作出回答。语音识别系统的分类 按可识别的词汇量多少划分 按照语音的输入方式划分按发音人划分说话人识别,4.2.4 语音识别,语音识别系统的最终目标 不存在对说话人的限制,即非特定人的。不存在对词汇量的限制,即基于大词汇表的。不存在对发音方式的限制,即可识别连续自
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体技术 教程 第四
链接地址:https://www.31ppt.com/p-6043237.html