书签分享收藏举报版权申诉 / 119

立即下载加入VIP免费专享

当前位置：首页 > 生活休闲 > 在线阅读 > 多媒体通信技术.ppt

多媒体通信技术.ppt

上传人：牧羊曲112

文档编号：6109379

上传时间：2023-09-25

格式：PPT

页数：119

大小：1.34MB

《多媒体通信技术.ppt》由会员分享，可在线阅读，更多相关《多媒体通信技术.ppt（119页珍藏版）》请在三一办公上搜索。

1、多媒体通信技术,主讲教师：黄玉兰学时：16,第一章多媒体通信技术概述第二章音频技术基础第三章图像技术基础第四章视频信息压缩与处理第五章多媒体通信系统中的关键技术第六章多媒体通信网络技术第七章多媒体数据的分布式处理第八章多媒体通信应用系统,本书章节,5.1 多媒体信息输入输出技术5.2 超媒体技术 5.3 多媒体同步技术,本章主要内容,第五章多媒体通信系统中的关键技术,多媒体技术的发展离不开相关技术的支持，如媒体输入输出技术、超媒体技术、网络同步技术、数据存储技术等。下面我们就这些在多媒体技术的发展过程中起重要作用的关键技术逐一进行介绍。,5.1 多媒体信息输入输出及存

2、储技术,多媒体计算机所涉及的输入输出技术包括视频图像技术、音频技术、语音技术、图像图形技术和文本技术等。在多媒体计算机系统中，支持系统输入输出的功能是由一些具有特定功能的功能卡来实现的。有一些功能卡是专门支持多媒体信息的采集与处理的，如视频卡、音频卡、VGA(Video Graphics Array即视频图形阵列）与TV转换卡、图形加速卡、SCSI(Small Computer System Interface小型计算机系统接口)接口卡、光盘接口卡等。多媒体计算机通过这些功能卡完成与各种外部设备的连接，从而形成一个制作和播放多媒体应用的工作环境。,5.1 多媒体信息输入输出及存储技术,5.1.

3、1 视频信息输入输出技术计算机只能处理数字图像信息，而现有的视频源都还只是模拟图像信息，因此需要先将模拟图像信息转变为数字图像信息。此外，计算机对图像进行相关的处理之后，在进行显示的时候也必须要将数字图像转换成模拟图像信息，因此就需要一个视频转换卡来完成相应的功能。当前用于多媒体计算机的视频卡主要有以下几类：电视接收卡、视频转换/捕捉卡、视频编码卡、MPEG卡等。,1、视频卡的基本工作原理,视频采集、显示播放是通过视频卡、播放软件、显示设备来实现的。视频卡是基于PC机的一种多媒体视频信号处理平台，它具有多个不同视频接口，分别对应录像机（VCR）、影碟机、摄像机（Camera）等视频源，可以通过

4、相应的视频软件来选择所需的视频源，经过编辑或特技处理而产生非常漂亮的画面。这些画面还可以被捕捉、数字化、冻结、存储、输出及进行其他的操作。对画面的修整、像素显示调整、缩放功能等都是视频卡支持的标准功能。多媒体视频卡除了可以实现视频信号数字化、捕捉特定镜头外，还可以在VGA上开窗口并与VGA信号叠加显示。,视频卡的基本工作原理可以用下面框图来说明。,图中的选择视频源完成对相应视频源的选择。ADC完成视频解码，主要是模拟图像信号至数字图像信号的转换和解码。视频处理芯片是用于视频信号的捕获、播放和显示的专用控制芯片，可以完成视频输入信号的裁减、比例变化、VGA同步、色键控制、PC总线接口和对帧存储器

5、的操作。视频处理器输出的是经过处理的RGB信号，与VGA显示卡输出的RGB信号是完全同步的，通过某种方法完成两路信号的叠加。视频随机访问存储器（VRAM）是专门为视频显示设计的存储器，可提供两个端口的同步读写能力，比一般的DRAM方式快得多。DAC主要完成数模转换，将叠加的信号转换成模拟信号，最后在显示器中进行显示。,2、常用视频卡目前，视频卡根据不同的用途可以分为很多种，如视频接收卡、视频转换/捕获卡、MPEG卡等。（1）视频接收卡视频接收卡也称为电视接收卡，其主要功能有两项：接收电视台发送的电视信号；将模拟电视信号数字化后叠加显示在VGA的RGB信号中，并转换成显示器可接收的模拟信号输出

6、到显示器进行显示。电视接收卡的功能框图如下图所示。,图5-2 电视接收卡功能,（2）视频转换/捕获卡视频转换卡完成计算机视频信号和电视视频信号间的转换。一般分为两类：一类完成由计算机的VGA信号到各种标准制式的电视信号的转换并在电视机上播放或进行录像，这类卡也被称作PCTV卡或VGATV卡；另一类完成将标准的各种制式电视信号转换成在计算机屏幕上显示的VGA信号，此类卡也叫做TVVGA卡。它带一个高频头，可将计算机变成一台电视机，收看不同频道的电视节目。视频捕获卡的主要功能是从视频图像信息中实时或非实时地捕获静态或短时间的动态视频图像。捕捉后的视频图像信息以AVI（Audio Video Int

7、erleaved）格式存储在计算机硬盘上。,图5-3 视频转换/捕捉卡工作原理,（3）MPEG卡 MPEG卡分为压缩卡和解压卡两类。MPEG压缩卡一般为专业人士使用，可以对静止和动态图像按照相应的标准进行实时和非实时的压缩和还原处理。MPEG解压缩卡也称为影碟卡，可以播放MPEG-1标准压缩的数字影视片（如VCD）。MPEG解压缩卡的主要功能是把MPEG文件进行解压缩并恢复播放。其基本工作原理如图5-4所示。视频卡主要向着视频技术与影视技术的结合影视节目后期制作视频技术与通信技术的结合多媒体视频会议、可视电话等方向发展,图5-4 MPEG解压缩卡工作原理,3、摄像头随着宽带网络逐渐深入到人们

8、的工作和生活中，利用网络进行视频对话和可视电话的使用也越来越多。数字摄像头作为数字摄像机的一个特殊分支，在网络视频应用中正发挥着越来越重要的作用。摄像头分为模拟摄像头和数字摄像头两类。模拟摄像头获得的模拟视频信号必须经过计算机的视频卡进行数字化转换，并经过压缩后才可以送入计算机进行处理，数字摄像头也称为网络摄像头，可以直接捕捉视频图像，然后通过USB或IEEE1394高速接口输入到计算机，而不再需要视频卡。,摄像头的基本工作原理：,摄像头的基本工作原理：外界景物通过摄像头的镜头（透镜）生成光学图像，再投射到图像传感器表面转换为模拟电信号，经过A/D变换转换为数字图像信号，送到数字处理芯片（DS

9、P）进行加工处理，再通过与计算机的接口传输到计算机中进行处理，最后，通过显示器就可以看到图像了。,摄像头的主要性能指标：,（1）摄像器件：按照感光元件的不同，摄像器件可以分为CCD（电磁耦合组件）和CMOS（金属氧化物半导体组件）两类。这两类摄像器件在技术上有很大的差异，但性能的差别不是很大。一般来说，CCD的成像质量较高，用于对影像要求较高的场合，而CMOS用于对影像要求较低的应用场合。（2）像素分辨率：像素是影响数字摄像头成像质量的重要指标，像素的大小关系着图像的分辨率。在早期的摄像头中所使用的像素值一般只有10万左右，成像后的分辨率是352288（CIF）。因其分辨率太低且性能不佳而遭市

10、场淘汰。目前市场上的主流产品的像素有30万像素（VGA，640480）和130万像素（SXGA，12801024），成像质量也有了很大提高。（3）颜色深度：大多数数字摄像头的颜色深度采用24位真彩色，质量更好的甚至会采用30位的真彩色。采用的颜色深度越大，所得到的图像色彩越丰富，细节也更加的清晰。,摄像头的主要性能指标：,（4）视频捕获速度：捕获速度也叫帧率，表示单位时间内图像帧的显示速度，单位是帧/秒。视频捕获速度是摄像头对视频图像捕获、处理和传输的能力，直接关系到动态图像的流畅度。由于摄像头捕获的是运动图像，因此帧率对图像主观感受影响较大。捕获速度一般是指摄像头采用最大分辨率时的流畅度。通

11、常所采用的摄像头的帧率在20帧/秒，高档摄像头的帧率在30帧/秒。帧率太低会出现跳帧的现象。一般数字摄像头视频捕获的最大分辨率为640480，若帧率要达到30帧/s，宽带网的传输速率要达到10Mbit/s；（5）接口方式：早期的数字摄像头是接在计算机的并口上，速率达到1Mbit/s，现在流行的数字摄像头都是接在计算机的USB口上。USB速度快、连接简单、即插即用并提供外接电源。现在的数字摄像头功耗都很低，依靠USB提供电源即可工作。,4、投影仪投影仪是目前使用较多的多媒体显示设备，在科研、教学、演示、会议和监控等领域得到了广泛应用。投影机所使用的技术分为三类：CRT投影机、LCD投影机和DL

12、P投影机。CRT：阴极射线管，体积大，亮度低，对焦调整复杂。LCD：液晶显示，当今主流产品，体积小，亮度高，分辨率高，色彩丰富。DLP：数字光处理器，显示的是数字图像信息，无噪声，画质稳定，色彩丰富细腻，是今后投影机发展方向。,投影机常用的技术指标：亮度：投影机的亮度常用ANSI流明来表示，播放环境对投影机的亮度表现影响较大。目前，一般的LCD投影机的亮度都会达到500 ANSI流明.分辨率：分为物理分辨率和压缩分辨率。物理分辨率决定了显示图像的清晰程度。灯泡寿命：用灯泡亮度降低为原来的一半时的使用时间来表示。使用寿命至少2000小时以上。灯泡可以分为金属卤素灯(金属卤素灯泡的优点是价格便宜

13、，缺点是半衰期短，一般使用1000小时左右亮度就会降低到原先的一半左右。并且由于发热高，对投影机散热系统要求高，不宜做长时间（4小时以上）投影使用。)UHE（超高压汞灯泡）：uhe灯泡的优点是价格适中，在使用4000小时以前亮度几乎不衰减。由于功耗低，习惯上被称为冷光源。uhe灯泡是目前中档投影机中广泛采用的理想光源。UHP（Ultra High Performance属于超高压汞灯泡）：uhp灯泡的优点是使用寿命长，一般可以正常使用4000小时以上，并且亮度衰减很小。uhp灯泡也是一种理想的冷光源，但由于价格较高，一般应用于高档投影机上。,5.1.2 音频信息的输入输出技术在多媒体计算机中，

14、数字化音频信息是一种重要的媒体信息。音频信息包括语音和音乐。音频信息的输入输出主要是由音频卡(也叫声卡）来完成的。声卡或音频卡（audio card）是负责录音、播音和声音合成的计算机硬件插卡，是计算机进行所有与声音相关处理的硬件设备。,1、声卡的基本工作原理声卡的结构如图5-5所示。数字音频处理芯片和音乐合成器是声卡的核心器件。总线接口芯片为声卡的各个部分与计算机系统总线间提供握手信号，同时总线接口芯片还起到对指令和数据的缓冲器作用，完成声卡与计算机系统总线之间指令和数据的传送。数字音频处理芯片完成各种音频信号的记录和播放任务，处理工作还包括ADPCM音频信号的压缩和解压缩、采样频率改变、M

15、IDI指令解释等。,音乐合成器负责MIDI的合成音效，可以即时创造声音，将数字音频的波形数据和MIDI信息合成为声音。一般声音的变化是用一些电压、电流这样的模拟信号的变化来反映的，而计算机只能处理数字信号，声卡中的AD转换器负责将接收的模拟信号转成数字信号供计算机处理或将数字化的音频信号转换为模拟信号送出去，驱动音箱或耳机发音。混音器将从话筒、线性输入、CD输入的不同途径声音信号进行混合，还提供用软件控制音量的功能。,图5-5 音频卡的工作原理,2、音频卡的主要功能录制和播放声音文件。声卡能将来自麦克风、收录机、激光唱盘等的声源采样，在软件的帮助下以数字声音文件的形式存放。在需要的时候，只要调

16、出相应声音文件播放即可。此外，声卡与CD-ROM驱动器相连，可以实现对CD唱盘的播放；对声音文件进行编辑和合成。可以给声音添加诸如淡入淡出、回声、音调变化等特效，这些对音乐爱好者都是非常有用的；通过语音合成技术将计算机中储存的文本文件转换成可以听到的语音，即让计算机来朗读文本；对数字声音文件进行压缩和解压缩，节省磁盘空间。直接通过采样得到的波形声音文件都很大，这样会占据太多有用的磁盘空间，需要用压缩编码的方法对这些文件压缩。有的声卡上有固化的压缩算法，有的是向用户提供压缩软件；,MIDI音乐录制和合成。MIDI接口是乐器接口的国际标准，MIDI规定了电子乐器与计算机之间相互进行数据通信的协议，

17、以保证双方有效的数据通信。通过相应的软件可以直接利用计算机完成对外部电子乐器的操作和控制。文语转换和语音识别。语音合成使人能够听到计算机的声音，相反语音识别能使计算机识别出人的声音。语音识别技术可以实现让计算机听懂人的声音信息，主要应用于需要用语音作为人机交互的场合；一般声卡都支持双声道立体声的采样，可支持的采样频率有：8kHz，11.025kHz：针对一般语音质量的要求；16kHz，22.05kHz，32kHz：针对普通音乐效果；44.10kHz，48kHz：针对高保真音乐效果；,声卡的相关技术标准（补充）,声卡的采样技术声卡的主要作用之一是对声音信息进行录制与回放。在这个过程中，采样的位

18、数和采样的频率决定了声音采集的质量。采样精度：它决定了记录声音的动态范围，以位(bit)为单位，比如8bit、16bit。8bit可以把声波分成256级，16bit可以把同样的声波分成65536级的信号。采样位数：可以理解为声卡处理声音的解析度。这个数值越大，解析度就越高，录制和回放的声音就越真实。如今的主流产品都是16bit的声卡。采样频率：当今的主流声卡，采样频率一般分为22.05kHz、44.1kHz、48kHz共3个等级，22.05kHz只能达到FM广播的声音品质，44.1kHz则是理论上的CD音质界限，48kHz则更加精确一些。对高于48kHz的采样频率，人耳已无法辨别出来了。,电子

19、乐器数字化接口,电子乐器数字化接口（Musical Instrument Digital Interface,MIDI)是电子乐器之间以及电子乐器与计算机之间的统一交流协议。是MIDI生产商协会制定给所有MIDI乐器制造商的音色及打击乐器的排列表。包括总共128个标准音色和81个打击乐器排列。由于MIDI只是记录乐曲每一时刻的音乐变化，它只是将需要演奏的乐曲信息记录下来，例如：演奏的乐器、演奏的音调伴奏等，并不包括任何可供回放的声音信息，所以MIDI文件的容量比较小。进行声音回放时需要通过声卡进行回放处理。通常有FM合成和波表合成两种方法。目前，在一些游戏软件和娱乐软件中我们经常发现很多以mi

20、d,rmi为扩展名的音乐文件，这些就是在计算机上最为常用的MIDI格式。,5.1.3 语音识别技术和语音合成技术此二者是实现人机语音通信的关键技术。1.语音识别技术语音识别技术就是使计算机能够听懂人的声音内容并可以识别出特定说话人的技术。根据不同的需求，语音识别的内容可分为狭义的语音识别（Speech Recognition）和说话人语音识别(Speaker Recognition)。前者是要排除不同人的发音差异，提取代表语音的共性特征，听懂说话人所说的话。后者是寻求说话者的个性特征以辨别说话人的身份。,（1）语音识别系统的基本原理一个典型的语音识别系统如下图所示。图56 语音识别系统工作原

21、理,一个完整的语音识别系统可大致分为三部分：语音预处理：完成语音信息的采样，消除设备环境噪声以及个体发音差异。语音特征提取：目的是从语音波形中提取随时间变化的语音特征序列。模式库与模式匹配（识别算法）：模式库是识别系统的底层模型，并且是语音识别系统中最关键的一部分。模式库通常由获取的语音特征通过训练产生，目的是为每个发音建立发音模板。在识别时将输入的语音特征同模式库中的模板进行匹配与比较，得到最佳的识别结果。,（2）语音识别系统的分类按照可识别词汇量的多少进行划分小词汇量、中词汇量、大词汇量语音识别系统按照语音的输入方式划分孤立词识别系统、连接词、连续词按发音者为特定人/非特定人划分

22、发音人可以是特定人、限定人和非限定人三种，对应三种识别系统按发音者的声纹划分即说话人识别，根据语音来辨别说话人的身份。语音识别最终目标：大词汇量、非特定人连续语音的识别。,（3）语音合成技术 a.语音合成实现的方式：一般有两种录音/重放模式参数合成方式（用滤波器和激励信号模拟人声，利用数字信号处理技术）b.文语转换技术应用于有声电子文档、信息电话查询、多媒体软件等。文语转换的语音合成一般包括三个部分：文本分析、韵律生成、语音合成语音合成未来发展方向是提高合成语音的自然度、丰富合成语音的表现力、降低合成语音技术的复杂度和实现多语种文语转换合成。,5.1.4 其它输入输出技术 1、扫

23、描仪扫描仪（Scanner）是一种图形、图像等信息的输入设备，利用光电转换原理，通过扫描仪光电的移动或原稿的移动，把黑白或彩色的原稿信息数字化后输入到计算机中。扫描仪一般由光源、光学透镜、感光元件和A/D转换电路组成。目前常用的感光元件是电荷耦合器件（Charge Coupled Device：CCD）阵列，它是在一片硅片上集成了数万个光电三极管，排成一行或一个阵列，阵列中的每个光电三极管都能把光信号变为电信号，光敏器件所产生的电量与所接收的光量成正比。,扫描仪的图像处理过程（以平面式扫描仪为例）：把原件面朝下放在扫描仪的玻璃台上，扫描仪内发出光照射原件，反射光线经一组平面镜和透镜导向后，照

24、射到CCD的光敏器件上，由CCD将光信号转换成相应电信号。来自CCD的电信号送到模数转换器中，将电压转换成代表每个像素色调或颜色的数字值。步进电机驱动扫描头沿平台作微增量运动，每移动一步，即获得一行像素值。扫描彩色图像时分别用红、绿、蓝滤色镜捕捉各自的灰度图像，然后把它们组合成为RGB图像。有些扫描仪为了获得彩色图像，扫描头要分3遍扫描。另一些扫描仪中，通过旋转光源前的各种滤色镜使得扫描头只需扫描一遍。,扫描仪类型按扫描方式分类：手动式平板式胶片式滚筒式按接口方式分类：SCSI(Small Computer System Interface小型计算机系统接口)接口、EPP（Enha

25、nced Parallel Port）增强型并行接口通用串行总线USB接口,扫描仪的主要性能指标：扫描精度这是最重要的技术指标之一，它直接影响到扫描效果。扫描精度常用分辨率来做为定量描述。分辨率表示了扫描仪对图像细节的表现能力，定义为每英寸长度上扫描图像所含的像素点的个数，单位是DPI（Dots Per Inchse），数值越大，精度越高对个人应用来说，300*600 DPI的扫描仪就可满足基本需要了。,色彩深度（bit）它是扫描仪所能捕获色彩层次信息的指标，由模数转换电路来决定。位数是由一次扫描过程中R、G、B三原色分别曝光（共三次）来定义的，例如三原色分别为28=256种色彩，则它们

26、的组合色彩为282828=224=16M种颜色，即色彩位为24bit，灰度定义为256阶。一般的色彩精度有24bit、30bit、32bit和36bit几种。在目前流行的扫描仪产品中，36bit的扫描仪性能最好，在高性能显卡、高处理速度的计算机和先进图像处理软件的配合下，可以达到完美的效果。扫描速度是指将一页文稿扫入计算机并完成相应处理共需要的时间。,2、触摸屏触摸屏（Touch Screen）是一种采用坐标定位方式的输入设备。当用户用手指或其它设备触摸安装在计算机显示器前面的触摸屏时，所摸到的位置（以坐标形式）被触摸屏控制器检测到，并通过串行口或者其它接口送到CPU，从而确定用户所输入的

27、信息。触摸屏可以附在CRT显示器、LCD显示器上。触摸屏的引入主要是为了改善人机交互方式，特别是非计算机专业人员，使用计算机时可以将注意力集中在屏幕上，免除了人们对键盘不熟悉的苦恼。在有的情况下（例如在公共场所的计算机），不希望使用者用鼠标或键盘操作它，只提供在某个应用程序下的操作）。,触摸屏系统一般包括触摸屏控制卡、触摸检测装置和驱动程序三部分。安装在触摸屏表面前端的触摸检测装置用来检测用户手指的触摸位置，并将相应信息传送给触摸控制卡。触摸控制卡接收从触摸检测装置送来的信息并转换成触点信息再传送给主机，同时还接收主机发送来的命令。触摸屏类型：按工作原理，可把触摸屏分为红外线式电阻式电容

28、式声表面波式近场成像触摸屏等类型,5.1.5 多媒体存储技术 1、概述多媒体存储最主要的特点是要考虑多媒体对象的庞大数据量及实时性的要求。目前，大型多媒体文档存储的主要介质是光盘存储系统和高速磁存储器。单机多媒体存储VCD 采用MPEG-1压缩技术 74min DVD MPEG-2 133488min 4.717GB 为弥补单一盘片容量不足的缺点，又出现了光盘库、冗余磁盘阵列和多媒体数据库等存储方式。,2、光盘库使用光盘库是实现对海量数据的存储的一种很好的选择。光盘库系统是一种带有自动换盘装置（机械手）的光盘存储共享设备，一般由放置光盘的光盘架、自动换盘机构（机械手）和驱动器三部分组成

29、。光盘库系统包含一个或多个光盘驱动器，由精确伺服控制的机电机械手自动升降器机构来在盘片堆栈上的槽和驱动器之间来回移动光盘。当用户访问光盘库时，自动换盘装置首先将驱动器中的光盘取出并放置在指定的盘架位置上，然后将光盘送入驱动器。在盘播放完毕后机械手装置从驱动器上将盘卸下并放回堆栈上它的槽内。在程序控制下，机械手设备可操作和管理多个驱动器。,一套光盘库一般由212个盘仓组成，每个盘仓可容纳50片光盘，最多可以容纳多达600张光盘，总容量可以达到几百GB甚至TGB。光盘库通过高速SCSI接口与网络服务器连接，光盘驱动器通过自身接口与主机交换数据。当用户需要对光盘中的数据进行访问时，自动换盘装置先将驱

30、动器中的光盘取出并按照要求放置在光盘架指定位置，然后再从光盘架中取出所需要的光盘并送入驱动器中。自动换盘装置的换盘速度迅速，一般是在秒级，光盘库所用的盘片一般是以VCD或DVD为主。,DVD光盘库的主要特点如下：高容量，每张DVD盘片容量达到5.2GB，总容量达到TGB；检索速度快，换盘时间在秒级，支持跨盘存取；高可靠性，光盘的寿命为100年；与各系统无缝连接，可应用于Windows NT，NetWare，Unix，IBM等系统；安装简便，易于管理。,图5-7 光盘库应用,3、存储区域网络,存储区域网络（Storage Area Network，SAN）是通过专用高速网将一个或多个网络存储设备

31、和服务器连接起来的专用存储系统。SAN在最基本的层次上定义为互连存储设备和服务器的专用光纤通道网络，它在这些设备之间提供端到端的通讯，并允许多台服务器独立地访问同一个存储设备。SAN通过单独的高速光纤网络将存储设备和局域网上的服务器群连接起来，数据的存取通过存储区域网在服务器和海量存储设备间进行高速传输。存储区域网络是一种可满足海量（TBPB数量级）数据存储、大量的I/O吞吐量和高端应用需求的网络式存储技术。应用计算机通过标准的网络（如以太网）连接到SAN的存储设备上。,SAN的出现使服务器和存储设备之间的连接方式产生了根本的变化。SAN是一种可以使服务器与大型存储设备（磁盘阵列或磁带库）之间

32、进行任意连接通信的存储网络系统，它通过一个单独专用的网络将存储设备和服务器连接在一起。由于在SAN中服务器可以和网络中的任何存储设备连接，所以数据存放在何处，服务器都可以直接存取所需要的数据。SAN中的各种设备是分散在网络中的。光纤通道技术可以支持多种网络拓扑结构，使用全双工串行通信原理传输数据，速度快且延迟小。现在，采用光纤通道（FC）技术硬盘存取速度实际上达到200MB/s。光纤通道采用同轴线时的传输距离达到30m，采用单模光纤时的传输距离可以达到10km。,存储区域网络以光纤通道（FC：Fiber Channel）为基础，实现了存储设备的共享，突破了现有传输距离的限制和存储容量的限制；服

33、务器通过存储网络直接与存储设备交换数据，释放了宝贵的局域网资源。SAN采用光纤通道技术彻底改变了服务器和存储设备之间的连接关系，实现以前无法实现的应用模式。,存储区域网络（SAN）由四部分组成：其结构如图5-7所示。包括终端用户、服务器群、存储系统和光纤通道,图5-7 存储区域网络结构,用户终端通过局域网和广域网与单独的服务器或服务器群连接。在某些特殊情况下也可以直接通过光纤通道网连到存储设备。在小型和大型网络应用中，服务器以单机或群的方式接入存储区域网络。光纤通道网络是特有的技术，光纤通道是由光纤集线器、光纤交换机等设备组成。存储设备通过光纤通道与服务器群连接。,存储区域网络（SAN）的特点

34、如下：,实现大容量存储设备的共享和高速的数据传输。SAN所提供的大容量存储设备共享方式可以形成共享数据存储池，满足当前计算机所要求的海量数据存储要求。由于SAN采用光纤网，提供了主机与存储设备之间的高速连接，提升了主机系统的存储带宽；连接方便和远距离传输。光纤通道FC技术的采用使SAN的设备连接距离可以达到10km（SCSI只有25m）；,实现主机与存储设备的分离。主机与存储设备的分离是当今计算机技术发展的一大趋势。由于多台服务器共享SAN上的存储设备，大大改善了向服务器分配磁盘空间的方式。存储设备与服务器的分离，使得SAN中的主机、存储设备不但在物理位置的安排上可以十分灵活，而且还可以方便地

35、将各种设备进行逻辑上的划分，还允许用户随时添加应用所需要的存储空间；提高数据的可靠性和安全性。在SAN中可以采用双环方式建立存储设备和计算机之间的多条通路，从而提高数据的可用性。还可以通过建立双机容错、多机集群，实现RAID（Redundant Array of Inexpensive Disk廉价冗余磁盘阵列）检验等方式，进一步保证数据的安全性。,4、多媒体数据库（1）概述多媒体数据库MMDB(Multimedia Database)是由若干个多媒体对像所构成的集合，这些多媒体数据对像是按某种特定的方式组织起来并为其它的具体应用共享。多媒体数据管理系统MMDBMS(Multimedia D

36、atabase Management System)是以多媒体数据库MMDB为基础的且能完成对多媒体数据库MMDB的各种操作和管理功能的多媒体应用系统。由于多媒体数据自身的特点，如由多种媒体构成且数据量巨大、媒体数据间的不同约束关系、实时性的要求等，使得多媒体数据库系统有别于传统的数据库系统。,关系模型是目前数据库系统中最常用的数据模型之一。关系模型是建立在关系代数的基础之上的，有较为严密的理论基础，其数据结构简洁明了、直观清晰、易学易用。目前大多数数据库管理系统产品均支持关系模型.关系模型要想存储多媒体数据，就需要进行扩充。非第一范式NF2(Non First Normal Form)数据模

37、型通过对关系模型的扩展来提高关系模型处理多媒体数据的能力。随着近年来面向对象技术的兴起，面向对象技术在数据库中的应用也日益显现出其强大的生命力。这主要是由于面向对象模型能够很好的描述复杂的事物对象，更好的维护复杂对象的语义信息。,（2）多媒体数据库的体系结构多媒体数据库管理系统MMDBMS的体系结构分为三层，即数据库管理层、多媒体数据合成层和交互层。如下图所示。,图5-8 多媒体数据库管理系统体系结构,数据库管理层负责完成对各类媒体对象的维护。多媒体对象是由既相互独立又相互联系的文本、图形、图像、音频或视频等媒体对象构成的一种复合实体，各类媒体对象在复杂程度、数据量和是否具有时域特征等方面存在

38、极大的差异。为了适应这种异构性，数据库管理层利用不同的数据库及数据库管理系统来存储和管理不同类型的媒体对象，即数据库管理层依据不同媒体类型的特点，选用不同的表示、存储和处理媒体对象的手段。数据库管理层可以被进一步划分为物理数据库管理子层和逻辑数据库管理子层，前者主要完成各类媒体对象的物理存储，后者则负责媒体对象的维护以及向外界提供各种数据访问服务。,多媒体数据合成层负责多媒体对象的存储与管理，主要完成表示及维护多媒体对象的合成方式(即各媒体对象如何聚集为多媒体对象)以及各媒体对象之间所具有的各种约束关系，尤其是对时域约束关系的描述信息，这些信息在提取、显示等多媒体数据的操作过程中发挥着重要作用

39、。交互层为用户访问MMDBMS提供所必需的查询、浏览、媒体编辑、数据组织等功能。同其余两层相比，该层的变动性较大，也就是说可以通过不断地引入新的技术来丰富和用户的接口功能。如随着Web技术的成熟与完善，可以利用HTML“超链”的概念，将 MMDBMS中保存的有关空域、时域等约束关系的描述信息嵌入Web主页，从而使用户能够通过统一的Web浏览器，对多媒体记录的内容进行检索和遍历。,5.2 超媒体技术,超媒体技术是在超文本技术基础之上结合多媒体技术而发展起来的信息管理与检索技术。5.2.1 超文本技术人类对信息的管理经历了文本、超文本和超媒体的三个阶段。传统的文本，如一本书、一篇文章、一个文件、

40、一段计算机程序等，它们的共同点是在组织上是线性的和顺序的。这种线性结构体现在阅读文本时必须按固定的顺序一页一页地有次序的进行，读者没有选择阅读内容的余地。然而人类的记忆是层次网状结构，知识的获取采用联想方式，联想检索必然会导致选择不同的路径，并产生不同的结果。因此文本的线性结构在客观上限制了人们自由联想能力的发挥。人类的思维是联想式的，如果信息的组织也具有联想式的非线性的结构，将有助于提高人们获取知识的效率，同时各种信息也会得到充分的利用。,超文本结构类似于人类的这种联想式记忆结构，超文本是一种按信息之间的关系非线性的存储、组织、管理和浏览信息的计算机技术。它采用一种非线性的网状结构组织块状信

41、息，没有固定的顺序，也不要求读者按照某个顺序来阅读。各信息块间按照自然关联关系用有向直线段(链)加以连接，以便于人们联想查找。超文本技术与传统计算机技术的区别在于，它不仅注重所要管理的信息更注重信息间关系的建立和表示。,下图为一完整的小型超文本结构。该结构由六个信息块组成。由图中可以看出，超文本结构是由若干内部互联的文本信息块（或其它信息）组成，这些信息块可以是计算机的若干屏、若干窗口、文件信息或更小的信息单元。这样的信息单元就是超文本结构的一个节点，每个结点可以是一段正文、一个文件、一帧图像(图形)、一幅动画、一段声音或一个窗口等，每个节点不论大小，都会有若干指向其它节点或由其它节点指向该节

42、点的指针，这些指针被称为链，链的数量通常事先不固定。结点之间按它们的自然关联用若干个链连接成网络。,超文本结构实际上就是由结点和链组成的一个网络。因此在超文本结构中获取信息时，可以通过不同的路径达到目的地。为了防止读者在复杂的信息网络结构中迷失方向，一个超文本系统还要配备有用于节点浏览并防止迷路的交互式工具，即浏览器。利用超文本技术来管理多媒体信息就构成了超媒体。创作和管理超媒体的系统就称为超媒体系统。,5.2.2 超媒体的组成节点、链和网络是超媒体系统的基本组成要素。1、节点（Node）节点是超媒体的信息组成结构中围绕一个特殊的主题组织起来的数据集合，该集合可以是有形的（例如一个数据块），也

43、可以是无形的（如信息空间中的一个部分）。现在的节点可以是各种媒体节点，也可以是数据库、文献等；也可以是动作类节点、组织类节点和推理型节点等。,(1)媒体类节点：这类节点中存放着各种媒体信息，这些媒体信息可以是文本、图像、图形、视频、动画等，也可以是数据库、文献等。(2)动作与操作类节点：动作与操作类媒体是通过按钮来访问的，也被称为按钮节点。由含有特殊功能的按钮组成，每个按钮都可以启动相应的计算机程序，完成特定的操作任务。(3)组织型节点：组织型结点主要用于结点的组织和知识的表示。组织型结点包括各种媒体节点的目录和索引节点。(4)推理型节点：是用于辅助链的推理和演算，包括对象节点和规则节点。,2

44、、链（自学）链也称为超链，它是固定节点间的信息联系，链以某种形式将一个节点与其它节点连接起来。通常链是有向的，一般是由3部分构成：链源、链宿和链的属性。,链源是指导致结点信息迁移的原因，链源可以是热字、热区、热点等。热字是在文本结点中特殊符号标注的词组(例如，用颜色或用下划线来标注)。热区是在图形和图像等静态视觉媒体结点中某一用户感兴趣的区域。热点是在具有时间特性的动态混合媒体结点(例如视频、动画、音频等)中某一段时间内的信息，因此，热点需要记录下某段时间内感兴趣信息的起止时间点。链宿是链所指向的目标，在超文本中链宿一般为一个结点。链的属性是指它的类型、版本和权限等。,在超文本系统中，结点联系

45、的多样性使得链具有多种不同的类型，一般常用的链的类型有以下几种：基本结构链组织链和推理链自动链接链和类型链热标（Hotspot）是确定信息关联的链源，由热标将引起向相关内容的转移。很明显，不同的媒体类型有不同形式的热标。热标的形式主要有以下几种。(1)热字(2)热区(3)热元(4)热点(5)热属性,3、网络（自学）超文本是由结点和链构成的信息网络，是一个有向图。这主要是由于超文本中的链都是有方向的，并且都是单方向的。它类似于人类的联想记忆模型，采用一种非线性的网状结构来组织块状信息。结点之间的联系与依赖通过交互的浏览、探索来实现。网络中的结点的排列没单一的、固定的顺序，因而每一个结点都可

46、以有多种不同的访问方式，由用户根据自己的需要来选择浏览的路径。超文本具有多方面、多层次的表现力，为人们提供了一种全新组织信息的方法。因此，超文本网络在建立信息联系的同时，也表现了设计者的思维轨迹。超文本网络是一种适合于多媒体系统表达和组织的模型。,5.2.3 超媒体系统结构 1.系统结构超媒体系统是指那些能够创作和使用超媒体应用的系统。一个超媒体系统一般是由创作子系统（作者子系统）、读者子系统（浏览器）和支持子系统组成。,作者子系统向用户提供生成超媒体的多种手段，其中包括编辑器、超媒体语言、媒体编辑工具等。读者子系统向用户提供使用超媒体的手段，主要是浏览器或导航工具。在超媒体系统的三个组成成

47、分中，支持子系统是实现超媒体服务的关键，对应用来说它是系统应用的内核层。支持子系统能够识别超链的成分，并引导其转向相应的目标节点。在支持子系统中最为重要的是超媒体服务器（也称Web服务器）的建立和维护。2、多媒体信息交换及标准（略）,图5-9 超媒体系统结构及对应媒体对象,5.2.4 分布式超媒体系统WWW WWW（World Wide Web）也称为万维网。WWW采用客户/服务器体系结构，支持通过Internet进行访问的分布式超文本。在万维网中，存取的单位是Web页，而它是一个超文本文件。WWW的客户端软件被称为Web浏览器，为用户提供统一管理各种媒体信息的交互界面，负责向Web服务器发出

48、请求、解释和定位信息资源，利用统一资源定位符URL(Universal Resource Locator)统一管理网络上的所有资源。Web服务器端软件也称为Web服务器，负责集合多种信息媒体并根据用户的请求作出相应的回应，以统一的文件格式传送给客户端。Web超文本系统可分为三层，即表现层、超文本抽像机层和超文本信息库层。,表现层：用户接口层，用户计算机上的浏览器完成对表现层的管理超文本抽象机层：由超文本标记语言HTML和超文本传输协议HTTP组成，完成对节点和链的存储超文本信息库层：由遍布Internet上的服务器组成，负责为网络上其他计算机提供各种信息资源，完成数据的存储和共享以及对网络的访

49、问 WWW被称为第一代网络超媒体信息系统的代表。下一代超媒体是向着智能化超媒体的方向发展。,超文本通信协议HTTP(Hyper Text Transfer Protocol)是在Internet环境下使用万维网(WWW)的标准化协议。浏览器/服务器(Browser/Server)方式是在客户/服务器(Client/Serve)方式基础上发展起来的一种适合于多媒体环境下的一种网络应用结构。它把全世界数以千计的多媒体数据库接入WWW，并以超文本方式链接起一个全球范围内的多媒体数据仓库。用户通过联网的计算机，在http超文本传输协议下，通过Web Browers软件，借助于鼠标器来浏览WWW上的信息

50、，共享Internet上的无限的信息资源，同时也能快速地向外发布内部的信息数据，使世界在空间上进一步缩小。,5.3 多媒体同步技术,5.3.1 多媒体同步概述 1、多媒体同步概述多媒体系统中集成了具有各种不同时态特性的媒体，这些媒体有依赖于时间的媒体（例如视频、音频、动画等）和独立于时间的媒体（例如文本、静止图像、表格等）。多媒体同步就是保持和维护各个媒体对象之间和各个媒体对象内部存在的时态关系，维持各种媒体序列以实现某种特定的表现任务。,多媒体系统的同步控制必须保证在同步点上各个媒体之间能够保持时间关系。例如,一个有语音讲解的多媒体幻灯片,其讲解必须和一组画面同时表现,且随着画面的显示,讲