【教学课件】第02章多媒体技术概论.ppt
第02章,多媒体技术概论*,学习目标,主要内容,2.1 多媒体基本概念,媒体Media是存储、传播、表现信息的载体。一方面是指存储信息的实体,如磁盘、光盘、磁带、半导体存储器等;媒体也可以指传递信息的载体,如数字、文字、声音、图形和图像等,多媒体技术中的媒体主要是指后者。,多媒体基本概念,多媒体Multimedia一种以交互方式将文本、图形、图像、声频、视频等多种媒体信息,经过计算机设备的获取、编辑、存储等综合处理后,以单独或合成的形态表现出来的技术和方法。多媒体具备多样性、集成性和交互性。,多媒体基本概念,多媒体的数据类型众多文本信息图形图像动画音频信息视频信息,多媒体基本概念,多媒体应用领域广泛教育应用:图、文、声、像一体,具有直观性、可操作性和交互性。电子出版:以信息存储容量大、多种媒体信息综合应用、信息查询方便,成为人类信息传播的一次革命。管理信息系统和办公自动化:MIS、OA家庭娱乐:声像制品和视频游戏应用虚拟现实,主要内容,2.2 多媒体计算机系统,多媒体计算机系统四大组成部分多媒体计算机硬件系统:包括计算机、声音/视频处理器、多种媒体输入/输出设备及信号转换装置、通信传输设备及接口装置等;多媒体操作系统:是驱动管理多媒体设备和处理多媒体信息的核心系统;多媒体开发系统:是基于操作系统之上的获取、加工、制作多媒体数据的软件系统;用户应用系统:是面向用户的采用多媒体开发系统制作的多媒体应用产品。,多媒体个人计算机,多媒体个人机(MPC)概念传统的微机处理的信息仅限于文字和数字,人机之间的交互只能通过键盘和显示器进行 多媒体个人机在PC机基础上,融入综合处理声、图、文信息的功能。,多媒体个人计算机,MPC硬件系统 CPU、内存、显示器、显卡、硬盘等基本计算机系统设备;多媒体适配卡:包括声卡、视频卡、传真卡、电视卡、视频采集卡等;多媒体外围设备:包括CD-ROM、DVD-ROM、扫描仪、摄像机、打印机、麦克风、音箱等声卡、光盘驱动器是MPC中最基本的硬件设备。,1、声卡,声卡的基本功能声卡(也叫音频卡)是计算机进行声音处理的适配器;声卡的基本功能包括模拟声音输入输出、音乐合成、混音和音效合成音乐合成调频(FM)合成法:通过将多个频率的简单声音合成复合声音的方法来模拟各种乐器的声音;波形表(Wavetable)合成法:把各种真正乐器的声音录下来,形成波形数据,存储在声卡中,发音时查找所选乐器的波形数据,再经过调制、滤波、合成等处理形成立体声后传送到音箱。,声卡,声卡的基本功能混音和音效处理将不同来源的声音组合输出,通过数字处理的方法实现各种音响效果(混响、延时、合唱等)等。模拟声音输入输出 A/D、D/A转换,能实现模拟的声音与数字声音的转换。,声音的采样,声音采样过程要将模拟的声音转换为数字声音,首先要对声音波形进行采样,记录每个采样点处的振幅。采样率和量化位数是衡量声卡的两个重要指标。,声音的采样,声音采样的重要指标采样率:表示两次采样之间的时间间隔。标准的采样频率有:语音效果(11 kHz)、音乐效果(22 kHz)、高保真效果(44.1 kHz),目前常用的声卡均支持44.1kHz采样率;量化位数:对声波每次采样后存储、记录声音振幅所用的二进制位数称为采样位数,量化位数决定了音乐的动态范围,8位声卡的声音从最低音到最高音只有256个级别,16位声卡有65536个高低音级别。,2、光盘驱动器,CD-ROM驱动器,读取CD-ROM光盘分为内置式和外置式,内置式光驱安装在主机箱内,与硬盘的连接方式类似,常与IDE接口连接;外置式光驱需要独立的电源,通常通过并口或USB接口连接;支持盘片容量一般为680M。光驱单倍速为150Kb/s(Kbps),通常光驱的速度为该速度的整数倍数,如50倍速光驱。速度是衡量光驱的重要指标。,光盘驱动器,DVD-ROM驱动器是下一代高速、大容量的光盘存储设备;兼容CD-ROM盘片;DVD-ROM盘片容量可达4.717G;DVD-ROM盘片目前主要用于存储高清晰度视频信息。DVD-ROM驱动器,定义单倍速为1335Kb/s。,3、光盘,DVD光盘只读DVDDVD-ROM:只读数据光盘,CD-ROMDVD-Video:存储DVD影片,VCDDVD-Audio:192KHz、24位采样,存储音频数据,类似于CD可擦写DVDDVD-RAM、DVD-RW、DVD+RW可刻录DVDDVD-R,光盘,DVD-Video盘片与VCD盘片DVD采用MPEG2编码,清晰度更高,而VCD采用MPEG1编码,清晰度差;DVD采用杜比AC3环绕立体声,而VCD使用的是普通的双声道立体声输出;DVD容量达4.717G,而VCD容量最高只有680MDVD播放时,支持多语言与多字幕选择,而VCD没有;DVD具有区域编码保护,VCD没有。,光盘,DVD-Video光盘的分类D5,DVD-5:单面单层,容量4.7G,一面数据,另一面为标记层,一般印刷文字或图案D9,DVD-9:单面双层,容量8.5G,一面数据,另一面印刷文字或图案 D10,DVD-10:双面单层,容量9.7G,其中一层两面均为数据D18,DVD-18:双面双层,容量17G,4、其它可扩充设备,视频卡,处理多媒体视频信号的接口卡。视频采集卡:从摄像机、录像机中捕捉模拟视频信息并转存到计算机中;视频播放卡:又称解压缩卡,专门处理光盘中的压缩视频文件并进行播放,现已逐步被软件替代;视频转换卡:完成显示器信号和电视信号之间的相互转换。,其它可扩充设备,扫描仪是一种图像输入设备,借助相应的软件还能进行文字和图像识别。通过光的反射照射称作CCD的光敏元件,根据光线强度转换为相应的信息。数码相机是一种将客观景物以数字方式记录在存储器中的照相机。其核心部件也是CCD光敏元件。,主要内容,2.3.1 图像和图形,色彩知识三原色原理 自然界常见的各种颜色光,都可由红(R)、绿(G)、蓝(B)三种颜色光按不同比例相配而成;某个物体呈现某种颜色,是因为该物体反射这种颜色的光波,而吸收了其它波长的色光。,图像和图形,矢量图(图形)和位图(图像)的概念位图(图像):是数字化的图像,通常把一幅位图图像近似为一个矩阵,矩阵中的一个元素(像素)对应图像的一个点,每点用若干位二进制位表示该点的灰度等级或颜色;矢量图(图形):以数学方法描述的由基本几何元素(圆弧、直线、抛物线等)组成的图形;位图存储构成图像的每个点的颜色,存储的是画面;矢量图存储的是如何画图的“指令”,指令由相应的软件解释执行并生成相应的画面。,图像和图形,图形文件和图像文件的简单比较图像文件都是由一些排成行列的像素组成的,数据量都较大;图形文件中只记录生成图的算法和图上的某些特征点,占用的存储空间小;图形文件只保存算法和特征点,显示时,需要通过计算生成画面,显示速度慢;图像缩放后会变形,而图形不会变形失真;位图包含的颜色信息多,适合表现比较细致、层次和色彩比较丰富、包含大量细节的画面,矢量图适合较小的图像或简单的画面。,图像和图形,位图的相关技术指标分辨率:指构成图像的像素数,描述的是图像的大小,用水平方向像素数垂直方向像素数表示;,图像和图形,位图的相关技术指标色彩数:对于每个像素,图像文件需要使用若干位二进制数描述其颜色信息,所用二进制数的位数称为色彩数。色彩数为1时,只能表示两种颜色(黑白图像);当色彩数为4时,能表示16种颜色,称为16色图像;色彩数为8,能表示256种颜色,称为256色图像;色彩数为24时,可以表示22416777216种颜色,称为24位真彩色图像。,图像和图形(五),位图的相关技术指标位图文件大小的计算:字节数分辨率色彩数/8如一幅1024768的真彩图片占用存储空间为102476824/82359296B,图像和图形,常用图像(图形)文件格式BMP:PC机上最常用的位图格式,可表现从2位到24位的色彩。GIF:在各种平台的各种图形处理软件上均可处理的经过压缩的图形格式,只能存储256种颜色。JPG:可以大幅度地压缩图形文件的一种图形格式,色彩数最高可达到24位,广泛应用于Internet上。WMF:Microsoft Windows图元文件,该类图形比较粗糙,只能在Microsoft Office中调用编辑。,声音媒体,声音的基础知识自然界的声音是一种连续的模拟量声波声波的频率范围为20H20kHz;人说话时的声音频率范围300Hz3kHz;音乐的频率范围为10Hz20kHz。计算机只能处理二进制编码的数字信号,模拟的声波必须进行数字化,转化为数字量,才能被计算机处理。声卡中的模拟/数字转换器能把模拟声音变成数字声音,数字/模拟转换器可以将数字声音还原为模拟声音。,声音(音频),声音的采样把模拟声音波形按相等时间间隔划分为许多片断,每个片断用一个数值对其振幅信息进行量化,将连续的波形转化为离散的数字信号。采样频率:指单位时间内的采样次数。量化位数:对采样点进行数字化时所使用的二进制位数,通常有8位、16位、32位,量化位数越大,所记录声音的变化程度就越细腻。,声音(音频),声音的采样声道数:指所处理的声音是单声道还是立体声,立体声需要左、右声道两个采样数据流。采样后声音文件的大小:采样频率量化位数声道数时间(秒)/8,例如以22.05kHz的采样频率对声音波进行采样,采样的量化位数为16位,录制4秒双声道声音,数据量为22.051000164/8352800字节。,声音(音频),MIDI音乐MIDI:是数字音乐的国际标准,定义了计算机音乐程序、合成器及电子乐器交换信息和电子信号的方式,解决了不同电子乐器之间的不兼容问题标准的多媒体计算机能够通过内部(声卡中)合成器或连接到计算机MIDI端口的外部合成器播放MIDI文件,利用MIDI文件演奏音乐,所需的存储量最少。,声音(音频),MIDI文件是存放MIDI信息的标准文件,不包含声音波形数据,只包含如何产生声音的指令,包含音符、定时和多达16个通道的演奏定义;演奏指令定义了所用MIDI设备的音色、声音的强弱、声音持续的时间等,MIDI文件需要的存储空间非常小。,声音(音频),MIDI音乐的采集和播放MIDI电子乐器(如电子琴等):通过声卡的MIDI接口与计算机连接,通过相应的程序可以采集MIDI电子乐器发送的“指令”,这些指令可以记录到以.MID为扩展名的MIDI文件中。要播放MIDI文件,可以将MIDI指令发送至音乐合成器,由声卡的合成器根据指令产生相应的波形,发送至音箱播放,也可以将MIDI指令直接发送给电子乐器进行“演奏”。,声音(音频),MIDI文件与波形文件MIDI文件占用空间小,如30分钟的立体声高品质音乐,用波形文件无压缩录制,约需300MB的存储空间;而同样的MIDI数据,则只需200KB,相差1500倍。MIDI只存储指令,编辑相对直接、方便,而波形文件的编辑相对复杂。,声音(音频),MIDI文件与波形文件MIDI适合表现音乐,不能很好再现自然界真实的声音,如语音、水流声;波形文件适合表现复杂声音。MIDI适合于播放长时间高质量音乐、播放背景音乐。波形文件适合于播放语音且声音不会太长的场合。,声音(音频),常用的声音文件存储格式 WAVE:扩展名为WAV,Windows平台的音频信号,记录声音的波形,文件庞大。MPEG-3:扩展名MP3,是将WAV声音数据压缩后产生的音乐文件格式,与CD音质相仿,压缩率非常高,是目前最流行的声音文件格式;MP4,由美国唱片行业联合会推出,主要解决MP3音乐文件无法提供版权保护的缺陷,压缩比略高于MP3,音质相当。,声音(音频),常用的声音文件存储格式 Real Audio:扩展名RA,压缩比大,许多音乐网站和网络广播都采用RA格式,音质差。CD Audio音乐:扩展名CDA,是CD唱片采用的格式,又叫“红皮书”格式,记录的是波形流,音色和音质都非常好;但占用空间大。WWA:Windows Media Audio是微软发布的音频文件格式,压缩率比MP3略高,音质也非常好,它属于流媒体(可以一边从网络下载一边播放,无需等待整个文件下载完成)。,视频与动画,基础知识动态图像:包括动画和视频信息,由连续渐变的静态图像或图形序列沿时间轴顺次更换显示形成的,它们往往也包含声音媒体。帧:电影、数字视频、动画,都是由一系列静止画面组成的,每个画面称为一帧,各帧连续播放形成动态画面。,视频与动画,基础知识视频(影像视频):每帧图像通过实时摄取自然景象或活动对象而获得的。动画:各帧图像由人工或计算机产生的。帧速:单位时间播放帧的数量称为帧速。帧速选择在每秒2430帧之间,视频的运动就比较光滑连续;低于每秒15帧,会有停顿的感觉,帧速过高,则会产生图像重叠效果。,视频与动画,数字视频的技术参数帧速:常用的有25帧/秒、30帧/秒。分辨率:视频分辨率越大,数据量越大,质量越好。颜色数:指每帧视频图像中最多能使用的颜色数。颜色位数越多,色彩越逼真,数据量也越大。压缩比:压缩比不易过高,压缩比超过一定数值后,图像质量明显下降,回放时所需的解压时间也更长。关键帧:视频信息往往利用关键帧动态合成中间的视频帧,关键帧数过少,会出现图像不稳定的现象。,视频与动画,常用的视频文件格式AVI:是微软公司采用的音频视频交错格式,应用非常广泛。没有经过压缩,数据量非常大,图像和声音质量较好。MPEG格式:用MPEG压缩标准压缩后的全运动视频图像,压缩比可达100:1至200:1。MOV格式:苹果公司推出的视频格式,包括音频的AIFF格式和视频的MOV格式,可由QuickTime播放。,视频与动画,常用的视频文件格式RM格式:是Real Networks公司开发的用于网络实时传输视频和音频的压缩文件格式。SWF格式:是Macromedia公司的Flash软件生成的矢量动画图形格式,可以包含动画和声音,具有较强的交互性能,SWF格式的动画文件很小,在网络中应用非常广泛。ASF格式:是微软公司推出的网络实时传输视频和音频的压缩文件格式,视频采用了最新的MPEG-4压缩方式,音频采用了WMA压缩。,主要内容,多媒体工具,矢量绘图工具CorelDraw:Corel公司出品的流行矢量图绘制软件;Freehand:Macromedia公司出品,广泛用于广告业和多媒体制作业;Illustrator:Adobe公司出品,支持矢量图绘制和位图处理,支持光笔;Fireworks:Macromedia公司的产品,与Flash、Dreamwaver等软件配合,广泛应用于网络创作。以上绘图软件,在新版本中,都开始支持图像处理,从而将矢量绘图和图像处理合二为一。,多媒体工具,图像处理工具Adobe PhotoShop:专业级的图像处理软件,支持丰富的虑镜和特效处理;目前版本也支持矢量绘图和简单的动画制作。PhotoImpact和Cool 3D:友立公司推出的适合家用的图像处理软件。图形图像浏览工具ACDSee:最流行的图片浏览器,支持绝大多数图像文件,操作非常方便。CompuPic和PicView:支持对图形(图像)格式、分辨率、色彩数的转换。,多媒体工具,媒体播放工具Winamp:最著名的MP3播放工具,支持各种音效和视觉插件,支持各种音乐文件格式和流行的视频文件。RealPlayer:RealNetworks公司推出的适应网络低带宽传输的网络流媒体播放器,一度非常受欢迎,但播放效果不好。,多媒体工具综述(四),媒体播放工具Windows Media Player:是微软推出的重量级媒体播放,从7.0版本开始,增强了网络功能,支持流媒体应用,支持除竞争对手RM等格式外的绝大多数媒体格式。超级解霸:国人开发的媒体播放工具,支持多种媒体格式,播放品质一般。,多媒体工具,视频创作工具Premiere:是美国Adobe System公司推出的专业级数字视频处理软件,能配合硬件进行视频捕获、编辑和输出,可以进行数字音频的编辑。Ulead MediaStudio Pro:美国Ulead公司推出的专业数字视频和音频处理软件。汇声会影:美国Ulead公司推出的面向家庭的数字视频处理软件,操作简单,适合家庭使用。HyperCam:能捕获Windows、Dos提示窗口的屏幕画面,适用于录制各种教学和演示操作。VirtualDub:功能强大的免费视频处理软件。,多媒体工具,动画制作工具3D Studio MAX:Autodesk公司产品,是三维绘图、造型设计和动画制作软件中的经典之作,应用广泛。POSER:MetaCreations公司的产品,能非常方便地制作人体三维造型和动画,操作容易。MAYA:是专业级的三维图像和动画制作软件的后起之秀,适合创建影视动画。Flash:Macromedia公司的产品,用于制作二维动画,文件尺寸小,非常适合网络传播和应用。,主要内容,压缩和编码标准,多媒体数据压缩的必要性数字化的声音、图像和视频占用非常大的存储空间,一幅640480中等分辨率的24色图像,占用存储空间为7.37Mb/帧;如果是30帧/s的视频,则视频信号的传输速率需要达到220Mb/s。随着网络应用的普及,人们希望能通过网络接收视频、动画、声音、文字等信息,而现有的网络传输速率是远远不能满足这种需求的,必须要对数据进行压缩处理。,压缩和编码标准,多媒体数据压缩数据压缩是一种数据处理方法,作用是将一个文件的数据容量减小,而又基本保持原来文件的内容,以便于信息传输;在需要这些信息时,能够通过解压缩将原始信息还原。通过数据压缩技术,有可能将文字数据压缩至1/2左右,语音数据压缩至原来的1/21/10,图像数据压缩至原来的1/21/60。,压缩和编码标准,多媒体数据压缩种类无损压缩:通过解压缩,能完全恢复原始信息,常用于文本、程序文件的压缩,压缩比不会太高。有损压缩:通过解压缩,只能近似恢复原始信息,常用于对视频、图像、声音数据的压缩。,压缩和编码标准,三大编码及压缩标准JPEG是针对静止图像的压缩和解压缩算法,由ISO(国际标准化组织)和CCITT(国际电报电话咨询委员会)共同制定,并在1992年后被广泛采纳后成为国际标准;压缩算法能把冗余的图像信号和其它类型的静止图像去掉,压缩比最高可达100:1,但当压缩比大于20:1时,图像质量明显变坏;广泛应用于多媒体CD-ROM、彩色图像传真、图文档案管理等方面。,压缩和编码标准,三大编码及压缩标准MPEG是针对动态图像压缩的国际标准,于1990年推出了MPEG-1,并不断推出新的压缩标准;MPEG-1广泛应用于VCD制作,能将120分钟的电影压缩到1.2GB左右;MPEG-2的标准数据传输率为10Mbit/s,能实现每秒30帧的720572的高清晰视频信号,是数字电视的标准,应用于DVD制作和高清晰数字电视广播;MPEG-4是一种崭新的低误码率、高压缩比的视频编码标准,发展目标是为了适应Internet的视频适时传送。,压缩和编码标准,三大编码及压缩标准MPEGMPEG还包括声音压缩标准,分为三层,MPEG Audio Layer-1、Layer-2、Layer-3,其中Layer-3被应用于MP3,压缩比能达到10:110:1。,压缩和编码标准,三大编码及压缩标准H.261针对可视电话和电视会议而制定的标准。该标准以64Kbps的整数倍作为传输速率,也称Px64标准,当P为1或2,适用于可视电话,P6,适用与电视会议。,