多媒体技术与应用(本)考前辅导.ppt

上传人：sccc

文档编号：5909632

上传时间：2023-09-02

格式：PPT

页数：112

大小：491.04KB

《多媒体技术与应用(本)考前辅导.ppt》由会员分享，可在线阅读，更多相关《多媒体技术与应用(本)考前辅导.ppt（112页珍藏版）》请在三一办公上搜索。

1、多媒体技术与应用,主要内容,1、介绍题型的设置2、概括整个知识点的分布3、总结基础理论知识点4、分析重点题型,题型,一、单项选择题（30%）二、填空（10%）三、问答（40%）四、计算题（20%）,各章的主要内容,多媒体技术综述（基本概念）多媒体数据压缩技术综述数字图像技术数字音频技术数字视频技术数字动画技术多媒体网络技术及应用多媒体计算机硬件系统,第一章多媒体技术综述,【知识点】媒体的分类多媒体包含的信息类型多媒体技术的基本概念和特点超文本、超媒体、CSCW、虚拟现实基于内容的检索等一些基本的思想方法,CCITT将媒体分为五类：（1）感觉媒体（preception medium）或称感官

2、媒体（直接作用于人的感官）：音乐、自然界的各种声音（2）表示媒体（representation medium）（人为研究、构造出来）：图像JPEG编码、文本ASCII编码和乐谱,一、媒体的分类,媒体分类（2）,（3）表现媒体（presentation medium）或称显示媒体（表示和获取信息的物理设备）输入表现媒体：键盘、摄像机、光笔、话筒、扫描仪输出表现媒体：显示器、喇叭、打印机,媒体分类（3）,（4）存储媒体（storage medium）（存储信息的物理设备）：磁盘、软盘、光盘、U盘、磁带及CD-ROM等（5）传输媒体（transmission medium）（传输数据的物理设备）：双

3、绞线、同轴电缆、光纤等,在计算机领域内，各种媒体的关系如下：,二、多媒体包含的信息类型,（1）文本：TXT格式、HTML格式等（2）图形：（矢量图，用数学方法）示例：几何图形、工程图、等高线地图、曲面的线框图等（3）图像：（位图，用物理方法）示例：从传统的相片、数码相机等得到,多媒体包含的信息类型（2）,（4）音频：波形音频文件(WAV)、数字音频文件(MIDI)、压缩音频文件(MP3)等；（5）视频：AVI、DAT、RM等；（6）动画：GIF（Internet上大量采用）、SWF等；,三、多媒体技术的概念及特点,定义：计算机综合处理声、文、图信息的技术。集成性：媒体信息和媒体设备的集成实时

4、性：实时处理交互性：与普通家电的区别,四、超文本,基本概念：由信息结点和表示信息结点间相关性的链构成的具有一定逻辑结构和语义的网络。超媒体（天然的多媒体信息管理方法）=超文本+多媒体超文本的主要成份：结点、链、宏结点（子网）,超文本的基本原理：人脑的记忆机制（联想式的记忆，非线性的网状结构）传统文本（它在组织上是线性的和顺序的）,文本的线性结构,五、CSCW,计算机协同工作(Computer Supported Cooperative Work，CSCW)：支持有着共同目标或者共同任务的群体活动的计算机系统，并且该系统为共享的环境提供接口。,CSCW分类原则,群体规模：两人或是多人地理位置：

5、远程或是同地交互形式：同步或是异步,CSCW目前活跃的领域,（1）电子邮件系统（2）电子布告栏系统（bulletin board system,BBS）（3）群决策支持系统和电子会议室系统（4）多用户共同编辑系统（5）计算机会议系统,六、基于内容的检索过程,初始检索说明：特定的查询语言相似性匹配：将特征与特征库中的特征按照一定的匹配算法进行匹配。特征调整：用户对返回的一组满足初始特征的检索结果进行浏览，挑选出满意的结果，检索过程完成；或者从候选结果中选择一个最接近的示例，进行特征调整，然后形成一个新的查询。重新检索：逐步缩小查询范围，重新开始。该过程直到用户放弃或得到满意的查询结果时为止。,

6、基于内容的检索过程,八、虚拟现实,虚拟现实（Virtual Reality，VR）：由计算机生成具有临场感觉的环境；是一种高度逼真地模拟人在现实生活中视觉、听觉、动作等行为的交互技术；是一种全新人机交互系统。涉及领域：计算机图形学、人工智能、传感技术等,实现语言：VRML（Virtual Reality Markup Language）关键技术：实时三维动画技术临场感技术（包括基于自然方式的人机交互技术等）快速、高精度三维跟踪技术辨识技术传感技术,虚拟现实的基本特征（3I特性）：浸没感（Immersion）：又称临场感，指用户感到作为主角存在于模拟环境中的真实程度。交互性（Interac

7、tivity）：使用者不再是被动地接受信息或是旁观，而是能够使用交互输入设备操作虚拟物体，改变虚拟世界。构想性（Imagination）：使用者利用VR系统可以从定性和定量综合集成的环境中得到感性和理性地认识，从而深化概念和萌发新意。,第二章多媒体数据压缩技术,【知识点】数据冗余的分类及概念压缩编码的分类和评价标准预测编码的基本思想、变换编码的基本原理Huffman编码基本原理、编码步骤及如何编码算术编码的基本原理、编码过程及如何编码游程编码的基本原理,一、数据冗余,空间冗余（在同一幅图像中，规则物体和规则背景的表面物理特性具有相关性）时间冗余（图像序列中的两幅相邻图像，后一幅与前一幅图像之

8、间有较大的相关性）结构冗余（有些图像的纹理区，图像的像素值存在着明显的分布模式。例如，方格状的地板图案等。）,知识冗余（有些图像的理解与某些基础知识有相当大的相关性。）视觉冗余：（人类视觉系统对于图像场的任何变化，并不是都能感知的。）其他冗余：例如：由图像的空间非定常特性所带来的冗余。信息量=数据量冗余量,二、数据压缩编码分类,按解码后数据与原始数据是否完全一致来划分：无损编码(可逆压缩、无失真编码)压缩比：大约在2：1到5：1之间。示例：Huffman编码、算术编码等。有损编码(不可逆压缩、有失真编码)：压缩比：可以从几倍到上百倍来调节。示例：变换编码、预测编码。,三、压缩的评价标准,（1

9、）压缩比要大；压缩过程中输入数据量和输出数据量之比（2）算法要简单，压缩/解压缩速度快，以满足实时性要求；（3）压缩损失要少，失真小，即解压恢复的效果要好。当三者不能兼得时，要综合考虑。,四、统计编码（信息熵编码）,定义：根据信源符号出现概率的分布特性而进行的压缩编码。分类：Huffman 编码、算术编码、游程编码,1、Huffman编码,基本原理：在变长编码中，对出现概率小的信源符号采用长码字，对出现概率大的信源符号采用短码字。,编码步骤：（a）将信源符号按概率递减顺序排列；（b）把两个最小概率相加作为新符号的概率，并按前一个步骤重排；（c）重复前两个步骤，直到概率为1；（d）在每次合并信源

10、时，将合并的信源分别赋“0”和“1”；（e）寻找从每一个信源符号到概率为1处的路径，记录路径上的“1”和“0”；（f）写出每一个符号的“1”、“0”序列（从树根到信源符号结点）,例：设一组信源符号为X1，X2，X3，X4，X5，X6，X7，X8，这些符号出现的概率分别为0.40，0.18，0.10，0.10，0.07，0.06，0.05，0.04，求它们的Huffman编码。上述编码的平均码子长度：R=0.401+0.183+0.103+0.104+0.074+0.064+0.055+0.045=2.61,2、算术编码,基本原理：将编码的信息表示成实数0和1之间的一个间隔，信息越长，编码表示它

11、的间隔就越小，表示这一间隔所需的二进制位就越多。特点：不必预先定义概率模型，在信源符号概率接近时，效率高于Huffman编码。,示例：采用固定模式符号概率分配如下：字符:a e i o u 概率:0.2 0.3 0.1 0.2 0.2 范围:0,0.2)0.2,0.5)0.5,0.6)0.6,0.8)0.8,1.0)编码数据串为eai编码结果用0.23,0.236)表示数据串eai。,字符:a e i o u概率:0.2 0.3 0.1 0.2 0.2范围:0,0.2)0.2,0.5)0.5,0.6)0.6,0.8)0.8,1.0),具体编码过程：初始high=1,low=0,range=hi

12、gh-low,每个字符编码后新的low1和high1按以下公式计算：Low1=low+range rangelowhigh1=low+range rangehigh（1）对e进行编码，此时rangelow=0.2，rangehigh=0.5，因此：Low1=0+1 0.2=0.2High1=0+1 0.5=0.5Range=high1 low1=0.3此时，得到e的范围为0.2，0.5),（2）再对a编码，使用新的生成范围0.2，0.5)，a的rangelow=0，rangehigh=0.2，因此：Low1=0.2+0.3 0=0.2High1=0.2+0.3 0.2=0.26Range=hi

13、gh1 low1=0.06此时，得到的范围为0.2，0.26),（3）最后，对i编码，使用新范围0.2，0.26)，i的rangelow=0.5，rangehigh=0.6，因此：Low1=0.2+0.06 0.5=0.23High1=0.2+0.06 0.6=0.236此时，得到最终的范围为0.23，0.236)，我们用这个范围来表示数据串eai。如上例题中，如果解码器知道最后范围是0.23,0.236)，它马上可解得一个字符为e，然后依次得到唯一解a、i，最终得到eai。,3、游程编码(Run Length Encoding，RLE),现象：在一幅图像中具有许多颜色相同的图块。（一行上有许

14、多连续的像素都具有相同的颜色，甚至许多行上的颜色都相同）解决方案：存储色彩时，只需存储一个像素的颜色，然后再存储具有相同颜色的像素数目或者相同颜色的行数，大大压缩数据量。,示例：假定一幅灰度图像，第n行的像素值如图所示。RLE编码为：80315084180。加下划线表示的数字是行程长度；不加下划线的数字代表像素的颜色值。在编码前要用73个代码表示这一行的数据，而编码后只要用11个代码即可表示原来的73个代码，压缩比约为7：1。,游程编码示例,五、变换编码,变换编码的基本原理将空域图像信号映射变换到另一个正交矢量空间（变换域或频域），产生一批变换系数，然后对这些变换系数，进行编码处理。,六、预

15、测编码,基本思想：根据算法模型，用原有的样本值对新样本进行预测，得到新样本的预测值。取新样本的实际数值，和预测值进行比较，二者相减得到差值，最后对差值进行编码。典型的压缩方法：差分脉冲编码调制（DPCM）自适应差分脉冲编码调制（ADPCM）,第三章数字图像技术,【知识点】计算机视觉的概念颜色的基本概念、计算机中的颜色模式及几种典型的彩色空间不经过压缩图像的数据量的计算方法常用的数字图像文件格式JPEG的压缩原理Photoshop一些基本操作,一、计算机视觉,定义：使用计算机及相关设备对生物视觉的一种模拟。实质：通过对采集的图片或视频进行处理以获得相应场景的三维信息。,二、颜色的三要素（1）亮

16、度（Brightness）：颜色的相对明暗程度（2）色调(色相)（Hue）：物体的颜色（3）饱和度（Saturation）：颜色的深浅程度人眼看到任意彩色光都是这三要素的综合效果。,三、计算机中的颜色模式定义：颜色模式又称颜色空间、彩色空间；是计算机如何建立彩色模型来表示自然界中的彩色图像。,应用范围：不同应用领域一般使用不同的颜色模式：（1）计算机显示时采用RGB彩色模式（2）图像打印输出时用CMYK彩色模式等（3）彩色电视信号传输时采用彩色模式：YUV（亮度信号、u和v是色差信号；我国彩色电视采用的是PAL制式，传输彩色电视信号时使用的彩色模式）YIQ（亮度、I和Q共同描述图像的色调和饱

17、和度；美国的电视系统采用NTSC制式，其彩色模式采用的就是YIQ）,RGB颜色模式CMYK颜色模式：采用青（Cyan)、品红（Magenta）、黄（Yellow）加上黑色（Black)四种基本颜色按一定比例合成颜色的方法。Lab颜色模式HSB颜色模式：根据日常生活中人眼的视觉特征而制定的一套色彩模式。索引颜色模式：最多使用256种颜色。灰度模式位图模式,四、图像的主要参数,1、分辨率图像分辨率：图像的真正的尺寸。示例：分辨率：12801024（1280：横向有1280个像素，1024：纵向有1024个像素，总像素数量：12801024，1310720个像素）屏幕的分辨率：屏幕范围内显示区域的大

18、小。2、颜色深度定义：图像的每个像素用多少个比特数来表示。,颜色深度与颜色数量关系表,图像数据量的计算,不经过压缩，图像数据量的计算公式为：图像数据量（单位：Byte）=图像分辨率图像的颜色深度/8示例：不经过压缩，分辨率是800 600的真彩色图像（24bit），其数据量是多少MB？计算如下：数据量=800 600 24/8=1440000(Byte)1.37MB,示例：若不经过压缩，以640480点阵存储一幅256色的彩色图像大约需要多少MB存储空间？由于256=28，所以存储256色的一个点的信息需要1个字节(Byte)的存储空间。则：以640480点阵存储一幅256色的彩色图像所需

19、要的存储量为：6404801 Byte307200Byte，约为0.29MB。,五、常用的图像文件格式BMP：微软公司为其Windows环境设置的标准图像格式。默认的文件扩展名：.BMP、.bmp。JPEG：默认的文件扩展名：.jpg、.jpeg。GIF：可以存多幅彩色图像。PNG：Fireworks软件的默认格式。PSD：PhotoshopTIFF、SVG、RAW、PCX、DXF等。,六、JPEG与JPEG2000 JPEG(Joint Photographic Experts Group)：（“多灰度连续色调静态图像压缩编码”标准）JPEG2000，主要采用以离散小波变换（DWT）为主的多

20、分辨率编码方法。,JPEG静态图像压缩算法分类：一、采用基于离散余弦变换（DCT）的有损压缩算法。在压缩比为25:1的情况下，压缩后还原得到的图像与原始图像相比较，非图像专家难于找出它们之间的区别，因此得到了广泛的应用。二、基于空间线性预测技术的差分脉冲编码调制（DPCM）无损压缩算法。容易硬件实现，重建图像质量好，但是压缩比仅是2:1。,基于DCT的有失真压缩编码,离散余弦变换量化处理DC系数的编码和AC系数的行程编码熵编码,基于离散余弦变换(DCT)的JPEG编码原理：将彩色图片分成8*8块，对每个8*8块进行DCT变换，得到DCT系数采用JPEG给定或自己选定的量化表进行量化，得到DC

21、和AC系数，对AC系数进行Z字型扫描，对其进行行程编码和熵编码，这样就得到了JPEG压缩图像的数据。,基于DCT编码过程,FDCT,熵编码器,表说明,有失真编码器,源图像数据,压缩图像数据,量化器,表说明,88块,（YUV每个分量）,解码过程,熵解码器,IDCT,表说明,解码器,逆量化器,表说明,88块,压缩图像数据,恢复的图像数据,七、常用数字图像处理软件介绍图像处理所使用的编程工具：Visual Studio、Matlab、Java等常见的图形图像处理软件：Photoshop、CorelDraw、ACDSee等,八、Photoshop,1、Photoshop的主要功能：手工绘图、图像浏览、

22、编辑、颜色调整等平面设计功能。2、Photoshop默认的文件格式：.psd；图像文件格式保存除了基本的图像信息之外，文件里面还存放图层、通道、遮罩等信息。3、图层：堆叠在一起的透明纸。,4、蒙版作用：把图层某些图像区域显示出来或者隐藏掉。5、通道作用：用来存放不同的颜色分量信息以及选区信息。6、滤镜作用：可以对图像进行后期处理，获得各种不同的效果。本质：对图像进行数学运算得到一副新的图像。,第四章数字音频技术,【知识点】数字音频技术的声学基础、常见音频格式和MIDI的基本概念不经过压缩的音频文件的数据量的计算语音识别的相关概念Cool Edit Pro音频处理软件,一、声音特性的三要素,音

23、强（或音量、响度）：声音的大小。分贝（dB）：振幅音调：声音的高低。赫兹(Hz)：频率：信号每秒变化的次数音色（或音质）：声音的特色，音色是辨别不同声源的依据。声波的形状。示例：不同乐器演奏同一乐音，音调和音强都相同，不同的是音色不同。,音频：人类听力所能接受的频率范围（20Hz 20kHz）的声音。话音信号：3003000Hz(人说话的频率),人能够听到的是2020 000Hz,二、声音信号的数字化数字化步骤：采样、量化、编码。,音频数字化的处理过程,采样定理,仅当采样频率2倍的原始信号频率时，才能保证采样后信号可被保真地恢复为原始信号。,三、数字音频的技术指标(1)采样频率：每秒钟内所采样

24、的次数采样频率越高，则单位时间内获取的样本数越多，数字化后的音频信号就越逼真。一般，CD标准采用44.1kHz。(2)量化位数：表示每个采样样本的二进制位数量化位数多，噪声低。一般采用8、16位。(3)声道数：采样时声音通道的个数立体声效果更真实。一般有单声道或者双声道。,四、声音文件的数据量,不经过压缩，声音文件的数据存储量的计算公式：声音文件的数据量=（采样频率量化位数声道数时间）/8量化精度也就是采样位数、量化位数,示例：请计算十分钟双声道、16位采样位数、441kHz 采样频率声音的不压缩数据量是多少MB？根据公式：数据量=采样频率(采样位数8)声道数时间代入相应的数据，得数

25、据量441 1000(168)2(10 60)(1024 1024)100.94MB注：采样频率单位是Hz；采样位数为b（位数，bit）；声道数为个；时间为s（秒）1MB=1024KB=1024 1024 B,五、常见音频格式WAVE格式定义：Windows使用的标准数字音频文件，来源于对音频模拟波形的采样。编码方式：脉冲编码调制(PCM)扩展名：.WAV示例：windows系统中自带的“录音机”,MIDI 格式定义：Musical Instrument Digital Interface（乐器数字化接口），数字音乐/电子合成乐器国际标准。作用：让音乐及合成音经过一系列消息在不同的设备上交流传

26、输。扩展名：.MID示例：Cakewalk Sonar,MIDI特点：（1）它存储的不是波形而是指令序列(包括调用何种 MIDI 设备的声音，声音的强弱及持续的时间等)，记录下音乐的行为。（2）易编辑：可以做细部的修改，如修改节拍等。其声音效果不会因改变节拍而变调。（3）它的重要特色是占用空间少：不适合编制口语旁白的音频，可以作背景音乐。（示例：1分钟的立体声音乐，其MIDI文件的长度仅7kB左右）,MPEG Audio Layer 1/2/3 格式（.MP1/.MP2/.MP3）MP1MPEG Audio Layer 1（压缩比：4:1）MP2MPEG Audio Layer 2（压缩比：6

27、:1-8:1）MP3 MPEG Audio Layer 3（高达 10:1-12:1）示例：一分钟 CD 音质的音乐未经压缩需要 10MB 存储空间，经过 MP3 压缩编码后只有 1MB 左右，同时其音质基本保持不失真。,Windows Media Audio 格式（.WMA）AIFF 格式（.AIF/.AIFF）RealAudio 格式（.RA/.RAM/.RM）Real Networks 公司开发的一种新型音频流文件格式，主要用于在低速率的广域网上实时传输音频信息。OGG Vorbis 格式（.OGG）Advanced Audio Coding 格式（.AAC）等,六、语音识别定义：让计算

28、机通过识别和理解过程把语音信号转变为相应的文本或命令。让计算机能听懂人类的自然语言。涉及到的领域：信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等。,七、常用音频处理软件GoldWaveSony Sound ForgeCool Edit（被Adobe收购后更名为Adobe Audition）Windows 操作系统自带的“录音机”其他,八、Cool Edit Pro,（1）录音（2）编辑：复制、粘贴、混合、删除静音、降噪、扩音等；（3）加特效：立体环绕、淡入淡出、3D回响、合唱等；（4）合成：录制的音频文件可保存为.wav、.voc、.wma、.mp3等各种格式；整个工程可保

29、存为.ses的文件，以便随时打开编辑修改；,示例：使用Cool Edit进行录制翻唱音乐。操作步骤：（1）录制原声（采用多轨录音，一条用于伴奏音乐，另一条录制原声）（2）降噪处理（可以使用“降噪器”进行降噪处理，还可以对破音、嘶音等进行消除处理）（3）效果处理（可以进行音量调整、淡入淡出、合唱效果、回声和混响效果）（4）混缩合成（将处理好的歌声和伴奏混缩合成）,第五章数字视频技术,【知识点】典型彩色电视制式的基本原理MPEG和JPEG的区别，MPEG系列标准各自适用的范围常见的视频编辑软件使用Premiere编辑视频数据的过程,一、模拟与数字电视技术,视频：图像连续运动感觉帧（frame）

30、：一幅幅单独的画面；帧率（fps）：每秒显示帧的数目；原理：人眼的视觉暂留原理,二、视频制式（1）,NTSC(52530帧)原理：以525条横扫描线来组成一个屏幕帧，每秒30帧，其图像的改变采用偶数线与奇数线相互交错更新的方式，造成视觉动态图像。应用领域：美国、加拿大等大部分西半球国家以及中国的台湾、日本、韩国、菲律宾等。,二、视频制式（2）,PAL（62525帧）原理：其基本原理类似于NTSC制式。它以625条扫描线，每秒25帧，也是以奇偶数扫描线交错方式造成动态图像。应用领域：联邦德国、英国等一些西欧国家，新加坡、中国大陆及香港、澳大利亚、新西兰等国家。PAL制式中根据不同的参数细节，又可

31、以进一步划分为G、I、D等制式，其中PAL-D制是我国大陆采用的制式。,二、视频制式（3）,SECAM（62525帧）原理：SECAM视频同样采用625条线和25帧，但与NTSC和PAL制式相比，其基础的技术是采用频率调制，传播的方式也不同于以上两种。应用领域：法国、俄罗斯、中东等国。,三、视频压缩编码技术（1）有损和无损压缩（2）帧内和帧间压缩帧内压缩：当压缩一帧图像时，仅考虑本帧的数据而不考虑相邻帧之间的冗余信息。帧内一般采用有损压缩算法。帧间压缩：基于许多视频或动画的连续前后两帧具有很大的相关性，或者说前后两帧信息变化很小的特点。帧间压缩一般是无损的。典型算法：帧差值算法，通过比较本帧

32、与相邻帧之间的差异，仅记录本帧与其相邻帧的差值，这样可以大大减少数据量。,（3）对称和不对称编码对称：压缩和解压缩占用相同的计算处理能力和时间。不对称（非对称）：压缩时需要花费大量的处理能力和时间，而解压缩时则能较好地实时回放。应用：对称算法适合于实时压缩和传送视频，示例：视频会议应用不对称编码示例：在电子出版和其他多媒体应用中，一般是把视频预先压缩处理好，而后再播放。示例：压缩一段三分钟的视频片断可能需要10多分钟的时间，而该片断实时回放时间只有三分钟。,四、常见数字视频文件格式（1）AVI（Audio Video Interleaved）格式（音频视频交错格式：将语音和影像同步组合在一起的

33、文件格式）（2）MPEG格式（.mpg、.mpeg等）（3）Real Media格式（RM格式和RMVB格式）定义：RealNetworks公司所制定的音频视频压缩规范。RealPlayer或RealOnePlayer,（4）Windows Media文件（ASF、WMV）（5）MOV格式定义：QuickTime影片格式，它是Apple公司开发的一种音频、视频文件格式，用于存储常用数字媒体类型，如音频和视频。（6）MKV格式,五、MPEG标准（音频、视频、系统等）1、MPEG面向运动图像压缩的系列标准：MPEG-1（适合家庭或终端用，标准不太高，分辨率要求不高；VCD）MPEG-2（扩展以后适

34、用于高清晰度电视HDTV；DVD）MPEG-4（有更强的交互能力）MPEG-7（多媒体检索）MPEG-21（应用于电子商务）,2、MPEG标准视频压缩编码技术（1）主要利用了具有运动补偿的帧间压缩编码技术以减小时间冗余度；运动补偿技术主要用于消除P图像和B图像在时间上的冗余性提高压缩效率。（2）利用DCT技术以减小图像的空间冗余度；和JPEG压缩算法一样；（3）利用熵编码则在信息表示方面减小了统计冗余度。这几种技术的综合运用，大大增强了压缩性能。,3、JPEG和MPEG的主要差别,JPEG是适用于连续色调、多级灰度、彩色或单色静止图像的数据压缩标准。MPEG视频压缩技术是针对运动图像的数据压缩

35、技术。为了提高压缩比，MPEG中帧内图像数据和帧间图像数据压缩技术必须同时使用,这是和JPEG主要不同的地方。JPEG和MPEG相同的地方均采用了DCT帧内图像数据压缩编码。,六、ITU编码标准制定视频编码标准的两大组织：ITU-T的标准包括H.261、H.263、H.264等，主要应用于实时视频通信领域，如会议电视；MPEG系列标准是由ISO/IEC制定的，主要应用于视频存储(DVD)、广播电视、因特网或无线网上的流媒体等。两个组织也共同制定了一些标准，H.262标准等同于MPEG-2的视频编码标准，而H.264标准则被纳入MPEG-4的第10部分。,H.261定义：H.261又称为P64

36、标准，它最初是针对在ISDN上实现电信会议应用特别是面对面的可视电话和视频会议而设计的。P是1到30的可变参数：P=1或P=2时，仅能支持QCIF（176 144）分辨率格式；当P6时，则可支持图像分辨率格式为CIF（352 288）的电视会议。,H.263：国际电联ITU-T的一个标准草案，是为低码流通信而设计的,在H.261基础上扩展形成的，提高了性能和纠错能力。H.264（高度压缩数字视频编解码器标准）：同时也是MPEG-4第十部分。最大的优势是在具有高压缩比的同时还拥有高质量流畅的图像。AVS标准：是我国具备自主知识产权的第二代信源编码标准，是数字音视频产业的共性基础标准。,七、常见数

37、字视频处理软件 Adobe Premiere会声会影Windows movie maker其他视频处理软件以Adobe Premiere为例，介绍一下数字视频处理软件的处理过程。,Adobe Premiere的功能,它是一个完整的视频后期制作工具：（1）视频转场（如滑入、渐入、扩散、翻页等）（2）视频特效（镜头旋转、马赛克等效果）（3）添加字幕（增加特效字幕）等一些处理。,数字视频处理软件的处理过程,（1）创建视频编辑工程；（2）输入要编辑的各视频段、音频段或图像，并浏览；（3）对视频片断或图像应用过渡方法等处理；（4）对整个视频增加特效，设计画面运动方式，增加字幕等操作；（5）预览编辑后的视

38、频效果；满意后保存。,第六章数字动画技术,【知识点】动画的基本概念及其分类数字动画常见的格式数字动画制作软件 Flash软件中的动画类型,一、数字动画简介,定义：动画是由很多内容连续但各不相同的画面组成。原理：“视觉滞留效应”。,二、按表现形式分类二维动画：平面的动画表现形式。Flash、GIF Animator等。三维动画：模拟三维立体场景中的动画效果。3ds max、Maya等。变形动画：通过计算机计算，把一个物体从原来的形状改变成为另一种形状，在改变的过程中把变形的参考点和颜色有序地重新排列。常用的软件有Morph等。（这种动画的效果有时候是惊人的，适用于场景的转换、特技处理等影视动画

39、制作。）,三、数字动画常见格式GIF（Graphics Interchange Format，图形交换格式）（1）一个GIF文件中可以存多幅彩色图像，可构成一种最简单的动画。（2）文件小，广泛应用于网上，但只能显示256色。,SWF格式（1）Flash默认的一种动画格式，能够用比较小的体积来表现丰富的多媒体形式。（2）在图像的传输方面，可以边下载边看，因此特别适合网络传输，特别是在传输速率不佳的情况下，也能取得较好的效果。（3）大量应用于WEB网页进行多媒体演示与交互性设计。（4）基于矢量技术制作的，因此不管将画面放大多少倍，画面不会因此而有任何损害。,四、数字动画制作软件,五、FLASH,功

40、能：制作矢量图形、二维动画等；Flash影片的基本构成为：帧默认的flash文件：.fla默认的flash影片文件：.swf测试影片：Ctrl+Enter插入关键帧：F6,六、Flash CS3的动画类型（按照制作方法的不同）（1）逐帧动画：所有帧都是创建的。时间轴上的每一帧都是关键帧。在时间轴上表现为连续的关键帧。（2）补间动画：制作好若干关键帧，Flash自动生成各中间帧。动作补间动画：在一个时间点定义一个实例位置、大小、旋转、颜色、透明度等属性，然后在另一个时间点改变这些属性形状补间动画：通过形状的改变来设置,（3）引导线动画：利用引导路径层自定义运动路径。（4）遮罩动画：使用遮罩层产

41、生的遮罩效果而实现。,元件和实例元件：可以重复使用的对象。只创建一次，然后在整部影片中反复使用。示例：一个形状，或者动画。实例：是对元件的引用，编辑元件会更新它的所有实例，这样减少了用户的工作量。,第七章多媒体网络技术及应用,【知识点】流媒体技术的概念及基本原理,流媒体技术产生的原因：无法容忍因为网络带宽不足而造成的数据传输的断断续续和低劣的播放效果。解决方案：把影像和声音信息经过压缩处理后放到网络服务器上，让浏览者一边下载一边观看、收听，而不需要等到整个多媒体文件下载完成就可以即时观看的技术。流媒体：指在网络中使用流式传输技术的连续时基媒体，例如：音频、视频、动画或其他多媒体文件。流媒体技

42、术,流媒体技术与传统视频播放技术的区别：,（1）传统的视频播放技术：完整下载，播放流媒体技术：多媒体文件压缩解析成多个压缩数据包，向客户端实时地顺序传送。用户一边解压播放前面传送过来的压缩包，一边下载后续的压缩包，从而节省了用户的时间。（2）流媒体技术有着很大的压缩比相当于MPEG-1或MPEG-2的15，因此占用很少的带宽和存储空间。,流媒体应用基础流媒体的传输方式（顺序流式传输和实时流式传输）流媒体的播放方式（单播、组播和点播）流媒体主流技术（RealNetworks 公司的 Real System，Microsoft 的Windows Media 和 Apple 公司的QuickTime）,第八章多媒体计算机硬件系统,【知识点】多媒体计算机的基本概念各个硬件系统的基本参数区分硬件设施的输入输出,