多媒体技术与应用(本)考前辅导.ppt
《多媒体技术与应用(本)考前辅导.ppt》由会员分享,可在线阅读,更多相关《多媒体技术与应用(本)考前辅导.ppt(112页珍藏版)》请在三一办公上搜索。
1、多媒体技术与应用,主要内容,1、介绍题型的设置2、概括整个知识点的分布3、总结基础理论知识点4、分析重点题型,题型,一、单项选择题(30%)二、填空(10%)三、问答(40%)四、计算题(20%),各章的主要内容,多媒体技术综述(基本概念)多媒体数据压缩技术综述数字图像技术数字音频技术数字视频技术数字动画技术多媒体网络技术及应用 多媒体计算机硬件系统,第一章 多媒体技术综述,【知识点】媒体的分类多媒体包含的信息类型多媒体技术的基本概念和特点超文本、超媒体、CSCW、虚拟现实基于内容的检索等一些基本的思想方法,CCITT将媒体分为五类:(1)感觉媒体(preception medium)或称感官
2、媒体(直接作用于人的感官):音乐、自然界的各种声音(2)表示媒体(representation medium)(人为研究、构造出来):图像JPEG编码、文本ASCII编码和乐谱,一、媒体的分类,媒体分类(2),(3)表现媒体(presentation medium)或称显示媒体(表示和获取信息的物理设备)输入表现媒体:键盘、摄像机、光笔、话筒、扫描仪输出表现媒体:显示器、喇叭、打印机,媒体分类(3),(4)存储媒体(storage medium)(存储信息的物理设备):磁盘、软盘、光盘、U盘、磁带及CD-ROM等(5)传输媒体(transmission medium)(传输数据的物理设备):双
3、绞线、同轴电缆、光纤等,在计算机领域内,各种媒体的关系如下:,二、多媒体包含的信息类型,(1)文本:TXT格式、HTML格式等(2)图形:(矢量图,用数学方法)示例:几何图形、工程图、等高线地图、曲面的线框图等(3)图像:(位图,用物理方法)示例:从传统的相片、数码相机等得到,多媒体包含的信息类型(2),(4)音频:波形音频文件(WAV)、数字音频文件(MIDI)、压缩音频文件(MP3)等;(5)视频:AVI、DAT、RM等;(6)动画:GIF(Internet上大量采用)、SWF等;,三、多媒体技术的概念及特点,定义:计算机综合处理声、文、图信息的技术。集成性:媒体信息和媒体设备的集成 实时
4、性:实时处理交互性:与普通家电的区别,四、超文本,基本概念:由信息结点和表示信息结点间相关性的链构成的具有一定逻辑结构和语义的网络。超媒体(天然的多媒体信息管理方法)=超文本+多媒体超文本的主要成份:结点、链、宏结点(子网),超文本的基本原理:人脑的记忆机制(联想式的记忆,非线性的网状结构)传统文本(它在组织上是线性的和顺序的),文本的线性结构,五、CSCW,计算机协同工作(Computer Supported Cooperative Work,CSCW):支持有着共同目标或者共同任务的群体活动的计算机系统,并且该系统为共享的环境提供接口。,CSCW分类原则,群体规模:两人或是多人 地理位置:
5、远程或是同地 交互形式:同步或是异步,CSCW目前活跃的领域,(1)电子邮件系统(2)电子布告栏系统(bulletin board system,BBS)(3)群决策支持系统和电子会议室系统(4)多用户共同编辑系统(5)计算机会议系统,六、基于内容的检索过程,初始检索说明:特定的查询语言相似性匹配:将特征与特征库中的特征按照一定的匹配算法进行匹配。特征调整:用户对返回的一组满足初始特征的检索结果进行浏览,挑选出满意的结果,检索过程完成;或者从候选结果中选择一个最接近的示例,进行特征调整,然后形成一个新的查询。重新检索:逐步缩小查询范围,重新开始。该过程直到用户放弃或得到满意的查询结果时为止。,
6、基于内容的检索过程,八、虚拟现实,虚拟现实(Virtual Reality,VR):由计算机生成具有临场感觉的环境;是一种高度逼真地模拟人在现实生活中视觉、听觉、动作等行为的交互技术;是一种全新人机交互系统。涉及领域:计算机图形学、人工智能、传感技术等,实现语言:VRML(Virtual Reality Markup Language)关键技术:实时三维动画技术 临场感技术(包括基于自然方式的人机交互技术等)快速、高精度三维跟踪技术 辨识技术 传感技术,虚拟现实的基本特征(3I特性):浸没感(Immersion):又称临场感,指用户感到作为主角存在于模拟环境中的真实程度。交互性(Interac
7、tivity):使用者不再是被动地接受信息或是旁观,而是能够使用交互输入设备操作虚拟物体,改变虚拟世界。构想性(Imagination):使用者利用VR系统可以从定性和定量综合集成的环境中得到感性和理性地认识,从而深化概念和萌发新意。,第二章 多媒体数据压缩技术,【知识点】数据冗余的分类及概念压缩编码的分类和评价标准预测编码的基本思想、变换编码的基本原理Huffman编码基本原理、编码步骤及如何编码算术编码的基本原理、编码过程及如何编码游程编码的基本原理,一、数据冗余,空间冗余(在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性)时间冗余(图像序列中的两幅相邻图像,后一幅与前一幅图像之
8、间有较大的相关性)结构冗余(有些图像的纹理区,图像的像素值存在着明显的分布模式。例如,方格状的地板图案等。),知识冗余(有些图像的理解与某些基础知识有相当大的相关性。)视觉冗余:(人类视觉系统对于图像场的任何变化,并不是都能感知的。)其他冗余:例如:由图像的空间非定常特性所带来的冗余。信息量=数据量 冗余量,二、数据压缩编码分类,按解码后数据与原始数据是否完全一致来划分:无损编码(可逆压缩、无失真编码)压缩比:大约在2:1到5:1之间。示例:Huffman编码、算术编码等。有损编码(不可逆压缩、有失真编码):压缩比:可以从几倍到上百倍来调节。示例:变换编码、预测编码。,三、压缩的评价标准,(1
9、)压缩比要大;压缩过程中输入数据量和输出数据量之比(2)算法要简单,压缩/解压缩速度快,以满足实时性要求;(3)压缩损失要少,失真小,即解压恢复的效果要好。当三者不能兼得时,要综合考虑。,四、统计编码(信息熵编码),定义:根据信源符号出现概率的分布特性而进行的压缩编码。分类:Huffman 编码、算术编码、游程编码,1、Huffman编码,基本原理:在变长编码中,对出现概率小的信源符号采用长码字,对出现概率大的信源符号采用短码字。,编码步骤:(a)将信源符号按概率递减顺序排列;(b)把两个最小概率相加作为新符号的概率,并按前一个步骤重排;(c)重复前两个步骤,直到概率为1;(d)在每次合并信源
10、时,将合并的信源分别赋“0”和“1”;(e)寻找从每一个信源符号到概率为1处的路径,记录路径上的“1”和“0”;(f)写出每一个符号的“1”、“0”序列(从树根到信源符号结点),例:设一组信源符号为X1,X2,X3,X4,X5,X6,X7,X8,这些符号出现的概率分别为0.40,0.18,0.10,0.10,0.07,0.06,0.05,0.04,求它们的Huffman编码。上述编码的平均码子长度:R=0.401+0.183+0.103+0.104+0.074+0.064+0.055+0.045=2.61,2、算术编码,基本原理:将编码的信息表示成实数0和1之间的一个间隔,信息越长,编码表示它
11、的间隔就越小,表示这一间隔所需的二进制位就越多。特点:不必预先定义概率模型,在信源符号概率接近时,效率高于Huffman编码。,示例:采用固定模式符号概率分配如下:字符:a e i o u 概率:0.2 0.3 0.1 0.2 0.2 范围:0,0.2)0.2,0.5)0.5,0.6)0.6,0.8)0.8,1.0)编码数据串为eai编码结果用0.23,0.236)表示数据串eai。,字符:a e i o u概率:0.2 0.3 0.1 0.2 0.2范围:0,0.2)0.2,0.5)0.5,0.6)0.6,0.8)0.8,1.0),具体编码过程:初始high=1,low=0,range=hi
12、gh-low,每个字符编码后新的low1和high1按以下公式计算:Low1=low+range rangelowhigh1=low+range rangehigh(1)对e进行编码,此时rangelow=0.2,rangehigh=0.5,因此:Low1=0+1 0.2=0.2High1=0+1 0.5=0.5Range=high1 low1=0.3此时,得到e的范围为0.2,0.5),(2)再对a编码,使用新的生成范围0.2,0.5),a的rangelow=0,rangehigh=0.2,因此:Low1=0.2+0.3 0=0.2High1=0.2+0.3 0.2=0.26Range=hi
13、gh1 low1=0.06此时,得到的范围为0.2,0.26),(3)最后,对i编码,使用新范围0.2,0.26),i的rangelow=0.5,rangehigh=0.6,因此:Low1=0.2+0.06 0.5=0.23High1=0.2+0.06 0.6=0.236此时,得到最终的范围为0.23,0.236),我们用这个范围来表示数据串eai。如上例题中,如果解码器知道最后范围是0.23,0.236),它马上可解得一个字符为e,然后依次得到唯一解a、i,最终得到eai。,3、游程编码(Run Length Encoding,RLE),现象:在一幅图像中具有许多颜色相同的图块。(一行上有许
14、多连续的像素都具有相同的颜色,甚至许多行上的颜色都相同)解决方案:存储色彩时,只需存储一个像素的颜色,然后再存储具有相同颜色的像素数目或者相同颜色的行数,大大压缩数据量。,示例:假定一幅灰度图像,第n行的像素值如图所示。RLE编码为:80315084180。加下划线表示的数字是行程长度;不加下划线的数字代表像素的颜色值。在编码前要用73个代码表示这一行的数据,而编码后只要用11个代码即可表示原来的73个代码,压缩比约为7:1。,游程编码示例,五、变换编码,变换编码的基本原理 将空域图像信号映射变换到另一个正交矢量空间(变换域或频域),产生一批变换系数,然后对这些变换系数,进行编码处理。,六、预
15、测编码,基本思想:根据算法模型,用原有的样本值对新样本进行预测,得到新样本的预测值。取新样本的实际数值,和预测值进行比较,二者相减得到差值,最后对差值进行编码。典型的压缩方法:差分脉冲编码调制(DPCM)自适应差分脉冲编码调制(ADPCM),第三章 数字图像技术,【知识点】计算机视觉的概念颜色的基本概念、计算机中的颜色模式及几种典型的彩色空间不经过压缩图像的数据量的计算方法常用的数字图像文件格式JPEG的压缩原理Photoshop一些基本操作,一、计算机视觉,定义:使用计算机及相关设备对生物视觉的一种模拟。实质:通过对采集的图片或视频进行处理以获得相应场景的三维信息。,二、颜色的三要素(1)亮
16、度(Brightness):颜色的相对明暗程度(2)色调(色相)(Hue):物体的颜色(3)饱和度(Saturation):颜色的深浅程度人眼看到任意彩色光都是这三要素的综合效果。,三、计算机中的颜色模式 定义:颜色模式又称颜色空间、彩色空间;是计算机如何建立彩色模型来表示自然界中的彩色图像。,应用范围:不同应用领域一般使用不同的颜色模式:(1)计算机显示时采用RGB彩色模式(2)图像打印输出时用CMYK彩色模式等(3)彩色电视信号传输时采用彩色模式:YUV(亮度信号、u和v是色差信号;我国彩色电视采用的是PAL制式,传输彩色电视信号时使用的彩色模式)YIQ(亮度、I和Q共同描述图像的色调和饱
17、和度;美国的电视系统采用NTSC制式,其彩色模式采用的就是YIQ),RGB颜色模式CMYK颜色模式:采用青(Cyan)、品红(Magenta)、黄(Yellow)加上黑色(Black)四种基本颜色按一定比例合成颜色的方法。Lab颜色模式HSB颜色模式:根据日常生活中人眼的视觉特征而制定的一套色彩模式。索引颜色模式:最多使用256种颜色。灰度模式位图模式,四、图像的主要参数,1、分辨率图像分辨率:图像的真正的尺寸。示例:分辨率:12801024(1280:横向有1280个像素,1024:纵向有1024个像素,总像素数量:12801024,1310720个像素)屏幕的分辨率:屏幕范围内显示区域的大
18、小。2、颜色深度定义:图像的每个像素用多少个比特数来表示。,颜色深度与颜色数量关系表,图像数据量的计算,不经过压缩,图像数据量的计算公式为:图像数据量(单位:Byte)=图像分辨率 图像的颜色深度/8示例:不经过压缩,分辨率是800 600的真彩色图像(24bit),其数据量是多少MB?计算如下:数据量=800 600 24/8=1440000(Byte)1.37MB,示例:若不经过压缩,以640480点阵存储一幅256色的彩色图像大约需要多少MB存储空间?由于256=28,所以存储256色的一个点的信息需要1个字节(Byte)的存储空间。则:以640480点阵存储一幅256色的彩色图像 所需
19、要的存储量为:6404801 Byte307200Byte,约为0.29MB。,五、常用的图像文件格式BMP:微软公司为其Windows环境设置的标准图像格式。默认的文件扩展名:.BMP、.bmp。JPEG:默认的文件扩展名:.jpg、.jpeg。GIF:可以存多幅彩色图像。PNG:Fireworks软件的默认格式。PSD:PhotoshopTIFF、SVG、RAW、PCX、DXF等。,六、JPEG与JPEG2000 JPEG(Joint Photographic Experts Group):(“多灰度连续色调静态图像压缩编码”标准)JPEG2000,主要采用以离散小波变换(DWT)为主的多
20、分辨率编码方法。,JPEG静态图像压缩算法分类:一、采用基于离散余弦变换(DCT)的有损压缩算法。在压缩比为25:1的情况下,压缩后还原得到的图像与原始图像相比较,非图像专家难于找出它们之间的区别,因此得到了广泛的应用。二、基于空间线性预测技术的差分脉冲编码调制(DPCM)无损压缩算法。容易硬件实现,重建图像质量好,但是压缩比仅是2:1。,基于DCT的有失真压缩编码,离散余弦变换量化处理DC系数的编码和AC系数的行程编码 熵编码,基于离散余弦变换(DCT)的JPEG编码原理:将彩色图片分成8*8块,对每个8*8块进行DCT变换,得到DCT系数采用JPEG给定或自己选定的量化表进行量化,得到DC
21、和AC系数,对AC系数进行Z字型扫描,对其进行行程编码和熵编码,这样就得到了JPEG压缩图像的数据。,基于DCT编码过程,FDCT,熵编码器,表说明,有失真编码器,源图像数据,压缩图像数据,量化器,表说明,88块,(YUV每个分量),解码过程,熵解码器,IDCT,表说明,解码器,逆量化器,表说明,88块,压缩图像数据,恢复的图像数据,七、常用数字图像处理软件介绍图像处理所使用的编程工具:Visual Studio、Matlab、Java等常见的图形图像处理软件:Photoshop、CorelDraw、ACDSee等,八、Photoshop,1、Photoshop的主要功能:手工绘图、图像浏览、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体技术 应用 考前 辅导
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5909632.html