多媒体技术原理及应用(马华东第二版)第二章.ppt
《多媒体技术原理及应用(马华东第二版)第二章.ppt》由会员分享,可在线阅读,更多相关《多媒体技术原理及应用(马华东第二版)第二章.ppt(63页珍藏版)》请在三一办公上搜索。
1、第二章 多媒体数据压缩技术,数字音频编码 数字图像编码数字视频编码常用的数据压缩技术 多媒体数据转换,2.1 数字音频编码,音频的基本特性,声音是由振动的声波所组成,在任一时刻t,声波可分解为一系列正弦波线性叠加:f(t)=Ansin(nt+n)其中,称为基频或基音,它决定声音的高低;n称为的n次谐波分量或称为泛音,与声音的音色有关;An是振幅,表示声音的强弱;n是n次谐波的初相位。,音频数字化,波形音频是以数字方式表示音波。它是用声卡(包含ADC和DAC)来录制与执行播出声音的。计算机对声音表示主要通过采样产生一系列声音数据。事实上,声波按频率可分为4类,其中多媒体系统仅处理人类的听力所接受
2、的频率范围的声音,我们称之为音频,这个频率范围的音波称之为声音信号。,声音的频率分类,通过规则时间间隔测出音波振动幅度从而产生一系列声音数据。这种测出数据方法称之为采样,一秒内采样次数叫采样率。采样的离散音频数据要转换成计算机能够表示的数据范围,这个过程称之为量化。量化后数字音频存储量计算公式 音频数据存储量(字节)=采样率(Hz)量化位数(位)声道数音频长度(秒)/8,MIDI,1980年制定一项工业标准,目的是让音乐及合成音可以经由一串消息在不同的设备上交流传输。MIDI提供了计算机外部的电子乐器与计算机内部之间的连接器接口。这种连接接口定义物理连接与电子乐器沟通的协议。MIDI也定义音频
3、的形态与存储的方法。MIDI音频是以消息的方式而非波形的方式组成。MIDI有三种连接器(In、Out、Thru)。In为输入,Out为输出,而Thru是用来扩充MIDI与其它设备连接用的。,序器可以将音乐等声音以一种序列来储存。所谓序列便是一连串的音符加上系统事件的命令。MIDI适配器是用来改变频道、路径与按键的。当电子琴的键盘与一般的MIDI规格不一致时可以经由适配器来修正使两者一致。,MIDI音频文件,MIDI音频文件是一串时序命令,它记录音乐的行为。命令消息分为频道消息(频道声音消息、频道模式消息)和系统消息(系统实时消息、系统通用消息与系统专用消息)。它是以某种乐器的发声为其数据记录的
4、基础。它的文件占用很少存储器空间,且可以做细部的修改,如修改节拍等。其声音效果不会因改变节拍而变调。MIDI不适合编制口语旁白的音频。,数字音频可从麦克风、录音带、CD、电视及其它来源获取。它把声音转换成储存体中数字信息。数字音频较为稳定,容易保持一致性,音频品质也较易获得保证。缺点是记录非常详尽,数据量极大,文件较MIDI音频大出200倍以上。要修改数字音频细节非常困难,大大地增加了CPU的负担。它可以适合任何一种音响,包括人的口语在内,故大多数节目仍采用这种音频。,3D音频,3D音效可分为以下几类:(1)扩展式立体声。(2)环绕立体声。(3)交互式音效。支持3D音频API种类:Direct
5、X DirectSound 3D;Aureal 3D;EAX;Sensaura;Qsound;杜比AC-3;数字化影院系统DTS,2.2 数字图像编码,2.2.1 彩色空间,常见模型:RGB彩色空间 HSI彩色空间 YUV彩色空间 YIQ彩色空间,RGB彩色空间,R、G、B是彩色最基本表示模型,也是计算机系统中所使用的彩色模型。RGB5:5:5方式 用2个字节表示一个象素,具体位分配。RGB5:5:5方式 RGB8:8:8方式 R、G、B三个分量各占一个字节。,HSI彩色空间,这种模型中,用H(Hue,色调)、S(Saturation,饱和度)、I(Intensity,光强度)3个分量来表示一
6、种颜色,这种表示更适合人的视觉特性。,YUV彩色空间,Y为亮度信号,U、V是色差信号(B-Y,R-Y)。PAL制式彩色空间即为YUV。优点是亮度和色差信号分离,容易使彩色电视系统与黑白电视信号兼容。国际无线电咨询委员会根据实验认为采用双倍度采样4:2:2方案效果较好,提出CCIR601标准。变换公式(YUVRGB)Y=0.299*R+0.587*G+0.114*B;U=-0.169*R-0.332*G+0.500*B;V=0.500*R+0.419*G-0.081*B,YIQ彩色空间,广播电视系统另一种常用的亮度与色差分离的模型。NTSC制式彩色空间即为YIQ。这里Y是亮度,I和Q共同描述图象
7、的色调和饱和度。变换公式(YIQRGB)Y=0.299*R+0.587*G+0.114*B;I=0.211*R-0.523*G+0.312*B;Q=0.596*R-0.275*G-0.322*B,2.2.2 数字图象文件格式,TIF PCXGIF、TGA、BMP、DVI、JPEG等,TIF文件格式,由美国Aldus Developers Desk和Microsoft制定 结构文件头(8B)参数指针表 参数数据表 图象数据,文件头 含字节顺序(2B,表示存贮格式:II-Intel格式;MMMotorola格式);标记号(2B,版本信息);指向第一个参数指针表的编码(4B)。参数指针表 由每个长为
8、12B参数块构成,描述压缩种类、长宽、彩色数、扫描密度等参数。较长参数(如调色板)只给出指针,参数放在参数数据表中。其结构定义如下:,typedef struct int tag-type;int number-size;long length;long offset;TIF-FIELD;图象数据 按参数表中描述的形式按行排列,PCX文件格式,由Z Soft公司最初制定结构文件头(128字节)数据部分(采用行程长度编码)文件头结构定义,typedef struct char manufacture;/*always 0 xa0*/char version;char encoding;/*alw
9、ays 1*/char bits-per-pixel;/*color bits*/int Xmin,Ymin;/*image origin*/int Xmax,Ymax;/*image dimension*/int hres;/*resolution values*/int vres;char palette48;/*color palette*/char reserved;char color-planes;/*color planes*/int bytes-per-line;/*line buffer size*/int palette-type;/*grey or color palet
10、te*/char filler58;PCXHEAD;其中Version若为5,文件内有个256色调色板,数据768字节,在文件最后。,文件体 对象素数据采用行程长度编码,由包含Keybyte和Databyte的包组成。分2种情况:(1)若Keybyte最高位为11,则低6位为重复次数。但最多重复63次,若再长重建一个包.PCX数据包的结构(2)若Keybyte最高位不是11,那么该Databyte按原样写入图象文件。对一个字符的表示用长度为1的包。,11,1,Databyte,2.3 数字视频编码,数字视频的结构,基本单位是帧。若干同一场景的帧构成镜头若干镜头构成情节 若干情节构成故事(节目)
11、,国际视频标准,NTSC 美国研制,是目前广泛使用的电视制式。它以525条横扫描线来组成一个屏幕帧,每秒30帧,其图象改变采用偶数线与奇数线相互交错更新的方式,造成视觉动态图象。PAL 中国、英国等国采用制式,W.Bruch1963年发明的,其基本原理类似于NTSC制式。以625条扫描线,每秒25帧,也是以奇偶数扫描线交错方式造成动态图象。SECAM 法国、俄罗斯等国采用制式。同样采用625条线和25帧,但与NTSC和PAL相比,其基础技术是采用频率调制,传播方式也不同于以上两种。,2.4 常用数据压缩技术,2.4.1 数据压缩的基本原理,传统上用模拟方式表示声音和图象信息 易出故障,常产生噪
12、音和信号丢失,且拷贝过程中噪音和误差逐步积累;模拟信号不适合数字计算机加工处理。数字化处理:巨大的数据量,采样定理:仅当采样频率2倍的原始信号频率时,才能保证采样后信号可被保真地恢复为原始信号。采用8bit数字化,从而1秒钟电视信号的数据量约为99.2Mbits。即约为100Mbps。650MB的CD-ROM仅能存约1分钟的原始电视数据。若HDTV(1.2Gbps),一张CD-ROM还存不下6秒钟的HDTV图象。,人说话的音频一般在20Hz到4KHz,即人类语音的带宽为4KHz。依据采样定理,设数字化精度为8b,则1秒钟信号量为64Kbits。因此,人讲1分钟话的数据量为480KB。数字化处理
13、的关键问题数据压缩,压缩的基础数据冗余,空间冗余 时间冗余 信息熵冗余结构冗余 知识冗余 视觉冗余 其它冗余,空间冗余,这是图象数据中经常存在的一种冗余。在同一幅图象中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成象结构在数字化图象中就表现为数据冗余。,时间冗余,这是序列图象和语音数据中所经常包含的冗余。图象序列中的两幅相邻的图象之间有较大的相关性,这反映为时间冗余。人在说话时发音音频是一连续的渐变过程,而不是一个完全时间上独立的过程,因而存在时间冗余。,信息熵冗余,信息熵是指一组数据所携带的信息量,它定义为:H=-i=0N-1Pilog2Pi N为数据类数或码元个数,Pi为码
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体技术 原理 应用 华东 第二
链接地址:https://www.31ppt.com/p-5909639.html