《数字媒体及应用》PPT课件.ppt
第五章 数字媒体及应用,学习目标和要求 掌握ASCII字符的编码的规则和特点 掌握中文信息存储的特点,GB2312国标字符集的构成、区位码、机内码和国标码及其关系了解BIG5、GBK、GB18030、Unicode等编码了解文本在计算机中的处理过程及相关原理,了解图像(image)、图形(graphics)的概念和特点,熟悉图像信息在计算机内的表示和处理了解声音、视频信息的表示和应用,一、字符编码,1、西文字符的编码 西文信息是由字母、数字、标点符号及一些特殊符号组成的,它们的集合统称为西文字符集。,ASCII字符集和ASCII码,标准ASCII(ISO0646):7位编码,从0000000到1111111,共128种编码,可用来表示128个不同的字符。95个可打印字符(常用字母、数字、标点符号等)33个控制字符,用一个字节存放一个字符的ASCII码,高位为0。,5.1 文本与文本处理,ASCII码的排放顺序:,1.数字、字母均按自然顺序排列。2.大小写字母的比较,小写字母大于大写字母。(A+32=a 65+32=97)3.字母与数字比较,数字(0-9)的代码均小于字母(A-Z)的代码4.空格比数字,标点,字母等常见符号都小。,扩展ASCII码(ISO2022),八位二进制表示一个字符,共有256个字符,前128个等同于标准ASCII,后128个均为高位为1的编码形式。,2、汉字字符的编码 GB2312汉字编码 GBK汉字内码扩展规范 GB18030编码 BIG5编码 UCS/Unicode编码,国家标准局 1981年信息交换用汉字编码字符集基本集,(1)GB2312汉字编码,6763个常用汉字和682个非汉字字符 7445 组成:第一部分:字母、数字和各种符号共682个(统称为GB2312图形符号)第二部分:一级常用汉字,共3755个,按汉语拼音排列 第三部分:二级常用字,共3008个,按偏旁部首排列,汉字区位码:汉字在代码表中的行号、列号,这是一个二维代码表,有94行、94列,汉字在代码表中的位置用它所处的行号、列号表示:,采用双字节编码。,例如:“大”字的区号20,位号83,区位码是20 83 用2个字节表示为:00010100 01010011,国标码:问题:信息通信中,汉字的区位码与通信使用的控制码(00H1FH)发生冲突。解决方案:为了避免冲突,每个汉字的区号和位号必须分别加上32得到的代码称为汉字的“国标交换码”,用于汉字的传输和交换。,例如:“大”字的区号20,位号83区位码 20 83 二进制表示为:00010100 01010011国标交换码52 115 二进制表示为 00110100 01110011,机内码:问题:文本中的汉字与西文字符经常是混合在一起使用的,汉字信息如不予以特别的标识,它与单字节的标准ASCII码就会混淆不清。解决方法:使表示GB2312汉字国标码的两个字节最高位都置为“1”。这种汉字编码,称为GB2312汉字的“机内码”,存储在计算机中。,例如:“大”字 区位码 20 83 国标交换码52 115 二进制表示为 00110100 01110011 机内码 180 243 二进制表示为 10110100 11110011(B4F3H),(1)Q132G1 Q232G2(区位码 国标码),总结:区位码,国标码,机内码之间的转换,假设某个汉字国标码G1 G2(G1 表示第一个字节,G2表示第二个字节),区位码 Q1 Q2,机内码 J1 J2,则:,(2)G1128J1 G2128J2(国标码 机内码),1995年颁布,全称汉字内码扩展规范 总计23940个码位,共收入21003个汉字和883图形符号 特点:双字节编码 简体和繁体汉字在同一个字符集中 Windows中文版操作系统、Office简体中文版都提供GBK汉字的支持。,(2)GBK汉字内码扩充规范(GBK-95),目的:建立统一的多文本处理环境,实现所有字符在同一字符集中统一编码 优点:编码空间极大,能容纳足够多的各种字符集(13亿字符)缺点:4字节的字符编码使存储空间浪费严重 实际做法:UCS-2为其子集,采用双字节编码,共有字符49194个,(3)UCS/Unicode(通用多8位编码字符集)编码,使用范围:通行于台湾、香港地区的一个繁体字编码 方案,俗称“大五码”。收录内容:13461个汉字和符号符号408个常用汉字5401个次常用汉字7652个,(4)BIG5编码,目的:与GB2312和GBK兼容,向UCS/Unicode过渡。内容:规定了信息交换用的基本图形、字符及其二进制编码的十六进制表示,同时收录了主要的少数民族文字。编码方式:在GB2312和GBK的基础上进行了扩充,采用单字节/双字节/四字节三种方式编码,码位数160多万。,(5)GB18030汉字编码标准,二、文本处理,1、文本:文本是基于特定字符集的、具有上下文相关性的一个字符流,每个字符都使用二进制编码表示。2、文本在计算机中的处理过程,文本准备,输入码:中文输入法输入的汉字编码。数字编码、字音编码、字形编码、形音编码,定义:是由一连串的字符组成的,几乎不包含任何其他格式信息和结构信息,称为纯文本。后缀名.txt 特性:文件体积小,几乎所有的文字处理软件都能识别和处理;不能插入图片、表格、超链接等.,简单文本(纯文本),3、文本的分类,按是否具有编辑排版格式分:,丰富格式文本 有格式控制和结构说明信息的文本,如设定字型、字号、颜色等。如:Word的doc格式、Adobe Acrobat 的pdf格式等都是丰富格式文本。RTF格式:一些公司联合提出的一种中间格式。为了便于不同的丰富格式文本能在不同的软件和系统中交换使用,按文本内容的组织方式分:线性文本和超文本,超文本:采用网状结构来组织信息,文本中的各部分按内容的关系互相链接。如:Web网页。超媒体:把超文本推广到多媒体的形式。(可以是图形、图像、声音或视频等),按是否变化以及如何变化分:静态文本、动态文本和主动文本,4、文本的编辑和处理常用编辑软件:记事本、写字板、Word、WPS、Acrobat公司的Pagemaker、PDF Writer 文本检索:将文本按一定的方式进行组织、储存、管理,并按用户的要求查找到所需文本的技术和应用。文件检索系统的分类:关键词检索系统(图书信息系统)、全文检索系统(Google),输出码字模(形)码:描述字符的字形信息。,同一种字体所有字符的形状描述信息集合在一起称为字形库,简称字库。,两种描述方法:点阵描述和轮廓描述。点阵描述行点数*列点数轮廓描述用一组直线和曲线勾画,记录其端点和 控制点的坐标。,轮廓描述精度高于点阵描述,Windows中使用的True Type,5、文本展现,计算机上的图有两种描述方法:,图像:在现实世界中通过扫描仪、数码相机获取的,描述画面中每个像素的亮度或颜色,也称为点阵图像或位图图像。图形:使用计算机合成的,描述构成画面的直线、矩形、圆、圆弧、曲线等的形状、位置、颜色等各种属性和参数,也称为矢量图形。,5.2 图像与图形,一、图像的数字化(1)扫描:对图像进行离散化处理。把画面划分为M(列数,水平分辨率)*N(行数,垂直分辨率)个取样点,经采样得到N*M的取样点构成的阵列。像素:每个取样点,是组成取样图像的基本单位。(2)分色:彩色图像的每一个像素由三个基色分量(R、G、B)组成。(3)取样:测量每个像素每个分量的亮度值。(4)量化:对每个像素的每个分量的亮度值进行数字 化处理,即用二进制进行编码,表示图像的颜色。,二、数字图像获取设备 2D图像获取设备扫描仪、数码相机 3D扫描仪,三、图像的表示方法与主要参数 灰度图像用一个矩阵来表示;彩色图像用三个矩阵来表示。(1)图像的分辨率:指图像的尺寸,即水平方向上与垂直方向上所包含的像素个数。(2)颜色空间:指彩色图像所使用的彩色描述方法,也叫颜色模型,如RGB、YUV等颜色模型。(3)像素深度:像素所有颜色分量的二进位数之和,决定了不同颜色的最大数目。,颜色总数=2像素深度,彩色图像的表示,红色分量,蓝色分量,绿色分量,一个位平面,一个位平面,一个位平面,四、图像的压缩编码 图像数据量可按下式进行计算(以字节为单位):图像数据量图像宽度图像高度像素深度/8,例:一幅分辨率为640480的真彩色图像,未压缩前的数据量至少为多少?,数据量为:64048024/8=900K,图像数据压缩的可能性:每一帧图像内,数据相关性很强,存在着大量的冗余信息 人的视觉特性,图像压缩方法,(1)无损压缩方法 特点:压缩后的数据进行图像还原时,重建的图像与原始图像完全相同。一般用于文本数据、程序以及有关图片和图像的压缩,无损压缩的压缩比一般为2:15:1,因此不适合实时处理图像、音频和视频数据。典型的无损压缩软件有:WinRar。,(2)有损压缩方法 特点:使用压缩后的数据进行图像还原时,有一定误差。是以牺牲某些信息为代价,换取较高的压缩比,一般用于图像、视频和音频数据的压缩,压缩比高达几十到几百。有损压缩编码方法有离散余弦变换、离散KL变换等。,评测一种图像压缩方法的优劣,需综合考虑如下3个方面:(1)信息压缩比。(2)重现精度,还原后的图像质量与原图相比有多大失真。(3)压缩算法的复杂度,实现压缩还原算法的难易程度,即执行速度的快慢及硬件实现的成本。,JPEG标准,一个适合于彩色和单色多灰度连续色调的静止图像的压缩编码标准。这个标准已于1992年被ISO批准,编号为ISOIEC 10918。,JPEG 2000:是JPEG标准的升级,采用更先进算法,改善压缩效率,更好的图像质量,同时支持有损和无损压缩。,标准JPEG,JPEG 2000,五、常用图像文件格式:BMP、TIF、GIF、JPEG/JP2 常用图像编辑软件:Photoshop、paint、ACDSee,六、计算机图形的概念及其应用 使用计算机根据景物的模型生成图像的过程称为图像合成,所产生的数字图像称为计算机图形。特点:在屏幕上移动、旋转、放大、缩小、扭曲时不失真,并且不同的物体还可在屏幕上重叠并保持各自的特性。常见图形软件:AutoCAD、MAPInfo、CorelDraw、Visio,将模拟音频信号转换成有限个数字编码的形式。声音数字化涉及音频的取样、量化和编码三个过程。,5.3 数字声音及应用,一、数字声音的获取方法与设备,声音获取设备:麦克风声波转换成电信号 声卡声波的数字化,二、数字声音的压缩编码 常用压缩编码MPEG系列的音频压缩标准 MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21,“MP3音乐”就是采用MPEG-1层3编码的高质量数字音乐,码率=取样频率*量化位数*声道数,数字化波形声音的表示:一种使用二进制表示的串行比特流,文件扩展名:.WAV 主要参数:取样频率、量化位数、声道数目、比特率(每秒钟的数据量)、压缩编码方法等。,三、计算机合成声音 语音合成:让计算机模仿人把一段文字朗读出来,这个过程称为文语转换(TTS)音乐合成:计算机自动演奏乐曲,采用MIDI音乐描述语言描述一首乐曲中所对应的全部消息,组成一个MIDI文件。(文件扩展名.MID),5.4 数字视频基础一、数字视频的获取方法与设备 以一帧帧画面为单位,对RGB的模拟视频信号转换成YUV的数字视频信号。,视频采集卡:简称视频卡,PC机中用于视频信号数字化的插卡。功能:将模拟视频信号(及伴音信号)转化为数字视 频信号。,二、数字视频的压缩编码 压缩编码标准:MPEG系列与H.261三、合成视频计算机动画 计算机动画是采用计算机制作可供实时演播的一系列连续画面的一种技术,是一种人工合成的数字视频。常用的动画制作软件:二维动画软件Animator和三维动画软件3DMAX等。ImageReady、Fireworks等GIF制作软件。制作Web网页动画的Flash软件(.swf、支持流媒体 传输技术),四、数字视频的应用VCD与DVD可视电话与视频会议数字电视视频点播(VOD),