第5章 数字媒体及应用.ppt
《第5章 数字媒体及应用.ppt》由会员分享,可在线阅读,更多相关《第5章 数字媒体及应用.ppt(100页珍藏版)》请在三一办公上搜索。
1、5.1 文本与文本处理 5.2 图像与图形及应用5.3 波形声音的获取与播放5.4 数字视频及应用,第五章 数字媒体及应用,文字、文本文字:一种书面语言,由一系列称为“字符”(character)的书写符号构成。文本:文字信息在计算机中的表示形式,是基于特定字符集的、具有上下文相关性的一个(二进制编码)字符流,是计算机中最常用的一种数字媒体。组成文本的基本元素是字符,字符在计算机中采用二进制编码表示。,文本的输入文本输入是将文字输入到计算机中,建立文本文件(电子文档)的操作。文字输入方法概述(1)人工输入。方法:键盘输入、手写笔联机识别输入、语音识别输入。(2)文字自动识别输入。将纸介质上的文
2、本通过识别技术自动转换为文字的编码。方法:印刷体文字识别输入,手写体文字脱机识别输入。,5.1.2 文本的表示与字符的编码1、文本的表示文本是计算机表示文字及符号信息的最常用也是最基本的一种数字媒体。由于文字和符号采用了二进制编码表示,因而可以方便地进行编辑、排版和各种分析处理(如统计、排序、分类、索引、检索等)。,西文字符集:由拉丁字母、数字、标点符号及一些特殊符号组成。字符的编码:字符集中每一个字符各有一个代码,即字符的二进制表示,称为该字符的编码。(1)标准ASCII编码字符集。美国标准信息交换码:使用7个二进位对字符进行编码(叫做标准ASCII码),称为ISO-646标准。基本的ASC
3、II字符集共有128个字符。,在计算机中的存储方法是:用一个字节(8位)来存储一个字符的ASCII码。每个字节中多出来的最高位一般保持为“0”。常用的特殊字符的ASCII码:空格(32)、A(65)、a(97)、数字0(48)。,(2)扩充ASCII编码字符集。每个扩充ASCII字符集分别可以扩充128个字符,这些扩充字符的编码均是高位为“1”的8位代码(十进制数128255),称为扩展ASCII码。,汉字编码字集(1)GB2312-80汉字编码字符集。信息交换用汉字编码字符集基本集(GB2312-80)第一部分:字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音
4、等共682个(统称为GB2312图形符号)。第二部分:一级常用汉字,共3755个,按汉语拼音排列。第三部分:二级常用字,共3008个,按偏旁部首排列。,区位码:GB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区号,列号称为位号。每一个汉字或符号在码表中都有各自的位置,字符的位置用它所在的区号(行号)及位号(列号)来表示。每个汉字的区号和位号分别用1个字节来表示。,国标交换码:将GB2312字符集中每个汉字的区号和位号必须分别加上32(即二进制0010 0000,十六进制20H),就可以得到该汉字的“国标交换码”(简称交换码)。,机内码:把一个汉字看作两个扩展ASCII码,
5、使表示GB2312汉字的两个字节的最高位(b7)都等于“1”。这种高位为1的双字节(16位)汉字编码就称为GB2312汉字的“机内码”,又称内码。国标码=区位码+2020H,机内码=区位码+A0A0H,2)GBK汉字编码字符集。1995年发布GBK,全称为汉字内码扩展规范GBK字符集中一共有21003个汉字和883个图形符号,它与GB2312国标汉字字符集及其内码保持兼容。GBK的编码是用2字节编码表示,第1字节的最高位必为“1”,第2字节的最高位不一定是“1”。,(3)UCS/Unicode与GB18030汉字编码标准。通用编码字符集UCS/Unicode。UCS/Unicode用4个字节对
6、全世界现代书面文字所使用的所有字符、符号进行编码(记作UCS-4)。其优点是编码空间极大,能容纳足够多的各种字符集(13亿字符);缺点是4字节的字符编码使存储空间浪费严重。,GB18030-2000编码。GB18030-2000汉字编码标准是为了既兼容GB2312和GBK,又尽快向UCS/Unicode编码标准过渡,而在2000年颁布的汉字编码国家标准。该标准在GB-2312和GBK的基础上进行扩充,增加了4字节编码。,例:(单选)在ASCII编码中,字母A的ASCII编码为41H,那么字母f的ASCII编码为()。A46H B66H C67H D78H,参考答案:B由题目中所给的字母A的AS
7、CII编码为41H这个已知条件,可以推导出a的ASCII编码为61H,再考虑ASCII编码表中字母的顺序是连续的,所以可以得出b的ASCII编码为62H,以此类推可得出f的ASCII编码为66H。,例:(判断)西文字符在计算机中通常采用ASCII码表示,每个字节存放1个字符。(),参考答案:对目前计算机中使用得最广泛的西文字符集的编码称为ASCII码,它一共有128个字符,每个字符使用7个二进位进行编码。还有一种扩充ASCII码,每个字符使用8个二进位进行编码。无论是7位的标准ASCII码还是8位的扩充ASCII码,一个字节只存放一个ASCII字符。若使用7位标准ASCII码,每个字节多余出来
8、的一位(最高位)通常保持为“0”。,例:(判断)采用GB2312、GBK和GB18030三种不同的汉字编码标准时,一些常用的汉字如“中”、“国”等,它们在计算机中的表示(内码)都是相同的。(),参考答案:对分析:GB2312、GBK和GB18030是我国从20世纪80年代开始先后制订与发布的三个汉字编码标准,它们的主要区别是字符集中所包含的图形符号和汉字的数目不同,后发布的标准中收录的字符总是涵盖了已发布标准中的所有字符,而且,它们在计算机中的表示(内码)也都保持相同。,(单选)有关我国汉字编码的叙述中,错误的是A.GB2312国标字符集所包含的汉字许多情况下已不够使用B.GBK字符集既包括简
9、体汉字,也包括繁体汉字C.GB18030编码标准中所包含的汉字数目超过2万字D.不论采用上述哪一种汉字编码标准,汉字在计算机中均采用双字节表示,参考答案:D在GB2312和GBK中,所有汉字在计算机中都使用2个字节表示和存储,但GB18030汉字数量很大,多数汉字使用2字节编码(且与GB2312、GBK保持相同),还有少数汉字使用4字节编码。,文本文件的类型,文本类型简单文本丰富格式文本超文本,文本的概念从由数字、字符和汉字等构成的纯文本扩大到包含了若干带有格式控制的Word文档、网页制作软件生成的HTML文件等等。,简单文本文件(纯文本)简单文本是由一连串的字符组成的,除了用于表达正文内容的
10、字符(包括汉字)及“回车”、“换行”、“制表”等有限的几个打印(显示)控制字符之外,几乎不包含任何其他格式信息和结构信息。这种文本通常称为纯文本或ASCII文本,文件后缀名是TXT。,2、丰富格式文本文件 文件内容有字符(汉字)的编码、数字图像、数字声音、数字视频信息、标记信息(格式信息、结构信息、链接信息等)。例如,RTF文件、DOC文件、PDF文件、HTML文件。,3、超文本文件 超文本也称为非线性文本,文本的组织结构是网状结构,即包含链接信息的丰富格式文本。阅读时除顺序阅读方式之外,还可以通过跳转、导航、回溯等操作,实现对文本内容更为方便的访问。例如,Windows中的“帮助”文件或者使
11、用浏览器从Web服务器上下载的网页(html或htm文件)。,超链是有向的,起点位置称为链源,目的地(目标)称为链宿。链源可以是节点中的一个标题、句子、关键词、字、一幅图像、一个图标等。链宿可以是节点,也可以是系统中的一个文件(包括文件的标签)或者程序。网页中的超文本文件还分静态文档、动态文档、主动文档。,例:(单选)关于文本的叙述中,错误的是。A.不同文字处理软件制作的丰富格式文本通常互不兼容B.纯文本的文件扩展名为“txt”C.“doc”文件中不只包含西文字符和汉字,并且含有许多字符属性和格式标记D.超文本既可以是丰富格式文本,也可以是纯文本,参考答案:D超文本虽然强调的是按信息块将文本组
12、织成为网状结构,并没有特别强调文本的外观和格式,但是,它使用的“链源”和“链宿”等均需要在文本中采用特定标记语言进行标记,从这个角度而言,超文本一般都是丰富格式文本,而非纯文本。,例:(填空)有一本英文小说,它在计算机中用纯文本形式表示,文件扩展名为“txt”,大小为35KB,该小说所包含字符(字母、数字、标点符号等)的总数大约是 个,参考答案:35840分析:在计算机中用纯文本形式表示的英文小说,其中包含的仅仅是采用ASCII码(7位或8位)表示的西文字母、数字和一些标点符号,每个字符使用1个字节进行存储,由于文件扩展名为“txt”,表示该文件没有进行数据压缩。因此,这本小说所包含字符(字母
13、、数字、标点符号等)的总数大约是351024=35840个。,文本的输出文本输出过程文本阅读器汉字字形生成过程字形库字符形状的描述,字形码点阵字形:象素阵列。象素多,字清晰,存储容量大 汉字字形点阵中每个点的信息用一位二进制码来表示。对于16 16点阵的汉字字形码,需要用32个字节(16 16 8=32)表示;24 24点阵的汉字字形码,需要用72个字节表示。矢量字形:折线。不占存储空间,字形美观轮廓字形:直线或曲线描述轮廓。占用存储空间小,字形质量高,.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#,1616点阵
14、字模,点阵字模示意图,图形与图像及应用,1、色光的三基色色光的三基色是:红(Red)、绿(Green)、蓝(Blue)。三基色以不同的比例相混合,可成为各种色光。当三基色分量都为0(最弱)时混合为黑色光。当三基色分量都为K(最强)时混合为白色光。,2、颜料的三基色颜料的三基色是:青(Cyan)、品红(Magenta)、黄(Yellow)。三基色颜料以不同的比例相混合,可产生各种颜色的颜料,但在印刷或者打印时,对黑色的处理有问题,因此需增加黑色。,3、色彩的表达方法(1)RGB色彩空间(RGB为色光的三基色)。R红色(Red),G绿色(Green),B蓝色(Blue)。典型应用是计算机的彩色显示
15、器。(2)YUV色彩空间。Y亮度信号,U、V色差信号。典型应用是彩色电视系统。(3)HIS色彩空间。H色调(Hue),I亮度(Intensity或Brightness),S色饱和度(Saturation或Chroma)。HIS色彩空间是从人的视觉系统出发描述色彩。,(4)CMYK色彩空间。C青色(Cyan),M品红色(Magenta),Y黄色(Yellow),K黑色(Black)。一幅图像在计算机中显示用RGB色彩空间,编辑处理用RGB或HSI色彩空间,打印时转换成CMY色彩空间(彩喷打印也用CMYK),印刷时转换成CMYK色彩空间。,数字图像的分类图像(Image):从现实世界中通过数字化设
16、备获取的图像;图形(Graphics):由计算机合成的数字图像。,5.2.3 图像的获取与重现1、图像的获取图像的获取是从现实世界中获得数字图像的过程,图像获取的过程实质上是模拟信号的数字化过程,它的处理步骤有:取样、分色、量化。,(1)取样:将画面划分为M N个网格,每个网格称为一个取样点。一幅模拟图像就转换为M N个取样点组成的一个阵列。每个取样点只有一种颜色或亮度,取得所有取样点的颜色或亮度。(2)分色:若是彩色图像,则将每个取样点的颜色分解成三个基色(例如R,G,B),对应有3个亮度值,如果不是彩色图像,则每一个取样点只有一个亮度值。(3)量化:对取样点的每个分量的亮度值进行A/D转换
17、,把模拟量的亮度值用数字量(一般是8位至12位的正整数)来表示。,16色图像,256色图像,24位真彩色图像,不同位深度的图像对比,16色图像,24位真彩色图像,256色图像,图像 取样 量化 数字图像,5.2.3数字图像的表示与压缩编码 从取样图像的获取过程可以知道,一幅取样图像由M(行)N(列)个取样点组成,每个取样点是组成取样图像的基本单位,称为像素(Picture Element,简写为PEL)。彩色图像的像素是矢量,它由多个彩色分量组成,黑白图像的像素只有1个亮度值。,1、数字图像的表示(1)单色图像(2)彩色图像,2、图像的属性信息(1)图像大小,也称图像分辨率(包括垂直分辨率和水
18、平分辨率)。(2)位平面的数目,即矩阵的数目,也就是彩色分量的数目。(3)颜色空间的类型,指彩色图像所使用的颜色描述方法,也叫颜色模型。常用颜色模型:RGB(红、绿、蓝)、CMYK(青、品红、黄、黑)、HSV(色彩、饱和度、亮度)、YUV(亮度、色度)等。(4)像素深度,即像素的所有颜色分量的位数之和,它决定了不同颜色(亮度)的最大数目。,(1)图像分辨率 图像采样的点数,称为图像分辨率 用点的“行数列数”表示 如数码像机常用的图像分辨率为640480、1024786、1128764等。相同尺幅的图像,组成该图的像素数目越多,则说明图像的分辨率越高,看起来越逼真。相反,图像显得越粗糙。图像分辨
19、率越高,图像文件占用的存储空间越大。,数字图像中表示每个像素的颜色使用的二进制位数称为像素深度或图像深度。像素深度值越大,图像能表示颜色数越多,色彩越丰富逼真,占用的存储空间越大。,(4)像素深度(图像深度),例:图像文件的大小估算 一幅640480的图像,位深度是24位(真彩色图像),则文件大小为:24(bit)/8(bit/Byte)640(列)480(行)=921600B(Bytes)约900kB,图像的分辨率和像素位深度决定了图像文件的大小。,3、数字图像的压缩数据压缩类型。无损压缩:压缩以后的数据进行图像还原(也称为解压缩)时,重建的图像与原始图像完全相同。有损压缩:使用压缩后的数据
20、进行图像重建时,重建后的图像与原始图像虽有一定的误差,但不影响人们对图像含义的正确理解。如变换编码、矢量编码等。图像压缩方法很多,一般都采用有损压缩。,(4)压缩比。图像数据压缩比=压缩后的图像数据量压缩前的图像数据量。(6)数字图像压缩编码国际标准。JPEG标准:制定了一个静止图像数据压缩编码的国际标准,称为JPEG标准。JPEG 2000标准:它兼容JPEG。,图像文件格式,(1)位图文件(Bitmap-File,BMP)bmp格式是Windows采用的图像文件存储格式,在Windows环境下运行的所有图像处理软件都支持这种格式 是一种不压缩的格式,因此占有较大的存储空间,但图像质量较高,
21、没有数据损失。,图像文件格式是图像数据在文件中的存放形式,不同的软硬件厂商可能定义不同的文件格式。,(2)GIF格式,GIF(Graphics Interchange Format)是CompuServe公司开发的图像文件存储格式 压缩效率、占用的存储空间很小 支持透明图像属性和动画图像属性 但表示的颜色数量有限,适合存储颜色较少的卡通图像、徽标等手绘图像。适合互联网上传输,(3)JPEG格式 JPEG(Joint Photographic Experts Group)负责制定静态的数字图像数据压缩编码标准 专家组开发的算法称为JPEG算法 相应的文件存储格式为jpg格式 可以选择压缩质量 适
22、合存储色彩丰富的照片(4)TIFF用于扫描仪和桌面出版系统,图像文件 静态图像文件BMP文件、GIF文件、JPEG文件、TIF文件 动态图像文件AVI文件、MPEG文件,矢量图像与位图图像,矢量图像(图形)用计算机指令(数学方法)描述一幅图。矢量图像文件所占空间较小,旋转、放大、缩小、倾斜等变换操作容易,且不变形、不失真 位图图像 用记录每一个离散点的颜色的方法(就是前面介绍的采样、量化和编码)来描述图像,这种图像叫位图图像用于描述复杂图像,占用空间较大。,例:(判断)GIF格式图像在因特网上广泛使用的原因是因为它是一种真彩色图像。,参考答案:错分析:GIF图像确实是目前因特网上广泛使用的一种
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第5章 数字媒体及应用 数字 媒体 应用
链接地址:https://www.31ppt.com/p-5651092.html