第5章_数字媒体及应用(江苏专转本计算机)课件.ppt
《第5章_数字媒体及应用(江苏专转本计算机)课件.ppt》由会员分享,可在线阅读,更多相关《第5章_数字媒体及应用(江苏专转本计算机)课件.ppt(85页珍藏版)》请在三一办公上搜索。
1、第5章 数字媒体及应用,5.1 文本与文本处理5.2 图像与图形5.3 数字声音及应用5.4 数字视频及应用,5.1 文本与文本处理,文字:是一种书面语言,它由一系列字符(character)的书写符号构成。文本(text):文字信息在计算机中的表示形式,是基于特定字符集的、具有上下文相关性的一个字符流,是计算机中最常用的一种数字媒体。组成文本的基本元素是字符,字符在计算机中采用二进制编码表示。,文本在计算机中的处理,文本在计算机中的处理过程:文本准备(例如汉字的输入)、文本编辑、文本处理、文本存储与传输、文本展现等,根据应用场合的不同,各个处理环节的内容和要求可能有很大的差别。,5.1 文本
2、与文本处理,文本信息的输入方法:(P130第13题)人工输入:通过键盘、手写笔或语音输入方式输入字符特点:速度慢、成本高,不适合需处理大批量文字的应用自动输入:将纸介质上的文本通过识别技术自动转换为文字的编码特点:速度快,效率高文字的自动识别分为:印刷体识别和手写体识别,5.1.1 文本准备,文本信息的输入方法,汉字输入编码方法的分类数字编码:使用一串数字来表示汉字的编码方法,例如区位码等 缺点:难以记忆,不易推广字音编码:一种基于汉语拼音的编码方法,简单易学,适合于非专业人员 缺点:同音字引起的重码多,需增加选择操作字形编码:将汉字的字形分解归类而给出的编码方法,重码少、输入速度较快,如五笔
3、字形法和表形码等 缺点:编码规则不易掌握形音编码:吸取了字音编码和字形编码的优点,使编码规则适当简化、重码减少 缺点:不易掌握,1.汉字键盘输入,以平常书写的习惯,把要输入的汉字写在一块叫书写板的设备上,书写板将笔尖的运动(包括抬笔、落笔、笔段轨迹以及各笔段之间的时间关系等)按时间采样后发送到计算机中,由计算机软件自动进行识别,然后用该汉字(或符号)对应的代码进行保存。汉王笔 正识率 95 90,速度 12字/秒中科院自动化所,华旗资讯科技发展有限公司(爱国者),2.联机手写汉字识别(笔输入),使用语音输入文本的系统也叫做“听写机”或“语音打字机”按照不同的应用及要求,语音识别的功能区别:孤立
4、语音/连续语音识别小词汇量/大词汇量语音识别特定人/非特定人语音识别最高目标:非特定人大词汇量的连续语音识别技术,3.汉语语音识别,印刷体汉字识别:将传统纸介质上的文字信息自动输入计算机并转换为数字文本形式的一种技术,也叫做汉字OCR(Optical Character Recognition)。(P130第2题)印刷体文字识别的过程,4.印刷体汉字识别(汉字OCR),5.1.2 字符的编码,字符是组成文本的基本元素,字符在计算机中采用二进制编码表示。1.西文字符的编码字符集:常用字符的集合。西文字符集:由拉丁字母、数字、标点符号及一些特殊符号组成。字符的编码:字符集中每一个字符各有一个代码,
5、即字符的二进制位表示,称为该字符的编码。,美国标准信息交换码(American Standard Code for Information Interchange):使用7个二进位对字符进行编码(叫做标准ASCII码),称为ISO-646标准。基本的ASCII字符集共有128个字符(P125 例1、P127第1题)96个可打印字符(常用字母、数字、标点符号等)32个控制字符特殊字符的ASCII码空格(32)A(65)a(97)0(48)(P128第17、19题),ASCII码,标准ASCII码是七位的编码,但字节是计算机中最基本的处理单位,故以一个字节来存放一个ASCII字符。每个字节中多出来
6、的一位一般保持为“0”。扩充ASCII字符集:标准ASCII字符集只有128个不同的字符,在很多应用中无法满足要求。ISO陆续制定了一批适用于不同地区的扩充ASCII字符集,每个扩充ASCII字符集分别可以扩充128个字符,这些扩充字符的编码均是高位为1的八位代码(十进制数128255),称为扩展ASCII码。,扩充ASCII字符集,(1)GB2312-80汉字编码信息交换用汉字编码字符集基本集(GB2312-80)组成:第一部分:字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个(统称为GB2312图形符号)第二部分:一级常用汉字,共3755个,按汉
7、语拼音排列第三部分:二级常用字,共3008个,按偏旁部首排列,2.汉字的编码,(1)GB2312-80汉字编码区位码:GB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区号,列号称为位号。每一个汉字或符号在码表中都有各自的位置,字符的位置用它所在的区号(行号)及位号(列号)来表示。每个汉字的区号和位号分别用1个字节来表示,如:“大”字的区号20,位号83,区位码是20 83用2个字节表示为:00010100 01010011(即十六进制1453H),2.汉字的编码,GB2312-80汉字编码,2.汉字的编码,(1)GB2312-80汉字编码国标交换码:为了避免汉字区位码与通
8、信控制码的冲突,ISO2022规定,每个汉字的区号和位号必须分别加上32(即二进制0010 0000,十六进制20H),经过这样处理得到的代码称为汉字的“国标交换码”(简称交换码)。因此,“大”字的交换码是:00110100 01110011。,2.汉字的编码,(1)GB2312-80汉字编码机内码:问题:文本中的汉字与西文字符经常是混合在一起使用的,汉字信息如不予以特别的标识,将汉字的区号和位号必须分别加上160(即二进制1010 0000,十六进制A0H),就可以得到该汉字的“机内码”,又称内码。如:“大”字的内码是:10110100 11110011(B4F3),2.汉字的编码,综上所述
9、,可以总结如下公式:(P127页第2题)国标码=区位码+2020H 机内码=区位码+A0A0H,(2)GBK汉字内码扩充规范问题:GB2312-80只有6763个汉字,使用时功能不够。解决方法:1995年发布GBK,全称为汉字内码扩展规范,它与GB2312国标汉字字符集及其内码保持兼容。GBK/1:GB2312中的符号;GBK/2:GB2312中的全部汉字;GBK/4和GBK/3:包括繁体字在内的大量汉字;GBK/5:符号。例如:計機係等繁体汉字和冃冄円冇鎔等生僻的汉字。,2.汉字的编码,(2)GBK汉字内码扩充规范(P129第23题)组成:21003个汉字,883个图形符号GBK的编码是用2
10、字节编码表示,第1字节的最高位为”1”,第2字节的最高位不一定是”1”,与GB2312-80保持兼容。,2.汉字的编码,(3)UCS/Unicode与GB18030汉字编码标准(a)通用编码字符集UCS/UnicodeUCS/Unicode用4个字节对全世界现代书面文字所使用的所有字符、符号进行编码(记作 UCS-4)优点是编码空间大,能容纳足够多的各种字符集(13亿字符);缺点是4字节的字符编码使存储空间浪费严重。,2.汉字的编码,(3)UCS/Unicode与GB18030汉字编码标准(b)GB18030-2000编码(P125页例2)GB18030-2000汉字编码标准时为了既兼容GB2
11、312和GBK,又尽快向UCS/Unicode编码标准过度,而在2000年颁布的汉字编码国家标准。该标准在GB-2312和GBK的基础上进行扩充,增加了4字节编码,收录的汉字达到27000个。,2.汉字的编码,文本是计算机表示文字及符号信息的最常用也是最基本的一种数字媒体。由于文字和符号采用了二进制编码表示,因而可以方便地进行编辑、排版和各种分析处理(如统计、排序、分类、索引、检索等)。使用计算机制作的数字文本,根据用途分为:简单文本、丰富格式文本和超文本三类。(P130第11题),5.1.3 文本的分类与表示,简单文本(plain text):是由一连串用于表达正文内容的的字符(包括汉字)所
12、组成的,它几乎不包含任何其他格式信息和结构信息。这种文本通常称为纯文本或ASCII文本,其文件后缀名是.txt。特性:呈现为一种线性结构,写作与阅读均按顺序进行。文件体积小,通用性好,几乎所有的文字处理软件都能识别和处理,但不能插入图片、表格等,也不能建立超链接。,1.简单文本(纯文本),文件内容有字符的编码、数字图像、数字声音、数字视频信息、标记信息。(P130第14题)例如RTF文件、DOC文件、PDF文件、HTML文件。RTF是为便于不同的丰富格式文本能在不同的软件和系统中互相交换使用而提出的一种中间格式标记语言。(P127第3题),2.丰富格式文本,超文本也称为非线性文本(P128第1
13、2题、P131第16题)超文本(hypertext)的阅读方式传统的顺序式阅读通过链接、跳转、导航、回溯等操作实现跳跃式阅读超文本的结构:采用网状结构来组织信息,各信息块按照其内容的关系互相链接例如,Windows中的”帮助”文件或者使用浏览器从Web服务器上下载的网页(html或htm文件)。,3.超文本,超文本,超文本结构,(1)面向通信的文本处理软件(P128第16题)计算机网络上最普及的应用是用电子邮件进行通信。大多数情况下电子邮件正文的内容一般都是简单文本,因此电子邮件内嵌的文本编辑器功能比较简单,操作使用方便。典型软件:微软公司的Outlook Express,具有文字的增、删、改
14、以及字体、字号的设置功能,也可以设定一些简单的格式和插入一些图片。当然邮件所带的附件并不受此限制。在互联网上进行聊天所使用的文本处理软件更加简单。,3.常用文本处理软件,(2)面向办公的文本处理软件功能要求:文本制作的高效率、高质量软件面向非专业用户,易学好用文本处理能力,既功能丰富,又操作简单排版功能典型软件:MS-OfficeWPS2000,3.常用文本处理软件,(3)面向出版的文本处理软件排版软件的主要功能:将文字、图形和图像等合理地安排在页面内.ps文件:排版软件的输出的一种使用页面描述语言(例如PostScript)描述的文件,该文件记录了每一个页面的排版结果,它被送到装有栅格图像处
15、理器(RIP)的激光照排机去,经过RIP的解释,产生页面的图像,然后驱动激光束对感光材料进行扫描曝光,以得到用于制版的胶片典型排版软件:方正集团公司的“飞腾”排版软件美国Adobe公司的PageMaker和PDF Writer,3.常用文本处理软件,(4)面向网络信息发布和电子出版的文本处理软件制作HTML文件的软件:微软的FrontPage超链的链宿有两种:书签,指的是文本内部标记有书签的某个地方互联网上的某个信息资源(文件),它用统一资源定位器(URL)指定面向电子出版的软件:PDF格式文件,3.常用文本处理软件,4.搜索引擎,Web服务器使用软件robot遍历Web,将Web上的信息下载
16、到本地文档库,然后对文本内容进行自动分析并建立索引,在用户提出检索请求时,搜索引擎通过检查索引找出匹配的文本并返回给用户。例如,搜狐(Sohu)、谷歌(Google)、雅虎(Yahoo)、新浪(Sina)、百度(baidu)等。,1.色光的三基色(P129第22题)色光的三基色是:红(Red)、绿(Green)、蓝(Blue)自然界中任何一种色光都可由R、G、B三基色按不同的比例相加混合而成。当三基色分量都为0(最弱)时混合为黑色光。当三基色分量都为K(最强)时混合为白色光。2.颜料的三基色:青、品红、黄,5.2 图像与图形及应用,3.色彩的表达方法(1)RGB色彩空间典型应用是计算机的彩色显
17、示器。(2)YUV色彩空间(P126例7)Y-亮度信号,U、V-色彩信号典型应用是彩色电视系统。(3)HIS色彩空间H色调,I亮度,S-色饱和度HIS色彩空间是从人的视觉系统出发描述色彩(4)CMYK色彩空间C-青色,M-品红色,Y-黄色,K-黑色典型应用为彩色打印系统、彩色印刷系统。,4.数字图像分类:从现实世界中通过数字化设备获取的图像,称为图像(image),是来自自然界中的真实的景物。由计算机合成的图像,称为:矢量图形,简称图形(graphics),是虚拟的。,1.图像的获取:从现实世界中获得数字图像的过程。图像获取的过程实质上是模拟信号的数字化过程,它的处理步骤:取样分色量化,5.2
18、.2 图像的获取与重现,2.数字图像获取设备:从现实世界获得数字图像过程中所使用的设备。设备的功能:将现实的景物输入到计算机内并以取样图像的形式表示。2D图像获取设备(如扫描仪、数码相机等)只能对图片或景物的2D投影进行数字化 3D扫描仪能获取包括深度信息在内的3D景物的信息,5.2.2 数字图像获取设备,1.图像的表示方法与主要参数:(P125例3)从取样图像的获取过程可以知道,一幅取样图像由M(行)*N(列)个取样点组成,每个取样点是组成取样图像的基本单位,称为像素(picture element,简写为pel)。彩色图像的像素是矢量,它由多个彩色分量组成,黑白图像的像素只有1个亮度值。,
19、5.2.3 图像的表示与压缩编码,取样图像在计算机中的表示方法:单色图像用一个矩阵来表示。彩色图像用一组(一般是3个)矩阵来表示,矩阵的行数称为图像的垂直分辨率,列数称为图像的水平分辨率,矩阵中的元素是像素颜色分量的亮度值,使用整数表示,一般是8位至12位。,数字图像的表示,图像大小,也称图像分辨率(包括垂直分辨率和水平分辨率)(P127第4题)位平面数目,即矩阵的数目,也就是彩色分量的数目。颜色空间的类型,指彩色图像所使用的颜色描述方法,也叫颜色模型。常用颜色模型:RGB(红、绿、蓝)、CMYK(青、品红、黄、黑)、HSV(色彩、饱和度、亮度)、YUV(亮度、色度)等像素深度,即像素的所有颜
20、色分量的位数之和,它决定了不同颜色(亮度)的最大数目,图像的属性信息,(1)数字图像压缩的必要性一幅图像的数据量可按下面的公式进行计算(以字节为单位):(P128第15题)图像数据量图像水平分辨率图像垂直分辨率像素深度/8(单位为字节)几种常用图像的数据量,2.图像的压缩编码,(2)图像数据压缩的可能性:由于数字图像中的数据相关性很强,数据的冗余度很大,因此对数字图像进行大幅度的数据压缩是完全可能的。而且,人眼的视觉有一定的局限性,即使压缩前后的图像有一定失真,只要限制在人眼允许的误差范围之内,也是允许的。,2.图像的压缩编码,(3)数据压缩类型(P129第21题)无损压缩:压缩以后的数据进行
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字 媒体 应用 江苏 计算机 课件
链接地址:https://www.31ppt.com/p-3730363.html