第5章数字媒体与应用(New).ppt
《第5章数字媒体与应用(New).ppt》由会员分享,可在线阅读,更多相关《第5章数字媒体与应用(New).ppt(142页珍藏版)》请在三一办公上搜索。
1、第5章 数字媒体及应用,5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用5.4 数字视频及应用,教学目的与要求,掌握GB2312字符集的内容及其在计算机内的表示,熟悉GBK字符集和GB18030字符集的内容,了解UCS/Unicode的目的及其与GB18030标准的关系了解字符信息输入计算机的方法与分类,了解汉字键盘输入编码的方案及其优缺点熟悉计算机文本的不同类型、特点、用途和它们的文件扩展名,熟悉简单文本(纯文本)和丰富格式文本的特点,掌握超文本的特点,了解链源、链宿和超链的概念,了解Windows环境中编辑制作各种类型文本的常用软件及其应用,了解什么是计算机文本处理掌握图
2、像获取(数字化)的原理与主要步骤,掌握黑白图像、灰度图像和彩色图像在计算机中表示方法的区别,掌握数字图像的主要性能参数(分辨率、像素深度)以及它们与图像大小、颜色数目、图像数据量之间的关系,了解图像数据压缩的意义和两类压缩方法,熟悉几种常用的数字图像文件格式以及它们的特点和用途,了解数字图像处理的主要内容和用途,了解计算机图形与图像的区别和联系、计算机图形的应用,教学目的与要求,掌握波形声音获取(数字化)的原理与主要步骤,熟悉波形声音获取设备(如麦克风、声卡)的功能,了解计算机输出(播放)声音时的工作过程与相关设备熟悉波形声音的主要性能参数(取样频率、量化位数、声道数目)及其与码率和数据量之间
3、的关系,了解波形声音的特性、常用的文件类型及其应用,了解CD立体声和MP3的特性和应用;了解计算机合成语音(文语转换)的过程和主要应用,熟悉计算机合成音乐(MIDI)的特点与应用了解数字视频获取设备的功能和特点,熟悉数字视频的压缩编码标准及其应用,熟悉VCD和DVD的特点和应用,了解可视电话和视频会议的基本原理和应用,了解什么是数字电视和数字电视的传播方式,了解点播电视(VOD)的功能,5.1 文本与文本处理,5.1.1 字符的编码5.1.2 文本准备5.1.3 文本的分类5.1.4 文本编辑、排版与处理5.1.5 文本的展现,文字处理是计算机应用的基础,计算机应用使用计算机进行信息处理,其中
4、,文字信息的处理是各种计算机应用的基础,传统的文字处理过程,计算机文字处理过程,文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体文本由一系列“字符”(character)组成,每个字符均使用二进制编码表示文本在计算机中的处理过程是:,5.1.1 字符的编码(在计算机中的表示),字符、字符集及其码表,文字的基本元素是字母和符号,统称为“字符”(character),它包括:字母、数字、符号等字符集:一组特定字符的集合不同的字符集包含的字符数目与内容不同,如:中文字符集、西文字符集、日文字符集等字符的编码:字符集中每个字符都使用二进位(code)表示,称为该字符的编码
5、不同的字符其编码各不相同字符集中所有字符的编码的一览表,称为该字符集的码表,西文字符的编码ASCII码,西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成美国标准信息交换码(American Standard Code for Information Interchange,简称ASCII码):ASCII字符集包含96个可打印字符和32个控制字符采用7个二进位进行编码计算机中使用1个字节存储1个ASCII 字符有关介绍可参看第1章1.2.3节,汉字如何编码?,汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素汉字的特点数量大;多个国家和地区使
6、用;字形复杂,同音字多,异体字多如何编码?确定收入多少字、哪些字?汉字在字符集中的排序方式确定使用的代码结构和代码空间,常用的汉字编码字符集,国家标准GB2312-1980汉字扩充规范 GBK(已被GB 18030取代)国家标准GB18030-2005港澳台使用的汉字编码字符集CNS 11643(BIG 5,俗称“大五码”)UCS/Unicode多文种大字符集Unicode的UTF-8Unicode的UTF-16,GB2312汉字编码字符集,1980年颁布信息交换用汉字编码字符集基本集GB2312-1980GB2312字符集由三个部分构成:,拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼
7、音等共682个,共6763个汉字和682个符号,每个汉字和符号都有一个确定位置,GB2312汉字的编码,每一个GB2312汉字使用16位(2个字节)表示每个字节的最高位均为“1”机内码(又称内码):这种高位均为1的双字节汉字编码例如“南”字的GB2312内码为:11000100 11001111(16进制表示为C4CF)汉字内码与ASCII字符二进制表示有明显的区别,第1字节,第2字节,图 GB2312汉字在计算机中的表示,有一段文本的机内码:AB F5 80 94 CA D7 70 62 B6 C8,则在这段文本中含有_。,A1个汉字和8个西文字符B2个汉字和6个西文字符C3个汉字和4个西文
8、字符D4个汉字和2个西文字符,题解,若内存中相邻2个字节的内容为十六进制74 51,则它们不可能是_。,A.2个西文字母的ASCII码 B.1个汉字的机内码 C.1个16位整数 D.一条指令的组成部分,题解,GBK汉字内码扩充规范,GB2312的不足:汉字字数太少,没有繁体字,无法满足人名、地名、古籍整理、古典文献研究等应用的需要;与ASCII码不兼容GBK汉字内码扩充规范(1995):在GB2312基础上,增加了1万多汉字(包括繁体字)和符号共有21003个汉字和883个图形符号,如“計算機”、冃、冄、円、冇等繁体字和生僻字 包含了中、日、韩认同的全部CJK汉字;与GB8312保持向下兼容,
9、也使用双字节表示,第1字节最高位必须为“1”,第2字节的最高位不一定是“1”:,UCS/Unicode与GB18030汉字编码标准,国际标准化组织(ISO)制定的一个将全世界现代书面文字所使用的所有字符和符号(包括中国大陆和港台地区、日本、韩国等使用的汉字在内,大约10万字符)集中进行统一编码,称为UCS标准,对应的工业标准称为UnicodeGB18030汉字编码国家标准:一方面与GB2312和GBK保持向下兼容,同时还扩充了UCS/Unicode中的其他字符,与其接轨,GB18030汉字编码标准,我国在2000年和2005年两次发布GB18030汉字编码国家标准。GB18030实质上是UCS
10、/Unicode字符集的另一种编码方案:单字节编码(128个)表示ASCII字符双字节编码(23940个)表示汉字,与GBK(以及GB2312)保持向下兼容,GBK不再使用四字节编码(约158万个)用于表示 UCS/Unicode中的其他字符GB18030目前已在我国信息处理产品中强制贯彻执行。,几种汉字编码的对比,例:IE浏览网页时文字编码的选择,下面是关于我国汉字编码标准的叙述,其中正确的是_。AUnicode是我国最新发布的也是收字最多的汉字编码国家标准。B汉字在计算机中的存储编码是机内码C在GB2312汉字编码国家标准中,共有2万多个汉字。DGB18030与GB2312和GBK汉字编码
11、标准不兼容。E.在GB2312汉字编码国家标准中,同一个汉字的不同造型(如宋体、楷体等)在计算机中的机内码相同。F.在最新的汉字编码国家标准中,同一个汉字的不同字形(如简体和繁体)在计算机中的内码不同。G.3种标准保持向下兼容,并与我国台湾地区发布和使用 的BIG-5兼容。H.GBl8030标准中收录的汉字数目超过2万,Windows XP操作系统支持该标准,5.1.2.文本准备 文稿如何输入计算机,文字符号输入计算机的方法,键盘输入,(1)数字编码,如电报码、区位码等,(2)字音编码,如智能ABC等(3)字形编码,如五笔字形和表形码等,(4)形音编码发展趋势:基于统计和学习功能的以词语(短语
12、)或句子作为输入单位的输入方法,文字符号输入计算机的方法,优点:自然,流畅小型化,适合移动计算不足:识别速度和正确性还需提高书写要求还要降低,文字符号输入计算机的方法,优点:自然,方便,适合移动计算不足:对说话人、说话方式、说话内容的适应能力要大大增强识别速度和正确性还需大大提高,文字符号输入计算机的方法,识别率已达到98%功能:简、繁体字混合识别中文、西文混合识别文字、表格混合识别智能校对功能,文字符号输入计算机的方法,技术上非常困难,还无法实用目前准备先突破工整的楷书手写体的识别!,汉字的键盘输入,汉字与键盘上的键无法一一对应,因此必须使用几个键来表示一个汉字,这就称为汉字的“键盘输入编码
13、”优秀的汉字键盘输入编码应具有的特点:易学习、易记忆效率高(平均击键次数较少)重码少容量大(可输入的汉字字数多),汉字键盘输入方法的比较,5.1.3 文本的分类,简单文本(纯文本),没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,其文件后缀名是.txt 由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结构信息 举例:,丰富格式文本,本书由南京大学出版社(Publishing House of Nanjing University)出版,有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格式文本”丰富格式文本中,除了正文内容之外,还使用了许多“标记”
14、来描述字符的属性和格式的设置。举例:下面标题的格式为:中文用黑体,西文用Arial Black体,居中,使用HTML语言描述为:,本书由南京大学出版社(Publishing House of Nanjing University)出版,用一对指出的是标记,如 和 等,用于说明排版的格式和文字属性,它们不属于正文内容,正文内容,超文本,若干文本或文本中的各个部分可按照其内容的关系互相链接起来,从而形成“超文本”,“超链”实际上就是一个指针,用于指向其他文本块,也可以指向同一文本块中的其他部分,超链是有向的,起点位置称为链源,它可以是文本块中的一个标题、一句句子、一个关键词、一幅画、一个图标等,文
15、本块可以是一个网页,一个文档,一段文字,也可以是一张图片,甚至一段声音或视频,小结:文本的分类,5.1.4 文本编辑、排版与处理,复习:使用Word的操作流程,创建新文档或打开老文档,文稿输入,编辑,排版,文档存盘、打印或发送,输入中西文字、符号和图表,进行增、删、改操作,保证文本的正确性,满足清晰、美观、便于使用等要求,目的:确保文本内容正确无误操作:对字、词、句和段落进行添加、删除、修改等操作MS Word的功能:在文本的任何位置都可以插入新的文字从文本的任何位置都可以删除不需要的文字将一段文字从一处移动到另一处将一段文字从一处复制到另一处在文本中自动查找指定的词语用一个词语自动替换文本中
16、指定的词语,文本编辑(text editing),目的:使文本清晰、美观、便于阅读操作内容:对文本中的字符、段落乃至整篇文章的格式进行设计和调整,分成3个层次:对字符格式进行设置对段落格式进行设置对文档页面进行格式设置,文本排版(格式化),设置字符的格式,字号(八号 初号,5磅72磅以上)1磅相当于1/72英寸 字体(宋体、楷体、黑体、仿宋、隶书)字符的修饰字符的形状(字形):正常、加粗、倾斜、加粗倾斜字形的修饰:下划线、着重号、上下标、删除线字符的颜色字符的宽度字符的间距字符的效果字符的排列方向,什么是段落?用“回车”相互隔开的一组文字段落格式的设置:段落的对齐方式(两端对齐、分散对齐、居中
17、对齐、左对齐、右对齐)段落的缩进方式(首行缩进、悬挂缩进、左缩进、右缩进)段间距和段内行距使用编号和项目符号段落添加边框和底纹首字下沉或悬挂段落与分页的关系,设置段落的格式,控制段落的缩进,段落缩进是指段落中的文本到正文区左、右边界的距离,包括段落左缩进、右缩进和首行缩进。其缩进的距离可由水平标尺上对应的三个缩进标记来指示,页面格式的设置:设置纸张大小和页边距设置每页的行、列数目设置分栏数目与格式设置页码设置页眉和页脚,设置页面的格式,设置页面的分栏,“所见即所得”(操作效果立即可见,且打印结果与屏幕所见相同)撤销(undo)和恢复(redo)操作格式刷多种视图(大纲视图与大纲编辑)自动更正、
18、自动套用格式、自动编号、自动图文集 自动保存功能和自动备份功能样式、模板和向导(wizard)功能宏操作(Macro),提高操作效率的若干措施,使用计算机对文本中的字、词、短语、句子、篇章进行识别、转换、分析、理解、压缩、加密和检索等有关的处理文本处理内容:字数统计,词频统计,简/繁体相互转换,汉字/拼音相互转换词语排序,词语错误检测,文句语法检查自动分词,词性标注,词义辨识,大陆/台湾术语转换关键词提取,文摘自动生成,文本分类文本检索(关键词检索、全文检索),文本过滤文语转换(语音合成),文种转换(机器翻译)篇章理解,自动问答,自动写作等文本压缩,文本加密,文本著作权保护,什么是文本处理?,
19、例:Word 2003的文本处理功能,英文拼写检查和英语同义词检查字数统计自动编写摘要中文简繁体转换和术语转换中英词语翻译语法和格式检查语音识别(口授命令和听写)文档保护(防止打开或修改文档),文本处理软件,(1)面向通信的文本处理软件:Outlook Express(2)面向办公的文本处理软件:MS Word、WPS(3)面向印刷出版的文本处理软件:“飞腾”排版软件、PageMaker、Adobe Acrobat(4)面向网络信息发布和电子出版的文本处理软件:FrontPage、Adobe Acrobat,5.1.5 文本的展现(输出),文本的展现(输出),目的:阅读、浏览或打印文本使用的软
20、件:文本阅读器/文本浏览器嵌入在文本编辑(处理)软件中,如微软的Word独立的软件:如Adobe公司的Acrobat Reader,微软公司的IE等 文本展现的过程:对文本的格式描述进行解释生成文字和图表的映像(bitmap)传送到显示器或打印机输出电子书阅读器:近几年市场出现的用于阅读.txt、.doc、html、pdf等电子文档的专用设备,5.2 图像与图形,5.2.1 数字图像的获取5.2.2 图像的表示与压缩编码5.2.3 数字图像处理与应用5.2.4 计算机图形,5.2.1 数字图像的获取,图像的获取过程,从现实世界中获得数字图像的过程称为图像的“获取”常用的图像获取设备:扫描仪、数
21、码相机、摄像头、摄像机等图像获取过程:,将画面划分为 M N个网格,每个网格称为 一个取样点,将彩色图像取样点的颜色分解成R,G,B三个基色,测量每个取样点的每个分量(基色)的亮度值,对取样点每个分量的亮度值进行A/D转换,使用数字整型量表示,5.2.2 图像的表示与压缩编码,数字(取样)图像的组成,数字取样图像由M(列)N(行)个取样点组成取样点是组成数字取样图像的基本单位,称为“像素”彩色图像的像素通常由3个彩色分量组成灰度图像和黑白图像的像素只包含1个亮度分量,例1:黑白图像的表示,黑白图像,黑白图像的每个像素只有一个分量,且只用1个二进位表示,其取值仅“0”(黑)和“1”(白)两种,例
22、2:灰度图像的表示,灰度图像,灰度图像的每个像素也只有一个分量,一般用812个二进位表示,其取值范围是:02n-1,可表示2n个不同的亮度,例3:彩色图像的表示,彩色图像的每个像素有三个分量,分别表示三个基色的亮度,假设3个分量分别用n,m,k个二进位表示,则可表示2n+m+k种不同的颜色,数字(取样)图像的主要参数,图像大小(图像分辨率):用来表示组成该图像的行列数目,亦即图像所包含的像素数目使用 水平分辨率x垂直分辨率 表示对在屏幕上显示出来的大小有影响颜色空间的类型,指彩色图像所使用的颜色描述方法,如:RGB(红、绿、蓝)模型,显示器使用CMYK(青、品红、黄、黑)模型,彩色打印机使用H
23、SB(色彩、饱和度、亮度)模型,用户界面中使用YUV(亮度、色度)模型,彩色电视信号传输时使用像素深度,即像素的所有颜色分量的二进位数目之和,举例:分辨率与图像尺寸的关系,520 x376,260 x188,130 x94,在显示比例相同时,显示在屏幕上的图像尺寸与图像分辨率成正比,数字图像的数据量,数字图像数据量的计算公式(以字节为单位):数据量=水平分辨率垂直分辨率像素深度8 几种常用格式的图像的数据量:,压缩之后数字图像的数据量计算(以字节为单位):数据量=(水平分辨率垂直分辨率像素深度/8)/压缩比,数字图像的数据压缩,图像数据压缩的必要性:节省存储数字图像所需要的存储器容量提高图像的
24、传输速度,减少通信费用 图像数据压缩的可能性:数字图像中有大量的数据冗余人眼视觉有局限性,允许图像有一些失真图像数据压缩的两种类型:无损压缩:用压缩后的数据还原出来的图像没有任何误差有损压缩:用压缩后的数据还原出来的图像有一定的误差压缩编码方法的评价,一架数码相机,其Flash存储器的容量为20MB,它一次可以连续拍摄65536色的分辨率为10241024的彩色相片40张,由此可以推算出图像数据的压缩倍数是_倍。,A、2 B、4 C、6 D、8,题解,数字图像的常用文件格式,常用的图像文件格式有:,不同的图象文件格式采用了不同的数据压缩技术和数据组织方法,适合不同的应用!,图像文件格式例1:B
25、MP格式,BMP图像格式是Windows操作系统下使用的一种标准图像格式支持单色、16色、256色、真彩色图像一个文件一幅图像,可以进行无损压缩,也可不压缩非压缩的BMP文件是一种通用的图像文件格式,几乎所有Windows 应用软件都能支持,图像文件格式例2:GIF 图像,颜色数目不超过256色,适合用作插图、剪贴画等色彩数要求不高的场合,文件特别小,适合网络传输GIF图像格式具有累进显示功能,适合网络浏览器观看 GIF图像格式能支持透明背景(JPEG不支持)GIF图像格式能支持动画,透明背景,缺点:不适合真彩色图片,图像文件格式例3:JPEG图像,JPEG是静止图像数据压缩编码的国际标准,采
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字 媒体 应用 New
链接地址:https://www.31ppt.com/p-5636910.html