欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第5章_数字媒体及应用(江苏专转本计算机)课件.ppt

    • 资源ID:3730363       资源大小:823KB        全文页数:85页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第5章_数字媒体及应用(江苏专转本计算机)课件.ppt

    第5章 数字媒体及应用,5.1 文本与文本处理5.2 图像与图形5.3 数字声音及应用5.4 数字视频及应用,5.1 文本与文本处理,文字:是一种书面语言,它由一系列字符(character)的书写符号构成。文本(text):文字信息在计算机中的表示形式,是基于特定字符集的、具有上下文相关性的一个字符流,是计算机中最常用的一种数字媒体。组成文本的基本元素是字符,字符在计算机中采用二进制编码表示。,文本在计算机中的处理,文本在计算机中的处理过程:文本准备(例如汉字的输入)、文本编辑、文本处理、文本存储与传输、文本展现等,根据应用场合的不同,各个处理环节的内容和要求可能有很大的差别。,5.1 文本与文本处理,文本信息的输入方法:(P130第13题)人工输入:通过键盘、手写笔或语音输入方式输入字符特点:速度慢、成本高,不适合需处理大批量文字的应用自动输入:将纸介质上的文本通过识别技术自动转换为文字的编码特点:速度快,效率高文字的自动识别分为:印刷体识别和手写体识别,5.1.1 文本准备,文本信息的输入方法,汉字输入编码方法的分类数字编码:使用一串数字来表示汉字的编码方法,例如区位码等 缺点:难以记忆,不易推广字音编码:一种基于汉语拼音的编码方法,简单易学,适合于非专业人员 缺点:同音字引起的重码多,需增加选择操作字形编码:将汉字的字形分解归类而给出的编码方法,重码少、输入速度较快,如五笔字形法和表形码等 缺点:编码规则不易掌握形音编码:吸取了字音编码和字形编码的优点,使编码规则适当简化、重码减少 缺点:不易掌握,1.汉字键盘输入,以平常书写的习惯,把要输入的汉字写在一块叫书写板的设备上,书写板将笔尖的运动(包括抬笔、落笔、笔段轨迹以及各笔段之间的时间关系等)按时间采样后发送到计算机中,由计算机软件自动进行识别,然后用该汉字(或符号)对应的代码进行保存。汉王笔 正识率 95 90,速度 12字/秒中科院自动化所,华旗资讯科技发展有限公司(爱国者),2.联机手写汉字识别(笔输入),使用语音输入文本的系统也叫做“听写机”或“语音打字机”按照不同的应用及要求,语音识别的功能区别:孤立语音/连续语音识别小词汇量/大词汇量语音识别特定人/非特定人语音识别最高目标:非特定人大词汇量的连续语音识别技术,3.汉语语音识别,印刷体汉字识别:将传统纸介质上的文字信息自动输入计算机并转换为数字文本形式的一种技术,也叫做汉字OCR(Optical Character Recognition)。(P130第2题)印刷体文字识别的过程,4.印刷体汉字识别(汉字OCR),5.1.2 字符的编码,字符是组成文本的基本元素,字符在计算机中采用二进制编码表示。1.西文字符的编码字符集:常用字符的集合。西文字符集:由拉丁字母、数字、标点符号及一些特殊符号组成。字符的编码:字符集中每一个字符各有一个代码,即字符的二进制位表示,称为该字符的编码。,美国标准信息交换码(American Standard Code for Information Interchange):使用7个二进位对字符进行编码(叫做标准ASCII码),称为ISO-646标准。基本的ASCII字符集共有128个字符(P125 例1、P127第1题)96个可打印字符(常用字母、数字、标点符号等)32个控制字符特殊字符的ASCII码空格(32)A(65)a(97)0(48)(P128第17、19题),ASCII码,标准ASCII码是七位的编码,但字节是计算机中最基本的处理单位,故以一个字节来存放一个ASCII字符。每个字节中多出来的一位一般保持为“0”。扩充ASCII字符集:标准ASCII字符集只有128个不同的字符,在很多应用中无法满足要求。ISO陆续制定了一批适用于不同地区的扩充ASCII字符集,每个扩充ASCII字符集分别可以扩充128个字符,这些扩充字符的编码均是高位为1的八位代码(十进制数128255),称为扩展ASCII码。,扩充ASCII字符集,(1)GB2312-80汉字编码信息交换用汉字编码字符集基本集(GB2312-80)组成:第一部分:字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个(统称为GB2312图形符号)第二部分:一级常用汉字,共3755个,按汉语拼音排列第三部分:二级常用字,共3008个,按偏旁部首排列,2.汉字的编码,(1)GB2312-80汉字编码区位码:GB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区号,列号称为位号。每一个汉字或符号在码表中都有各自的位置,字符的位置用它所在的区号(行号)及位号(列号)来表示。每个汉字的区号和位号分别用1个字节来表示,如:“大”字的区号20,位号83,区位码是20 83用2个字节表示为:00010100 01010011(即十六进制1453H),2.汉字的编码,GB2312-80汉字编码,2.汉字的编码,(1)GB2312-80汉字编码国标交换码:为了避免汉字区位码与通信控制码的冲突,ISO2022规定,每个汉字的区号和位号必须分别加上32(即二进制0010 0000,十六进制20H),经过这样处理得到的代码称为汉字的“国标交换码”(简称交换码)。因此,“大”字的交换码是:00110100 01110011。,2.汉字的编码,(1)GB2312-80汉字编码机内码:问题:文本中的汉字与西文字符经常是混合在一起使用的,汉字信息如不予以特别的标识,将汉字的区号和位号必须分别加上160(即二进制1010 0000,十六进制A0H),就可以得到该汉字的“机内码”,又称内码。如:“大”字的内码是:10110100 11110011(B4F3),2.汉字的编码,综上所述,可以总结如下公式:(P127页第2题)国标码=区位码+2020H 机内码=区位码+A0A0H,(2)GBK汉字内码扩充规范问题:GB2312-80只有6763个汉字,使用时功能不够。解决方法:1995年发布GBK,全称为汉字内码扩展规范,它与GB2312国标汉字字符集及其内码保持兼容。GBK/1:GB2312中的符号;GBK/2:GB2312中的全部汉字;GBK/4和GBK/3:包括繁体字在内的大量汉字;GBK/5:符号。例如:計機係等繁体汉字和冃冄円冇鎔等生僻的汉字。,2.汉字的编码,(2)GBK汉字内码扩充规范(P129第23题)组成:21003个汉字,883个图形符号GBK的编码是用2字节编码表示,第1字节的最高位为”1”,第2字节的最高位不一定是”1”,与GB2312-80保持兼容。,2.汉字的编码,(3)UCS/Unicode与GB18030汉字编码标准(a)通用编码字符集UCS/UnicodeUCS/Unicode用4个字节对全世界现代书面文字所使用的所有字符、符号进行编码(记作 UCS-4)优点是编码空间大,能容纳足够多的各种字符集(13亿字符);缺点是4字节的字符编码使存储空间浪费严重。,2.汉字的编码,(3)UCS/Unicode与GB18030汉字编码标准(b)GB18030-2000编码(P125页例2)GB18030-2000汉字编码标准时为了既兼容GB2312和GBK,又尽快向UCS/Unicode编码标准过度,而在2000年颁布的汉字编码国家标准。该标准在GB-2312和GBK的基础上进行扩充,增加了4字节编码,收录的汉字达到27000个。,2.汉字的编码,文本是计算机表示文字及符号信息的最常用也是最基本的一种数字媒体。由于文字和符号采用了二进制编码表示,因而可以方便地进行编辑、排版和各种分析处理(如统计、排序、分类、索引、检索等)。使用计算机制作的数字文本,根据用途分为:简单文本、丰富格式文本和超文本三类。(P130第11题),5.1.3 文本的分类与表示,简单文本(plain text):是由一连串用于表达正文内容的的字符(包括汉字)所组成的,它几乎不包含任何其他格式信息和结构信息。这种文本通常称为纯文本或ASCII文本,其文件后缀名是.txt。特性:呈现为一种线性结构,写作与阅读均按顺序进行。文件体积小,通用性好,几乎所有的文字处理软件都能识别和处理,但不能插入图片、表格等,也不能建立超链接。,1.简单文本(纯文本),文件内容有字符的编码、数字图像、数字声音、数字视频信息、标记信息。(P130第14题)例如RTF文件、DOC文件、PDF文件、HTML文件。RTF是为便于不同的丰富格式文本能在不同的软件和系统中互相交换使用而提出的一种中间格式标记语言。(P127第3题),2.丰富格式文本,超文本也称为非线性文本(P128第12题、P131第16题)超文本(hypertext)的阅读方式传统的顺序式阅读通过链接、跳转、导航、回溯等操作实现跳跃式阅读超文本的结构:采用网状结构来组织信息,各信息块按照其内容的关系互相链接例如,Windows中的”帮助”文件或者使用浏览器从Web服务器上下载的网页(html或htm文件)。,3.超文本,超文本,超文本结构,(1)面向通信的文本处理软件(P128第16题)计算机网络上最普及的应用是用电子邮件进行通信。大多数情况下电子邮件正文的内容一般都是简单文本,因此电子邮件内嵌的文本编辑器功能比较简单,操作使用方便。典型软件:微软公司的Outlook Express,具有文字的增、删、改以及字体、字号的设置功能,也可以设定一些简单的格式和插入一些图片。当然邮件所带的附件并不受此限制。在互联网上进行聊天所使用的文本处理软件更加简单。,3.常用文本处理软件,(2)面向办公的文本处理软件功能要求:文本制作的高效率、高质量软件面向非专业用户,易学好用文本处理能力,既功能丰富,又操作简单排版功能典型软件:MS-OfficeWPS2000,3.常用文本处理软件,(3)面向出版的文本处理软件排版软件的主要功能:将文字、图形和图像等合理地安排在页面内.ps文件:排版软件的输出的一种使用页面描述语言(例如PostScript)描述的文件,该文件记录了每一个页面的排版结果,它被送到装有栅格图像处理器(RIP)的激光照排机去,经过RIP的解释,产生页面的图像,然后驱动激光束对感光材料进行扫描曝光,以得到用于制版的胶片典型排版软件:方正集团公司的“飞腾”排版软件美国Adobe公司的PageMaker和PDF Writer,3.常用文本处理软件,(4)面向网络信息发布和电子出版的文本处理软件制作HTML文件的软件:微软的FrontPage超链的链宿有两种:书签,指的是文本内部标记有书签的某个地方互联网上的某个信息资源(文件),它用统一资源定位器(URL)指定面向电子出版的软件:PDF格式文件,3.常用文本处理软件,4.搜索引擎,Web服务器使用软件robot遍历Web,将Web上的信息下载到本地文档库,然后对文本内容进行自动分析并建立索引,在用户提出检索请求时,搜索引擎通过检查索引找出匹配的文本并返回给用户。例如,搜狐(Sohu)、谷歌(Google)、雅虎(Yahoo)、新浪(Sina)、百度(baidu)等。,1.色光的三基色(P129第22题)色光的三基色是:红(Red)、绿(Green)、蓝(Blue)自然界中任何一种色光都可由R、G、B三基色按不同的比例相加混合而成。当三基色分量都为0(最弱)时混合为黑色光。当三基色分量都为K(最强)时混合为白色光。2.颜料的三基色:青、品红、黄,5.2 图像与图形及应用,3.色彩的表达方法(1)RGB色彩空间典型应用是计算机的彩色显示器。(2)YUV色彩空间(P126例7)Y-亮度信号,U、V-色彩信号典型应用是彩色电视系统。(3)HIS色彩空间H色调,I亮度,S-色饱和度HIS色彩空间是从人的视觉系统出发描述色彩(4)CMYK色彩空间C-青色,M-品红色,Y-黄色,K-黑色典型应用为彩色打印系统、彩色印刷系统。,4.数字图像分类:从现实世界中通过数字化设备获取的图像,称为图像(image),是来自自然界中的真实的景物。由计算机合成的图像,称为:矢量图形,简称图形(graphics),是虚拟的。,1.图像的获取:从现实世界中获得数字图像的过程。图像获取的过程实质上是模拟信号的数字化过程,它的处理步骤:取样分色量化,5.2.2 图像的获取与重现,2.数字图像获取设备:从现实世界获得数字图像过程中所使用的设备。设备的功能:将现实的景物输入到计算机内并以取样图像的形式表示。2D图像获取设备(如扫描仪、数码相机等)只能对图片或景物的2D投影进行数字化 3D扫描仪能获取包括深度信息在内的3D景物的信息,5.2.2 数字图像获取设备,1.图像的表示方法与主要参数:(P125例3)从取样图像的获取过程可以知道,一幅取样图像由M(行)*N(列)个取样点组成,每个取样点是组成取样图像的基本单位,称为像素(picture element,简写为pel)。彩色图像的像素是矢量,它由多个彩色分量组成,黑白图像的像素只有1个亮度值。,5.2.3 图像的表示与压缩编码,取样图像在计算机中的表示方法:单色图像用一个矩阵来表示。彩色图像用一组(一般是3个)矩阵来表示,矩阵的行数称为图像的垂直分辨率,列数称为图像的水平分辨率,矩阵中的元素是像素颜色分量的亮度值,使用整数表示,一般是8位至12位。,数字图像的表示,图像大小,也称图像分辨率(包括垂直分辨率和水平分辨率)(P127第4题)位平面数目,即矩阵的数目,也就是彩色分量的数目。颜色空间的类型,指彩色图像所使用的颜色描述方法,也叫颜色模型。常用颜色模型:RGB(红、绿、蓝)、CMYK(青、品红、黄、黑)、HSV(色彩、饱和度、亮度)、YUV(亮度、色度)等像素深度,即像素的所有颜色分量的位数之和,它决定了不同颜色(亮度)的最大数目,图像的属性信息,(1)数字图像压缩的必要性一幅图像的数据量可按下面的公式进行计算(以字节为单位):(P128第15题)图像数据量图像水平分辨率图像垂直分辨率像素深度/8(单位为字节)几种常用图像的数据量,2.图像的压缩编码,(2)图像数据压缩的可能性:由于数字图像中的数据相关性很强,数据的冗余度很大,因此对数字图像进行大幅度的数据压缩是完全可能的。而且,人眼的视觉有一定的局限性,即使压缩前后的图像有一定失真,只要限制在人眼允许的误差范围之内,也是允许的。,2.图像的压缩编码,(3)数据压缩类型(P129第21题)无损压缩:压缩以后的数据进行图像还原(也称为解压缩)时,重建的图像与原始图像完全相同例如:行程长度编码(run length coding,RLC):111110005555333302222222 513045431072哈夫曼(Huffman)编码:对出现概率高(低)的编短(长)码,是变长码有损压缩:使用压缩后的数据进行图像重建时,重建后的图像与原始图像虽有一定的误差,但不影响人们对图像含义的正确理解。如变换编码、矢量编码等,图像的压缩编码,图像压缩方法很多,不同方法适用于不同的应用,在计算机中常常是多种压缩方法的综合使用。为得到较高的数据压缩比,一般都采用有损压缩。P126例4图像数据的压缩比=压缩后的图像数据量/压缩前的图像数据量。,2.图像的压缩编码,(4)压缩编码方法优劣的评价压缩倍数的大小重建图像的质量(有损压缩时)压缩算法的复杂程度,(5)图像压缩编码方法的国际标准和工业标准:ISO和IEC两个国际机构联合组成了一个专家组(Joint Photographic Experts Group,JPEG),制定了一个静止图像数据压缩编码的国际标准,称为JPEG标准(P129第20题)JPEG标准的特点:适用范围广;能处理各种连续色调的彩色或灰度图像;算法复杂度适中;既可用硬件实现,也可用软件实现;图像的压缩比可控制(压缩比越低,图像质量越好;压缩比越高,图像质量越差)JPEG 2000:适用于各种不同类型(黑白、灰度、彩色等)和不同特性(自然、医学、遥感、合成)的图像,可用于不同的应用模式(实时传输、检索、存档等)。采用了小波分析等先进算法,提供了更好的图像质量,更低的码率,更适合在WWW网上传输等,它兼容JPEG,2.图像的压缩编码,JPEG图像压缩示例,2.图像的压缩编码,中等压缩后的图像,高倍压缩后的图像,BMP(BitMaP-file)图像:微软公司在Windows操作系统下使用的一种标准图像文件格式,一个文件存放一幅图像,可以使用行程长度编码(RLC)进行无损压缩,也可不压缩。不压缩的BMP文件是一种通用的图像文件格式,几乎所有Windows应用软件都能支持。TIFF(Tagged Image File Format)图像文件格式:用于扫描仪和桌面出版,能支持多种压缩方法和多种不同类型的图像,有许多图像图形应用软件支持这种文件格式。由文件头、文件目录、目录条目三个部分组成。,3.常用图像文件格式,GIF(Graphics Interchange Format):互联网上广泛使用的一种图像文件格式,它的颜色数目较少(不超过256色),文件特别小,适合网络传输。由于颜色数目有限,GIF适用于插图、剪贴画等色彩数目不多的应用场合。GIF格式能够支持透明背景,具有在屏幕上渐进显示的功能。尤为突出的是,它可以将许多张图像保存在同一个文件中,显示时按预先规定的时间间隔逐一进行显示,从而形成动画的效果,因而在网页制作中大量使用。,3.常用图像文件格式,景物形状的计算机表示景物的模型(model):景物在计算机内的描述景物的建模(modeling):人们进行景物描述的过程绘制(rendering):也称图像合成(image synthesis),根据景物的模型生成图像的过程,所产生的数字图像称为计算机合成图像计算机图形学(Computer Graphics):研究如何使用计算机描述景物并生成其图像的原理、方法与技术,5.2.5 计算机图形,5.3.1 波形声音的获取与播放1.声音的产生与信号的特征声音:由振动而产生,通过空气进行传播。它由许多不同频率的谐波所组成,谐波的频率范围称为声音的带宽(bandwidth),带宽是声音的一项重要参数。决定声音信号特征的三个参数:频率决定音调的高低;幅度决定声音的强弱;相位决定声音的音色。,5.3 数字声音及应用,2.数字声音概述数字声音又两种类型:(1)波形声音,如数字语音(取样于人说话的声音)、全频带数字声音(取样于自然界各种声音)。(2)计算机合成声音,如合成音乐(MIDI)、合成语音。,声音信号的数字化:将模拟声音信号转换成数字编码形式以便于计算机进行处理的过程。常用方法是脉冲编码调制法(PCM)。声音信号数字化的过程:(P126例6)取样、量化、编码(P116奈奎斯特采样原理),3.声音信号的数字化,麦克风:将声波转换为电信号(P128第18题)声卡(sound card):进行数字化(P127第6题)波形声音的获取:把模拟的声音信号转换为数字形式。(话筒或线路输入、单双道)波形声音的重建与播放MIDI(Musical Instrument Digital Interface)声音的输入MIDI声音的合成与播放,4.波形声音的获取设备,5.声音的播放,波形声音的重建,波形声音的播放经过四个步骤:解码、数模转换、插值处理、播放。(P128第13题),声卡输出的声音需送到音箱去发音。音箱分类普通音箱:接收的是重建的模拟声音信号数字音箱:可直接接收声卡输出的数字声音信号,避免信号在传输中发生畸变和受到干扰,其音响效果更加突出,6.声音的播放设备,1.波形声音的主要参数:(P130第8题)取样频率 量化位数 声道数目 使用的压缩编码方法 数码率(bit rate):指的是每秒钟的数据量,也称比特率、码率数字声音未压缩前,其计算公式为:(P126例5、P128第14题)波形声音的码率 取样频率 量化位数 声道数压缩编码以后的码率 压缩前的码率/压缩倍数,5.3.2 波形声音的表示现压缩编码,2.波形声音数据压缩的可能性:声音信号中包含有大量的冗余信息,再加上还可以利用人的听觉感知特性,因此,产生了许多压缩算法声音数据压缩算法的评价:压缩倍数高,声音失真小,算法简单,编码器/解码器的成本低,3.波形声音压缩算法的分类 分为有损压缩和无损压缩 有损压缩是指声音信号在压缩过程中存在数据的丢失,不能完整地还原信号的原貌。无损压缩是指在压缩过程中没有数据的丢失,能够完整地还原信号本来的面貌。一般的,压缩越多,信息丢失越多、信号还原后失真越大。一个好的声音数据压缩算法通常应做到压缩倍数高,声音失真小,算法简单,编码器/解码器的成本低。,MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次:层1(Layer 1):编码简单,用于数字盒式录音磁带层2(Layer 2):算法复杂度中等,用于数字音频广播(DAB)和VCD等层3(Layer 3):编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍(P130第6题)MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1,层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。,4.波形声音压缩编码标准,杜比数字AC-3(Dolby Digital AC-3):美国杜比公司开发的多声道全频带声音编码系统,它提供的环绕立体声系统由5个全频带声道加一个超低音声道组成,6个声道的信息在制作和还原过程中全部数字化,信息损失很少,细节丰富,具有真正的立体声效果,在数字电视、DVD和家庭影院中广泛使用。,MIDI(Musical Instrument Digital Interface):计算机中描述乐谱的一种标准描述语言,规定了乐谱的数字表示方法(包括音符、定时、乐器等)和演奏控制器、音源、计算机等相互连接时的通信规程。(P130第9题)MIDI文件在Windows系统中可以使用媒体播放器播放。,MIDI,MIDI音乐的制作与播放:,2.音乐合成,MIDI音乐与高保真的波形声音相比:缺点:音质方面较差无法合成出所有各种不同的声音(例如语音)优点:数据量很少(比CD-DA少3个数量级,比MP3少2个数量级)易于编辑修改可以与波形声音同时播放,5.4.1 数字视频基础1.基本概念视频(video):指的是内容随时间变化的一个图像序列,也称为活动图像(motion picture)。常见的视频有电视和计算机动画。电视:能传输和再现真实世界的图像与声音,是当代最有影响力的信息传播工具。数字视频:数字化的电视信号称为数字视频。计算机动画:是计算机制作的图像序列,是一种计算机合成的视频。,5.4 数字视频及应用,彩色电视信号的三种制式(1)彩色电视信号有PAL(德国、英国、朝鲜、中国等采用)、NTSC(美国、加拿大、日本等国采用)、SECAM(法国、前苏联、东欧等国采用)三种制式。(2)彩色信号在远距离传输时用亮度信号Y和两个色度信号U、V来表示。优点是能与黑白电视接收机兼容。,2.彩色电视信号的三种制式,1.视频采集卡:简称视频卡,PC机中用于视频信号数字化的插卡。(P130第7题)功能:将模拟视频信号(及伴音信号)数字化并存储在硬盘中。数字化后的视频图像,经彩色空间转换(从YUV转换为RGB),与计算机图形显示卡产生的图像叠加,显示在屏幕上。获取数字视频的同时使用数字信号处理器(DSP)进行音频和视频数据的压缩编码,5.4.2.视频卡与视频获取设备,2.数字摄像头:在线获取数字视频的设备。通过光学镜头采集图像,然后直接将图像转换成数字信号并输入到PC机,不需视频采集卡进行模数转换。最高分辨率:640480,一般:352288,速度:30帧/s以下,镜头视角:4560度光传感器:大多采用CCD,部分采用CMOS,后者分辨率不能很高,但功耗低、速度快接口:USB接口,IEEE1394(火线)接口。,5.4.2视频卡与视频获取设备,3.数字摄像机:一种离线的数字视频获取设备。原理:与数码相机类似,功能更多压缩编码:视频图像及伴音使用M-JPEG或MPEG-2记录介质:磁带,硬盘接口:USB,IEEE1394,5.4.2视频卡与视频获取设备,数字摄像头 数字摄像机,数字视频压缩的必要性:数字视频的数据量很大,1分钟CCIR601数字视频的数据量约为1G字节。数字视频压缩的可行性:画面内部信息相关性很强相邻画面的内容具有高度的连贯性人眼的视觉特性,5.4.3 数字视频的压缩编码,视频压缩编码的标准及其应用,MPEG-1:一种运动图像及其伴音的编码标准码率:1.2 Mb/s 1.5Mb/s图像质量:200多线,相当于一般家用录像机应用:数码相机和数字摄像机VCD,视频压缩编码的标准及其应用,MPEG-2:针对数字电视(DTV)的应用要求码率:1.5Mb/s60Mb/s甚至更高特点:通用性,向下兼容 MPEG-1应用:(P128第11题)数字卫星电视高清晰度电视(HDTV)广播数字视盘DVD,视频压缩编码的标准及其应用,MPEG-4:目标:支持各种网络条件下(包括移动通信)的交互式多媒体应用,侧重于对多媒体信息内容的访问支持:自然的(取样)和计算机合成视频和音频,功能强,应用前景广H.261:数字视频编码标准,由国际电联(ITU)前身CCITT制定,适用于在ISDN网上以p64kbps(p=l,30)的速率开展视频会议和可视电话业务,视频压缩编码的标准及其应用,AVI(Audio Video Interleaved Format):一种音频/视频文件格式应用:Windows平台,在获取、编辑以及播放音频/视频流的应用软件中被广泛使用对压缩方法没有限制,只需在文件中加以说明,增强了可扩展性缺点:不适应在网络上对视频流的实时播放,视频压缩编码的标准及其应用,ASF(Advanced Stream Format)文件格式针对AVI文件的网络实时播放缺陷开发采用技术:WM Video8和WM Audio8流媒体技术应用:互联网上视频直播(WebTV)、视频点播(VOD)、视频会议等Real Networks公司的RealMedia(包括RealVideo和RealAudio)与微软公司流媒体技术相当,已在互联网上得到了广泛的应用,视频压缩编码的标准及其应用,1.VCD与DVDCD(Compact Disc):小型光盘,最早应用于数字音响领域,代表产品是CD唱片。每张CD唱片的存储容量是650MB左右,可存放1小时的立体声高保真音乐。Video CD(简称VCD):1994年由JVC、Philips等公司联合定义的一种以数字技术在CD光盘上存储视频和音频信息的规范。规定了将MPEG-1音频/视频数据记录在CD光盘上的文件系统的标准,使一张普通的CD光盘可记录约60分钟的音视频数据,图像质量达到家用录放像机的水平,可播放立体声。VCD播放机体积小,价格便宜,音视频质量较好。VCD的一个派生产品是Karaoke CD光盘,它同VCD保持兼容。,5.4.5 数字视频的应用,DVD(Digital Versatile Disk):数字多用途光盘。有多种规格,用途广泛。其中的DVD-Video(日常简称为DVD)就是一种类似于LD或Video CD的家用影碟。DVD影碟与VCD相比:存储容量大得多。CD光盘容量650MB,存放74分钟VHS质量(352240)的视频图像;单面单层DVD容量4.7GB,以平均码率4.69Mb/s播放视频图像,能存放133分钟的接近于广播级图像质量(720480)的整部电影压缩编码:MPEG-2画面品质比VCD高,5.4.5 数字视频的应用,DVD-Video的特点和功能:提供32种文字或卡拉OK字幕,最多可录放8种语言的声音具有多结局、多角度(从9个角度选择观看图像)、变焦和家长锁定控制等功能画面的长宽比有三种方式:全景扫描、4:3普通屏幕、16:9宽屏幕方式伴音具有5.1声道(左、右、中、左环绕、右环绕和超重低音),实现三维环绕立体音响效果,5.4.5 数字视频的应用,数字电视:将电视信号进行数字化,然后以数字形式进行编辑、制作、传输、接收和播放。数字电视的特点:频道利用率高、图像清晰度好可以开展交互式数据业务,包括电视购物、电视银行、电视商务、电视通信、电视游戏、实时点播电视、电视网上游览、观众参与的电视竞赛等,数字电视,数字电视接收机(简称DTV接收机)的三种形式:数字电视接收机传统模拟电视接收机的换代产品传统模拟电视机外加一个数字机顶盒可以接收数字电视的PC机,数字电视,VOD(Video On Demand):视频点播(也称为点播电视)技术的简称,即用户可以根据自己的需要收看电视节目。(P131第12题)视频点播系统分类TVOD(True VOD):用户提出要求即可及时从VOD系统得到服务,为每个用户提供单独连接,每个连接占用一定的网络带宽NVOD(Near VOD):准视频点播,系统每隔一段时间(例如10分钟)在不同的频道上播放同一个节目,用户可选择收看,点播电视(VOD),流媒体技术:允许在窄带网上让用户一边下载一边收看(听)音视频连续媒体的技术流媒体:使用流式传输技术的音/视频媒体优点:等待时间大大缩短减少了对缓冲容量的需求降低了对网络带宽的要求,流媒体,声音流媒体产品Real Networks公司的RA(Real Audio)数字音频微软公司的WMA(Windows Media Audio)数字音频 苹果公司的 Quick Time,流媒体,.wav(waveform):用于PC.PCM:使用PCM编码的声音文件.VOC:声霸卡使用的音频文件格式.Mp2:MPEG Layer I,II.Mp3:MPEG Layer III,.rm,ra(RealAudio):RealNetworks的流式声音文件.wma:微软公司的流式声音文件,波形声音的文件格式,

    注意事项

    本文(第5章_数字媒体及应用(江苏专转本计算机)课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开