《计算机应用技术基础》第六章.pptx
本章学习目标,了解多媒体的基本概念以及常用多媒体软件的类型与格式,如何对常用多媒体文件进行简单的操作及格式转换。本章要点多媒体的基本概念常用多媒体软件及其格式音频、视频及图片文件的采集与编辑常用音频、视频文件格式的转换文字识别软件的使用,介绍多媒体,多媒体(Multimedia)是多种媒体的综合,一般包括文本,声音和图像等多种媒体形式。在计算机系统中,多媒体指组合两种或两种以上媒体的一种人机交互式信息交流和传播媒体。使用的媒体包括文字、图片、照片、声音、动画和影片,以及程序所提供的互动功能。音频、图像、视频,音频数字化,数码录音最关键一步就是要把模拟信号转换为数码信号。就电脑而言是把模拟声音信号录制成的文件就是wav文件,描述wav文件主要有两个指标,一个是采样频率,或称采样率、采率,另一个是采样精度也就是比特率。这是数字音频制作中十分重要的两个概念。,采样频率,数码信号就是在原有的模拟信号波形上每隔一段时间进行一次“取点”,赋予每一个点以一个数值,这就是“采样”,然后把所有的“点”连起来就可以描述模拟信号了,很明显,在一定时间内取的点越多,描述出来的波形就越精确,这个尺度我们就称为“采样频率”,采样频率,我们最常用的采样频率是44.1kHz,它的意思是每秒取样44100次。人们发现这个采样频率最合适,低于这个值就会有较明显的损失,而高于这个值人的耳朵已经很难分辨,而且增大了数字音频所占用的空间。一般为了达到“万分精确”,我们还会使用48kHz甚至96kHz的采样频率,实际上,96kHz采样频率和44.1kHz采样频率的区别绝对不会象44.1kHz和22kHz那样区别如此之大,我们所使用的CD的采样标准就是44.1kHz,比特率(采样精度),数码录音一般使用16比特、20比特或24比特制作音乐。作为数码录音,必须也要能精确表示乐曲的轻响,所以一定要对波形的振幅有一个精确的描述。“比特(bit)”就是这样一个单位,16比特就是指把波形的振幅划为216即65536个等级,根据模拟信号的轻响把它划分到某个等级中去,就可以用数字来表示了。和采样频率一样,比特率越高,越能细致地反映乐曲的轻、响变化,常见音频文件格式的特点,要在计算机内播放或是处理音频文件,也就是要对声音文件进行数、模转换,这个过程同样由采样和量化构成,人耳所能听到的声音,最低的频率是从20Hz起一直到最高频率20KHZ,20KHz以上人耳是听不到的,因此音频的最大带宽是20KHZ,故而采样速率需要介于4050KHZ之间,而且对每个样本需要更多的量化比特数。音频数字化的标准是每个样本16位(16bit,即96dB)的信噪比,采用线性脉冲编码调制PCM,每一量化步长都具有相等的长度。在音频文件的制作中,正是采用这一标准。,CD格式:天籁,现音质最好的音频格式是CD。在大多数播放软件的“打开文件类型”中,都可以看到*.cda格式,这就是CD音轨了。标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是忠于原声的。问题:能否直接复制CD格式的*.cda文件到硬盘上播放?,WAV:无损,WAV是微软公司开发的一种声音文件格式。“*.WAV”格式支持多种压缩算法,支持多种音频位数、采样频率和声道,标准格式的WAV文件和CD格式一样,也是44.1K的采样频率,速率88K/秒,16位量化位数,WAV格式是PC机上广为流行的声音文件格式,几乎所有的音频编辑软件都“认识”WAV格式。,MP3:流行,MP3也就是指的是MPEG标准中的音频部分,根据压缩质量和编码处理的不同分为3层,分别对应“*.mp1/“*.mp2”/“*.mp3”这3种声音文件。注意:MPEG音频文件的压缩是一种有损压缩,MPEG3音频编码具有10:112:1的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取文件的尺寸,相同长度的音乐文件,用*.mp3格式来储存,一般只有*.wav文件的1/10,而音质要次于CD格式或WAV格式的声音文件。,MIDI:作曲家最爱,经常玩音乐的人应该常听到MIDI(Musical Instrument Digital Interface)这个词,MIDI允许数字合成器和其他设备交换数据。MID文件格式由MIDI继承而来。这样一个MIDI文件每存1分钟的音乐只用大约510KB。MID文件主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。*.mid文件重放的效果完全依赖声卡的档次。*.mid格式的最大用处是在电脑作曲领域。*.mid文件可以用作曲软件写出,也可以通过声卡的MIDI口把外接音序器演奏的乐曲输入电脑里,制成*.mid文件。,WMA:最具实力,WMA(Windows Media Audio)格式是来自于微软的重量级选手,高保真声音通频带宽,音质更好,音质要强于MP3格式,更远胜于RA格式,WMA的压缩率一般都可以达到1:18左右,WMA的另一个优点是内容提供商可以通过DRM(Digital Rights Management)方案如Windows Media Rights Manager 7加入防拷贝保护。,RealAudio:流动旋律,RealAudio主要适用于在网络上的在线音乐欣赏,大多数的用户仍然在使用56Kbps或更低速率的Modem,所以典型的回放并非最好的音质。有的下载站点会提示你根据你的Modem速率选择最佳的Real文件。real的的文件格式主要有这么几种:有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured),还有更多。这些格式的特点是可以随网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较富裕的听众获得较好的音质。,FLAC:自由无损音频,FLAC即是Free Lossless Audio Codec的缩写,中文可解为无损音频压缩编码。FLAC是一套著名的自由音频压缩编码,其特点是无损压缩。不同于其他有损压缩编码如MP3及AAC,它不会破坏任何原有的音频资讯,所以可以还原音乐光盘音质。它已被很多软件及硬件音频产品所支持。FLAC是免费的并且支持大多数的操作系统。,APE:网络无损,APE是流行的数字音乐文件格式之一。与MP3这类有损压缩方式不同,APE是一种无损压缩音频技术,也就是说当你将从音频CD上读取的音频数据文件压缩成APE格式后,你还可以再将APE格式的文件还原,而还原后的音频文件与压缩前的一模一样,没有任何损失。APE的文件大小大概为CD的一半,但是随着宽带的普及,APE格式受到了许多音乐爱好者的喜爱,特别是对于希望通过网络传输音频CD的朋友来说,APE可以帮助他们节约大量的资源。,图像,数字图像是由扫描仪、摄像机等输入设备捕捉实际的画面产生的图像。由像素点阵构成的位图。数字图像用数字任意描述像素点、强度和颜色。描述信息文件存储量较大,所描述对象在缩放过程中会损失细节或产生锯齿。图像文件格式是记录和存储影像信息的格式。,图像,计算机图像从处理方式上可以分为位图和矢量图。,BMP(Bitmap)格式,BMP(位图格式)是DOS和WindowS兼容计算机系统的标准Windows图像格式。BMP格式支持RGB、索引颜色、灰度和位图颜色模式,但不支持Alpha通道。BMP格式支持1、4、24、32位的RGB位图。,TIFF(TagImage File Format)格式,TIFF(标记图像文件格式)用于在应用程序之间和计算机平台之间交换文件。TIFF是一种灵活的图像格式,被所有绘画、图像编辑和页面排版应用程序支持。几乎所有的桌面扫描仪都可以生成TIFF图像。而且TIFF格式还可加入作者、版权、备注以及自定义信息,存放多幅图像。,GIF(Graphic Interchange Format)格式,GIF(图像交换格式)是一种LZw压缩格式,用来最小化文件大小和电子传递时间。在WorldWideWeb和其它网上服务的HTML(超文本标记语言)文档中,GIF文件格式普遍用于现实索引颜色和图像。GIF还支持灰度模式。,JPEG(Joint Photographic Experts Group)格式,JPEG(联合图片专家组)是目前所有格式中压缩率最高的格式。大多数彩色和灰度图像都使用JPEG格式压缩图像,压缩比很大而且支持多种压缩级别的格式,当对图像的精度要求不高而存储空间又有限时,JPEG是一种理想的压缩方式。在WorldWideweb和其它网上服务的HTML文档中,JPEG用于显示图片和其它连续色调的图像文档。JPEG支持CMYK、RGB和灰度颜色模式。JPEG格式保留RGB图像中的所有颜色信息,通过选择性地去掉数据来压缩文件。,PDF(Portable Document Format)格式,PDF(可移植文档格式)用于Adobe Acrobat,Adobe Acrobat是Adobe公司用于Windows、UNIX和DOS系统的一种电子出版软件,十分流行。与Postseript页面一样,PDF可以包含矢量和位图图形,还可以包含电子文档查找和导航功能。,PNG 图片以任何颜色深度存储单个光栅图像。PNG 是与平台无关的格式。优点:PNG 支持高级别无损耗压缩。支持 alpha 通道透明度。PNG 支持伽玛校正。PNG 支持交错。PNG 受最新的 Web 浏览器支持。缺点:较旧的浏览器和程序可能不支持 PNG 文件。作为 Internet文件格式,与 JPEG 的有损耗压缩相比,PNG 提供的压缩量较少。作为 Internet 文件格式,PNG 对多图像文件或动画文件不提供任何支持。,PNG(Portable Network Graphic Format)格式,视频AVI,AVI:比较早的AVI是Microsoft开发的。其含义是Audio Video Interactive,就是把视频和音频编码混合在一起储存。AVI也是最长寿的格式,已存在10余年了,虽然发布过改版(V2.0于1996年发布),但已显老态。AVI格式上限制比较多,只能有一个视频轨道和一个音频轨道(现在有非标准插件可加入最多两个音频轨道),还可以有一些附加轨道,如文字等。AVI格式不提供任何控制功能。扩展名:.avi,WMV,WMV(Windows Media Video)是微软公司开发的一组数位视频编解码格式的通称,ASF(Advanced Systems Format)是其封装格式。ASF封装的WMV档具有“数位版权保护”功能。扩展名:.wmv、.asf、.wmvhd,MPEG,MPEG格式:MPEG(Moving Picture Experts Group),是一个国际标准组织(IS0)认可的媒体封装形式,受到大部份机器的支持。其储存方式多样,可以适应不同的应用环境。MPEG-4档的档容器格式在Layer 1(mux)、14(mpg)、15(avc)等中规定。MPEG的控制功能丰富,可以有多个视频(即角度)、音轨、字幕(位图字幕)等等。MPEG的一个简化版本3GP还广泛的用于准3G手机上。扩展名:.dat(用于DVD)、.vob、.mpg/.mpeg、.3gp/.3g2(用于手机)等,MPEG1、MPEG2,MPEG1:是一种 MPEG(运动图像专家组)多媒体格式,用于压缩和储存音频和视频。用于计算机和游戏,MPEG1 的分辨率为 352 x 240 象素,帧速率为每秒 25 帧(PAL)。MPEG1 可以提供和租赁录像带一样的视频质量。MPEG2:是一种 MPEG(运动图像专家组)多媒体格式,用于压缩和储存音频及视频。供广播质量的应用程序使用,MPEG 2 定义了支持添加封闭式字幕和各种语言通道功能的协议。,MPEG-4,MPEG-4包含了MPEG-1及MPEG-2的绝大部份功能及其他格式的长处,并加入及扩充对虚拟现实模型语言(VRML,VirtualReality Modeling Language)的支持,面向对象的合成档案(包括音效,视讯及VRML对象),以及数字版权管理(DRM)及其他互动功能。而MPEG-4比MPEG-2更先进的其中一个特点,就是不再使用宏区块做影像分析,而是以影像上个体为变化记录,因此尽管影像变化速度很快、码率不足时,也不会出现方块画面。,DivX/xvid,DivX是一项由DivXNetworks公司发明的,类似于MP3的数字多媒体压缩技术。DivX基于MPEG-4,可以把MPEG-2格式的多媒体文件压缩至原来的10%。通过DSL或CableModen等宽带设备,它可以让你欣赏全屏的高质量数字电影。同时它还允许在其他设备(如数字电视、蓝光播放器、PocketPC、数码相框、手机)上观看对机器的要求不高,这种编码的视频CPU只要是300MHz以上、64M内存和一个8M显存的显卡就可以流畅地播放了。采用DivX的文件小,图像质量更好,一张CD-ROM 可容纳120min的质量接近DVD的电影,DV,DV(数字视频)通常用于指用数字格式捕获和储存视频的设备(诸如便携式摄像机)。有DV 类型I 和 DV 类型II两种AVI文件DV类型I:数字视频 AVI 文件包含原始的视频和音频信息。DV 类型 I 文件通常小于 DV 类型 II 文件,并且与大多数 A/V 设备兼容,诸如 DV 便携式摄像机和录音机。DV类型II:数字视频 AVI 文件包含原始的视频和音频信息,同时还包含作为 DV 音频副本的单独音轨。DV 类型 II 比 DV 类型 I 兼容的软件更加广泛,因为大多数使用 AVI 文件的程序都希望使用单独的音轨,MKV,Matroska是一种新的多媒体封装格式。它也是其中一种开放源代码的多媒体封装格式。Matroska同时还可以提供非常好的交互功能,而且比MPEG的方便、强大。扩展名:.mkv,RM/RMVB,Real Video或者称Real Media(RM)档是由RealNetworks开发的一种档容器。它通常只能容纳Real Video和Real Audio编码的媒体。该档带有一定的交互功能,允许编写脚本以控制播放。RM,尤其是可变比特率的RMVB格式,体积很小,非常受到网络下载者的欢迎。扩展名:.rm、.rmvb,MOV,QuickTime Movie是由苹果公司开发的容器,由于苹果电脑在专业图形领域的统治地位,QuickTime格式基本上成为电影制作行业的通用格式。QT可储存的内容相当丰富,除了视频、音频以外还可支援图片、文字(文本字幕)等。扩展名:.mov,小结,音频格式:CD格式:天籁、MP3:流行、RealAudio:流行旋律、WAV:无损、WMA:最具实力、MIDI:作曲家最爱、FLAC:自由无损的音频格式、APE:最具前途的网络无损格式图像格式:BMP、TIFF、GIF、JPEG、PDF、PNG视频格式:AVI、WMV、MPEG、MPEG-1、MPEG-2、DivX/xvid、DV、MKV、RM/RMVB、MOV,音频操作通过声卡录制声音,声卡的插孔:MIC(话筒)LINE IN(线路输入)PHONE/SPEAKER(耳机/扬声器),音频操作通过声卡录制声音,控制面板硬件和声音管理音频设备“声音”之“录制”,选择录音设备,用Cool Edit录制声音信号,用Cool Edit录制声音信号,在“文件”菜单选择“新建文件”,设置波形文件属性:声道采样精度采样频率然后单击左下角控制面板上的“录制”按钮即可录音。,用Cool Edit录制声音信号,用Cool Edit放大声音信号,选取“效果”“波形振幅”“音量标准化”“标准化”对话框勾选“标准化到”输入框填入“100%”确定。这样声音就放大了,用Cool Edit DIY手机铃声,打开要剪辑的音乐文件通过播放音乐,找到需要部分的起止位置选中需要的音乐部分将选中部分复制出来新建一空音频文件将复制的部分粘贴进去并保存为一新的文件(以MP3格式进行保存),用“千千静听”批量转换音频文件格式,以APE格式转MP3为例:在“千千静听”播放列表中选中要转换的曲目用右键单击选中选中的曲目选择“转换格式”设置好输出格式及目标文件夹单击“立即转换”,将MP3刻录成CD光盘,最常见的刻录软件Nero刻录CD的方法:打开Nero Express界面,在窗口的的左边选择“音乐”选项,再在窗口的右边选中“音乐光盘”选项打开音乐CD刻录界面后,单击右边的“添加”按钮,选择要刻录的文件。选择好要刻录的曲目后,单击“下一步”按钮进入刻录界面,设置好刻录份数及相关信息后单击“刻录”按钮,就开始刻录CD光盘了。,图片处理图片文件的采集,采集图片的方法:网上下载 数码相机拍摄扫描仪扫描 制图软件制作,使用扫描仪导入图片,将扫描仪连接到计算机上打开扫描软件(自带或Photoshop等)单击Preview(预览)按钮调整完毕后,单击Scan(扫描)按钮设置好图片保存格式,保存到指定文件夹,用“美图秀秀”裁剪图片,用“美图秀秀”打开一张图片单击“裁剪”按钮调节图片预览区中的边框至需要的范围,单击“完成裁剪”按钮单击“保存与分享”按钮用“美图秀秀”制作场景效果,实例:用“画图”或ACDSee编辑图片(20分),对给出的世界杯.jpg图片按要求进行如下处理:(1)将JPG格式转换为PNG格式,并改变图片大小为250*250像素;(2)将改变后的图片命名为“世界杯修改”,并覆盖原文件夹的同名文件。,文字识别软件(OCR)的使用,汉王识别软件的使用:打开汉王识别软件打开(导入)图片文件如果导入的图片有点歪,用“编辑”菜单中的“自动倾斜校正”调整在“识别”菜单选择执行“版面分析”,如有错误,将其删除并手动建立识别模块在“识别”菜单中选择执行“开始识别”,视频文件的采集,用“会声会影”采集视频文件:打开“会声会影”软件,选择“影片向导”在“影片向导”面板中执行“捕捉”功能在来源选项中选择要采集的视频源设置好视频格式和捕捉文件夹单击“捕获视频”按钮,开始捕获视频单击“停止捕获”按钮停止视频采集后,生成一个MPG视频文件,视频文件的编辑与剪辑,用“会声会影”截取视频片段:进入“会声会影”编辑器将截取的影片素材拖放到视频轨道中拖动时间轴上的拖柄至要截取的时间点,单击小剪刀按钮,将视频分段将前后两端不要的视频删除单击“分享”按钮,选择格式保存。使用“会声会影”制作短片,视频文件的格式转换,用“格式工厂”将影片转换为iPhone格式单击“格式工厂”“移动设备”按钮选择移动设备的品牌和视频的尺寸单击“确定”后,转到视频转换窗口通过“添加文件”、“添加文件夹”来添加一个或多个文件设置好输出文件夹,单击“确定”单击窗口工具栏中的“开始”,即开始转换,