多媒体技术基础习题解答(林福宗)doc.docx
《多媒体技术基础习题解答(林福宗)doc.docx》由会员分享,可在线阅读,更多相关《多媒体技术基础习题解答(林福宗)doc.docx(19页珍藏版)》请在三一办公上搜索。
1、多媒体技术基础(第2版) 练习与思考题参考答案 第1章多媒体技术概要 1.1 多媒体是什么? 多媒体是融合两种或者两种以上媒体的一种人机交互式信息交流和传播媒体。使用的媒体包括文字、图形、图像、声音、动画和电视图像(video)。 1.2 超文本的核心思想是什么?超文本系统和超媒体系统有什么差别? (1) 超文本是通过复杂的、非顺序的关联关系连接在一起的一种文本,其真正含义是“链接”的意思。 (2) 超文本系统是以文本为主并使用超链接构成的信息系统;超媒体系统除文本外还包含图像、音乐、动画或其他元素构成并使用超链接构成的全球信息系统。 1.3 超媒体是什么?多媒体与超媒体之间有什么关系? (1
2、) 使用文本、图形、图像、声音和电视图像等媒体任意组合的一种交互式信息传播媒体。 (2) 多媒体是超媒体系统中的一个子集 。1.4 SGML是什么语言?HTML是什么语言?它们之间有何关系? (1) 1986年国际标准化组织(ISO)采用的一个信息管理标准。该标准定义独立于平台和应用的文本文档的格式、索引和链接信息,为用户提供一种类似于语法的机制,用来定义文档的结构和指示文档结构的标签。 (2) HTML是万维网上的文档所用的标记语言。 (3) HTML是SGML的一个子集。SGML使用标签来标志文档中的文本或图形之类的元素,并告诉Web浏览器该如何向用户显示这些元素,以及应该如何响应用户的行
3、为,例如当用户通过按键或鼠标单击某个链接时该如何响应。 1.5 有人认为“因特网就是万维网”,这种看法对不对?为什么? (1) 不对。 (2) 因特网是专指全球范围内最大的、由众多网络相互连接而成的、基于TCP/IP协议的计算机网络;万维网是指分布在全世界所有HTTP服务器上互相连接的超媒体文档的集合。 1.6 多媒体、万维网和因特网之间有何关系? 多媒体构成了超媒体系统,超媒体系统构成了万维网,万维网是因特网上使用TCP/IP协议和UDP/IP协议的应用系统。 第2章数字声音及MIDI简介 2.1 音频信号的频率范围大约多少?话音信号频率范围大约多少? (1) Audio: 2020000
4、Hz (2) Speech: 3003400 Hz 2.2 什么叫做模拟信号?什么叫做数字信号? (1) 幅度或频率发生连续变化的一种信号。 (2) 以二进制代码形式表示有无或者高低的一种信号。 2.3 什么叫做采样?什么叫做量化?什么叫做线性量化?什么叫做非线性量化? (1) 采样:在某些特定的时刻对模拟信号进行测量的过程。 (2) 量化:幅值连续的模拟信号转化成为幅值离散的数字信号的过程。 (3) 线性量化:在量化时,信号幅度的划分是等间隔的量化。 (4) 非线性量化:在量化时,信号幅度的划分是非等间隔的量化。 2.4 采样频率根据什么原则来确定? 奈奎斯特理论和声音信号本身的最高频率。
5、2.5 样本精度为8位的信噪比等于多少分贝? 48 分贝 2.6 声音有哪几种等级?它们的频率范围分别是什么? 见表2-01。 2.7 选择采样频率为22.050 kHz和样本精度为16位的录音参数。在不采用压缩技术的情况下,计算录制2分钟的立体声需要多少MB(兆字节)的存储空间(1MB=10241024B) (2205022260)/(10241024) 10.09 MB 2.8 什么叫做MIDI?它有什么特点? (1) 音乐合成器、乐器和计算机之间交换音乐信息的一种标准协议。 (2) 文件比较小;容易编辑等 2.9 用自己的语言说明FM合成声音和乐音样本合成声音的思想。 (1) 把几种乐音
6、的波形用数字表达,用计算机把它们组合起来,通过数模转换器(DAC)来生成乐音。 (2) 把真实乐器发出的声音以数字的形式记录下来,播放时改变播放速度,从而改变音调周期,生成各种音阶的音符。 第3章话音编码 3.1 用自己的语言说出下面3种话音编译码器的基本想法。 波形编译码器,音源编译码器,混合编译码器 (1) 波形编译码器:不利用生成话音信号的任何知识而企图产生一种重构信号,它的波形与原始话音波形尽可能地一致。 (2) 企图从话音波形信号中提取生成话音的参数,使用这些参数通过话音生成模型重构出话音。 (3) 企图填补波形编译码和音源编译码之间的间隔。波形编译码器虽然可提供高话音的质量,但数据
7、率低于16 kb/s的情况下,在技术上还没有解决音质的问题;声码器的数据率虽然可降到2.4 kb/s甚至更低,但它的音质根本不能与自然话音相提并论。 3.2 列出你所知道的话音编译码器的主要指标(至少2个) 音质,数据速率 3.3 试说混合编译码器的发展过程 为了得到音质高而数据率又低的编译码器,历史上出现过很多形式的混合编译码器,但最成功并且普遍使用的编译码器是时域合成-分析(analysis-by-synthesis,AbS)编译码器。这种编译码器使用的声道线性预测滤波器模型与线性预测编码(linear predictive coding,LPC)使用的模型相同,不使用两个状态(有声/无声
8、)的模型来寻找滤波器的输入激励信号,而是企图寻找这样一种激励信号,使用这种信号激励产生的波形尽可能接近于原始话音的波形。AbS编译码器由Atal和Remde在1982年首次提出,并命名为多脉冲激励(multi-pulse excited,MPE)编译码器,在此基础上随后出现的是等间隔脉冲激励(regular-pulse excited,RPE)编译码器、码激励线性预测CELP(code excited linear predictive)编译码器和混合激励线性预测(mixed excitation linear prediction,MELP)等编译码器。 3.4 什么叫做均匀量化?什么叫做非
9、均匀量化? (1) 均匀量化:采用相等的量化间隔对采样得到的信号进行量化。它是线性量化的另一种说法。 (2) 非均匀量化:采用非相等的量化间隔对采样得到的信号进行量化。例如,对大的输入信号采用大的量化间隔,对小的输入信号采用小的量化间隔。它是非线性量化的另一种说法。 3.5 什么叫做率压扩?什么叫做A率压扩? (1) 在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITT压(缩)扩(展)标准。在北美PCM电话网中,使用率压扩算法,详见“3.2.4 律压扩”。 (2) 在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITT压(缩)扩(展)标准。在欧
10、洲电话网,使用A律压扩算法,详见“3.2.5 A律压扩” 对于采样频率为8 kHz,样本精度为13比特、14比特或16比特的输入信号,使用律压扩编码或使用A律压扩编码,经过PCM编码器之后每个样本的精度为8比特,输出的数据率为64 kb/s。 3.6 G.711标准定义的输出数据率是多少?T1的数据率是多少?T2的数据率是多少? (1) G.711使用率和A率压缩算法,信号带宽为3.4 kHz,压缩后的数据率为64 kb/s。 (2) T1总传输率:1.544 Mb/s。 (2) T2总传输率:6.312 Mb/s。 3.7 图3-23是DM编码器的原理图,如果你已经学过模拟电路和数字电路技术
11、基础,请分析该电路是如何完成增量调制编码的。 (略) 3.8 自适应脉冲编码调制(APCM)的基本思想是什么? 根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应,即量化阶的大小每隔几个样本就改变,也可以是音节自适应,即量化阶的大小在较长时间周期里发生变化。 3.9 差分脉冲编码调制(DPCM)的基本思想是什么? 利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。这种技术是根据过去的样本去估算(estimate)下一个样本信号的幅度大小,这个值称为预测值,然后对实际信号值与预测值之差进行量化编码,从而就减少了表示每个样本信号的位数。它与脉冲编码调制
12、(PCM)不同的是,PCM是直接对采样信号进行量化编码,而DPCM是对实际信号值与预测值之差进行量化编码,存储或者传送的是差值而不是幅度绝对值,这就降低了传送或存储的数据量。此外,它还能适应大范围变化的输入信号。 3.10 自适应差分脉冲编码调制(ADPCM)的两个基本思想是什么? ADPCM综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。它的核心想法是: 利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值。 使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。 第
13、4章无损数据压缩 4.1 现有8个待编码的符号m 0,m7它们的概率如表练习_表1所示。使用哈夫曼编码算法求出这8个符号的所分配的代码,并填入表中。(答案不惟一。参考答案:1,000,001,011,0101,01000,010010,010011) 练习_表1 待编码 的符号概率分配的代码代码长度 (比特数) m0 0.4 1 1 m1 0.2 000 3 m2 0.15 001 3 m3 0.10 011 3 m4 0.07 0101 4 m5 0.04 01000 5m6 0.03 010010 6m7 0.01 010011 64.2 字符流的输入如练习_表2所示,使用LZW算法计算输
14、出的码字流。如果对本章介绍的LZW算法不打算进行改进,并且使用练习_表3进行计算,请核对计算的输出码字流是否为: (1) (2) (4) (3) (5) (8) (1) (10) (11) . 并将码字流中的码字填入练习_表2对应的位置。 练习_表2 输入位置1 2 3 4 5 6 7 8 9 101112131415 16 17 输入字符流A ba b c b a b a b a a a a a a a 输出码字A b-ab c- ba baba - aa- - aaa 练习_表3 步骤位置词典输出码字(1) a (2) b (3) c 1 1 (4) ab (1) 2 2 (5) ba (
15、2) 3 4 (6) Abc (4) 4 5 (7) Cb (3) 5 7 (8) Bab (5) 6 10 (9) Baba (8) 7 11 (10) Aa (1) 8 13 (11) Aaa (10) 9 16 (12) Aaa (11) 4.3 LZ78算法和LZ77算法的差别在哪里? (1) LZ77编码算法的核心是查找从前向缓冲存储器开始的最长的匹配串(4.4.2 LZ77算法) (2) LZ78的编码思想是不断地从字符流中提取新的缀-符串(String),通俗地理解为新“词条”,然后用“代号”也就是码字(Code word)表示这个“词条”。这样一来,对字符流的编码就变成了用码字
16、(Code word)去替换字符流(Charstream),生成码字流(Codestream),从而达到压缩数据的目的。(4.4.4 LZ78算法) 4.4 LZSS算法和LZ77算法的核心思想是什么?它们之间有什么差别? (1) LZ77通过输出真实字符解决了在窗口中出现没有匹配串的问题,但这个解决方案包含有冗余信息。(4.4.3 LZSS算法) (2) LZ77编码算法的核心是查找从前向缓冲存储器开始的最长的匹配串(4.4.2 LZ77算法) 4.5 LZW算法和LZ78算法的核心思想是什么?它们之间有什么差别? (1) LZW算法和LZ78算法的核心思想都是不断地从字符流中提取新的缀-符
17、串(String),通俗地理解为新“词条”,然后用“代号”也就是码字(Code word)表示这个“词条”。这样一来,对字符流的编码就变成了用码字(Code word)去替换字符流(Charstream),生成码字流(Codestream),从而达到压缩数据的目的。(4.4.4 LZ78算法) (2) 在LZW算法中使用的术语与LZ78使用的相同,仅增加了一个术语前缀根(Root),它是由单个字符串组成的缀-符串(String)。在编码原理上,LZW与LZ78相比有如下差别:LZW只输出代表词典中的缀-符串(String)的码字(code word)。这就意味在开始时词典不能是空的,它必须包含
18、可能在字符流出现中的所有单个字符,即前缀根(Root)。由于所有可能出现的单个字符都事先包含在词典中,每个编码步骤开始时都使用一字符前缀(one-character prefix),因此在词典中搜索的第1个缀-符串有两个字符。(4.4.5 LZW算法) 第5章彩色数字图像基础 5.1 什么叫做真彩色和伪彩色? 在一幅彩色图像中,每个像素值有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。例如用RGB 555表示的彩色图像,R,G,B各用5位,用R,G,B分量大小的值直接确定三个基色的强度,这样得到的彩色是真实的原图彩色。 现在,通常把每个像素的颜色值用
19、24位表示的颜色叫做真彩色。24位表示的颜色总数:2 24 16 777 216 种颜色。 5.2 分别用3,3和2位表示的一幅图像,问该幅图像的颜色数目最多是多少? 256 种 5.3 如果有一幅256色的图像,问该图的颜色深度是多少? 8 位 5.4 按照JPEG标准的要求,一幅彩色图像经过JPEG压缩后还原得到的图像与原始图像相比较,非图像专家难于找出它们之间的区别,问此时的最大压缩比是多少? 24:1 5.5 JPEG压缩编码算法的主要计算步骤是:DCT变换,量化,Z字形编码,使用DPCM对直流系数(DC)进行编码,使用RLE对交流系数(AC)进行编码,熵编码。假设计算机的精度足够高,
20、问在上述计算方法中,哪些计算对图像的质量是有损的?哪些计算对图像的质量是无损的? (1) DCT变换: 无损 (2) 量化: 有损 (3) Z字形编码: 无损 (4) 使用DPCM对直流系数(DC)进行编码: 无损 (5) 使用RLE对交流系数(AC)进行编码: 无损 (6) 熵编码:无损 5.6 什么叫做校正?在计算机中找一幅彩色图像,使用Microsoft Office 97/2000中的Microsoft Photo Editor或者其他图像处理软件显示该图像,然后使用校正功能修改值,观察图像有什么变化。 (1) 在屏幕上显示用离散量表示的色彩时采用的一种色彩调整技术。计算机显示器和电视
21、采用的阴极射线管产生的光亮度与输入的电压不成正比,而是等于以某个常数为底,以输入电压为指数的数,这个常数称为,它的值随显示器的不同而改变,一般在2.5左右。 (2) (略) 5.7 什么叫做通道?它的作用是什么? 在每个像素用32位表示的图像表示法中的高8位,用于表示像素在一个对象中的透明度。例如,用两幅图A和B混合成一幅新图New,新图的像素为:New pixel =(alpha)(pixel A color) +(alpha)(pixel B color)。在计算机环境下,通道可存储在帧缓冲存储器中的附加位平面上。对于32位帧缓冲存储器,除高8位是通道外,其余24位是颜色位,红、绿和蓝各占
22、8位。 5.8 在计算机中找一幅像素深度为24的彩色图像,使用Office 97/2000中的Microsoft Photo Editor或者其他图像处理软件显示该图像,然后用GIF格式存储,再显示GIF图像。观察图像有什么变化,并分析其原因。 (略) 5.9 PNG图像文件格式的主要特点是什么? PNG用来存储灰度图像时,灰度图像的深度可多到16位,存储彩色图像时,彩色图像的深度可多到48位,并且还可存储多到16位的通道数据。详见“5.7.4 PNG格式”。 5.10 通过调查、试验和分析,把BMP,GIF,JFIF和PNG格式的一些特性填入下表。 图像格式名称是不是有损压缩支持的最大颜色数
23、BMP 无16 777 216 GIF 无256 JFIF 有16 777 216 PNG 无16 777 216 第6章颜色的度量体系 6.1 在开拓颜色科学方面, Newton, Thomas Young, Maxwell,Munsell,Ostwald和CIE分别做出了哪些重要贡献? (1) Newton:发明了颜色圆,用于度量颜色 (2) Thomas :认为人的眼睛有三种不同类型的颜色感知接收器,大体上相当于红、绿和蓝三种基色的接收器。 (3) Maxwell:探索了三种基色的关系,并且认识到三种基色相加产生的色调不能覆盖整个感知色调的色域,而使用相减混色产生的色调却可以。他认识到彩
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体技术 基础 习题 解答 林福宗 doc

链接地址:https://www.31ppt.com/p-2019108.html