多媒体技术基础习题解答(林福宗)doc.docx

上传人：牧羊曲112

文档编号：2019108

上传时间：2022-12-31

格式：DOCX

页数：19

大小：305.66KB

《多媒体技术基础习题解答(林福宗)doc.docx》由会员分享，可在线阅读，更多相关《多媒体技术基础习题解答(林福宗)doc.docx（19页珍藏版）》请在三一办公上搜索。

1、多媒体技术基础(第2版) 练习与思考题参考答案第1章多媒体技术概要 1.1 多媒体是什么？多媒体是融合两种或者两种以上媒体的一种人机交互式信息交流和传播媒体。使用的媒体包括文字、图形、图像、声音、动画和电视图像(video)。 1.2 超文本的核心思想是什么？超文本系统和超媒体系统有什么差别？ (1) 超文本是通过复杂的、非顺序的关联关系连接在一起的一种文本，其真正含义是“链接”的意思。 (2) 超文本系统是以文本为主并使用超链接构成的信息系统；超媒体系统除文本外还包含图像、音乐、动画或其他元素构成并使用超链接构成的全球信息系统。 1.3 超媒体是什么？多媒体与超媒体之间有什么关系？ (1

2、) 使用文本、图形、图像、声音和电视图像等媒体任意组合的一种交互式信息传播媒体。 (2) 多媒体是超媒体系统中的一个子集。1.4 SGML是什么语言？HTML是什么语言？它们之间有何关系？ (1) 1986年国际标准化组织(ISO)采用的一个信息管理标准。该标准定义独立于平台和应用的文本文档的格式、索引和链接信息，为用户提供一种类似于语法的机制，用来定义文档的结构和指示文档结构的标签。 (2) HTML是万维网上的文档所用的标记语言。 (3) HTML是SGML的一个子集。SGML使用标签来标志文档中的文本或图形之类的元素，并告诉Web浏览器该如何向用户显示这些元素，以及应该如何响应用户的行

3、为，例如当用户通过按键或鼠标单击某个链接时该如何响应。 1.5 有人认为“因特网就是万维网”，这种看法对不对？为什么？ (1) 不对。 (2) 因特网是专指全球范围内最大的、由众多网络相互连接而成的、基于TCP/IP协议的计算机网络；万维网是指分布在全世界所有HTTP服务器上互相连接的超媒体文档的集合。 1.6 多媒体、万维网和因特网之间有何关系? 多媒体构成了超媒体系统，超媒体系统构成了万维网，万维网是因特网上使用TCP/IP协议和UDP/IP协议的应用系统。第2章数字声音及MIDI简介 2.1 音频信号的频率范围大约多少？话音信号频率范围大约多少？ (1) Audio: 2020000

4、Hz (2) Speech: 3003400 Hz 2.2 什么叫做模拟信号？什么叫做数字信号？ (1) 幅度或频率发生连续变化的一种信号。 (2) 以二进制代码形式表示有无或者高低的一种信号。 2.3 什么叫做采样？什么叫做量化？什么叫做线性量化？什么叫做非线性量化？ (1) 采样：在某些特定的时刻对模拟信号进行测量的过程。 (2) 量化：幅值连续的模拟信号转化成为幅值离散的数字信号的过程。 (3) 线性量化：在量化时，信号幅度的划分是等间隔的量化。 (4) 非线性量化：在量化时，信号幅度的划分是非等间隔的量化。 2.4 采样频率根据什么原则来确定？奈奎斯特理论和声音信号本身的最高频率。

5、2.5 样本精度为8位的信噪比等于多少分贝？ 48 分贝 2.6 声音有哪几种等级？它们的频率范围分别是什么？见表2-01。 2.7 选择采样频率为22.050 kHz和样本精度为16位的录音参数。在不采用压缩技术的情况下，计算录制2分钟的立体声需要多少MB(兆字节)的存储空间(1MB=10241024B) (2205022260)/(10241024) 10.09 MB 2.8 什么叫做MIDI？它有什么特点？ (1) 音乐合成器、乐器和计算机之间交换音乐信息的一种标准协议。 (2) 文件比较小；容易编辑等 2.9 用自己的语言说明FM合成声音和乐音样本合成声音的思想。 (1) 把几种乐音

6、的波形用数字表达，用计算机把它们组合起来，通过数模转换器(DAC)来生成乐音。 (2) 把真实乐器发出的声音以数字的形式记录下来，播放时改变播放速度，从而改变音调周期，生成各种音阶的音符。第3章话音编码 3.1 用自己的语言说出下面3种话音编译码器的基本想法。波形编译码器，音源编译码器，混合编译码器 (1) 波形编译码器：不利用生成话音信号的任何知识而企图产生一种重构信号，它的波形与原始话音波形尽可能地一致。 (2) 企图从话音波形信号中提取生成话音的参数，使用这些参数通过话音生成模型重构出话音。 (3) 企图填补波形编译码和音源编译码之间的间隔。波形编译码器虽然可提供高话音的质量，但数据

7、率低于16 kb/s的情况下，在技术上还没有解决音质的问题；声码器的数据率虽然可降到2.4 kb/s甚至更低，但它的音质根本不能与自然话音相提并论。 3.2 列出你所知道的话音编译码器的主要指标(至少2个) 音质，数据速率 3.3 试说混合编译码器的发展过程为了得到音质高而数据率又低的编译码器，历史上出现过很多形式的混合编译码器，但最成功并且普遍使用的编译码器是时域合成-分析(analysis-by-synthesis，AbS)编译码器。这种编译码器使用的声道线性预测滤波器模型与线性预测编码(linear predictive coding，LPC)使用的模型相同，不使用两个状态(有声/无声

8、)的模型来寻找滤波器的输入激励信号，而是企图寻找这样一种激励信号，使用这种信号激励产生的波形尽可能接近于原始话音的波形。AbS编译码器由Atal和Remde在1982年首次提出，并命名为多脉冲激励(multi-pulse excited，MPE)编译码器，在此基础上随后出现的是等间隔脉冲激励(regular-pulse excited，RPE)编译码器、码激励线性预测CELP(code excited linear predictive)编译码器和混合激励线性预测(mixed excitation linear prediction，MELP)等编译码器。 3.4 什么叫做均匀量化？什么叫做非

9、均匀量化？ (1) 均匀量化：采用相等的量化间隔对采样得到的信号进行量化。它是线性量化的另一种说法。 (2) 非均匀量化：采用非相等的量化间隔对采样得到的信号进行量化。例如，对大的输入信号采用大的量化间隔，对小的输入信号采用小的量化间隔。它是非线性量化的另一种说法。 3.5 什么叫做率压扩？什么叫做A率压扩？ (1) 在脉冲编码调制(PCM)系统中，一种模拟信号和数字信号之间进行转换的CCITT压(缩)扩(展)标准。在北美PCM电话网中，使用率压扩算法，详见“3.2.4 律压扩”。 (2) 在脉冲编码调制(PCM)系统中，一种模拟信号和数字信号之间进行转换的CCITT压(缩)扩(展)标准。在欧

10、洲电话网，使用A律压扩算法，详见“3.2.5 A律压扩” 对于采样频率为8 kHz，样本精度为13比特、14比特或16比特的输入信号，使用律压扩编码或使用A律压扩编码，经过PCM编码器之后每个样本的精度为8比特，输出的数据率为64 kb/s。 3.6 G.711标准定义的输出数据率是多少？T1的数据率是多少？T2的数据率是多少？ (1) G.711使用率和A率压缩算法，信号带宽为3.4 kHz，压缩后的数据率为64 kb/s。 (2) T1总传输率：1.544 Mb/s。 (2) T2总传输率：6.312 Mb/s。 3.7 图3-23是DM编码器的原理图，如果你已经学过模拟电路和数字电路技术

11、基础，请分析该电路是如何完成增量调制编码的。 (略) 3.8 自适应脉冲编码调制(APCM)的基本思想是什么？根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应，即量化阶的大小每隔几个样本就改变，也可以是音节自适应，即量化阶的大小在较长时间周期里发生变化。 3.9 差分脉冲编码调制(DPCM)的基本思想是什么？利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。这种技术是根据过去的样本去估算(estimate)下一个样本信号的幅度大小，这个值称为预测值，然后对实际信号值与预测值之差进行量化编码，从而就减少了表示每个样本信号的位数。它与脉冲编码调制

12、(PCM)不同的是，PCM是直接对采样信号进行量化编码，而DPCM是对实际信号值与预测值之差进行量化编码，存储或者传送的是差值而不是幅度绝对值，这就降低了传送或存储的数据量。此外，它还能适应大范围变化的输入信号。 3.10 自适应差分脉冲编码调制(ADPCM)的两个基本思想是什么？ ADPCM综合了APCM的自适应特性和DPCM系统的差分特性，是一种性能比较好的波形编码。它的核心想法是：利用自适应的思想改变量化阶的大小，即使用小的量化阶(step-size)去编码小的差值，使用大的量化阶去编码大的差值。使用过去的样本值估算下一个输入样本的预测值，使实际样本值和预测值之间的差值总是最小。第

13、4章无损数据压缩 4.1 现有8个待编码的符号m 0，m7它们的概率如表练习_表1所示。使用哈夫曼编码算法求出这8个符号的所分配的代码，并填入表中。(答案不惟一。参考答案：1，000，001，011，0101，01000，010010，010011) 练习_表1 待编码的符号概率分配的代码代码长度 (比特数) m0 0.4 1 1 m1 0.2 000 3 m2 0.15 001 3 m3 0.10 011 3 m4 0.07 0101 4 m5 0.04 01000 5m6 0.03 010010 6m7 0.01 010011 64.2 字符流的输入如练习_表2所示，使用LZW算法计算输

14、出的码字流。如果对本章介绍的LZW算法不打算进行改进，并且使用练习_表3进行计算，请核对计算的输出码字流是否为： (1) (2) (4) (3) (5) (8) (1) (10) (11) . 并将码字流中的码字填入练习_表2对应的位置。练习_表2 输入位置1 2 3 4 5 6 7 8 9 101112131415 16 17 输入字符流A ba b c b a b a b a a a a a a a 输出码字A b-ab c- ba baba - aa- - aaa 练习_表3 步骤位置词典输出码字(1) a (2) b (3) c 1 1 (4) ab (1) 2 2 (5) ba (

15、2) 3 4 (6) Abc (4) 4 5 (7) Cb (3) 5 7 (8) Bab (5) 6 10 (9) Baba (8) 7 11 (10) Aa (1) 8 13 (11) Aaa (10) 9 16 (12) Aaa (11) 4.3 LZ78算法和LZ77算法的差别在哪里？ (1) LZ77编码算法的核心是查找从前向缓冲存储器开始的最长的匹配串(4.4.2 LZ77算法) (2) LZ78的编码思想是不断地从字符流中提取新的缀-符串(String)，通俗地理解为新“词条”，然后用“代号”也就是码字(Code word)表示这个“词条”。这样一来，对字符流的编码就变成了用码字

16、(Code word)去替换字符流(Charstream)，生成码字流(Codestream)，从而达到压缩数据的目的。(4.4.4 LZ78算法) 4.4 LZSS算法和LZ77算法的核心思想是什么？它们之间有什么差别？ (1) LZ77通过输出真实字符解决了在窗口中出现没有匹配串的问题，但这个解决方案包含有冗余信息。(4.4.3 LZSS算法) (2) LZ77编码算法的核心是查找从前向缓冲存储器开始的最长的匹配串(4.4.2 LZ77算法) 4.5 LZW算法和LZ78算法的核心思想是什么？它们之间有什么差别？ (1) LZW算法和LZ78算法的核心思想都是不断地从字符流中提取新的缀-符

17、串(String)，通俗地理解为新“词条”，然后用“代号”也就是码字(Code word)表示这个“词条”。这样一来，对字符流的编码就变成了用码字(Code word)去替换字符流(Charstream)，生成码字流(Codestream)，从而达到压缩数据的目的。(4.4.4 LZ78算法) (2) 在LZW算法中使用的术语与LZ78使用的相同，仅增加了一个术语前缀根(Root)，它是由单个字符串组成的缀-符串(String)。在编码原理上，LZW与LZ78相比有如下差别：LZW只输出代表词典中的缀-符串(String)的码字(code word)。这就意味在开始时词典不能是空的，它必须包含

18、可能在字符流出现中的所有单个字符，即前缀根(Root)。由于所有可能出现的单个字符都事先包含在词典中，每个编码步骤开始时都使用一字符前缀(one-character prefix)，因此在词典中搜索的第1个缀-符串有两个字符。(4.4.5 LZW算法) 第5章彩色数字图像基础 5.1 什么叫做真彩色和伪彩色？在一幅彩色图像中，每个像素值有R，G，B三个基色分量，每个基色分量直接决定显示设备的基色强度，这样产生的彩色称为真彩色。例如用RGB 555表示的彩色图像，R，G，B各用5位，用R，G，B分量大小的值直接确定三个基色的强度，这样得到的彩色是真实的原图彩色。现在，通常把每个像素的颜色值用

19、24位表示的颜色叫做真彩色。24位表示的颜色总数：2 24 16 777 216 种颜色。 5.2 分别用3，3和2位表示的一幅图像，问该幅图像的颜色数目最多是多少？ 256 种 5.3 如果有一幅256色的图像，问该图的颜色深度是多少？ 8 位 5.4 按照JPEG标准的要求，一幅彩色图像经过JPEG压缩后还原得到的图像与原始图像相比较，非图像专家难于找出它们之间的区别，问此时的最大压缩比是多少？ 24:1 5.5 JPEG压缩编码算法的主要计算步骤是：DCT变换，量化，Z字形编码，使用DPCM对直流系数(DC)进行编码，使用RLE对交流系数(AC)进行编码，熵编码。假设计算机的精度足够高，

20、问在上述计算方法中，哪些计算对图像的质量是有损的？哪些计算对图像的质量是无损的？ (1) DCT变换：无损 (2) 量化：有损 (3) Z字形编码：无损 (4) 使用DPCM对直流系数(DC)进行编码：无损 (5) 使用RLE对交流系数(AC)进行编码：无损 (6) 熵编码：无损 5.6 什么叫做校正？在计算机中找一幅彩色图像，使用Microsoft Office 97/2000中的Microsoft Photo Editor或者其他图像处理软件显示该图像，然后使用校正功能修改值，观察图像有什么变化。 (1) 在屏幕上显示用离散量表示的色彩时采用的一种色彩调整技术。计算机显示器和电视

21、采用的阴极射线管产生的光亮度与输入的电压不成正比，而是等于以某个常数为底，以输入电压为指数的数，这个常数称为，它的值随显示器的不同而改变，一般在2.5左右。 (2) (略) 5.7 什么叫做通道？它的作用是什么？在每个像素用32位表示的图像表示法中的高8位，用于表示像素在一个对象中的透明度。例如，用两幅图A和B混合成一幅新图New，新图的像素为：New pixel =(alpha)(pixel A color) +(alpha)(pixel B color)。在计算机环境下，通道可存储在帧缓冲存储器中的附加位平面上。对于32位帧缓冲存储器，除高8位是通道外，其余24位是颜色位，红、绿和蓝各占

22、8位。 5.8 在计算机中找一幅像素深度为24的彩色图像，使用Office 97/2000中的Microsoft Photo Editor或者其他图像处理软件显示该图像，然后用GIF格式存储，再显示GIF图像。观察图像有什么变化，并分析其原因。 (略) 5.9 PNG图像文件格式的主要特点是什么？ PNG用来存储灰度图像时，灰度图像的深度可多到16位，存储彩色图像时，彩色图像的深度可多到48位，并且还可存储多到16位的通道数据。详见“5.7.4 PNG格式”。 5.10 通过调查、试验和分析，把BMP，GIF，JFIF和PNG格式的一些特性填入下表。图像格式名称是不是有损压缩支持的最大颜色数

23、BMP 无16 777 216 GIF 无256 JFIF 有16 777 216 PNG 无16 777 216 第6章颜色的度量体系 6.1 在开拓颜色科学方面, Newton, Thomas Young, Maxwell，Munsell，Ostwald和CIE分别做出了哪些重要贡献？ (1) Newton：发明了颜色圆，用于度量颜色 (2) Thomas ：认为人的眼睛有三种不同类型的颜色感知接收器，大体上相当于红、绿和蓝三种基色的接收器。 (3) Maxwell：探索了三种基色的关系，并且认识到三种基色相加产生的色调不能覆盖整个感知色调的色域，而使用相减混色产生的色调却可以。他认识到彩

24、色表面的色调和饱和度对眼睛的敏感度比明度低。Maxwell的工作可被认为是现代色度学的基础。 (4) Munsell：开发了第一个广泛被接受的颜色次序制，称为Munsell color-order system或者叫Munsell color system，对颜色作了精确的描述并用在他的教学中。Munsell颜色次序制也是其他颜体系的基础。 (5) Ostwald：开发了Ostwald颜色体系，根据对颜色起决定作用的波长、纯度和亮度来映射色调、饱和度和明度的值。 (6) CIE定义了许多度量颜色的标准 6.2 什么是颜色空间？对人、显示设备和打印设备，通常采用什么颜色参数来定义颜色？ (1)

25、颜色空间：表示颜色的一种数学方法，人们用它来指定和产生颜色，使颜色形象化。 (2) 对于人来说，可以通过色调、饱和度和明度来定义颜色；对于显示设备来说，人们使用红、绿和蓝磷光体的发光量来描述颜色；对于打印或者印刷设备来说，人们使用青色、品红色、黄色和黑色的反射和吸收来产生指定的颜色。 6.3 什么叫做颜色系统(即颜色体系)？简要说明组织和表示颜色的两种方法。 (1) 组织和表示颜色的方法。 (2) 两种方法：颜色模型(color model)，编目系统(cataloging system)。注： (1) 颜色模型：在台式机排版和图形艺术中，表示颜色的任何一种方法或约定。在图形艺术和印刷领域，

26、颜色常用Pantone(公司)颜色匹配系统；在计算机图形学方面，以下任何一种不同的色彩系统都可以描述色彩：HSB(色调，饱和度和亮度)，CMY(青，品红，黄)和RGB(红，绿，蓝)。 (2) 颜色空间是颜色模型最普通的例子，RGB, HSB, CMY, CIE XYZ, CIELAB，CMYK和颜色的光谱描述方法都是颜色模型。 6.4 使用你能够找到的工具和资料，探讨本章介绍的CIE度量体系是否有错误，哪些地方需要修改和补充。CIE度量体系包括： CIE 1931 RGB CIE 1931 XYZ CIE 1931 xyY CIE 1960 YUV和CIE YUV CIE 1976 LUV C

27、IE 1976 LAB CIELUV LCh和CIELAB LCh (略) 第7章颜色空间变换 7.1 PAL制彩色电视使用什么颜色模型？NTSC制彩色电视使用什么颜色模型？计算机图像显示使用什么颜色模型？ (1) PAL制彩色电视：YUV (2) NTSC制彩色电视：YIQ (3) 计算机图像显示设备：RGB 7.2 用YUV或YIQ模型来表示彩色图像的优点是什么？为什么黑白电视机可看彩色电视图像？ (1) YUV表示法的一个优点：它的亮度信号(Y)和色度信号(U，V)是相互独立的，因此可以对这些单色图分别进行编码；另一个优点：可以利用人眼的特性来降低数字彩色图像所需要的存储容量。YIQ同样

28、具有YUV的这两个优点。 (2) 黑白电视能接收彩色电视信号的道理是利用了YUV/YIQ分量之间的独立性。 7.3 在RGB颜色空间中，当R=G=B，且为任意数值，问计算机显示器显示的颜色是什么颜色？灰色 7.4 在HSL颜色空间中，当H为任意值，S=L=0时，R，G和B的值是多少？当H0, S=1, L0.5，R，G和B的值是多少? 当H为任意值，S=L=0时， R = G = B = 0 当H0, S=1, L0.5，R1，G B 0 7.5 打开Windows 95/98/2000中的“画图”“颜色编辑”程序，在RGB和HSL转换栏中，如果R=G=B255，问H, S和L的值分别为多少

29、？分别改变R，G和B的值，观察H，S和L的值的变化。如果R=G=B255，H160，S=0, L=240。 (2) (略) 7.6 用MATLAB编写RGB到HSL和HSL到RGB颜色空间的转换程序：rgb2hsl.m和hsl2rgb.m。(略) 7.7 用MATLAB编写YCbCr和RGB0,219颜色空间的转换程序：RGB2YCbCr和YCbCr2RGB.m。(略) 第8章小波与小波变换 8.1 写出矢量空间W3的哈尔小波并画出它的波形。 8.2 写出44哈尔小波变换矩阵。 8.3 使用MATLAB中的多级一维小波分解函数例程(function)wavedec，对例8.2所示的函数作小波

30、变换。(略) 8.4 使用规范化的小波变换算法，用MATLAB编写一个M文件，重新计算的哈尔小波变换。(略) f (x) =2,5,8,9,7,4,-1,-1 第9章小波图像编码 9.1 什么叫做零树？ “零树”是指小波变换系数之间的一种数据结构。因为离散小波变换是一种多分辨率的分解方法，每一级分解都会产生表示图像比较粗糙(低频图像)和比较精细(高频图像)的小波系数，在同一方向和相同空间位置上的所有小波系数之间的关系可用一棵树的形式表示，如果树根和它的子孙的小波系数的绝对值小于某个给定的阈值T(threshold)，那么这棵树就叫做零树。 9.2 解释EZW的含义。嵌入零树小波编码(embe

31、dded zerotree wavelet, EZW)是Shapiro, J. M在1993年开发的一种编码算法。小波表示该算法以离散小波变换为基础，以变换后的大系数比小系数更重要以及高频子带中的小系数可以忽略为背景；零树表示小波变换系数之间的一种数据结构，用同一方向和相同空间位置上的所有小波系数构成一棵树，如果树根及其子孙的小波系数的绝对值小于某个给定域值，则这棵树就称为零树；嵌入表示一幅图像可以分解成一幅低分辨率图像和分辨率由低到高(表示图像细节)的许多子图像，图像合成过程是通过子图像生成许多分辨率不同的图像。EZW编码就是按照用户对图像分辨率的不同要求，编码器进行多次编码，每进行一次编码

32、，域值降低1/2，水平和垂直方向上的图像分辨率各提高1倍。编码从最低分辨率图像开始扫描，每当遇到幅度大于域值的正系数就用符号P表示，幅度小于域值的负系数用符号N表示，树根节点上的系数幅度小于域值而树枝中有大于域值的非零树用符号Z表示，零树用符号T表示，编码的输出是符号集P, N, T, Z, 0, 1中的一系列符号。 9.3 如果条件允许，用MATLAB或者其他语言编写执行EZW算法的编码和解码程序 (略) 9.4 解释SPIHT的含义。层树分集算法(set partitioning in hierarchical trees, SPIHT)的根据是，图像经过小波变换之后，大部分能量都集中在

33、低频子带。从这个事实出发，最先传送幅度大的系数，这样解码器即使在低速率应用环境下也可得到图像的大部分信息。编码树的结构与EZW算法的结构类似，每一个节点要么没有子节点，要么有4个子节点。在编码过程中，使用三个列表变量存储重要系数和不重要系数。该算法适用于图像的渐进传输，具有比较高的PSNR，复杂度比较低，计算量比较少，位速率容易控制等优点。 9.5 如果条件允许，用MATLAB或者其他语言编写执行SPIHT算法的编码和解码程序。(略) 9.6 请用因特网搜索工具，查找并阅读EBCOT的详细说明。(略) 9.7 如果条件允许，用MATLAB或者其他语言编写执行EBCOT算法的编码和解码程序。(略

34、) 9.8 JPEG 2000有许多功能，请用因特网搜索工具调查和描述它的详细功能。(略) 第10章彩色数字电视基础 10.1 世界上主要的彩色电视制式是哪几种？目前世界上使用的彩色电视制式主要有PAL，NTSC，SECAM三种，都是模拟彩色电视制式。 10.2 隔行扫描是什么意思？非隔行扫描是什么意思？ (1) 在隔行扫描中，一帧画面分两场，第一场扫描总行数的一半，第二场扫描总行数的另一半。电子束扫完第1行后回到第3行开始的位置接着扫，如图10-01(b)所示，然后在第5、7、，行上扫，直到最后一行。奇数行扫完后接着扫偶数行，这样就完成了一帧(frame)的扫描。隔行扫描要求第一场结束于最

35、后一行的一半，不管电子束如何折回，它必须回到显示屏顶部的中央，这样就可以保证相邻的第二场扫描恰好嵌在第一场各扫描线的中间。正是这个原因，才要求总的行数必须是奇数。 (2) 在非隔行扫描中，电子束从显示屏的左上角一行接一行地扫到右下角，在显示屏上扫一遍就显示一幅完整的图像。 10.3 电视机和计算机的显示器各使用什么扫描方式？电视机通常使用隔行扫描；计算机的显示器通常使用非隔行扫描。 10.4 ITU-R BT.601标准规定PAL和NTSC彩色电视的每一条扫描线的有效显示像素是多少? 720 10.5 什么叫做S-Video？它的连接器结构是什么样？质量较高的一种电视技术，用这种技术录制和

36、处理电视时亮度信号(Y)和色差信号(C)是分开进行的。S-Video是分量模拟电视信号和复合模拟电视信号的一种折中方案。使用S-Video有两个优点：(1) 减少亮度信号和色差信号之间的交叉干扰。(2) 不须要使用梳状滤波器来分离亮度信号和色差信号，这样可提高亮度信号的带宽。 S-VHS和Hi-8摄像机以及盒式录像机(video cassette recorder，VCR)使用这种技术，它比标准的VHS和8毫米格式的设备提供质量比较高的彩色图像。在使用S-video技术的设备上，电视信号的输出除含有分离的亮度(Y)和色差信号(C)输出外，还有复合彩色全电视信号。S-video设备与其他设备连接

37、的连接器使用S-video连接器，而不是普通的RCA连接器。有些电视图像卡和高档家用录像机(VCR)可以支持这种信号。 10.6 对彩色图像进行子采样的理论根据是什么？人的视觉系统所具有的两种特性。一是人眼对色度信号的敏感程度比对亮度信号的敏感程度低，利用这个特性可以把图像中表达颜色的信号去掉一些而使人不察觉；二是人眼对图像细节的分辨能力有一定的限度，利用这个特性可以把图像中的高频信号去掉而使人不易察觉。子采样是压缩彩色电视信号的一种技术。 10.7 图像子采样是在哪个彩色空间进行的？ YCbCr 10.8 一幅YUV彩色图像的分辨率为720576。分别计算采用4:2:2、4:1:1和4:2

38、:0子采样格式采样时的样本数。 (1) 4:4:4 这种采样格式不是子采样格式，它是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、4个红色差Cr样本和4个蓝色差Cb样本，这就相当于每个像素用3个样本表示。 7205763 1 244 160 (2) 4:2:2 这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、2个红色差Cr样本和2个蓝色差Cb样本，平均每个像素用2个样本表示。 7205762 829 440 (3) 4:1:1 这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本，平均每个像素用1.5个样本表示。

39、7205761.5 622 080 (4) 4:2:0 这种子采样格式是指在水平和垂直方向上每2个连续的采样点上取2个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本，平均每个像素用1.5个样本表示。 7205761.5 622080 第11章MPEG简介 10.1 回顾制定MPEG标准的4个阶段和各阶段的提交的文件类型。 (1) 工作文件(Working Draft，WD)：工作组(Working Group，WG)准备的工作文件 (2) 委员会草案(Committee Draft，CD)：从工作组WG准备好的工作文件WD提升上来的文件。这是ISO文档的最初形式，它由ISO内部正式调查研究

40、和投票表决。 (3) 国际标准草案(Draft International Standard，DIS)：投票成员国对CD的内容和说明满意之后由委员会草案CD提升上来的文件。 (4) 国际标准(International Standard，IS)：由投票成员国、ISO的其他部门和其他委员会投票通过之后出版发布的文件。 10.2 MPEG-1, -2, -4和-7的目标是什么？ MPEG-1处理的是标准图像交换格式的电视，即NTSC制为352像素240行/帧30帧/秒，PAL制为352像素288行/帧25帧/秒，压缩的输出速率定义在1.5 Mb/s以下。这个标准主要是针对当时具有这种数据传输率的C

41、D-ROM和网络而开发的，用于在CD-ROM上存储数字影视和在网络上传输数字影视。 MPEG-2标准是一个直接与数字电视广播有关的高质量图像和声音编码标准，是MPEG-1的扩充。MPEG-2提供位速率的可变性能功能，其最基本目标是：位速率为49 Mb/s，最高达15 Mb/s。 MPEG-4是为视听数据的编码和交互播放开发算法和工具，是一个数据速率很低的多媒体通信标准。MPEG-4的目标是要在异构网络环境下能够高度可靠地工作，并且具有很强的交互功能。 MPEG-7的名称叫做多媒体内容描述接口，目的是制定一套描述符标准，用来描述各种类型的多媒体信息及它们之间的关系，以便更快更有效地检索信息。这些

42、媒体材料可包括静态图像、图形、3D模型、声音、话音、电视以及在多媒体演示中它们之间的组合关系。在某些情况下，数据类型还可包括面部特性和个人特性的表达。第12章MPEG声音 12.1 列出你所知道的听觉系统的特性。响度感知, 音高感知, 掩蔽效应 12.2 什么叫做听阈？什么叫做痛阈？ (1) 当声音弱到人的耳朵刚刚可以听见时，称此时的声音强度为“听阈” (2) 当声音强到人的耳朵刚刚感到疼痛时，称此时的声音强度为“听阈”。实验表明，如果频率为1 kHz的纯音的声强级达到120 dB左右时，人的耳朵就感到疼痛，这个阈值称为“痛阈”。 12.3 什么叫做频域掩蔽？什么叫做时域掩蔽？强纯音掩蔽

43、在其附近同时发声的弱纯音，这种特性称为频域掩蔽。 (2) 在时间方向上相邻声音之间的掩蔽，这种特性称为时域掩蔽。 12.4 MPEG-1的层1、2和3编码分别使用了听觉系统的什么特性？层1：频域掩蔽特性层2：频域掩蔽特性，时间掩蔽特性层3：频域掩蔽特性，时间掩蔽特性 12.5 MPEG-1的层1、2和3编码器的声音输出速率范围分别是多少？层1：384 kb/s 层2：256192 kb/s 层3：128112 kb/s 12.6 MPEG-1的声音质量是： AM FM 电话 near-CD CD-DA AM FM 电话 near-CD CD-DA 12.7 什么叫做5.1声道立体环绕声

44、？什么叫做7.1声道立体环绕声？ (1) “5.1环绕声”也称为“3/2-立体声加LFE”，其中的“.1”是指LFE声道。它的含义是播音现场的前面可有3个喇叭声道(左、中、右)，后面可有2个环绕声喇叭声道，LFE是低频音效的加强声道。 7.1声道环绕立体声与5.1类似。参见图12-19。 12.8 简述MPEG-2 AAC的特性。 MPEG-2 AAC是MPEG-2标准中的一种非常灵活的声音感知编码标准。它使用听觉系统的掩蔽特性来减少声音的数据量，并且通过把量化噪声分散到各个子带中，用全局信号把噪声掩蔽掉。 AAC支持的采用频率可从8 kHz到96 kHz，AAC编码器的音源可以是单声道的、

45、立体声的和多声道的声音。AAC标准可支持48个主声道、16个低频音效加强通道LFE、16个配音声道或者叫做多语言声道和16个数据流。 MPEG-2 AAC在压缩比为11:1，即在每个声道的数据率为(44.116 )/11=64 kb/s，而5个声道的总数据率为320 kb/s的情况下，很难区分还原后的声音与原始声音之间的差别。与MPEG-Audio层2相比，MPEG-2 AAC的压缩率可提高1倍，而且质量更高，与MPEG的层3相比，在质量相同的条件下数据率是它的70%。 12.9 什么叫做自然声音？什么叫做合成声音？自然声音通常是指人、动物等发出的声音、弹奏乐器或其他音源自然发出的声音。合

46、成声音通常指合成器生成的声音，如MIDI。 12.10 什么叫做TTS？至少列举TTS的3个潜在应用例子。通过话音合成设备自动地把基于文字的数据转换为声音输出的一种技术。文语转换的最终目标是要使计算机像人一样输出清晰而又自然的声音，也就是说，根据文本的内容可以不同的情调来朗读任意的文本。TTS是一个十分复杂的系统，涉及到语言学、语音学、信号处理、人工智能等诸多的学科。尽管现有的TTS系统结构各异，转换方法不同，但是基本上可以分成两个相对独立的部分：文本分析，通过对输入文本进行词法分析、语法分析，甚至语义分析，从文本中抽取音素和韵律等发音信息。语音合成，使用从文本分析得到的发音信息去控制合成单元的谱特征(音色)和韵律特征(基频、时长和幅度)，送入声音合成器(软件或硬件)产生相应的语音输出。通过电话访问信息，朗读文本，盲人计算机等。第13章MPEG电视 13.1 电视图像数据压缩的依据是什么？根据人的视觉特性和电视图像数据自身的冗余特性。注：人的视觉系统具有的两种特性可以用来压缩电视图像数据。一是人眼对色