多媒体视频监控系统课件.ppt
《多媒体视频监控系统课件.ppt》由会员分享,可在线阅读,更多相关《多媒体视频监控系统课件.ppt(70页珍藏版)》请在三一办公上搜索。
1、第5章 多媒体视频监控系统,对多媒体视频监控系统的架构、原理及其维护方法进行分析,并介绍其维护与日常故障的处理方法。,5.1 压缩图像,图像压缩有减少数据存储量、降低传输速率、压缩频带、降低传输成本的作用。数字视频信号的压缩分为有损压缩和无损压缩两类。如果在进行数据压缩的过程中不丢弃任何无效信息,使还原出的数据与未经压缩的原始信号完全相同,就称为无损压缩。无损压缩的压缩比很低,一般是作为有损压缩的辅助方法进行应用。有损压缩在压缩过程中丢弃了一些视频信息,使还原后的视频信号与原始信号有所差别。由于人眼的分辨力有限,某些图像信息被丢弃后是难以察觉的,因此可以保证视频信号在压缩程度较大的情况下仍有较
2、高的信号质量。有时又把图像压缩称为图像编码,其冗余度和压缩比成正比,所以,应设法减少图文、视频数据的冗余度,以达到压缩数据率的目的,从而节约传输带宽或存储空间。,5.1.1 编码方法,实质上,对视频信号的压缩就是对其进行编码,理论中有多种编码方法,但实际应用的主要有如下几种。,1预测编码,预测编码技术的重要应用就是差分脉冲编码调制,在依靠图像信号冗余度高的条件下,当前的像素值可用与其邻近的像素值预测获得。由于视频信号的相关性很强,即邻近像素的样值很接近,所以预测有较高的准确性。在预测编码中,并不直接传送像素样值本身,而是对实际样值及其一个预测值之间的差值进行量化、编码再传送,以达到很大的压缩比
3、。这个差值称为预测误差,预测误差被量化后再编码的方式叫做DPCM,是预测编码中最重要的一种编码方法。,2变换编码,(1)变化编码方法变化编码方法是将空间域描写的图像信号变换到一个正交的变换域进行描写。如果所选的正交向量空间的基准向量与图像本身的特性向量很接近,那么同一信号在这种变换域内的描写就简单得多。空间域的一个由NN个像素组成的像块经过正交变换后,在变换域变成了同样NN的变换系数块。变换前后的明显差别是,在空间域像素块中的像素之间存在着很强的相关性,能量集中在直流和少数低频系数上,去除了相关性,降低了冗余度,在变换域内进行滤波、量化及统计编码,即可实现有效的码率压缩。(2)应用方法例如,对
4、图像进行二维傅里叶变换,就是将空间域变换到频域,在水平和垂直方向上进行频谱展开。经过传输后,在接收端可用这些频谱恢复出信号。因为视频信号的能量主要集中在低频部分,随着频率的升高,能量迅速下降。考虑到人眼的主观视觉对调频不如对低频敏感的特点,在编码时对高、低频成分分别采用粗、细不同的量化,甚至对很高的频率成分舍去不传,这样既可以降低码率又可以保持良好的主观图像质量。,3熵编码,熵编码又称统计编码,其目的是降低平均字长,以达到压缩码率的目的。在熵编码过程中保持信息的熵值不变,因此也称为熵保持编码或无损伤编码。算术编码也属于熵编码,其中的自适应二进制算术编码已经为新的视频标准H264所采用。,5.1
5、.2 数字视频信号,在认识数字信号之前,有必要了解传统的模拟视频信号,以便更深入地认识前者的重要性。,1传统的模拟视频信号,传统视频信号采用模拟技术,在传统的视频监控系统中,由前端的摄像机输出到中心端的矩阵切换、监视及录像,采用的都是模拟视频信号,在整个系统中传输的也都是模拟视频信号。即使DSP摄像机采用了数字信号处理技术,其输出仍为模拟视频信号。传统的模拟视频信号标准主要有复合视频、Y/C视频、分量视频。,2数字视频信号,由于大规模集成电路LSI(LARGE-Scale Integrated Circuit)向着微型化、高速化的方向发展,数字技术已经应用于视频信号的处理。通过模/数(A/D)
6、转换,将模拟信号数值化,模拟信号就可变换为数字信号。同模拟信号相比,数字信号主要有以下几方面的优点。数字信号处理技术(DSP)能轻易对付传统模拟信号模式难以进行的算法、处理技术及各种功能。采用计算机处理,并通过计算机网络传输。全面、有效地在大规模集成电路中应用。,现在,数字视频技术技术开始广泛应用于非线性编辑、Flash、数字视频特技、数字图像修复等视频信号的处理领域,同时,与此相关的Adobe Premiere、3D Studio Max、Cool3D等计算机图像处理软件也应运而生。它们在很大程度上为人们的各种应用提供了方便,其中也包括针对多媒体视频监控系统开发的专用软件。将来,视频监控系统
7、将完全采用数字视频技术,其具体内容是:将连续、模拟的视频信号经取样、量化及编码转换成用二进制表示的数字视频信号,再进行各种功能的处理、传输、存储和记录,最后利用计算机进行处理、监测和控制。采用数字处理技术不仅使各种视频设备获得比模拟设备更高的技术性能,而且还具有模拟技术的全部新功能:视频监控技术将进入崭新的时代。,5.1.3 数字灰度图像,关于灰度图像的数字化,一般是利用Flash A/D变换器进行,而A/D变换设备一般为8位,产生256级灰度,足以保证灰度的层次。如图5-1所示。图5-1 数字灰度图像数字化的例子(1)观察图5-1,其中,灰度图像是指人类视觉对物体的亮度的反映(先用Flash
8、 A/D变换器来进行转换)。(2)图像分成栅格状,其中的每一个小格子代表一个位置确定像素。(3)通过光电亮度传感器,可以得到物体的灰度信号。Zf(x,y)式中,Z是光强信号;(x,y)是二维空间坐标。(4)还可以利用矩阵对灰度图像进行数字化,以更直观、科学。例如,一幅灰度图像被划分为以空间坐标(x,y)表示的NM个点,则灰度信号的数学表达式为,一幅黑白灰度图像,要对其进行数字化,步骤如下:用Flash A/D变换器对每个像素进行取样;将每个像素的取样值(如灰度级)以2的整数幂表示,即G2m。当m8,7,6,1时,其对应的灰度等级为256,128,64,2;Flash A/D变换器处理这些数据;
9、Flash A/D变换器将经处理后的数据存储在存储器中,使图像变为计算机可以操作的一系列数据。采用上述处理后,灰度图像除了可通过电子数据来描述外,还能通过电子数据来重建。,5.1.4 数字化彩色图像,众所周知,无论是视频模拟信号还是视频数字信号,对彩色图像的还原与记录,都是采用三基色原理。其彩色信号可以分解为R,G,B三个分量。例如,要记录和重建一幅彩色画面,就可以方便地用R,G,B三种传感器来进行,其中每个分量都可以采用和灰度图像相同的方式表示。实际上,对于人类的视觉特性来说,一幅彩色图像的亮度信息应该比色度信息丰富。因此,现行的电视系统都是把亮度信号和色度信号分开进行处理,并把调制后的色度
10、信号以频谱交错的方式置于亮度信号的频谱的高端,以亮/色信号混合的方式进行传输。而对于数字彩色视频信号,仍然遵循这一原则,即对亮度信号和色度信号分配以不同的比特率进行编码。,由R,G,B信号进行等自由度的可逆线性变换,就可得到构成彩色视频信号的亮度信号Y和两个色差信号RY及BY。其中,RY和BY经简单的幅度处理后分别用V和U表示,即有如下的变换式Y0.587G0.3114B0.3299RU0.331G0.500B0.169RV0.419G0.081B0.500R针对人类视觉的亮度灵敏度比色度灵敏度高的特点,亮度信号和色度信号在编码时分配以不同的比特。其中,亮度信号经较多的比特进行编码,而色度信号
11、则给以较少的比特。这也可以看作是对彩色数据的初始压缩。,5.1.5 数字视频信号的形成,模拟信号在时间、数值上是连续的,所以,从信息理论上分析,模拟信号包含了无限的信息数量。而数字化是采取保留所考虑的信号的某些代表值的方法,使信息内容减少到一种合理层次。具体从时间和幅度上采样两方面来解决这个问题。数字视频也包括这两方面的内容,即空间位置的离散、数字化及亮度电平值的离散、数字化。这就关系到生成数字化视频信号的过程,即扫描、采样、量化和编码。,1扫描过程,(1)逐行扫描逐行扫描有点像用眼睛阅读书籍,一行接一行地进行。逐行扫描将二维图像转换为一维电信号表示。为了将二维图像空间所覆盖面积上的每一个最小
12、单位面积都照顾到,扫描过程都是按从左到右、从上到下的顺序进行。进行扫描时,扫描头从图像的左上角开始沿水平方向移动到图像的右端,完成一个扫描行,然后再快速地返回到下行的开始点,开始第二个扫描行,依此继续,直到扫描完整个图像。绝大多数计算机显示器都是采用逐行扫描,其集合称为帧。由于扫描过程是连续的,因此逐行扫描得到的图像具有较高的清晰度。(2)隔行扫描现行电视系统大多数都采用隔行扫描,其方式为隔一行后再扫描下一行。隔行扫描行的集合称为场。由于一场扫描仅得到逐行扫描所对应的一半的扫描行,因此,一场图像的清晰度显然不如一帧图像的清晰度高,而随后下一场的扫描应该对本场刚刚没有扫描过的那些行来进行。这就涉
13、及到奇数场和偶数场的概念。一帧完整的图像应该由奇、偶两场组成,它们在时间上有一段延时,但在空间上却相互补充。,2采样过程,(1)采样采样是指以一个周期为T的窄脉冲流对模拟信号的幅度进行抽取,把时间上连续变化的模拟信号变成时间上的离散信号,包括取样和抽样两部分。此过程是在每一条水平扫描线上等间隔地抽取视频图像的属性值。(2)视频信号的属性对模拟视频信号进行数字化,关键是捕获包含在模拟信号中的有用信息,并去除冗余成分。为了正确进行模/数转换,就须认识数字化信号的属性,如带宽、信噪比、信号失真度和动态范围等。带宽说明给定时间周期内的模拟信号的最大可能变化,它决定了为保留信号的信息内容而必须在每个单位
14、时间的采样点数。动态范围和其他因素决定了保存信号振幅的精确程度。为了将模拟信号转换为数字信号,通常对模拟信号进行等时间间隔采样,而且每个采样的幅值都数量化,并分配给一个数字码字。,(3)采样频率的选取采样频率对数字系统非常重要。若采样频率取得过高,其数字化后的数据比特率就很高,会造成传输和存储速度缓慢;过低则会丢失信号的重要信息,除产生某些干扰信号外,分辨率也会下降。应用奈奎斯特采样定理采样,如图5-2所示。要保证采样的样值信号正确恢复其原始信号,采样频率fs就要达到信号最高频率fM的2倍以上。若采样频率fs2fM,则会出现混叠现象,将对视频图像信号本身产生干扰。要解决这个难题,在采样前,一般
15、要对有噪声的视频图像信号进行低通滤波。模拟信号被看作是一个连续的图像函数f(x,y),采样便是对图像函数f(x,y)的空间坐标(x,y)进行离散化处理。对这样一个函数,沿x方向以等间隔x采样,采样点数为M;沿y方向以等间隔y采样,采样点数为N:于是得到一个MN的离散样本阵列f(x,y)MN。,3量化过程,(1)量化的意义经采样后的视频图像,仍以空间上的离散像素阵列行式存在,对每个像素的亮度值而言,还是连续的,需要把它转换为有限个离散值,这个过程称为量化,如图5-3所示。若像素值等间隔分层量化,则称为均匀量化;若使用非等间隔进行分层量化,则称为非均匀量化。,(2)量化的实质,量化的实质是对每个像
16、素的灰度或颜色样本进行数字化处理,在样本幅值的动态范围内进行分层、取整,以正整数表示。如图5-4所示,采用有限个量化电平来代替无数个采样电平,使原来幅度连续变化的模拟信号变成一系列离散的量化电平值。为进一步显示信号幅值被数字化,在A/D转换器的输出端,模拟信号采样的瞬时值是由有限而且定长的二进制代码值表示的。转换到离散幅值时,可能引入舍入误差和量化噪声。,为了尽可能不失真地重现模拟信号,需合理选择量化电平。显然,将量化电平分得越细,其失真程度就越低,但数字化后的比特率也会成倍增加;如果选得太低,信号就会出现轮廓效应,并伴随有量化噪波。最佳量化的目标是使用最少的电平数实现最小量化误差。设计最佳量
17、化器的方法有两种。一种是客观的计算方法,根据量化误差的均方值为最小的原则,计算出判决电平和量化器输出的电平值;另一种是主观准则设计方法,根据人眼的视觉特性设计量化器。对二进制方式,其量化比特数一般取为8 bit,由于其量化电平数为256(28)个量化电平,基本上满足了人眼的视觉特性。因此,现在的数字视频领域已广泛采用8 bit量化。,4编码实质,码(coding)就是按照一定的规律,将量化后的值用数字表示,然后变换成二进制或其他进制的数字信号。通过采样、量化和二进制编码所形成的信号称为脉冲编码调制信号,如图5-5所示。对于一个模拟信号,若采用4个量化电平,编码就是对每一个量化电平分配一个二进制
18、码的过程。对于4个量化电平,通常用2 bit表示。如果这4个电平仅是256个量化电平中的一部分,那么就要用8 bit表示。图5-5 编码实质视频信号是一种有灰度层次的图像信号。视频信号数字编码的实质是:在保证一定质量的前提下,以最少的比特数来表示视频图像。对标量量化来说,对视频信号进行线性PCM编码,其信噪比与量化比特数的关系为:当像素的编码比特数每增加或减少1时,其信噪比约增加或减少6 dB。,图像压缩编码标准主要有ITUR601,MJPEG,MPEG,H.263,H.264等几种。,5.1.6 数字视频编码标准,1ITUR601标准,ITUR601标准在视频信号的数字化进程中起重要作用,见
19、表5-1。该标准采用分量编码,其中,亮度信号Y的采样频率为13.5 MHz,为525/60和625/50两系列三大现行电视制式行频公倍数(2.25 MHz)的6倍,而色度信号的采样频率则是亮度信号采样频率的一半,即RY和BY的采样频率都取为6.75 MHz(因人类视觉对彩色分辨率不敏感)。无论对哪种制式,每行的样值数都为720个,两个色差信号的样值数则各为360个,由此形成了720360360的采样结构,简记作422格式。由于图像处理技术的发展,对数字视频存储的需求越小越好,因而在近几年中,某些新型录像机又提出了采用420与411两种采样格式,用以进一步降低数字视频码率。由于420的采样结构是
20、对色差信号进行轮换采样,相当于降低了信号的时间分辨率,因此虽在水平方向上每两个亮度样点对应一个Cr/Cb 样点,但在垂直方向上则是每两个Y样点含一行Cr/Cb 样点。而411的采样格式,是将对色差信号的采样频率进一步降低到亮度信号采样频率的1/4,相当于进一步降低了色度信号的空间分辨率。在每个有效行内有720个亮度样点,只有180个色差样点。,2MJPEG标准,作为运动静止图像压缩技术,MJPEG是较早使用的一种图像压缩编码标准,它将运动的视频序列作为连续的静止图像来处理,可单独完整地压缩每一帧,在编辑过程中可随机存储每一帧,进行精确到帧的编辑。但MJPEG只对帧内空间冗余进行压缩,不对帧间的
21、时间冗余进行压缩,故压缩效率不高。,3MPEG标准,MPEG标准是指由ISO的活动图像专家组制定的一系列关于音/视频信号及多媒体信号的压缩与解压缩技术的标准。此标准又分成几种:1991年批准的MPEG1和MPEG3、1994年批准的MPEG2、1999年批准的MPEG4和MP4,以及正在制定的MPEG7和MEPG21。其中,MPEG1与MPEG2已经广泛应用于包括多媒体视频监控系统在内的各种数字视频领域中,MP4作为目前最新的数字视频标准之一(另外一种是H.264标准),也逐渐成为多媒体视频监控系统采用的主流数字视频标准。,(1)MPEG2标准,MPEG2作为现行大多数多媒体视频监控系统使用的
22、视频压缩标准,其基本框架如图5-6所示。MPEG2标准规定视频码流的层次化结构,以便更好地表示编码数据。MPEG2的视频码流共分为六层,见表5-2。表中层次从高至低依次为图像序列(Video Sequence)层、图像组(Group of Pictures)层、图像(Picture)层、宏块条(Slice)层、宏块(Macroblock)层、块(Block)层。MPEG2是MPEG1的扩充、丰富、改进与完善,MPEG2标准的视频数据位速率为415 Mbps,能提供720480(NTSC)或720576(PAL)分辨率的广播级质量的图像,可用于包括宽屏幕和HDTV在内的高质量电视广播。其主要特点
23、如下:,MPEG2解码器通常支持MPEG1和MPEG2两种标准;MPEG2的基本分辨率为720480,传输率为30帧/秒,并具有CD级音质;MPEG2有“按帧编码”和“按场编码”两种模式。在MPEG1中,没有定义电视帧,只支持逐行扫描,不支持隔行扫描。在MPEG2中,针对隔行扫描的常规电视中的电视图像,专门设置了“按帧编码”模式。与之相对应,运行补偿算法进行相应扩充,分为“按帧运动补偿”和“按场运动补偿”,因而编码效率显著提高;MPEG2允许在一定范围内改变压缩比,以便在画质、存储容量和带宽之间作出权衡,它可在301或更低的压缩比时提供广播级质量;MPEG2的压缩比高达2001,能够实现以30
24、帧/秒的速度播放全屏幕影像,实现压缩比依赖于节目内容及重放质量,运动及变化背景越多,压缩比就越低;MPEG2可对分辨率可变的视频信号进行压缩编码,预计传输率将为10 Mbps。,(2)MPEG4标准,MPEG4是MPEG专家组于1994年开始制定的新标准,编号为ISO/IEC 14496,其基本框架如图5-7所示。MPEG4的主要特点是提出了基于各种媒体对象的编码规范,因而更便于对象的描述与交互处理。同时,其视频编码部分也保留了在MPEG1和MPEG2标准中的一些解决方案,见表5-3,MPEG4基于内容图像编码简化的原理图如图5-8所示。MPEG4压缩标准由以下几方面构成。,多媒体传送整体框架
25、,多媒体传送整体框架(DMIF,The Delivery Multimedia Integration Framework),主要解决交互网络中、广播电视环境下的多媒体视频监控系统及DVR中多媒体应用的操作问题。通过传输多路合成比特信息来建立客户端和服务器端的交互和传输。通过DMIF、MPEG4可以建立具有特殊品质服务(QoS)的信道和面向每个基本流的带宽。,数据平面,MPEG4中的数据平面分为传输关系部分和媒体关系部分。为使基本流和AV对象在同一场景中出现,MPEG4引用了对象描述(OD)和流图桌面(SMT)的概念。OD传输与特殊AV对象相关的基本流的信息流图。桌面把每一个流与一个CAT(C
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 视频 监控 系统 课件
链接地址:https://www.31ppt.com/p-3787145.html