DVIP01数字图像基础.ppt
第01章 数字图像基础Foundation of DIP,门爱东教授,第1章 数字图像基础,人眼的构造视觉心理学视觉感知特性黑白视觉的数学模型二维空间频率与视频时间信号谱线性移不变滤波器傅里叶变换矩阵表示随机过程及其分类随机场的相关模型随机场的线性系统模型一阶因果模型图像的逼真度,2,1.1人眼的构造,眼睛的主要结构如图1.1所示。外面是一层较硬的膜,其前面一部分是透明的,称为角膜。后面大部分称为巩膜,起外壳作用。膜内是一个空室,称为前室。前室后面是虹膜,虹膜中间有一小孔,称为瞳孔,其直径可在2到8mm间变化,以调节进入眼睛的光通量。瞳孔后面是一个透镜式的水晶体,起透镜作用,把景象的光聚焦到视网膜上去成像。水晶体的后面是眼睛的内腔,称为后室,内有粘液,也起滤光作用,以保护眼睛。后壁则为视网膜,由大量的光敏细胞组成。,人眼的构造,光敏细胞可分为两类,一类是锥状细胞,另一类是杆状细胞。锥状细胞大约有一亿个以上。它们在视网膜上的分布是很不均匀的,在视网膜中央正对着瞳孔的一个不大的区域里,锥状细胞最多最密,没有杆状细胞,这一区域叫做黄斑。向外离开黄斑越远,视网膜上杆状细胞的数目越多,在接近边缘的地方,几乎都是杆状细胞了。锥状细胞除了能够区别明暗以外,还能辨别光的颜色,即不但能感光,也能感色。但是,杆状细胞却只能感光,不能感色。在亮光时,锥状细胞起作用,能看清彩色景象。,人眼的构造,在黄斑的中心部分,每个锥状细胞连接着一个神经末梢,因此分辨景象细节的能力强。在远离黄斑的网膜上,神经末梢分布较稀疏,锥状和杆状细胞群接合在一条神经上,所以这些视神经所传递的是这二种细胞群受光刺激后发出的平均电脉冲,故分辨能力差,但是感光灵敏度却高些。视神经在视网膜上汇聚到一点,通向大脑,此点无光敏细胞,称为盲点。视觉是主观对客观的反应,是一种主观感觉。视觉包括光感觉与色感觉,色感觉又有色调与色饱和度之分。色调即颜色的类别,色饱和度指某种颜色的浓度。,1.2视觉心理学 视觉感知特性,从视觉生理学(psychophysics)的角度,人眼的视觉系统可以被看成一个输入-输出系统,输入是视觉刺激(visual stimuli),输出是感觉。显然,视觉系统完全可以由这个“黑盒子”的传输函数来定义。光强的感知特性空间频率的感知特性时间的感知特性,光强的感知特性,定义1:在给定某个亮度环境下,人眼刚好能够区分的2个相邻区域的亮度差别的最小值,称为视觉阈(Visibility Threshold)。视觉阈值的大小与观察条件(例如周围环境的亮度、邻近区域亮度的变化等)有关。,考虑图1.2(a)所示情况,其中环境亮度为,图的中间有一个张角为、亮度为 的环,环内包围着一个亮度为 的小区域。调节的 大小使其刚好能被察觉到与 有所不同,则 为视觉阈,或者称为临界对比度。它与背景亮度和环境亮度,以及背景和环境的尺寸大小有关。如图1.2(b)所示。在 的情况下,视觉阈 几乎随 线性增长,即 为常数,这就是韦伯定律(Webers law)。,根据韦伯定律,(1.1)所以(1.2)(1.2)表明人眼对光的主观视觉增量与客观亮度的对数增长成线性关系,即,如图1.3中直线部分所示。,图1.3是实验获得的人眼对不同亮度的主观亮度感觉级数曲线。曲线中间有折断点,表示两种细胞的感觉不一样。亮度低时杆状细胞起作用。亮度高时锥状细胞起作用,在某些亮度时二者同时起作用。每一种细胞的感觉曲线的中间部分都近于直线,这表示感觉差一级时,亮度的差 并不是常数,而 是常数。也就是说,当亮度大时,二者的差别 也要大才能感觉到亮度的差别。但在亮度很大或很小时,则与每一感觉级相对应的 要更大一些,示如曲线两端的弯曲部分。,定义2:眼睛所能感觉到的亮度级差(1.3)称为对比度阈,常称韦伯比(Weber Ratio)。韦伯比表示相对某一亮度能引起亮度感觉差别所必需的最小相对亮度变化。在对视频信号的亮度分量进行PCM数/模转换时,通常就是根据上述的视觉阈效应来选择合适的量化级数。,另一方面,图1.3的亮度感觉曲线还表明人眼的视觉范围是非常宽阔的,它能感觉亮度低至千分之几cd/m2的光,也能感受亮度高至百万cd/m2的光,差别达 这样大的视觉范围是由于眼睛有适应性。这是人眼适应性的第一种表现 在实际条件下观看某一景象时,眼睛已适应于景象的某一平均亮度,也就是说已调节到某一平均灵敏度,这时视觉范围就小多了。这是人眼适应性的第二种表现,它说明人眼是绝不可能同时观看图1.3所示那么大的视觉范围的.,实验证明,在平均亮度一定时,人眼能观察到亮度差别(即景象层次)的范围如图1.4中虚线所示,图中按不同的平均亮度给出了相应的范围。可见,当平均亮度 为一定值时,大约在它周围 的范围内,对比度阈保持在比较小的数值,人眼有区别亮度层次的能力。图1.4的曲线还表明,由于人眼的适应性,对于明暗的感觉是相对的,同一个亮度,在某种平均亮度下可能给人以白的感觉,但在更高的平均亮度下却可能给人以黑的感觉。因此,对于一副景象,重要的是体现其相对的明暗层次。利用这一原理,电视实现了比自然景象亮度范围小得多的景象视觉。,空间频率的感知特性,空间频率是指单位视角()内所含黑或白的条纹数,单位是线/度。假设人眼的视觉系统是一个线性系统,如果已知该系统的冲击响应或者传输函数,则可以计算出给定背景亮度下的视觉阈值。如果用不随时间变化的空间正弦光栅作为人眼的测试信号,即(1.4)则可以得到视觉阈随空间频率变化的函数。例如图1.5所示的曲线是在背景亮度为500cd/m2的条件下得到的。这个函数被称为对比度灵敏度函数(Contrast Sensitivity Function)。它具有特定的形状,空间频率在3-4.5 Cycles/degree时有最大值,即最小对比度阈。,值得说明的是,图1.5实际上不是视觉阈对空间频率的函数,而是对比度灵敏度对空间频率的函数。对比度灵敏度的定义是,平均背景亮度 与测试信号达到视觉阈时的调制电平 的比;或者说是对比度阈 的倒数。在(1.4)式中,是背景亮度,是正弦光栅的空间频率,是空间频率偏离纵轴的角度,是调制电平,是时间频率。对于给定的,通过调整 得到在、和 的各种取值情况下的视觉阈。图1.6(a)给出一种测试光栅图样,图1.6(b)是前人的各种实验得出的对比度灵敏度函数曲线。可得到如下结论:,(1)给定光栅的 和,视觉阈主要取决于调制深度,而不单单取决于背景亮度 或调制电平。(2)对比度灵敏度,即达到视觉阈时 的值,随着空间频率 从低频到中频近似线性地增大,并在中频区段取得最大值。从图1.6(b)可见,在空间频率的方向上,人眼对亮度的作用相当于一个带通或低通滤波器(3)对比度灵敏度还与光栅的角度 有关。它在垂直或水平光栅时取得最大值,随着光栅偏离水平或垂直轴而减小,在 角时大约减小3dB。(4)图1.7给出了视觉对彩色变化的频率响应。由图可见,人眼对亮度的空间分辩力明显地比对色度的空间分辨力要高。因此,在图像及视频传输时就可以使用较少的比特数来传输色度信号,以达到压缩数据量、节省带宽资源的目的。,视觉的空间掩蔽(spatial masking)效应也发生在空间频域。实验发现,背景亮度变化(不均匀性)剧烈时,对比度灵敏度就会下降,即视觉阈增大。这被称为空间掩蔽效应。图1.8、1.9给出了典型的实验结果。在该试验中,一条很细的垂直光线出现在有一条垂直亮度边界的背景的不同位置上,这条光线在不同位置上的视觉门限(即光线刚好能被识别时的亮度值)曲线如图1.8所示。,关于空间掩蔽效应,一些相关实验得出的几点重要结论如下:(1)在接近边界的两边,光线的视觉阈增大。(2)在对比度 较小的边界附近,掩蔽效应也较弱。(3)从图1.9可以看出掩蔽效应是一种非常局部化的效应,仅出现在背景亮度剧烈变化的边界附近很窄的区域上。(4)若背景掩蔽边缘出现的时间很短,则视觉阈不会有明显的提高。例如无意识的眼运动就是这种情况。现代压缩编码中无例外的都利用了人眼的视觉掩蔽效应。例如,使用不均匀量化步长(step size)的DPCM量化就是依赖于亮度的空间变化对误差的掩蔽。又如,对噪声的主观感受受图像内容的影响,在图像亮度跳变边沿处,视觉阈增高。即此处噪声的可见度降低。在图像大面积处(亮度变化缓慢),视觉阈降低,即对噪声敏感。,需要强调的是,不应把空间掩蔽效应与马赫效应(Mach effect)混淆。马赫效应指的是在边界处感知到的亮度的变化,如图1.10所示,在较亮的一侧亮度明显地增大,而在较暗的一侧亮度明显地减小。因此,感知到的对比度增大,亮的一侧更亮,暗的一侧更暗。通常认为,人眼的横向抑制(lateral inhibition)作用是导致马赫效应的主要原因。,时间的感知特性,视觉系统的时域特性研究的是外界亮度以不同的时间频率进行变化时,人眼的视觉敏感度。时域中的视觉阈值对于帧间编码技术十分重要。其中一个重要的时域视觉阈值就是临界闪烁频率(Critical Flicker Fusion Frequency)。如果让观察者观察按时间重复的亮度脉冲,当脉冲重复频率不够高时,人眼就有一亮一暗的感觉,称之为闪烁(Flicker)。如果重复频率足够高,闪烁感觉消失,看到的则是一个恒定的亮点。闪烁感刚好消失时的频率称为临界闪烁频率。临界闪烁频率在图像与视频处理中应用的非常广泛,视频采集和显示设备的帧率必须大于临界闪烁频率,以避免人眼觉察到闪烁现象。,1.3黑白视觉的数学模型,光线进入人眼首先要经过由角膜、晶状体组成的前端光学系统,其功能相当于一个二维低通光学镜头,系统函数为。在电磁波谱范围内,分布在约380780nm波长范围的电磁波可以被人类视觉感知,称为可见光。人眼对不同波长光的敏感程度并不相同,该特性用视觉系统的相对光效率函数 描述,如图1.12所示。来自光分布函数为 的空间物体的光经过人眼空间响应之后的输出空间分布函数为:(1.5),接下来,杆状细胞和锥状细胞的作用是使人眼对亮度的对比度进行分辨而不是亮度本身,用非线性函数 表示,输出为对比度。最后视觉细胞中的横向抑制效应可用空间频率相应为 的空不变(spatially invariant)的、各向同性的、线性系统来表示,输出是神经信号,即人眼感受到的主观亮度。人眼的黑白系统的总体模型如图1.13所示:,1.4二维空间频率与视频时间信号谱,二维空间频率,数字图像是分布在二维空间的样值阵列,因此需要研究其二维空间频率。以下我们通过几个二维空间信号的例子来直观的了解二维空间频率的概念,视频时间信号及频谱,1、二维取样的定义 视频信号通常在摄像机的输出端,通过扫描二维的运动场景,并将其转化为一维的电信号来产生。运动场景是一组图片或图像,每幅被扫描的图像生成一帧视频信号。扫描从图像的左上开始,到右下结束,如图1.16所示。恒速扫描定义为从左至右的扫描速率为,从上至下的扫描速率为,即:(1.7)(1.8)其中,H是行周期,F是帧周期;a、b分别是图像宽度和高度。,线性恒速扫描等效为将图像在x方向及y方向上无限重复地取样,从而将二维图形变为一维时间信号。图1.17是逐行扫描和隔行扫描。,2、频谱分析,1.5、线性移不变滤波器,用 表示,线性系统,移不变系统,线性移不变(LSI)系统,离散卷积的直接运算,1.6 傅立叶变换,二维离散图像信号的付氏变换及其特性 离散信号的展开,二维离散图像信号的付氏变换及其特性,二维离散图像信号的付氏变换和反变换如下:(1.19a)(1.19b)其中,m、n为空间坐标,k、l为空间频率。k、l的单位是m、n的单位的倒数。,二维离散图像信号的付氏变换及其特性,下面介绍二维离散图像信号的付氏变换的一些特性。(1)空间频率 在节已讲述二维连续空间信号的空间频率的概念。对于二维离散的亮度信号,空间频率就是空间单位距离内亮度的变化数,有时用cycles/degree(观察角)来表示。(2)可分离性 从式(1.19a)可知,付氏变换的基核是可分离的,即可以对m和n分别作变换:,二维离散图像信号的付氏变换及其特性,(3)传输函数及特征函数(特征矢量)特征函数的定义:用特征函数做输入,则输出等于此输入函数乘传输函数(它是频率的函数,即传输函数)。容易证明,是满足以上定义的特征函数。,二维离散图像信号的付氏变换及其特性,(4)两函数卷积等于两函数付氏变换之积。若 则,(5)能量保持 若 是 的傅立叶变换,则。(6)由付氏变换的相位函数恢复原图像 若是的傅立叶变换,则用相位幅度的形式表示为:,二维离散图像信号的付氏变换及其特性,从相位恢复的信号为:从幅度恢复的信号为:其中,是傅立叶反变换运算符。实践表明,比 更像原始图像。,1.6.2 离散信号的展开,用基函数作信号的展开,可实现各种正交变换(付氏变换及小波变换),进一步易于用滤波器组(filter bank)实现。离散信号展开的原理:是平方可积序列,则在平方可积空间 中 可正交展开为:其中,是 的变换。基函数 满足正交条件:,离散信号的展开,正交展开的一个重要特性是能量保持:(1.22),离散信号的展开,作为数字图像处理中常用的工具,我们在这里考察傅立叶变换的离散性和周期性在时域与变换域中的对应关系。根据不同的组合列表如下:,傅立叶变换,(1)傅氏级数 给定平方可积周期函数,其周期为T,即,则它可表示为频率为 的复指数函数的线性组合:(1.23a)其中,(1.23b),傅立叶变换,(2)傅氏变换 给定绝对可积函数,它的傅氏变换:(1.24a)其反变换:(1.24b),傅立叶变换,(3)离散时间傅氏变换 给定序列 为平方可积的,其基函数为,(1.25a)它以 为周期,其逆变换为:(1.25b),傅立叶变换,(4)离散时间傅氏级数 若离散时间序列是周期为N的信号,即,基函数为,则 的离散时间傅氏级数表示为:(1.26a)其中,(1.26b)(1.27),傅立叶变换,此时两卷积为周期卷积 其中 和 等于 和 的一个周期。即。以上四种傅氏变换/级数的时域和频域波形示意图如图所示。,傅立叶变换,傅立叶变换,(5)离散傅氏变换 有限长的离散时间序列 的傅氏变换叫离散傅氏变换(DFT),可实现FFT,基函数为,则 的离散傅氏变换为(1.29a)逆变换(1.29b)其中。,1.7 矩阵表示,1.7.1 二维图像的矩阵向量表示1.7.2 卷积的矩阵向量积表示1.7.3 图像在计算机中的表示及处理,1.7.1 二维图像的矩阵向量表示,将二维图像写成向量形式,便于利用一维信号处理方法。二维图像的坐标表示到矩阵表示的映射如图1.23所示。,1.7.1 二维图像的矩阵向量表示,二维图像的行列矩阵表示为:,1.7.1 二维图像的矩阵向量表示,用列(或行)向量 表示。,1.7.2 卷积的矩阵向量积表示,用矩阵向量表示卷积,如图1.24所示。由扫描矩阵 得到,由扫描 得到。卷积的矩阵向量表示为:(1.30)其中 是 维的矩阵。与系统的冲击响应有关,关系在后页分析。,1.7.2 卷积的矩阵向量积表示,(1)一维的情况 若 与 长度不同,分别为 和,即 用补零的方法将它们变为长度。于是有线性卷积:(1.31),1.7.2 卷积的矩阵向量积表示,写为矩阵形式:或者,(1.32)其中,的构成元素 取决于,满足(1.33)这就是Toeplitz矩阵。,1.7.2 卷积的矩阵向量积表示,对于因果系统有,所以为实现快速算法,在 NM1+M2-1时,可用循环卷积来计算该线性卷积。长为N的两个序列 和 的循环卷积为,1.7.2 卷积的矩阵向量积表示,式中 表示整数模的最小非负余,例如图1.25所示。用矩阵表示为:或者,其中,矩阵 既是Toeplitz矩阵,也是循环矩阵。,1.7.2 卷积的矩阵向量积表示,(2)二维情况 设 大小为,大小为,将它们都变成大小为 的延伸图像,如图1.26所示,方法是在上述序列中加零:(1.36)(1.37)其中,,1.7.2 卷积的矩阵向量积表示,则循环卷积为(1.38),1.7.2 卷积的矩阵向量积表示,将一维的结论直接用在二维上,有:或者,即,其中、为列矢量,每个列矢量含M个像元。由 个子块 组成,每一子块 是 维的矩阵,由 的第 j 列构成的循环矩阵。,1.7.3 图像在计算机中的表示及处理,如前所述,数字图像可以很方便的使用矩阵 形式表示,这就给图像在计算机中的表示及处理带来了方便。设矩阵中的元素代表 8 bit 数字图像中的象素,取值范围为 0 至 255 之间的整数。因此该元素可使用 C 语言中的符号类型或浮点数类型来表示:,1.7.3 图像在计算机中的表示及处理,实际应用中,图像的大小往往是预先不知道的,同时,M、N 是不能作为声明变量来在函数间传递的。这样,指针就成为解决这一问题的最好方法。数组可以使用内存分配进程 malloc 动态生成:unsigned char*a;a=(unsigned char*)malloc(N*size of(unsigned char);类似的,声明浮点类型一维数组。,1.7.3 图像在计算机中的表示及处理,二维数组可以被看作一维数组的数组,即:指针*a 指向指针数组*a0,*a1,.,*aM-1,其中每一元素又指向图像的每一行。基本数字图像处理包括图像加、减和数乘:(1.41),1.7.3 图像在计算机中的表示及处理,使用计算机进行处理时,上述运算应注意输出图像的上下溢出问题。如果上溢出发生,对应象素为白背景下的黑色;如果下溢出发生,对应象素为黑背景下的白色。实际应用中,上下溢出应避免,这可以通过限幅处理来实现。图像的非线性变换用于大量的应用中,其用式(1.42)表示:(1.42)使用 C 语言进行处理时,常用到的操作是比较与缓冲器(Buffer)拷贝。,1.7.3 图像在计算机中的表示及处理,限幅(Clipping):旋转(Rotation):其中 分别为图像旋转前后的坐标值。由式(1.44)可知,旋转之后的图像可表示为:通过缓存器(Buffer)映射,即可实现上述变换过程。,1.8 随机过程及其分类,1.8.1 一维随机过程1.8.2 二维随机过程随机场1.8.3 随机过程的统计特性1.8.4 用矩阵表示的统计特性:随机过程的分类,1.8.1 一维随机过程,大致地说,一个随机过程就是一系列具有概率测度的时间函数。对于有限结果样本空间,随机过程可以看作是样本空间到时间波形空间的一个映射,如图1.27所示。,1.8.1 一维随机过程,一个随机过程也可以被看作是,给定概率为 的结果样本,则时间波形 出现,如图1.28所示。这n个时间信号代表时间波形的整体。如果在 时刻观察这些时间波形,则得到右边第二列值。从上向下,得到从最左端的结果样本到该列对应数值的一个映射,该映射描述了一个特定的随机变量。同理,从结果样本到最后一列的映射描述了 时刻的随机变量。值得注意的是,随机过程 是具有两个变量 和 的函数,其中 是时间变量,是结果样本变量。,1.8.1 一维随机过程,对于给定时刻,是一个随机变量,因为它是样本空间的函数。若给定结果样本,则 是一个特定的时间函数,称为一个样本函数,或者称为随机过程的一个实现。若同时给定 和,则 对于实随机过程就是一个实数,对于复随机过程就是一个复数。,1.8.2 二维随机过程随机场,数字图像的象素点分布在二维平面上,因此我们可以将其看作是二维的随机过程。下面来看一种最简单的由黑白两个亮度电平构成的数字图像:表示位于点 上的图像象素的亮度。表示随时间变化的二维序列,该序列是各种可能的图像集合 中的一个实现。如图1.29所示。,1.8.2 二维随机过程随机场,由以上分析可见:对于一维情况,是一个随机过程,随机变量 是随时间变化的;在二维情况下,是一个随机场,随机变 量 是在空间两个方向上分布的,给定 平面上n个点,有n个随机变量,进一步推广到活动图像序列的情况,图像单元 可看成三维随机序列或随机场 的一个样值,其中是t时间参量。这是在三个方向上变化的随机变 量 的一种表述法。,1.8.3 随机过程的统计特性,对于不能精确表述的信号的波形,采用随机信号表述是一种基本的方法。我们知道,随机变量的常用统计特性包括均值、方差、阶矩等。类似地,随机过程的重要统计特性也包括均值、方差和阶矩,但通常都是时间的函数。对于随机过程,还必须定义一些新的特性,包括n阶密度、自相关函数和谱密度,这些特性对于随机过程的分析很有帮助。由前面已知,对于每个 t,是一个随机变量。因此,一个随机过程给出了可列无限或无限多个随机变量。如果对于所有时刻 和所有的n,随机变量 的联合密度都已知,那么就说这个随机过程被完全地定义,或者说被完整地描述。一般而言,完整的统计特性只在极少数情况下需要,而且这种特性是不可实现的。因此,定义并使用部分特性是很实用的。,1.8.3 随机过程的统计特性,对于离散随机过程,给定时刻n,则 是随机变量。其统计特性如下:概率分布函数:。其意义是,若随机变量 是实数,则对于全部实参变量x,事件 的概率是确定的。概率密度函数(pdf):是分布函数的导数,即(1.46)不同时刻的概率密度不一定相同。若该统计特性与时间无关(即平稳过程),则所有时刻的概率密度都相同,可省去时间参量,记为,1.8.3 随机过程的统计特性,均值:(1.47)则对于一切n,离散随机过程的均值 是时间的函数。当 的均值与时间无关时,是一个常量。方差:(1.48)自相关函数(acf):给定两个随机变量 和,相关性 是二者间线性关系的量度。和 可以取所有可能的值,这个相关性是 和 的函数。因此,实随机过程的自相关函数是时间参量 和 的二维函数,定义为,1.8.3 随机过程的统计特性,因为,所以 关于 和 对称,即(1.50)在稍后将要说明的广义平稳的情况下,自相关函数只与时间差 有关。在这种情况下,定义一维自相关函数 为(1.51)因为 可以和 交换位置,所以 是 的偶函数,可以写作=(1.52),1.8.3 随机过程的统计特性,自协方差函数:(1.56)如果把 标准化,得到标准自协方差函数,定义为(1.57)复随机过程的自协方差函数 定义为,1.8.3 随机过程的统计特性,把 标准化得到标准自协方差函数(1.59)有一类十分重要的随机过程是平稳随机过程,它的统计特性与时间的起点无关,即:即所有矩函数都独立于 n。同样地,自相关和自协方差函数也仅取决于时间差:,1.8.3 随机过程的统计特性,对于阶平稳过程,当时叫广义平稳过程。而当随机信号在所有时刻的联合概率密度函数对于所有移动都保持不变时,称该随机信号为严格平稳。严格平稳的随机过程必然是广义平稳的,但反之并不一定成立。只有对于高斯分布的随机过程,严格平稳与广义平稳是等价的。对于平稳随机过程还有一个重要的统计特性:功率谱密度函数(psdf):是自相关函数的傅立叶变换。这个公式大致地描述了平稳随机过程的功率在频率域中的分布情况。,1.8.3 随机过程的统计特性,对于实平稳随机过程,是实偶函数,所以自相关函数可改写为:平均功率,1.8.3 随机过程的统计特性,下面研究系统对功率谱密度的频率响应。考虑冲击响应为、传输函数为 的线性移不变系统,设系统输入是广义平稳随机过程,则输出的随机过程 有:由于 的均值为常数,且其自相关函数只依赖于时移n,所以广义平稳过程 经过线性移不变系统后输出 也是广义平稳的。,1.8.4 用矩阵表示的统计特性:,对于由维的随机变量 构成的随机矢量,可以定义用矩阵表示的统计特性如下:均值 协方差 其中,分别称为随机变量 的均值矢量和协方差矩阵。,1.8.5 随机过程的分类,给定平面上个点,对应地有个随机变量 这些随机变量的联合概率密度函数为:。对数字图像而言,随机变量数非常大。因此,测量一个实际的联合概率密度函数是非常困难的。而对于以下几种特殊的随机过程,情况可以大大简化。平稳随机过程 高斯随机过程 白噪声过程 周期随机过程(periodic random processes)Markov 过程(相关过程),平稳随机过程,热噪声就是一种平稳随机过程,它的物理参量不随时间改变,结果样本的概率密度函数也不随时间变化,即对于随机序列,若它的部分序列 的联合概率密度函数和时移后序列 相等,则它的均值与自相关函数是时不变的确定量。在弱平稳意义下的随机过程又叫作广义平稳。广义平稳的条件是:即相关性,只与时间差有关。因此平稳过程的相关函数可用 表示:,平稳随机过程,得到 的相关矩阵:它是Toeplitz矩阵。的协方差为即,协方差也只与时间差有关。得到平稳过程的协方差矩阵:它也是Toeplitz矩阵。实际上,平稳序列协方差矩阵和自相关矩阵都是Toeplitz矩阵;反之,若序列的协方差矩阵和自相关矩阵是Toeplitz矩阵,则序列是平稳的。,平稳随机过程,因为当均值为零时,自相关矩阵等于协方差矩阵:其中,。具体地,高斯随机过程,若一个随机矢量 为有限子序列,且其联合概率密度函数是高斯分布,则称其为高斯随机过程。高斯序列的联合概率密度函数是:其中 是 的协方差矩阵。高斯随机过程具有一些特殊性质,下面列出其中比较重要的三条:(1)若高斯过程是广义平稳的,则它必定也是严格平稳的(2)高斯随机过程在任意时间段内的积分也是服从高斯分布的随机变量,对不同时间段积分所得的不同高斯变量之间服从联合高斯分布(3)高斯随机过程在(),上积分所得的随机过程仍是高斯过程高斯随机过程具有如下统计特性:均值=常数协方差,白噪声过程,为简化分析,定义一种白噪声过程,之所以称其为白噪声过程是因为该过程的谱密度在整个频率范围内都是一个确定的常数。由于它在所有瞬时的信号都是独立的,则其中任意瞬时的信号值也是独立的,可知在所有瞬时的概率密度函数相等。因此很显然,这种信号是平稳信号。其功率谱密度函数和自相关函数分别定义为:,白噪声过程,图1.30示出了白噪声过程的自相关函数和功率谱密度函数若白噪声过程的概率密度为高斯分布,则称为高斯白噪声或正态白噪声。,周期随机过程,广义平稳随机过程,若其自相关函数是周期的,则叫周期随机过程。例如随机正弦过程,若A、为独立随机变量,有确定概率密度函数,其自相关函数 因其自相关函数是周期的,把它叫做周期随机过程。同样的形式,由其付氏级数表示的随机过程 它有独立的零均值幅度随机变量 和。可以证明,它的自相关函数是周期性,因此它也是周期随机过程。,Markov 过程,若一个随机过程的条件概率函数具有下列特性:则称该随机过程为一阶Markov序列。由上式可见,设 为现在时刻,为过去时刻,在给定所有过去随机变量的条件下,的条件概率取决于给定条件下 的条件概率。高斯过程也是Markov过程。例7:一阶平稳Markov序列的协方差函数为:它常用做黑白图像扫描行的协方差模型。对于 矢量,它的协方差矩阵是:该矩阵为Toeplitz矩阵。,1.9 随机场的相关模型,用随机模型表示图像,有两种方法:协方差模型和线性系统模型。本节讲述协方差模型。该模型常用在图像编码和图像恢复问题中。线性模型留在下一节讨论。平稳随机场中各点的均值与空间坐标无关,即设,自协方差平移不变,它可写成一个依赖两个变量的函数:(1.98)其中,下角标 代表水平方向,代表垂直方向。满足上述条件的平稳随机场的相关模型有两种:可分离模型和不可分离模型。对于平稳图像场,均值为常数,协方差函数可以采用可分或不可分的指数模型。可分模型在图像处理中易于进行分析;不可分模型的协方差模型更好,但不易分析。,可分离模型,对于一阶平稳Markov模型:,其中 是图像水平与垂直方向上的空间位移,为相关量。令,代入式(1.98)得,。若,则上式为:,归一化相关系数得到对角线相关系数 相邻小象素之间的相关系数。如图1.31所示。,各向同性模型,,它有旋转对称特性,称为各向同性特性,它不可分离。用水平和垂直间隔的空间坐标 表示。令,则:。归一化的相邻象素间的相关系数为 其对角相邻象素间的相关系数为。具体实验表明,大多数图像的 和 接近 0.95。对于一幅象素的黑白图像,实验结果如图1.32所示。由上图可见,水平与垂直方向上,自相关函数都以相似速率随 增加而衰减,但给定,细节少图像与细节多图像的自相关函数有显著差异。,1.10 随机场的线性系统模型,随机过程除前面讲的协方差模型外,还可由一阶因果模型表示,如图1.33所示。类型包括:AR 过程自回归过程,用IIR滤波器实现;MA 过程滑动平均过程,用FIR滤波器实现;ARMA 过程自回归滑动平均过程。,1.10 随机场的线性系统模型,给定频谱密度,利用谱分解技术以得到因果的最小时延传输函数。具体地,输入是零均值单位方差、具有高斯分布的随机变量,通过滤波器,产生输出序列要求的的谱密度。系统传输函数为令,输出随机过程具有如下的递归形式:其中,第一部分和式是AR模型,第二部分和式是MA模型,线性均方估值的正交原理,设 为随机变量,均值为零。线性预测估值是用过去的值预测现在的值,即其中,是线性预测系数。预测误差表示为:定义均方误差为,我们要研究的问题是如何求 使 最小?根据拉格朗日极值定理,将 对 求偏导,并令其等于0,则得到:即 与所有随机变量 统计上正交。或者记为:,自回归AR模型(Auto Regressive),简单表征图像是把它考虑为光栅扫描器输出的一维信号,是行或列的序列信号。若行间(或列间)互不相关,则可用一维线性系统来模拟这样的信号。令 是实的平稳随机序列,其均值为零,协方差为,它是线性移不变系统的输出,其输入为平稳零均值白噪声序列,于是它的谱密度函数SDF为:其中 是 的SDF。对其进行解析开拓:和 有一个根(极点)在单位圆内,必有一个根在单位圆外。线性移不变系统,极点在单位圆内,满足因果稳定条件,则:用IIR滤波的实现有:,一切极点均在单位圆内,自回归AR模型(二),当系统输出零均值的随机序列 时,叫做 阶AR(自回归)过程。如图1.34所示,其数学描述如下:其中 是平稳零均值序列,它与过去的输出无关。上式的意义为:通过最近 个输出和现在的输入递归产生下一个输出。,自回归AR模型(三),AR模型具有如下特性:(1)最佳线性均方预测器的值它是基于所有 个过去 样值的结果。对于高斯白噪声序列,它意味着 阶AR序列是Markov-p过程,则:时刻 的样值是“最小方差因果预测估值+预测误差”,因此AR模型也被叫做因果最小方差表示。(2)因果滤波器被叫做预测误差滤波,如图1.35所示。,自回归AR模型(四),此滤波器由序列 产生预测误差序列,预测误差序列是白的:因此,又叫做 的白滤波。除去在 处可能取零,AR过程的传输函数 和谱密度函数是全极点模型。(3)观察系统的传输函数有则AR模型的SDF为:(4)对 于均值为 的序列,如图1.36所示,AR模型可作如下修正,自回归AR模型(五),令又替换得到:修正后的模型的统计特性为:下面的问题是如何确定AR模型的线性预测系数 及。其中,。方程中 及 是未知量,而随机过程的协方差函数 已知或可通过测量得到。,自回归AR模型(六),对上式 和 两种情况展开,得到下列矩阵方程:其中 是Toeplitz矩阵,若 是正定矩阵,则AR模型保证稳定。,自回归AR模型(七),例8:图像扫描行光栅的协方差可由任一行两象素间的协方差决定。将二维可分(或不可分)自相关模型简化为一维模型有:。为满足2阶AR模型,求解下式:上式共包括三个方程三个未知数,求解得:AR模型:对于像素均值为 的图像扫描行,相应的表示是一阶AR模型,设 为0均值 有,AR模型的应用,(1)预测编码AR模型的预测特性可用于图像编码。假定AR序列 的每个象素用Bbit表示,其差值序列,是 的预测值。由于 解除了相关性,熵值比 要小,因此可用比特要求更小。由此实现了图像的压缩编码。(2)图像的半递归表示变换图像的每一行,用独立的AR模型表示:,其中 最佳的情况为 K-L变换,但是从运算量的角度出发,常用的是DCT变换(有快速算法)。不相关,p=1 或 2。,滑动平均MA模型(Moving Average),随机序列 被表示为不相关随机变量加权平均和(白噪声加权和),叫做 q 阶滑动平均过程,如图1.37所示。输出随机序列为其中输入和输出的谱密度函数分别为:传输函数为:它具有最小相位解,零点在单位圆内。,滑动平均MA模型(二),MA模型的自相关函数和谱密度的关系为其中自相关在 外为0,可由 阶MA滤波器 来产生,此时 是FIR滤波器,是全零点模型。MA过程是广义平稳的,其均值为零,自相关仅与时间差有关。,滑动平均MA模型(三),例9:1阶MA过程则:得到 的协方差序列为:对于MA(2)过程,可得由以上式子可以求解,自回归滑动平均过程(ARMA),当AR模型的输入是MA序列时:其中 是零均值方差为 的白序列,ARMA模型的传输函数和谱密度函数(SDF)分别为:当 q=0 时为p阶AR模型,p=0 时它是q阶MA模型。,1.11 图像的逼真度(一),虽然图像处理的质量最终应由人进行主观评价,但是在实际工作中,还是有必要定义能反映处理后图像与原始图像之间相近程度的客观测量准则。在图1.39所示的图像处理系统中,目前常用的测度方法是计算处理前后图像之间的均方误差,其值越小说明失真程度越小。对于行列数为 的数字图像,差值图像方差为:或其中,为原始图像方差。易知,值越大失真程度越小。,图像的逼真度(二),在实际应用中,我们常常用原图像最大强度值(峰值)的平方来代替原始图像方差,得到:通常 比 大1215dB。但是这种客观评价方法有其局限性:由于误差 是功率的平均,因此它不能完全地反映主观感觉。例如,在图像出现窄的水平亮条干扰时,虽然图像的 高,但主观感觉差;又如,在图像传输处理过程中出现的小错误,虽然它不会对 值产生大的影响,但如果其位置恰好处在图像理解的关键位置,由于人类视觉系统对关键信息的改变非常敏感,因此会大大影像主观质量的评价。尽管有以上缺点,但由于均方误差和信噪比在数学上容易处理,另外也缺少性价比更好的替代方法,因此上述方法在图像处理的客观失真测量方面仍得到了大量的应用。,谢谢!,