研究生学位论文选题报告.ppt
研究生学位论文选题报告及论文工作实施计划,重庆大学研究生院2003年12 月9 日,学 院:数 理 学 院 专 业:应 用 数 学 研 究 生:杨 静 学位级别:硕 士 指导教师:何 传 江 入学年月:2002年9月,说 明,一、论文选题报告由研究生向教研(研究)室汇报并听取意见后,整理成文填写。二、研究生应在入学后的第三学期内完成选题报告。三、本表一式三份,一份交学院,指导教师和研究生各存一份。研究生自存表应于答辩前交学院,作为答辩申报材料之一。,一、论文选题报告(申请时间:2003 年12月9 日),报告内容:(课题学术和实用意义,国内外现状综述;研究目的、内容、技术路线;可行性论证等),现代多媒体应用和通信技术的发展,提出了大量存贮和传输各种静态图像和动态图像的问题,高质量传输和存贮图像的一种途径是把连续的图像信息离散化形成数字化图像。一幅图像的各象素之间存在很大的相关性,因此,可以利用一些编码的方法删去相关性达到减少冗余的目的,使其数据量大大小于原始的图像的数据量,接着对压缩后的图像进行存贮或传输。如何用尽可能少的数据来尽可能不失真地表示图像已成为这些应用的关键,这就是图像压缩编码问题。自1948年Oliver提出PCM编码理论开始,图像压缩技术走过了50余年的历史。许多压缩方法(如DPCM、DCT、VQ等)被提出,并得到较为广泛的实际应用。目前还有了基于DCT 等的国际压缩标准(如JPEG,MPEG等)。然而,随着这些传统编码方法的深入应用,人们逐渐发现了它们的许多缺点(比如高压缩比时图像出现的严重方块效应,压缩算法不易反映人的视觉系统特性等等)。为克服传统压缩方法中的上述缺点,人们不断探索新的图像编码方法。分形图像编码就是在这样的背景下产生的,它被认为是第二代图像压缩编码技术的三大方法之一。分形图像编码是一个新颖的迭代解码压缩技术。自1990年初Jacquin提出实用的分形块编码(fractal block coding)以来,短短十余年间,分形图像编码的研究取得了长足的进展。,一、图像压缩编码方法 图像压缩编码可分为无失真编码和限失真编码。为了进一步提高图像编码的压缩比,除了利用图像中象素之间的相关性外,还必须充分利用人的视觉系统对图像灰度灵敏度的差异,因此,限失真编码便成了压缩图像的常用方法。(1)变换编码:在变换编码中,进行图像编码的一项重要工作就是寻求一种正交变换,图像数据经这种变换后,可以用一组解除了相关性的数据(变换系数)代替对于大多数自然图像,变换得到的系数值大都很小。如果把这些系数按其含有图像信息及其对图像主观质量影响的重要程度顺序排列起来,那么,粗量化或完全忽略掉一些不重要的系数将不会对重建图像质量发生什么重大影响(只产生很少的失真),从而达到压缩数据的目的。图像处理学中介绍的各种变换(如离散余弦变换,小波变换等)都可以用于变换编码。(2)预测编码:图像的相邻象素之间通常呈现出高度的相关性,这种高度的相关性使得未加工数据中蕴涵高度的信息冗余。因此,解除数据的这种相关性有可能获得图像数据的有效压缩编码。预测编码(又称DPCM,Differential Pulse-Code Modulation,差分脉冲编码调制)就是基于这样的基本原理,每个像素可以根据以前已知的几个象素值来预测。因此在预测法编码中,编码和传输的并不是象素取样值本身,而是这个取样值的预测值与实际值之间的差值。,(3)矢量量化:预测编码与变换编码都属于标量量化(数值量化,Scalar Quantization),即先将图像经某种映射变换变成一个数列,然后逐一进行量化编码。向量量化(Vector Quantization,VQ)与标量量化方法不同,它把图像数据分成很多组,每组看成为一个向量,然后逐个向量进行量化编码。(R.M.Gray and D.L.Neuhoff,Quantization,IEEE Trans.Information Theory,vol.44,no.6,Oct.1998,pp.2325-2383)(4)模型法:把图像分割成几个基本模型,模型具有一定的参数,只要将参数进行编码传输,就可恢复出原始图像。众所周知,经典压缩编码方法主要依据图像本身固有的统计特性,并利用了人眼视觉系统的某些特性,但是利用得还不够充分。随着感知生理心理学的发展,人们越来越清楚地认识到,人的视觉感知特点与统计意义上的信息分布并不完全一致,统计上需要许多信息量才能表征的某些特征对视觉感知也许并不重要。因此,从感知角度来说,详细表征这部分特征是不必要的。受此启发,人们从微观转向宏观去研究开发新的编码方法(因为视觉感知是一种宏观认识过程),并注重对感知特性的利用。新一代编码技术,如子带与小波编码(Subband and Wavelet Coding)J.W.Woods and S.P.O.Neil,Subband Coding of Image,IEEE Trans.on ASSP,1986,34(6),pp.1278-1288;S.Mallat,A theory for multiresolution signal decomposition the wavelet representation,IEEE Trans.Pattern Analysis and Machine Intelligence,vol.11,no.7,July 1989,pp.674-693;M.Vetterli,Wavelets and Filter Banks:Theory and Design,IEEE Trans.Signal Processing,1992,40(9),pp.2207-2232.、模型编码(Model Based Coding)K.Aizwa and T.S.Huang,Model-based image coding:advanced video coding techniques for very low bit-rate applications,Proceedings of the IEEE,vol.83,no.2,1995,pp.259-271、神经网络编码R.D.Dony and S.Haykin,Neural Network Approaches to Image Compression,Proceedings of the IEEE,vol.83,no.2,1995,pp.288-303;J.Jiang,Image compression with neural networks-A survey,Signal Processing:Image Communication 14(1999)737-760;M.Egmont-Petersena,D.de Ridderb and H.Handelsc,Image processing with neural networks-a review,Pattern Recognition 35(2002)22792301.与分形编码(Fractal Coding)就是在这样的背景下发展起来的。,二、分形图像编码概述基于分形理论的图象压缩方法介于(3)和(4)之间,但有又其独特的一面,即把一幅图象看作一个分形,只要找到迭代函数的参数,那么就可用迭代的方法把原来的图象恢复出来。分形编码的原理从数学上看是简单的,基于拼贴定理,待编码图像由使得它近似不变的压缩仿射变换表示,压缩映象原理保证不动点图像由压缩变换迭代作用于任意初始图像来生成,拼贴定理则保证不动点图像是待编码图像的近似图像。分形图像编码的数学基础主要是迭代函数系统、压缩映象原理和拼贴定理。迭代函数系统(Iterated Function System,IFS)是Bernsley及其研究小组在Hutchinson 1981年提出的迭代函数理论(Iterated Function Theory)的基础上发展起来的,它是分形几何的一个重要组成部分。拼贴定理是Bernsley 于20世纪80年代后期提出的,它是压缩映象原理的一个简单推论,并成功地用于集合、函数(包括信号、图像)等的逼近。分形理论(核心是分形几何)是非线性科学研究中十分活跃的一个分支,特别是十余年来在计算机图像处理和分析中显示出越来越重要的作用。自然图像的模拟、图像压缩、图像纹理分析、数字水印技术和模式识别等领域的大量学术论文都可见分形的身影。总之,分形图像编码是分形几何、泛函分析等现代数学分支最成功的应用之一。,基于IFS的早期分形压缩编码(数学家Barnsley 1 提出)的大致步骤为:通过一些如颜色分割、边缘检测、频谱分析、纹理分析等图像处理技术,从图像中提取分形子图(如一棵树、一片云、一片海景),使得每个子图具有一定的分形结构(子图的整体与局部之间存在某种自仿射特征),由此构造由大量子图组成的分形库。分形库中每个子图对应一个仿射变换(迭代函数),这些迭代函数具有仿射形式,因此只要几个参数即可确定。此外,需要存储的并不是子图本身,而是由若干参数组成的IFS码(仿射变换参数),因此,分形库并不占有很大的储存空间。编码时,一幅数字图像被划分成互不重叠、形状任意的子图。对于每个子图,在分形库中寻找与之最仿射相似的子图(即在旋转、反射、伸缩、偏斜等操作之后与之相似),以保证它们的“拼贴”(Collage)与原始图像相似。于是,一幅图像对应于一个由若干迭代函数组成的迭代函数系统,迭代函数系统的所有参数就构成图像的IFS码。因此,这种编码方法能够实现很高的压缩比(Barnsley称可以得到10000:1以上的压缩比)。尽管事实证明这种方法是不实用的(因为编码时间太长,且需要人机交互,对操作者有较高要求),但它毕竟为图像压缩提供了一条与以往完全不同的新思路。实际上,Jacquin8,9提出的实用分形块编码正是在此基础上发展起来的。从矢量量化编码的观点来看,分形块编码算法可描述如下:图像被分割成大小两类子块,小块称为range块(子块),大块称为domain块(父块),子块互不重叠且覆盖整幅图像,父块可以重叠且边长为R块的两倍。父块经四邻域象素平均收缩为子块的大小,然后每个这样的父块按等距变换(4个旋转和4个反射)扩大为8个子块,这种子块的全体就构成虚拟码书(记为)与矢量量化编码不同,分形解码器并不存在(也不需要)这样的码书,而是以自参考方式暗含于图像中,故称为“虚拟码书”。然后每个子 块R由其最佳匹配块D的亮度变换(对比度和亮度调整)来近似,即,其中1是亮度值均为1的常值块,s、o起调整D的对比度和亮度的作用。,编码阶段,对于每个子块Ri,为了寻求其最佳匹配块D,必须求解下面的极小化问题(把R、D视为向量):其中是向量2-范数,mi、si和oi分别表示Ri的最佳匹配块的序号和对该匹配块对比度和亮度的最优调整。极小化上述问题的三元组称为Ri的分形码,其中、是量化值。全体Ri的分形码就组成原始图像的分形码,它描述了一个使图像近似不变的压缩仿射变换T。分形编码虽然压缩比比较高,解码速度快,但其编码速度满,尤其是子块和父块匹配的搜索复杂度很高,难以做到实时处理。因此,近年来有关分形和其他方法的结合的研究正在开展。本文就是采用分形和小波变换相结合的方法进行编码。因为小波变换具有高效的能量压缩和空间频率局部特性被广泛应用于图象处理领域。小波编码的基本思想,是将原始图象经二维小波变换转换成小波域上的小波系数,然后对小波系数进行量化编码。一幅图象经过小波变换分解后有两种相似性可供利用:一种是子图象本身的自相似性,也即编码时子图象作为一幅空间域的图象,可以利用通常的分形图象编码方法单独进行图象压缩编码;另一种是同方向不同分辨率的子图象之间的互相似性。在编码中我们以树为单位。代替在空间域中的子块和父块的匹配,因而分形编码的方法就延伸到小波域中进行,在空间域中的取块和放块,在小波域中为取树和放树,空间域中父块和子块的仿射变换,在小波域中为父树与子树的仿射变换。本文编码的步骤是首先对图像进行小波变换,小波基一般用哈尔小波或双正交小波,第二对小波变换后的图像进行分形编码。需要修改,因不知其意关于分形与小波结合的编码方法,文献11讨论了基于小波变换的迭代分形编码方法。提出了以细节失量的相似度(?),作为匹配判据的思想。文献12给出了基于小波分解的统计预测分形编码方案。实验结果表明利用统计预测技术与纯粹的小波分解及VQ方法相比较能获得1.5倍的编码效率(?)的提高。本文主要着力于研究小波分形图像进行压缩编码方法的研究。,三阅读文献?主要参考文献目录:1A.E.Jacquin,A Novel fractal Block-Coding Technique for Digital Image,Proceedinngs ofICASSP IEEE International conference on ASSP,VoL.4 1990.2A.E.Jacquin,Fractal Image Coding:A Review,Proceeding of the IEEE Vol.81 No.10 1993.3Y.Fisher,Fractal Image compression,Fractals Vol.2 No.3 19944E.Wjacobs,y,Fisher,R.D.Boss.Image Compression:A study of the Itrated Transform Method,Signal Processing Vol.29,19925Y,Fisher.Fractal Encooding:Theory and Applicaation to Digifal Image,Springer Verlag,New York 1994.6T.Bedford,F.M.Dekking,M.S.Keane,Fractal Image Coding Techniques and Contraction operators,Nieuw Arch.Wisk(4)10,3.19927A,E.Jacquin,Image Coding Based on a Fractal Theory of Iterated Contractive Markov Operators,PartI,:Theoretical Foundation,Report Math,913899-016Georgia Insstitute of Technology,1989.8A.e.Jacquin9王大凯 陈伟 小波变换在图象分解编码中的应用,电子学报 Oct 199510Alex pentland Bradley Holowitz:A Practical approach to fractal based image compression preo IEEE 1991 PAML-1311G.Mm.Davis,Self quantitation of wavelet subtree:A wavelet-based theory of fractal image cccompression,in IEEE 18th Conv.Electtrial Engineering in Isral,Tel-Aviv Israel Mar 1995,二、论文工作实施计划,三、指导教师综合意见(对选题报告的理论和应达到的程度及结果):,本开题报告介绍的分形图像编码技术,尽管只有十余年的历史,但已成为一种最有发展前途、研究范围较为广泛的图像压缩编码方法,也已被认为是第二代图像编码技术的三大方法之一。分形图像编码产生于分形几何的研究,这是该技术冠以“分形”名称的原因。分形图像编码需要许多现代数学知识,如分形几何、拓扑学、泛函分析等,是数学应用中最成功的例子之一。因此,选题具有相当的数学理论深度。要求对分形编码的数学基础进行深入的学习研究,然后至少提出一个新的算法并编程实现,并给出有关实验结果。小波分形编码算法是很成功的混合分形图像编码也是分形编码的主要发展方向,还有许多待解决的公开问题。因此,选题小波分形图像编码作为主攻方向抓住了分形编码的主流方向。,