数字图像处理系统毕业设计论文.doc
毕业设计说明书基于ARM的嵌入式数字图像处理系统设计学生姓名: 张占龙 学号: 0905034314 学 院: 信息与通信工程学院 专 业: 测控技术与仪器 指导教师: 张志杰 2013年 6月摘要简述了数字图像处理的应用以及一些基本原理。使用S3C2440处理器芯片,linux内核来构建一个简易的嵌入式图像处理系统。该系统使用u-boot作为启动引导程序来引导linux内核以及加载跟文件系统,其中linux内核与跟文件系统均采用菜单配置方式来进行相应配置。应用界面使用QT制作,系统主要实现了一些简单的图像处理功能,比如灰度话、增强、边缘检测等。整个程序是基于C+编写的,因此有些图像变换的算法可能并不是最优化的,但基本可以满足要求。在此基础上还会对系统进行不断地完善。关键词:linnux 嵌入式 图像处理 边缘检测AbstractThis paper expounds the application of digital image processing and some basic principles. The use of S3C2440 processor chip, the Linux kernel to construct a simple embedded image processing system. The system uses u-boot as the bootloader to boot the Linux kernel and loaded with file system, Linux kernel and file system are used to menu configuration to make corresponding configuration. The application interface is made using QT, system is mainly to achieve some simple image processing functions, such as gray, enhancement, edge detection. The whole procedure is prepared based on the C+, so some image transform algorithm may not be optimal, but it can meet the basic requirements. On this basis, but also on the system constantly improve.Keywords:linux embedded system image processing edge detection 目录第一章 绪论11.1 数字图像处理概述11.2 数字图像处理现状分析51.3 本文章节简介7第二章 图像处理理论82.1 图像信息的基本知识82.1.1 视觉研究与图像处理的关系82.1.2 图像数字化92.1.3 图像的噪声分析102.1.4 图像质量评价102.1.5 彩色图像基本知识112.2 图像变换122.2.1 离散傅里叶变换122.2.2 离散沃尔什-哈达玛变换(DWT-DHT)192.2.3 离散余弦变换(DCT)202.2.4 离散图像变换的一般表达式212.3 图像压缩编码232.3.1 图像编码的基本概念232.4 图像增强和复原232.4.1 灰度变换232.4.2 图像的同态增晰242.4.3 图像的锐化252.5 图像分割252.5.1 简单边缘检测算子262.6 图像描述和图像识别26第三章 需求分析263.1 系统需求分析273.2 可行性分析273.3 系统功能分析27第四章 概要设计274.1 图像采集284.2 图像存储294.3 图像处理(image processing)294.4 图像显示304.5 网络通讯30第五章 详细设计305.1 Linux嵌入式系统的构建305.1.1 启动引导程序的移植315.1.2 Linux内核移植315.1.3 根文件系统的移植315.2 图像处理功能的实现325.2.1 彩色图像的灰度化325.2.2 灰度图的直方图均衡化增强325.2.3 图像二值化335.2.4 边缘检测34第六章 调试与维护34附录 A34参考文献41致谢41第一章 绪论1.1 数字图像处理概述数字图像处理(Digital Image Processing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理的主要研究内容包括以下几个方面:图像变换、图像编码压缩、图像增强和复原、图像分割、图像描述、图像分类(识别)。图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方方面面。随着人类活动范围的不断扩大,图像处理的应用领域也随之不断扩大,在航天和航空技术、生物医学工程、通信工程、工业和工程、军事与安全、文化艺术等方面获得越来越广泛的应用。数字图像处理的发展始于20世纪60年代初期,首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功绘制出月球表面地图,获得了巨大成功 。这位人类登月创举奠定了坚实的基础,在以后的航空技术中,如对火星、土星等星球的探测研究中,数字图像处理都发挥了巨大的作用。数字图像处理取得的另一个巨大成就是在医学上的应用。1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置,简称CT(Computer Tomograph)。CT的基本方法是根据人的头部截面的投影,经计算机处理来重建截面图像,成为图像重建。1975年EMI公司又成功研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像。1979年,这项无损伤诊断技术获得了诺贝尔奖,说明它对人类做出了划时代的贡献。于此同时,图像处理技术在许多其它应用领域受到广发重视并取得了重大的开拓性成就,属于这些领域的有工业检测、机器视觉、公安司法、军事制导、文化艺术等,是图像处理成为一门引人注目、前景远大的新型学科。从20世纪70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展。很多国家,特别是发达国家投入更多地人力、物力研究计算机视觉(图像理解)领域,取得了不少重要的研究成果。其中代表性的成果是20世纪70年代末MIT的Marr提出的视觉计算理论,这个理论成为计算机视觉领域其后十多年的主导思想1。图 一1 基于Marr视觉计算理论的方框图Marr视觉计算理论主要涉及描述三维物体的几何表示问题。Marr理论认为描述三维物体有三个层次(图 一2):(1)图像特征(基元图)。它反映了二维图像的重要特征。是以原始图像中抽取如边缘、角点、纹理、线条、不连续点等基本特征,这些特征的集合称为基元图。(2)2.5维图,又称为intrinsic图像。它在以观察点为中心的坐标系统中,由输入图像和基元图恢复场景可见部分的深度、法线方向、轮廓等,这些信息包含了深度信息,但不是真正的物体三维表示,因此称为二维半图。从图像特征恢复得到2.5维图,可以有很多方法,如立体图、从图像序列、从阴影至形状从纹理至形状、从x至形状(其中x为新研究的方法)等方法恢复得到2.5维图。(3)三维模型表示。在以物体为中心的坐标系中,描述了三维物体的形状和它们在空间的结构基元是体积的或表面面积的基元。Marr计算视觉理论框架虽然还不十分完善,许多方面还有争议,如该理论建立的视觉处理框架基本上是从上至下,而没有考虑反馈的作用;此外,该理论没有重视知识引导作用。但是,它至今仍然是可接受的基本框架,它不仅推动了计算机视觉这门科学的形成和发展,也为计算机视觉领域提供了许多研究的起点。计算机视觉是模仿人的视觉,由于人们对视觉机理的研究还没有突破性的进展,因此计算机视觉研究是一项艰巨而长远的任务。尽管目前已有了不少图像理解的理论、方法、算法和初级图像理解系统,但真正能在实际应用中可以取代人的视觉功能的还不多见。当前科学技术的发展使得许多领域迫切需要应用图像处理和理解,因此,应当在计算机视觉领域中,加强新理论与方法的探索和研究,使之有可能较大的降低视觉理解的难度,而仍然能解决不少有意义的实际问题。近来兴起的“有目的、定性、主动地视觉”、基于CAD的视觉、距离图像的理解、多传感器融合等都是一些有代表性的研究方向。这里特别要指出,从20世纪90年代,计算智能信息处理技术获得飞速的发展,它在数字图像处理和计算机视觉领域中获得了越来越广泛的应用,取得了许多引人注目的突破性成果。这些成果不仅推动了计算智能信息处理技术的进一步发展,而且给数字图像处理和计算机视觉开辟了不少新的研究领域。在计算机智能信息处理技术中,如模糊集与模糊逻辑、神经网络、小波分析、进化计算(遗传算法)、分形等,在图像编码、增强、分割、特征提取、描述以及识别等方面都有广泛的应用,获得了不少新方法、新算法。另外,一些新的数学方法,如数学形态、粗糙集理论等数学工具在数字图像处理中也有成功的应用,引起了人们极大的关注。可以相信,视觉作为人类最重要的一种感知,是人类智能活动不可缺少的。因而,研究图像处理和理解将永远是一个挑战性的研究课题,无论存在多大的困难,总会取得突破性进展,并给人类社会各个方面的实际应用带来越来越多的效益。下面就数字图像处理主要的几个方面作简要介绍:1)图像变换由于图像阵列很大,直接在空间与中进行处理,设计计算量很大。因此,往往采用各种图像变换的方法,如傅里叶变换、哈尔变换、离散余弦变换等间接处理技术,将空间域的处理转换为变换域处理,这不仅可以减少计算量,而且可获得更有效的处理(如傅里叶变换可在频域中进行数字滤波处理)。目前新兴研究的小波变换在时域和频域中都具有良好的局部化特性,它在图像处理中也有着广泛而有效地应用。2)图像编码压缩图像编码压缩技术可减少描述图像的数据量(即比特数),以便节省图像传输、处理时间和减少存储器容量。压缩可以在不失真前提下获得,也可以在允许的失真条件下进行。编码是压缩技术中重要的方法,它在图像处理技术中是发展最早且比较成熟的技术。3)图像增强和复原图像增强和复原的目的是为了提高图像的质量,如去除噪声,提高图像的清晰度等。图像增强不考虑图像降质的原因,突出图像中所感兴趣的部分。如强化图像高频分量,可使图像中物体轮廓清晰,细节明显;如强调低频分量可以减少图像中噪声影响。图像复原要求对图像降质的原因有一定了解,一般讲应根据降质过程建立“降质模型”,在采用某种滤波方法,恢复或重建原来的图像。4)图像分割图像分割时数字图像处理中的关键技术之一。图像分割是将图像中有意义的特征部分提取出来,包括图像中物体的边缘、区域等,这是进一步进行图像识别、分析和理解的基础。虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像处理的有效方法。因此,对图像分割的研究还在不断深入之中,是目前图像处理中研究的热点之一。5) 图像描述图像描述是图像识别和理解的必要前提。作为最简单的二值图像可采用其几何特性描述物体的特征。一般图像描述方法采用二维形状描述,有边界描述和区域描述两类方法。对于特殊的纹理图像可采用二维纹理描述。在计算机视觉中要进行三维物体描述的研究,为此,提出了体积描述、表面描述、广义圆柱体描述等方法。6)图像分类(识别)图像分类(识别)属于模式识别的范畴,其主要内容是图像经过某些预处理(增强、复原、压缩)后,进行图像分割和特征提取,从而进行判决分类。图像分类常采用经典的模式识别方法,有统计模式分类和句法(结构)模式分类,近年来新发展起来的模糊模式识别、人工神经网络模式分类以及支撑向量机方法在图像识别中也越来越受到重视。此外,图像重建以及图像的只是表示、彩色图像处理等都是目前数字图像处理中新发展的研究领域,在图像处理中获得越来越广法的应用。1.2 数字图像处理现状分析数字图像处理技术的应用越来越广,己经渗透到工程、工业、医疗保健、航空航天、军事、科研、安全保卫等各个方面,在国计民生及国民经济中发挥着越来越大的作用。总之,数字图像处理技术应用还可列出相当多的领域,它在国家安全、经济发展、日常生活中充当越来越重要的角色,对国计民生的作用不可低估。图像处理技术由于本身所具有的特点导致它又很容易受到一些因素的制约。图像处理的特点主要集中在以下几点:(1)图像信息量庞大。在数字图像处理中,一幅图像可看成是由图像矩阵中的像素(pixel)组成的,每个像素的灰度级至少要用6bit(单色图像)来表示,一般采用8bit(彩色图像),高精度可用12bit或16bit甚至更高。X射线照片一般用64KB-256KB的数据量,一幅遥感图像3240x2340x430MB的数据量。(2)图像处理综合性强。在数字图像处理中涉及的基础知识和专业技术相当广泛。一般来说涉及通信技术、计算机技术、电子技术、电视技术,至于涉及到的数学、物理学等方面的基础知识。总之,图像处理科学是一项涉及多学科的综合性科学。(3)图像信息理论与通信理论密切相关。自从1948年,Shannon发表了“A Mathematical Theory ofCommunication”(通信中的数学理论)一文,便奠定了信息论的基础。此后,信息理论便渗透到了各个领域。图像信息论也属于信息论科学中的一个分支。从当今的理论发展看,可以说图像信息论是在通信理论研究的发展起来的。图像理论是把通信中的一维问题推广到二维空间上来研究。总之,通信中的一维问题都可推广到二维,尽管有些理论尚不完全贴切,但对图像自身理论体系的形成有极大的借鉴意义。(4)处理精度高。(5)内容丰富,通过编写不同的软件程序可以实现对图像的不同处理,如增强、滤波、恢复和压缩等,其处理内容十分丰富。(6)灵活性强。数字图像处理不仅能完成线性运算,且能实现非线性处理,即凡是可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现。(7)再现性好。数字图像处理与模拟图像处理的根本不同在于,它不会因图像的存储、传输或复制等一系列变换操作而导致图像质量的退化。只要图像在数字化时准确地表现了原稿,则数字图像处理过程始终能保持图像的真实再现。(8)适用面广。图像可以来自多种信息源。从图像反映的客观实体尺度看,可以小到电子显微镜图像,大到航空照片、遥感图像甚至天文望远镜图像。只要被变换为数字编码形式后,均可用计算机来处理。(9)占用频带宽,信息压缩的潜力大。数字图像中各个像素是不独立的,其相关性大。就电视画面而言,同一行中相邻两个像素或相邻两行间的像素,其相关系数可达0.9以上,而相邻两帧之间的相关性比帧内相关性一般说还要大些。因此,图像处理中信息压缩的潜力很大。由此造成图像处理会受到一些因素的制约:(1)知识的综合性强,需要掌握多方面的知识。(2)对计算机的计算速度、存储容量要求高。(3)处理宽频带难度大。数字图像处理占用的频带较宽。与音频信息相比,占用的频带要大几个数量级。所以在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本高。(4)二维到三维的转换难度大。由于图像是三维景物的二维投影,一幅图像本身不具备复现三维景物的全部几何信息的能力,三维景物背后部分信息在二维图像画面上是反映不出来的.因此,要分析和理解三维景物必须作合适的假定或附加新的测量.在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。(5)人为因素。数字图像处理后的图像一般是给人观察和评价的,因此受人的因素影响较大。鉴于图像处理自身的特点以及影响其的一系列因素,个人认为图像处理未来的发展可能会有以下几个方向:(1)数字图像处理技术的发展将向着高速、高分辨率、立体化、多媒体、智能化和标准化方向发展(2)进一步加强软件研究、开发新的软硬件图像处理方法。(3)加强基础学科、边缘学科的研究工作,促进数字图像处理技术的进一步发展。(4)逐步完善数字图像处理科学自身的理论体系。(5)图像、图形相结合朝着三维成像或多维成像的方向发展(6)新理论与新算法研究.近年来在图像处理领域引入了一些新的理论并提出了一些新的算法,如:Wavelet、Fractal、Morphology、遗传算法、神经网络等。Fractal广泛用于图像处理、图形处理、纹理分析,同时还可以用于数学、物理、生物、神经和音乐等方面,有人认为Fractal把杂乱无章、随意性很强的事物能用数学方法加以规范和描述,它在分析和描绘自然现象上具有独到之处。这些理论在未来图像处理理论与技术上的作用应给予充分的注意,并积极地加以研究(7)图像处理芯片化。目前,结合多媒体技术的研究,硬件芯片越来越多。如Thomson公司ST13220采用SyStO11C结构,作运动预测器。INMOS公司的IMS-A 121,采用流水线结构,C-CUbe公司CL-550把JPEG做到一个芯片上,更便于推广应用。总之把图像处理的众多功能固化在芯片上将会有更加广阔的应用领域。(8)虚拟现实。计算机的运算速度发展到今天,已为虚拟现实提供了可能。网上虚拟现实、可视电话及会议系统等方面的发展及应用都为数字图像处理技术的发展提供了新的机遇。(9)机器人视觉.随着各种相关技术和相关学科研究的不断发展,机器人视觉将由2D向3D,由低速响应向高速响应发展。1.3 本文章节简介本文共分为六章。第一章绪论,主要介绍数字图像处理的现状,基本概念,以及内容分布。第二章图像处理理论,对图像处理技术中经常用到的一些理论与方法进行比较详细的介绍。第三章需求分析,该数字图像处理系统进行可行性分析,并且就所使用的嵌入式平台进行介绍。第四章概要设计,这一章是整个系统的设计思路以及一些算法的简单分析。第五章进行系统的具体实现,包括硬件电路的设计与软件程序的编写。第六章是系统的最后调试以及功能使用说明部分。第二章 图像处理理论2.1 图像信息的基本知识2.1.1 视觉研究与图像处理的关系(1)图像质量评价与视觉心里。目前把图像信息看成二维平面上具有亮暗色彩变化的若干单个像素信息的集合是非常初步的认识。应该说,对图像的认识或理解是由感觉和心理状态决定的,也就是说,与图像内容和观察者的心理因素有关。由此启发人们去研究建立包括人的因素在内的信息理论。(2)画面组成和心理视觉。人的视野相当宽广,左右视角约为,上下月,但如此宽广的视野中视力好的部位仅限于。那么,人是如何转动眼球使视线移动,从而适应大的画面和立体景象的呢?人眼中心视力分辨率强,可以进行图像细节的认识,但只能认识图像的一小部分;而周边视力分辨率差,但可以认识图像的全貌,而且可以将所视目标特征部分检出,利用检出的目标图像特征去控制眼球运动,必要时可以再用中心视力来进一步认识这一部分图像。对于大画面图像,充分利用周边视力产生较强的临场感;而小画面临场感弱,为了产生充分的临场感,画面尺寸一般应有以上的视野。宽银幕和球幕电影的视觉效果好的原因也就是这个道理2。(3)主观亮度感觉。实验表明,人的视觉系统感觉到的景物亮度并不直接由景物本身的亮度所决定。其主观亮度感觉S与光强度B的对数呈线性关系,这一规律称为韦伯-弗赫涅尔(Weber-Fechner)定律,即为下式所示:式中k、为常数。(4)同时对比效应和马赫带效应在某些情况下,人的感觉不是简单的光强度函数,还可以从人的两个视觉特性,即同时对比效应和马赫带效应得到说明。图 二1 同时对比效应同时对比效应(如上图所示)。图中所有的中心方块都有相同的光强度,但在人的视觉感觉就不同,这种与背景光强度有关的视觉主观感觉称为同时对比效应。图 二2 马赫带效应图中各个条带的客观亮度不同,但每个条带本身的客观亮度是相同的。但在人的视觉中,对每个条带感觉都是不均匀分布的,感到所有条带的右边比左边亮些,出现的这些毛边带(特别是靠边界处)称为马赫带效应。2.1.2 图像数字化一幅黑白静止平面图像中各点的灰度值可用其位置坐标的函数来描述。显然,是二维连续函数,有无穷多个值。这种用连续函数表示的图像无法用计算机进行处理,也无法再各种数字系统中传输或存储,必须将代表图像的连续(模拟)信号转变为离散(数字)信号。这样的变换过程称为图像数字化,主要包括采样和量化两步。采样和量化。图像在空间上的离散化成为采样,其约束条件是:由采样点,通过某种方法可以正确的重建原图像。采样的方法有两类:一类是直接对表示图像的二维函数值进行采样,即读取各离散点上的信号值,所得结果就是一个样点值阵列,所以也称为点阵采样;另一类是先将图像函数进行某种正交变换,用其变换系数作为采样值,故称为正交系数采样。对样点灰度值的离散化过程称为量化。也就是对每个样点值数字化,使其只和有限个可能电平数中的一个对应,即使图像的灰度值离散化3。量化也可以分为两种,一种是将样点灰度值等间隔分档取整,称为均匀量化;另一种是不等间隔分档取整,称为分均匀量化。因为都要取整,故量化也常称为整量或整量化过程。2.1.3 图像的噪声分析图像噪声在数字图像处理技术中的重要性已越来越明显,如高放大倍数航片的判读、X射线图像系统中的噪声去除等都已成为不可缺少的技术。图像噪声按其产生的原因可分为:(1)外部噪声:是指系统外部干扰从电磁波或经电源串进系统内部而引起的噪声,如电气设备、天体放电现象等引起的噪声。(2)内部干扰一般可分为四种:由光和电的基本性质所引起的噪声、电器的机械运动产生的噪声、元器件材料本身引起的噪声、系统内部设备电路所引起的噪声。从统计理论观点图像噪声可分为平稳和非平稳噪声两种。不严格的讲,这两种噪声可以理解为:其统计特性不随时间变化的噪声称为平稳噪声;其统计特性随时间变化而变化的称为非平稳噪声。还可以按噪声幅度分布形状来定义,如其幅度分布是按高斯分布的就称其为高斯噪声,而按雷利分布的就称其为雷利噪声。当然也有按噪声频谱形状来命名的,如频谱均匀分布的噪声称其为白噪声,频谱与频率成反比的称为噪声,而与频率平方成正比的称其为三角噪声等等4。2.1.4 图像质量评价图像质量的含义包含两个方面,一个是图像的保真度(fidelity),另一个是图像的可懂度(inteligibility)。所谓图像保真度是描述被评价图像与标准图像的偏离程度;而图像的可懂度则是表示图像能向人或机器提供信息的能力。目前对图像质量在定量评价上一般采用均方误差表示的客观保真度准则,而图像的可懂度定量测量还是很困难。目前对图像质量评价往往还是采用主观保真度准则,它是由一批图像评价专家按主观感觉来定性地评价图像质量5。显然这种评价方法容易受到很大认为因素的影响。2.1.5 彩色图像基本知识为了定量的描述颜色对人眼的视觉作用,可以用亮度(brightness)、色调(hue)、色饱和度(saturation)这3个与视觉特征有关的量来计算描述,这3个量称为颜色的3个基本属性。色调是彩色的最重要的属性,是决定颜色本质的基本特性;色饱和度是指一个颜色鲜明程度,饱和度越高,颜色越深;亮度是指光波中作用于感受器所发生的效应,其大小由反射系数决定,反射系数越大,物体的亮度越高。实际应用中,一般将色调和色饱和度称为彩色,颜色便用彩色和亮度表征6。人眼大概能识别128种不同的色调和130种不同的色泽(色饱和度)。根据不同的色调,还可以识别若干种明暗。因此,人眼可以识辨出大约种不同的颜色。对于数字图像处理来说,128种不同的色调和8种不同的色饱和度,16种明暗级基本上可满足应用需求。彩色模型。为了能使用RGB三基色描述各种色彩,根据实际应用和需要提出了一些彩色模型。RGB(红、绿、蓝)模型主要用于彩色监视器和彩色视频摄像机;CMY(青、深红、黄)模型用于彩色打印机;HSI(色调、饱和度、亮度)模型更符合人描述和解释颜色的方式。此外,还有常用的国际照明委员会CIE提出的CIE-XYZ模型和美国国家电视系统委员会(national television system Committee-NTSC)提出的YIQ彩色模型。RGB和CMY的转化。假设RGB在三维坐标系中为R(1,0,0)、G(0,1,0)、B(0,0,1),则二者关系为:CIE-XYZ模型。使用RGB模型生成颜色时,用于产生颜色的原基色比例系数出现负值,使用起来十分不便。同时,不同研究者所用的三基色和标准白色不同,使得研究结果很难比较。XYZ颜色把彩色光表示为:。其中、是XYZ颜色模型的基色量,X、Y、Z为三色比例系数。XYZ表色系统须满足如下3个条件:三色比例系数X、Y、Z皆大于零;Y的数值正好是彩色光的亮度;当X=Y=Z时仍然表示标准白光。由此得到二者转化关系为:RGB和NTSC-YIQ彩色模型转化:当采用PAL电视制式时公式应为2.2 图像变换一般数字图像处理的计算方法本质上都可看为线性的,处理后的输出图像阵列可看为输入图像阵列的各个元素经加权线性组合而得到,这种空间线性处理要比非线性处理简单。但对于图像处理的运算来说,由于图像阵列很大,如果没有有效地算法,计算上很麻烦且费时,往往采用各种图像变换方法,如傅里叶变换、沃尔什变换等间接处理技术,可获得更有效地处理。下面对几种常用的图像处理变换一一介绍。2.2.1 离散傅里叶变换离散傅里叶变换(Discrete Fourier Transform简称DFT)在数字信号处理和数字图像处理中应用十分广泛,它建立了离散时域和离散频域之间的联系。如果直接应用卷积和相关运算在时域中处理,计算量将随着取样点数N的平方而增加,这使计算机的计算量加大,费时,很难达到实时处理的要求。因此,一般可采用DFT方法,将输入的数字信号首先进行DFT变换,在频域中进行各种有效地处理,然后进行DFT反变换,恢复为时域信号。这种用计算机对变换后的信号进行频域处理,比在时域中直接处理更加方便,计算量也大大减少,提高了处理速度。DFT还有一个明显的优点是有快速算法,即FFT(Fast Fourier Transform)算法,它可大大减少计算次数,使计算量减少到只是直接用DFT所需计算量的一小部分7。一维离散傅里叶变换:如果去N个间隔为取样增量的方法将一维连续函数进行离散化。变为离散函数,可用下图所示序列表示。它可表示为:,式中,为离散值。图 二3 一维连续函数的采样经取样后的一维离散函数的傅里叶变换对由下式表示:式中;。要知道,这里是准确值而不是近似值。最后应指出,离散傅里叶变换总是存在的,它不必考虑连续傅里叶变换所需的可积的条件要求。二维离散傅里叶变换:只要考虑两个变量就很容易将一维离散傅里叶变换推广到二维。二维离散傅里叶变换对由下式给出式中:;。式中:;。二维连续函数的取样是在二维的取样间隔上进行的,对空域的取样间隔为和,对频域的取样间隔为和。它们的相互关系为:,。在数字图像处理中,图像一般取样为方形阵列,则M=N,那么二维DFT可表示为式中:;。式中:;。需要指出的是上述变换对并不是通用的表示式,常用的是正、反变换式中常数项均去,这不影响问题的本质。接下来介绍二维离散傅里叶变换的几种常用的性质。(1)线性傅里叶变换是一种线性算子。设和分别为二维离散函数和的离散傅里叶变换,则式中a,b是常数。(2)可分离性显然傅里叶变换公式中指数项可分成只含x、u和y、v的二项乘积,其相应的二维离散傅里叶变换对可分离成两部分之积:式中,u、v、x、y均取。可分离性的重要意义在于:一个二维傅里叶变换或反变换都可以分解为两步进行,其中每一步都是一个一维傅里叶变换或反变换。为说明问题,以二维傅里叶正变换为例,设其后面的求和项为,即此式表示对每一个x值,先沿每一行进行一次一维傅里叶变换。再将沿每一列在进行一次一维傅里叶变换,就可得二维傅里叶变换 ,即这说明二维傅里叶变换可以先沿行后沿列分离为两个一维变换的过程,显然改为先沿列后沿行分离为两个一维变换,其结果是一样的,公式略。二维离散傅里叶反变换的分离过程完全与上述相似,所不同的只是指数项为正,这里就不再重复了。(3)平移性傅里叶变换对的平移性由下式给出:上式表明,在空域中图像原点平移到时,其对应的频谱要乘上一个负责的指数项;而频域中原点平移到时,其对应的要乘上一个正的指数项。平移性告诉我们一个感兴趣的事实:当空域中产生移动时,在频域只发生相移,而傅里叶变换的幅值不变,因为反之,当频域中产生移动时,相应的在空域中也只发生相移,而幅值不变。在数字图像处理中,常常需要将的原点移到频域方阵的中心,以使能清楚地分析傅里叶变换谱的情况。要做到此点,只需令则,根据欧拉公式,代入而得。代入原式:。这说明,如果需要将图像频谱的原点从起始点移到图像的中心点,只要乘上因子进行傅里叶变换即可实现。(4)周期性和共轭对称性离散傅里叶变换和反变换具有周期性和共轭对称性。傅里叶变换对的周期性可表示为:式中:共轭对称性可表示为离散傅里叶变换的周期性说明正变换后得到的或反变换后得到的都是具有周期为N的周期性重复离散函数。因此,若要完全确定或,只需变换一个周期中每个变量的N个值。也就是说要在频域中完全确定,只需要变换一个周期。在空域中,对也有类似的性质。共轭对称性说明变换后的幅值是以原点为中心对称。利用此特性,在求一个周期内的值时,只需求出半个周期,另半个周期也就知道了,这大大减少了计算量。(5)旋转不变性若引入极坐标则和分别变为和。在极坐标系中,存在以下变换对此式表明,如果在空域旋转角度后,相应的傅里叶变换在频域中也旋转同一角;反之亦然。(6)分配性和比例性傅里叶变换的分配性表明傅里叶变换和反变换对于加法可以分配,对乘法则不行。即傅里叶变换的比例性表明对于两个标量a,b,有这说明在空间比例尺度的展宽,相应于频域比例尺度的压缩,其幅值也减少为原来的。(7)平均值二维离散函数的平均值定义如下:将u=v=0代入二维离散傅里叶定义式,可得比较上面两个式子可以看出:因此,若要求离散信号的平均值,只需算出相应的傅里叶变换在原点值即可。(8)微分性质二维变量函数的拉普拉斯算子定义为按二维傅里叶变换的定义,可得:拉普拉斯算子通常用于检测图像的边缘。(9)卷积定理卷积定理和相关定理都是研究两个函数的傅里叶变换之间的关系,这也构成了空间域和频域之间的基本关系。设和是大小分别为和的离散数组,为了避免交叠误差,将和用增补零的方法扩充为以下的二维周期序列:式中:;二维离散卷积定理可用下式表示:应用卷积定理的明显好处是避免了直接计算卷积的麻烦,它只需先算出各自的频谱,然后相乘,再求其反变换,即可得卷积。(10)相关定理在离散情况下,与离散卷积一样,须用增补零的方法扩充和为和。离散和连续情况的相关定理都可表示为:傅里叶变换虽然有很多有用的性质,也获得了很广泛的应用,但它有两个明显的缺点。首先,需计算复数而不是实数,进行复数运算比较费时。其次,傅里叶变换收敛慢,这在图像编码应用中尤为突出。2.2.2 离散沃尔什-哈达玛变换(DWT-DHT)沃尔什(Walsh)变换是由两个数值,即+1或-1的基本函数的级数展开而成的,它和傅里叶变换一样具备完备正交特性。由于沃尔什函数时二值正交函数,与数字逻辑中的两个状态相对应,因此更适用于计算机技术、数字信号处理。设,一维离散沃尔什变换表示为式中u、x均取。沃尔什变换核(后面提到)是一个对称阵列,其行和列是正交的。同时正反变换的任何算法都可直接用来求反变换,这时只需将算法结果乘以N即可8。而且沃尔什变换核不是+1就是-1,因此,沃尔什变换本质上是将离散序列各项值的符号按一定规律改变,进行加减运算,因此,比采用复数运算的DFT要简单得多。二维沃尔什正变换核和反变换核为此处,为使正、反变换核有相同形式,取相同的常数项,则所对应的二维离散沃尔什正、反变换为二维沃尔什变换也可以分成两步一维沃尔什变换来进行。2.2.3 离散余弦变换(DCT)离散余弦变换(Discrete Cosine Transform)的变换核为实数的余弦函数,因而DCT的计算速度要比核为复数的DFT要快得多,而且对于具有一阶马尔柯夫的随机信号,DCT是K-L变换的最好近似,已被广泛应用到图像压缩编码、语音信号处理等众多领域。一维离散余弦变换的正向变换核为式中:;。由此得一维DCT:式中,。同样,一维DCT反向变换核取与其正向变换核相同的形式,则有:式中,。二维DCT正变换核定义为:式中:x、y均取;u、v均取。同样,当反变换核与正变换核有相同的形式时,二维DCT变换对为:式中:;。式中:;。从以上式中可以看出,二维DCT变换核是可分离的,因此二维DCT可逐次应用一维DCT算法进行计算。而且,傅里叶变换中指数项通过欧拉公式和进行分解后9,其傅里叶变换实数部分对应于余弦项,其虚数部分对应于正弦项,因此,离散余弦变换可从傅里叶变换的实数部分求得。2.2.4 离散图像变换的一般表达式从各种不同的离散变换表达式可以看出,它们其实有着很多相同的地方。以二维离散傅里叶变换为例,可以用通用的关系式来表示:式中:x、y、u、v均取;和称为正变换核和反变换核。如果则称正反变换核是可分离的。如果和,和在函数形式上相同,则称此变换时加法对称的。这时有显然二维离散傅里叶变换对只是通用关系式的一个特殊情况,它们的核为它们都是可分离和对称的,因为如上所述,二维傅里叶变换可以利用变换核的可分离性,用两次一维变换来实现,同理,不论何种变换,只要其变换核是可分离的,就可以将一个二维变换用两次一维变换来实现。数字图像变换还可以用矩阵来表示,以便应用矩阵运算的很多性质,这里就不再详述10。关于数字图像的变换还有很多,由于篇幅关系,这里不再一一例举。2.3 图像压缩编码2.3.1 图像编码的基本概念图像编码可以分为两类:信息保持编码(无失真编码、无损编码)、保真度编码(失真编码、有损编码)。还有一种是对图像某些有用的特征信息进行所谓特征抽取编码。2.4 图像增强和复原本文只针对涉及到的几种图像增强和复原方法进行介绍。2.4.1 灰度变换灰度变换是一