基于内容的图像检索系统及sift算法的应用.doc
《基于内容的图像检索系统及sift算法的应用.doc》由会员分享,可在线阅读,更多相关《基于内容的图像检索系统及sift算法的应用.doc(54页珍藏版)》请在三一办公上搜索。
1、基于SIFT算法的图像检索系统的研究摘 要人类进入现代社会以来,科技、经济、文明不断发展,信息量的增长速度也随之加快。从海量数据中迅速检索出有用信息成为人们的迫切需求。因此,图像检索作为一种能从海量图像中迅速查找到需要图像的技术很快成为人们研究的热点。在一个图像检索系统中最重要的环节便是图像特征提取与匹配,而SIFT算法正是一种由David Lowe提出的图像局部特征描述子,因为其良好的独特性和鲁棒性而受到人们的普遍关注。本文给出了一种基于SIFT算法的图像检索技术,并依此开发了一套图像检索实验系统,主要研究工作总结为:首先分析了CBIR系统的组成和关键技术的基本原理,重点分析了特征提取环节的
2、技术细节,对比分析了几种经典的特征描述算子,尤其是SIFT算法的基本原理和各自的优缺点。然后根据对比结果选择SIFT算法作为最终的特征提取方案,最后实现了一个实验性的CBIR系统。实验结果表明SIFT 算法对图像的平移、旋转、视角等变化具有良好的鲁棒性,提出的基于SIFT算法的CBIR系统方案具有良好的效果。关键词 图像检索;CBIR;SIFT算法;特征提取 Research about Image Retrieval System Based on SIFT AlgorithmAbstractSince the humans enter the modern age,the growth o
3、f science,technology, economy and civilization has accelerated the growth of information.Retrieving useful information from the huge amounts of data quickly becomes peoples urgent needs.Therefore, image retrieval as a technology which able to find the required image from massive image quickly has be
4、came a research focus soon. Image feature extraction and matching is the most important principle in image retrieval system,and SIFT algorithm is a local characteristic of image description made by David Lowe,because of its unique and robustness,SIFT algorithm has admired widespread concern.This art
5、icle will present an image retrieval technology based on SIFT algorithm and so on develops a testing system for image retrieval.Research summary:Firstly,analysis the basic principle and key technology of CBIR system,focusing on aspects of feature extraction from technical details.Secondly,comparison
6、 and analysis several classic describes of the characteristics,particularly foundations and their respective advantages and disadvantages,then select SIFT algorithm based on comparison results as the final programme of feature extraction.Finally achieved an experimental CBIR system. Experimental res
7、ults show that the SIFT algorithm has good robustness to image translation, rotation and perspective changes,and the CBIR system based on SIFT algorithm also shows good property and action.Keywords image retrieval; feature extraction; SIFT algorithm目 录摘要IAbstractII第1章 绪 论11.1 研究背景11.2 CBIR系统概述11.3 研
8、究现状31.4 应用领域41.5 主要工作内容5第2章 CBIR系统关键技术环节62.1 特征提取技术62.1.1 图像特征基础62.1.2 点特征提取算子72.1.3 各算法性能比较112.2 匹配与相似性度量132.3 CBIR 系统性能评价142.4 本章小结14第3章 SIFT算法原理及性能验证153.1 SIFT算法原理153.1.1 DoG尺度空间的构造153.1.2 关键点搜索与定位193.1.3 特征点方向赋值213.1.4 关键点描述223.2 SIFT算法性能实验243.3 SIFT算法在CBIR系统中的应用283.4 本章小结30第4章 基于SIFT算法的CBIR系统31
9、4.1 系统概述314.2 系统GUI324.3 性能实验334.4 本章小结34结论35参考文献36致谢38附录39第1章 绪 论1.1 研究背景人类进入现代社会以来,多媒体技术、计算机网络技术和通信技术迅速发展,使得信息总量不断飙升。而图像信息由于能够对场景或对象进行直观生动的描述,因而成为最重要、也是最常见的多媒体信息。随着数码相机、扫描仪等数字设备的普及,大量的图像信息被创造出来,随着图像的数量越来越多,人们亟需一种能够有效管理图像信息的技术。于是,自20世纪70年代以来,图像检索技术逐渐成为一个非常活跃的研究领域。图像检索技术共经历了基于文本的图像检索技术(TBIR, Text Ba
10、sed Image Retrieval)、基于内容的图像检索技术(CBIR,Content Based Image Retrieval,为叙述方便,以下皆简称CBIR)两个发展阶段。前者主要通过人工对图像进行文本标注,然后将图像的文本描述写入数据库中进行管理。用户检索时,则根据数据库中存储的文本描述查找需要的图片。后者则直接利用图像内容进行检索,即通过对图像的视觉特征进行研究和提取,形成图像库中所有图像的特征集,检索时对用户所提交的样本图像进行一致或相似的特征提取操作,通过对图像低层视觉特征的比较来实现检索。随着图像库规模的增加,TBIR技术的弊端日益显露。首先,由于人类意识的主观性,对同一副
11、图像不同的人会产生不同的理解,因此不可能形成一个统一的检索标准。这使得图像的文本描述很难准确响应用户的查询信息,查询效果差,效率低。其次,图像携带大量的信息,其丰富的细节和深远意义很难用文字表达出来,更别说区区几个关键词了。另外,对图像的文本标注是通过人工操作完成的,当需要处理大量的图像信息时,这无疑是一项浩大的工程,处理速度也会很慢。由于这些原因,上个世纪90年代开始,CBIR技术逐渐取代TBIR而成为新的研究热点。1.2 CBIR系统概述如上所述,CBIR系统是指直接采用图像内容进行图像信息查询的检索,即在图像数据库中检索与用户所提交样本图像在内容上一致或相似的图像集合的过程,通过对图像底
12、层特征的比较来实现检索。主要研究技术包括特征抽取、相似度量、图像匹配、用户反馈。它不同于TBIR技术,不需要人工参与图像特征的描述,而是按照一定的方法有计算机自动完成,然后建立索引,因此相对于TBIR技术,它拥有许多优点:1.由计算机进行特征的分析与提取取,无需人工参与,避免了由于主观意识不同而引起的误差,又节省了大量的人力物力财力,同时大大提高了建立索引的时间,图像库的管理也更加方便高效。2.采用近似匹配作为匹配方式。CBIR系统找出的图片是与查询图像最相似的图像,并对查询结果按相似程度进行派序,具有很高的灵活性,能应用到多个领域。3.采用交互式的查询方式,具有根据用户反馈进行再查询的能力,
13、用户可以根据查询结果提供反馈信息,系统再根据用户的反馈对查询结果进行修正,提高查准率。综上,CBIR突破TBIR系统的许多局限,使图像检索的效率和查准率都有了质的飞跃,因此很快在各个领域推广开来。对该领域的研究,也因此具有十分重要的学术和经济价值。但是CBIR技术所利用的仅是图像的低层视觉特征,还无法实现对图像内容、场景和所表达的情感等含义的理解与认识,也就是说现有的CBIR技术还无法利用图像的高层语义特征。这种高层语义特征是无法直接从视觉特征中提取出来的,它依赖于人的经验、推理和认识。因此,要想利用高层语义特征进行图像检索,势必需要人工智能、机器学习等相关理论的发展,这还有待更加深入的研究和
14、探索。CBIR是一项新兴技术,集成性很高,技术环节主要包括以下几个:1.特征提取 视觉特征主要分为通用视觉特征和与领域相关的视觉特征,通用特征是指所有图像共有的特征,包括颜色、纹理、形状、空间位置关系等;与领域相关的视觉特征则建立某些经验、专业知识的基础上,如人脸特征、指纹特征等。特征提取是CBIR技术的基础环节,是区别不同类型图像检索系统的标准。2. 征匹配和相似性度量 图像特征提取出来之后,通常会用向量的形式对其进行描述,这样图像的相似性就转化成了特征空间的相似性问题。良好的匹配与相似性度量标准映与人眼的相似性判断保持良好的一致性。 3. 特征索引 图像蕴含了大量的有用信息,在处理大图像库
15、时,提取出的特征类型多、结构复杂、数据量大。采用合理有效的数据结构对这些特征信息进行存储对节省存储空间、提高检索效率非常重要。常用的索引方式Kd-tree,B-tree等。 4. 查询模式 查询模式是指用户用何种方式向系统提交何种类型的查询信息,主要有以下几种模式:由用户提供一个查询图像(query image)进行检索的按例查询(QBE, Query By Example)、以用户绘制简单的图形为标准进行查询的按草图查询(query by sketch)、由用户指定对检索条件的描述,然后据此查询的按描述查询例。5. 相关反馈(Relevance Feedback) 在系统按照用户要求进行初次
16、检索之后,用户可以根据初步查询的结果向系统提交修正信息一获得更佳的检索结果,这个过程就是相关反馈。采用这种方式可以提高检索的准确性,并从一定程度上弥补了用户与计算机之间的语义鸿沟。6. 系统性能评价(performance evaluation) CBIR是一项集成度很高的技术,有着丰富的理论和复杂的分类,因此对不同算法的评判和比较方法是确定CBIR系统优劣的重要工具,有利于研究者之间的交流和算法的推广,共同推动CBIR技术的发展。图2-1给出了一个典型的CBIR系统整体框图:图1-1 CBIR系统整体框图1.3 研究现状如上所述,CBIR技术是利用图像特征进行图像库索引的生成与检索的,对图像
17、特征的研究是开发CBIR系统的基础。图像特征是一幅图像区别于其他图像所特有的属性或特点,是人们区别图像的依据,描述了图像的各个含义,是图像抽象的表达。图像特征从提取范围角度可分为局部特征(点特征、线特征等)和全局特征;从获取方式角度可分为自然特征(大小、方向、位置等)和人工特征(直方图、距、边缘等);从特征属性角度可分为高层语义特征(知识语义、人工交互语义、外部信息源语言等)和低层视觉特征(颜色、纹理、形状等)。图像特征的研究最早始于20世纪70年代末。早在1977年Moravec就提出了点特征这个概念,他将图像特征点称为“兴趣点”,通过灰度自相关函数来衡量某像元与其邻域像元的关系。C.Har
18、ris和M.J.Stephens在1988年提出的Harris算子是一种特征点提取算子,它是Moravec 角点检测算法的改进,用一阶偏导来描述亮度变化,这种算子受信号处理中自相关函数的启发,给出与自相关函数相联系的矩阵M。M矩阵的特征值是自相关函数的一阶曲率,如果两个曲率值都高,那么就认为该点是特征点。直观的看,Harris算子的原理为:如果某一点向任一方向的微小偏移都会引起灰度的很大变化,这就说明该点是角点。1999 年Lowe提出的高效SIFT局部特征检测算法可以说是图像特征研究领域里程碑式的成果。该算法的思想来源是林德伯格的尺度空间理论,在林德伯格的论文中,规范化的拉普拉斯高斯算子被证
19、明具有真正的尺度不变性。然而高斯拉普拉斯变换计算相当繁琐,Lowe便采用高斯差分算子近似高斯拉普拉斯变换,首先图像转化为灰度图,然后对图像进行不同尺度的高斯平滑滤波处理,进而获得图像在高斯差分尺度空间中的表达,最后将尺度空间中的极值点最为图像的特征点,特征提取速度提高的同时,又具备对各类缩放、光照强度、旋转等变化的不变性和稳定性。正由于SIFT算法具备的这些优点,因而被选为本课题的特征提取方案。其基本原理及具体实现方法将在第三章详细介绍。就图像检索技术总体而言,相关研究可分为三个层次:1.利用图像的低层视觉特征,包括颜色、纹理、形状以及空间结构等进行查询;2.利用检出特征或图像中各对象之间的逻
20、辑关系进行检索,其中加入了对于图像中目标的识别和描述;3.抽象语义特征如场景描述,包含理解图像的深层寓意。现阶段大部分CBIR系统都在应用低层视觉特征进行图像检索,少数系统能够应用局部特征进行图像中部分对象的识别与检索,而高层语义特征的研究还在进行中,目前没有成熟的应用。1.4 应用领域基于内容的图像检索作为一项新兴的技术自问世以来已取得了不少的突破,这些成果也已经开始转化为应用技术,创造了不少的价值和财富,甚至颠覆了不少传统的运作方式,刺激了整个行业的技术革新。随着研究的不断深入,CBIR技术也逐渐渗透到越来越多的领域,它所带来的效益也刺激人们不断将其理论研究推向更高的层次。以下便是几个成功
21、应用CBIR技术的领域。1.设计领域 利用CBIR系统,可以迅速找到所需要的素材,提高设计效率。2.医学领域 对收录的各种病例的医学CT图像进行检索,可快速搜索相似病例,及时快速的找到病因,获得参考治疗方案。另外也可以迅速查找典型病例进行教学,对医学研究也会产生深远影响。3.地理信息管理领域 可以快速检索利用遥感技术获得的大量图像信息,准确辨识图像中的各个地标,方便地理信息的后期处理。4.军事领域 不断对实时获取的图像进行检索,及时发现关键目标,可应用于武器制导和目标侦查。5.刑事侦查领域 通过人脸识别技术提取面部特征后建立头像资料库,可利用图像检索技术迅速确定犯罪嫌疑人身份,相同的技术还可建
22、立指纹资料库或DNA资料库。6.版权保护领域 可将已注册的所有商标提取特征后建立索引,注册新商标时,都要对原有商标进行检索,防止重复或雷同,避免纠纷事件的发生。7.安全领域 对监控视频进行关键帧检索,迅速定位关键信息,另外指纹识别、视网膜识别等也都要利用到图像检索技术。正是由于CBIR系统有着越来越广泛的应用领域,创造着越来越多的社会财富,引起越来越多的生产及运作方式的革新,进行CBIR技术的深入研究,也拥有了重要的经济及学术价值。另外,由于CBIR技术跨学科、宽领域的技术特点,CBIR技术自身的发展,势必会带动其他诸如人工智能、认知心理学、计算机学习等学科的发展与进步。1.5 主要工作内容1
23、.分析了CBIR系统的组成和各个模块的原理和细节,涉及的关键技术,对比分析了现有的几个著名的CBIR系统的基本原理和特点。2.对比分析了Harris算子、SUSAN算子和SIFT算子三种图像特征描述及提取方法,分析了他们各自的优缺点,并根据对比结果后选择了SIFT算法作为本系统的特征提取方案。3.分析了SIFT算法的原理及细节,并编写了matlab程序以验证它的各项性能,对将SIFT算法应用到图像检索领域的可能性进行了论证。4.利用matlab开发了一套CBIR试验系统,能够对较大的图像库(包涵1000张以上的图片)进行方便高效的管理,并根据提供的样图快速的检索出相关图片。第2章 CBIR系统



- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 内容 图像 检索系统 sift 算法 应用

链接地址:https://www.31ppt.com/p-4015941.html