毕业设计(论文)图像垂直搜索引擎.doc
《毕业设计(论文)图像垂直搜索引擎.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)图像垂直搜索引擎.doc(72页珍藏版)》请在三一办公上搜索。
1、学 号:2007c7010115河北理工大学成人教育毕业论文论文题目:图像垂直搜索引擎学 院:河北理工大学继续教育学院专 业:计算机科学与技术班 级:07计本姓 名:指导教师:2010 年 12 月 日河北理工大学成人教育毕业设计(论文)任务书学院继续教育学院学生姓名指导教师郝胜男设计(论文)题目图像垂直搜索引擎主要研究目标和研究内容用Google以及百度等搜索引擎来搜索高校的图片,但这些都不是专业的针对高校来进行搜索,存在一定的缺陷。本人选择此题就是要解决这个泛而不精的问题,这样设计出来的是一个具有很强的针对性的搜索引擎,在各方面比传统的综合性图片搜索引擎能提供更全面更周到的服务。说明书(论
2、文)的要求纸张大小:标准A4纸(210mm297mm)装订:左侧装订版芯:页边距上2.54 mm,下2mm,左3mm,右2.3 mm。正文字体小4号宋体,每页2832行,每行3338字。图纸的要求进度安排312周搜集材料,确定题目,编写大致结构1214周编写每个模块的代码,并进行汇总1516周做最后的调试与运行设计的基础数据和主要参考文献1叶乃文,喻国宝.面向对象程序设计M.北京:清华大学出版社,2004.2 张怀庆.Java 案例精粹150例M.北京:冶金工业出版社,2005.3 蔡明志.数据结构M.北京:中国水利水水电出版社,2006.4 王剑.规模中文搜索引擎的架构和设计技术M.北京:科
3、学出版社,2002.指导教师签字: 系主任签字: 河北理工大学成人教育毕业设计(论文)进程表学 院河北理工大学姓 名袁洁琼合作者设计(论文)题目图像垂直搜索引擎时 间工 作 内 容完 成 情 况34周57周810周1112周1314周1516周确定论文题目构思整体的模块对小细节莫块进行研究对所需材料进行搜集对各个模块的代码进行编写做最后的运行调试论文题目为图像垂直搜索引擎完成大体模块的设计确定细节模块的内容搜集全需材料编写完所修代码调试成功本人完成部分论文(说明书)1.7929万字 图纸指导教师签字: 摘 要互联网上的信息每天都以指数量级的速度爆炸性增长,面对如此浩瀚的资源,搜索引擎为所有网上
4、冲浪的用户提供了一个入口,毫不夸张的说,所有的用户都可以从搜索引擎出发到达自己想去的网上任何一个地方。因此它也成为除了电子邮件以外最多人使用的网上服务。但是,随着信息多元化的增长,千篇一律的给所有用户提供同一个入口显然已经不能满足特定用户更深入的查询需求。同时,这样的通用搜索引擎在目前的硬件条件下,要及时更新以得到互联网上较全面的信息是不太可能的。针对这种情况,我们需要一个分类细致精确、对硬件要求低,数据全面深入、更新及时的专业的搜索引擎。关键词:互联网,搜索引擎,图片,JSP,网络蜘蛛AbstractInformation on the Internet grows explosively
5、every day. Search engine provides all the surfers on it with an entrance, from which they can reach every corner of the web. Therefore, search engine becomes the most popular network service second to email.With information continuing to explode in all directions, however, some specific kinds of use
6、rs are not satisfied with only one entrance, In the meanwhile, due to current hardware imitations, it is not likely to crawl full data on the Internet. What we need is a professional search engine which is well classified, requesting low hardware requirement, containing profound and entire data, and
7、 being updated in time. Key words: Internet;Search Engine;images; Java Server Page; Spider Network目录1 引言11.1 研究背景及意义11.2 论文结构22 系统需求分析32.1 系统功能需求32.2 用户需求32.3数据流图4231 前台数据流图4232 后台管理数据流图42.4 数据字典62.4.1 管理员登录数据字典说明62.4.2用户管理数据字典说明72.4.3本地图片管理数据字典说明72.4.4远程图片管理数据字典说明72.4.5种子网站管理的数据流图的数据字典说明82.4.6留言管理的
8、数据流图的数据字典说明82.5 E-R图92.6 数据表的说明92.7实现语言说明92.7.1 关于前台实现语言JSP的说明92.7.2 网蜘蛛实现语言JAVA的说明103 系统概要设计113.1 系统体系结构113.1.1 前台搜索模块113.1.2 后台管理模块113.1.3 网络蜘蛛模块123.2 系统模块功能123.2.1 前台一般搜索模块123.2.2 前台高级搜索模块123.2.3 后台用户管理模块133.2.4 本地图片管理模块133.2.5 网络蜘蛛管理模块133.2.6 留言管理模块143.3 数据库结构设计143.3.1本地图片库表设计143.3.2图片用户反馈表设计153
9、.3.3注册用户表设计163.3.4 意见反馈表设计163.3.5 用户类型库表设计163.3.6 远程图片库表设计173.4 界面设计173.4.1前台界面183.4.2后台界面194 系统详细设计214.1 前台一般搜索214.1.1模块说明214.2 前台高级搜索模块224.2.1模块说明224.2.2 程序设计思路224.3 后台用户管理模块224.3.1 模块说明224.3.2 程序设计思路234.4.1 模块说明234.4.2程序设计思路244.5 网络蜘蛛管理模块254.5.1模块说明254.5.2程序设计思路264.6 留言管理模块275.6.1模块说明275.6.2程序设计思
10、路274.7 网络蜘蛛模块274.7.1 模块说明274.7.2程序设计思路285 系统调试及运行285.1 系统调试28511 启动网络蜘错误28512 启动服务器错误29513 访问数据速度慢295.2 经验30结论32致谢33参考文献34附 录 1 引言 1.1 研究背景及意义l 背景: 随着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为普通网民,会根据搜索引擎的性能和技术来选择自己喜欢的引擎查找资料;作为学者,会把有代表性的搜索引擎作为研究对象。据统计,搜索引擎已经成为继电子邮件之后的第二大互
11、联网应用,业界又把2004年定为搜索引擎年。的确,在这一年里搜索引擎发生了许多变化:年初,Google推出了区域搜索;Google的桌面搜索越炒越火,搜狗则宣布启动第三代搜索引擎;年底,微软亚洲研究院正式把“互联网搜索和挖掘”纳入其主要研究方向,这一场场造势运动足以说明搜索引擎已经在引起企业、网民、专家学者的注意,即将掀起一股股“搜索研究热”。专家普遍认为技术是推动搜索引擎的重要力量,特别是在国外的第三方机构对搜索引擎网站进行了一次隐式测评后,即拿掉各家网站的LOGO,让用户在没有先入概念的情况下为其搜索结果打分。没出预料的是,Google依然是这次评测的第一名;但出乎预料的是,Google只
12、领先第二名一个百分点。这一现象又向人们发出一个信号,以Google为代表的超链分析即将成为历史过客,被新的技术所取代。在这种背景下,专业图片搜索引擎作为研究对象,具有重要的理论价值和应用前景。l 国内外研究现状: 搜索引擎技术的研究,国外比中国要早近十年,从最早的Archie,到后来的Excite,以及altvista、overture、google等搜索引擎面世,搜索引擎发展至今,已经有十几年的历史,而国内开始研究搜索引擎是在上世纪末本世纪初。在许多领域,都是国外的产品和技术一统天下,特别是当某种技术在国外研究多年而国内才开始的情况下。例如操作系统、字处理软件、浏览器等等,但搜索引擎却是个例
13、外。虽然在国外搜索引擎技术早就开始研究,但在国内还是陆续涌现出优秀的搜索引擎,像百度(http:/www。baidu。com/)、中搜(http:/www。zhongsou。com/)等。从搜索结果的高度相关性与排它性来看,专业搜索引擎或许应该称之为“精确”搜索引擎;一些专业搜索引擎实际上是专业搜索目录,对提交的网站都经过该专业内的人员进行筛选编辑。从搜索结果的高度相关性与排它性来看,专业搜索引擎或许应该称之为“精确”搜索引擎;在国外一些专业搜索引擎实际上是专业搜索目录,对提交的网站都经过该专业内的人员进行筛选编辑,就此看来,网民迫切需要更加细分的搜索服务,专业的搜索引擎应该应运而生,是未来的
14、趋势。 l 意义:虽然可用Google以及百度等搜索引擎来搜索高校的图片,但这些都不是专业的针对高校来进行搜索,存在一定的缺陷。本人选择此题就是要解决这个泛而不精的问题,这样设计出来的是一个具有很强的针对性的搜索引擎,在各方面比传统的综合性图片搜索引擎能提供更全面更周到的服务。为高校间活动图片提供一个展示交流的平台。在这里不仅能够搜索到高校的相关图片,而且还能提供一个展示和交流的平台,为扩大和宣传高校自己的活动和形象等方面,可起到一定的作用。也为课件制作提供一个素材的渠道,在这里可以提供丰富的针对性强的高校图片。通常教师及同学在制作课件时,如果用到关于一些学校之类的图片一般都很能找到令人满意的
15、,在一般的综合性搜索引擎中,找出一大堆图片中,也许很难发现与自己满意的图片,这样此系统就可以解决此问题,随着信息技术的日益发展,图像信息加工的深入和检索标准的出台,图像搜索引擎功能势必日益完善,图像搜索引擎也必将成为因特网上的新宠。1.2 论文结构本论文结构包括以下几个部分。摘要,是对前言,详细介绍了论文研究背景及意义;第二章 需求分析,包括系统目标需求、功能需求、数据需求以及系统环境介绍,让读者全面了解系统将采用什么样的环境、要做什么、实现什么样的功能整个设计内容的总体概括;关键词,论文中用到的主要关键词语;第一章;第三章 概要设计,包括系统结构设计、模块设计、界面设计,是系统功能模块的初步
16、实现;第四章 详细设计,包括网站整体、应用模块、后台管理的设计与实现,对于主要的模块还给出了详细的源码开发过程。第五章 结论,总结本次开发的经验体会;第六章 参考文献;第七章 致谢。2 系统需求分析2.1 系统功能需求经过实际分析调查,实现一个完整的高校图片搜索引擎,在前台主要是通过关键字进行图片的搜索,能够快速,准确,搜索需要的图片,后台进行用户管理,图片数据的上传,审核,编辑等维护工作。具体功能的需求:前台搜索功能:一般搜索、高级搜索后台用户管理功能:添加新管理员、删除管理员、编辑管理员信息本地图片管理功能:上传图片、对片审核、编辑图片信息、本地图片删除、本地图片查找网络蜘蛛管理功能:远程
17、图片获取、种子网站的编辑、编辑远程网络图片、远程图片删除、远程图片查找留言管理管理功能:留言查看、留言删除2.2 用户需求要设计一个性能良好的高校图片搜索引擎,明确用户的应用环境对平台的要求是首要的各基本的。高校图片搜索引擎不仅能够够搜索到高校的相关图片,而且还能搜索高校以外的图片,包括网络的大多数图片,这样为高校提供一个展示和交流的平台,为扩大和宣传高校自己的活动和形象等方面,可起到一定的作用,也为课件制作提供一个素材的渠道。高校图片搜索引擎开发的目标是实现高校图片搜索,这是在用户要求的基础上提的。用户要求如下:(1)基本Web,用户界面友好,灵活,操作方面易扩充。(2)人机交互性好,容错性
18、强,对用户的操作上的错误,系统能给出相应的是示。(3)在该平台之上, 用户可以上传图片,也可以很方便,精确地搜索到想要的图片。(4)程序结构清晰,便于系统维护。(5)目录结构清晰,便于系统扩充,增强系统通用性。图2-1前台搜索数据流图Fig 2-1 prospects search data flow diagram用户1搜索4显示2搜索3显示消费表I关键字图片图片图片图片2.3数据流图231 前台数据流图232 后台管理数据流图(1)用户管理1检索2登录用户密码密码正确管理员图片表III4编辑5删除3添加用户删除用户编辑 用户添加用户信息用户信息用户信息图2-2 用户管理数据流图Fig 2-
19、2 users manage data flow diagram 图2.3本地图片管理数据流图Fig2-3 Photo local management of data flow diagram用户密码密码正确上传图片管理员1检索登录日志I图片表II2登录4更新6修改7审核5查找图片审核图片编辑 图片查找查找结果5删除删除图片图片信息图片信息记录号审核信息(2)本地图片管理图2-4网络蜘蛛管理数据流图Fig 2-4 spider network management data flow diagram用户密码选择管理员密码正确启动网络蜘蛛管理员1检索登录日志I图片库II2登录3更新5修改6修改
20、4查找种子网站编辑远程图片编辑 远程图片查找查找结果图片信息图片信息图片表III图片图片(3)网络蜘蛛管理2.4 数据字典2.4.1 管理员登录数据字典说明表1 管理员登录数据流词条描述Table 1 Data Flow Manager Login Article Description数据流名说 明数据流来源数据流去向数据流组成报告错误用户的密码错误由使用者输入管理员密码错误信息选择用户名用户名级别由使用者选择进入用户表查找并比较20个字符正确管理员的密码正确由管理员输入登录日志各种字符、数字、非字符等2.4.2用户管理数据字典说明表2 用户管理数据流词条描述Table 2 users ma
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 论文 图像 垂直 搜索引擎

链接地址:https://www.31ppt.com/p-3978232.html