2438.搜索引擎中搜索器的研究与实现 【计算机信息 毕业论文】.doc
《2438.搜索引擎中搜索器的研究与实现 【计算机信息 毕业论文】.doc》由会员分享,可在线阅读,更多相关《2438.搜索引擎中搜索器的研究与实现 【计算机信息 毕业论文】.doc(13页珍藏版)》请在三一办公上搜索。
1、职业学院毕业论文(设计)题 目 搜索引擎中搜索器的研究与实现 学 生 学 号 专业班级 计算机应用技术 系院名称 计算机信息工程系 指导教师 二七年六月十日独 创 性 声 明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得xxx职业学院或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签 名: 年 月 日关于论文使用授权的说明本人完全了解xxx职业学院有关保留、使用学位论文的规定,即:学校有权保
2、留送交论文的复印件及电子版,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密论文在解密后应遵守此规定)学生签名: 年 月 日导师签名: 年 月 日搜索引擎中搜索器的研究与实现 摘 要搜索引擎是从WWW上快速而有效地获取信息资源的捷径,而网络蜘蛛技术则是搜索引擎的关键。首先介绍了搜索引擎的工作原理及其系统结构,然后分析了搜索引擎中搜索器的地位和重要性,最后提出了实现一个中小型网站智能搜索引擎的设计思路。本文对于智能搜索器的设计与实现,主要是在现有网络蜘蛛的基础上,提出了以网页评价值或权威度为依据确定搜索策略的思路,并提出了更快捷、更全面的提
3、取URL的策略。本文对如何提取文档摘要做了研究,提出以语句位置、关键词、与标题相关度、累计相似度四个参数为依据,按所得到的语句权值对文中所有语句进行排序,确定语句在整个文档中的重要性,由此按照一定的压缩率得到整个文档的摘要。本文的研究既具有一定的理论意义和技术价值,又具有一定的市场价值,它将有助于搜索引擎智能化的提高,对生活信息、娱乐信息、科研信息、商业信息的检索和获取,扩大商业机会,具有较大的社会和经济效益。关键词:搜索器,URL,智能,搜索策略,文档摘要目 录搜索引擎中搜索器的研究与实现I目 录II第1章 前言11.1 课题的意义11.2 国内外研究现状11.3 课题的研究目标1第2章 搜
4、索引擎的工作原理和系统结构22.1 搜索引擎的工作原理22.2 搜索引擎的系统结构32.3 本章小结3第3章 搜索引擎中搜索器的设计思想43.1搜索器基本概念的理解43.2智能搜索器系统结构的设计43.3 搜索策略的设计思想43.4 文档摘要提取方法设计思想43.5 本章小结4第4章 智能搜索器的设计实现54.1 搜索器的搜索程序的设计54.2 文档摘要提取的具体设计54.3 本章小结5第5章 试验结果65.1 搜索算法的试验结果与性能分析65.3 本章小结6第6章 总结76.1 主要工作和创新点76.2 存在的问题及未来的方向7参考文献8致谢9个人简历10第1章 前言1.1 课题的意义因特网
5、上的信息呈几何级数增长,面向因特网的信息获取与处理技术是当前计算机科学与技术领域急需研究的课题。1.2 国内外研究现状国内关于搜索引擎和搜索器的研究始于对国外相关成果的介绍,到现在渐渐成为热点,从论文数量的分支专题分布看,综合性研究论文的数量远远超过细分化专门领域的论文及成果数量。国外未来搜索引擎的发展应朝着智能型综合化的方向发展1 2。1.3 课题的研究目标通过对搜索引擎工作原理及系统结构的研究,以Java为开发工具,编写智能搜索器来提高搜索引擎的搜索能力。尤其是在提高全、准、快、省方面有明显的效果。拟解决的关键问题:(1) 采用多线程编程技术设计中小型网站的爬行算法。(2) 根据语句位置、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机信息 毕业论文 2438.搜索引擎中搜索器的研究与实现 【计算机信息 毕业论文】 2438. 搜索引擎 搜索 研究 实现 计算机信息 毕业论文
链接地址:https://www.31ppt.com/p-2394505.html