Five搜索引擎及国际联机检索.ppt
《Five搜索引擎及国际联机检索.ppt》由会员分享,可在线阅读,更多相关《Five搜索引擎及国际联机检索.ppt(56页珍藏版)》请在三一办公上搜索。
1、第五章 搜索引擎及国际联机检索,主要内容,5.1 搜索引擎5.2 国际联机检索,5.1 搜索引擎,1、网络信息资源检索概述2、基于搜素引擎的网络信息检索3、常用的搜索引擎介绍4、使用搜索引擎的相关问题及发展趋势,5.1 搜索引擎,1、网络信息资源检索概述(1)网络信息检索特点1)交互式作业方式2)用户透明3)信息检索空间的拓宽4)友好的用户界面操作方便,5.1 搜索引擎,1、网络信息资源检索概述(2)网络信息检索的进入方式从方法上来看,用户访问WWW系统,搜索和利用网络信息资源的方法有两种:1)已知URL地址的查找方法2)未知URL地址的查找方法,5.1 搜索引擎,1、网络信息资源检索概述(3
2、)网络信息检索工具的类型1)按检索机制划分分类目录检索工具搜索引擎型检索工具混合型检索工具,5.1 搜索引擎,1、网络信息资源检索概述(3)网络信息检索工具的类型2)按检索内容划分综合型检索工具专题型检索工具特殊型检索工具,5.1 搜索引擎,1、网络信息资源检索概述(3)网络信息检索工具的类型3)按包含检索工具数量划分单独型检索工具:拥有独立的网络资源采集标引机制和相应的数据库。多元型检索工具:是一种能够利用多个检索工具进行网络信息查询的检索工具,它通过一个统一用户界面帮助用户在多个检索工具中选择和利用合适的检索工具来实现检索操作。,5.1 搜索引擎,1、网络信息资源检索概述(3)网络信息检索
3、工具的类型4)按检索资源类型划分万维网检索工具:主要检索万维网站点上的资源。非万维网检索工具:主要检索特殊类型的信息资源,如:检索FTP文件的Archie、FileZ和T等。,5.1 搜索引擎,2、基于搜素引擎的网络信息检索(1)搜索引擎概述1)搜索引擎的基本类型按分类检索:Yahoo、Infoseek、Galaxy、GNN等。按检索词检索:Webcrawler、Lycos、Alta Vista、excite、Open-Text,5.1 搜索引擎,2、基于搜素引擎的网络信息检索(1)搜索引擎概述2)搜索引擎的工作原理搜索引擎一般主要由搜索软件、索引软件和检索软件三部分组成。信息的采集和存储信息
4、索引的建立检索界面的建立搜索结果的相关性处理,5.1 搜索引擎,2、基于搜素引擎的网络信息检索(2)搜索引擎的技术分析1)搜索引擎的Robot技术分析2)搜索引擎的索引技术分析3)搜索引擎的接口技术分析,5.1 搜索引擎,3、常用的搜索引擎介绍(1)常用的单个搜索引1)Alta vista-http:/Excite-http:/Lycos-http:/,5.1 搜索引擎,3、常用的搜索引擎介绍(1)常用的单个搜索引1)Alta vista-http:/Excite-http:/Lycos-http:/,5.1 搜索引擎,3、常用的搜索引擎介绍(2)多元搜索引擎概述 可以在不降低系统效率的前提下
5、,把多个 搜索引擎的检索结果综合起来,从中选取与用户查询相关度较大的,排除掉重复的和相关度较低的检索结果,并将检索结果以统一的界面呈现给用户。,5.1 搜索引擎,3、常用的搜索引擎介绍(2)多元搜索引擎概述1)基本体系结构(1)用户接口部分:指用户的浏览器和多元搜索引擎系统交互的界面,任务是接收用户的查询要求,生成适用于不同独立搜索引擎的特定请求。(2)查询代理部分:指多元搜索引擎和相应的单元搜索引擎的交互,以获得用户需要的查询结果。其中,包括查询、网页分析、汇总输出并调整。,5.1 搜索引擎,3、常用的搜索引擎介绍(2)多元搜索引擎概述2)工作原理 多元搜索引擎实际上是一种网络查询接口工具。
6、用户向多元搜索引擎发出检索请求,它将该请求整理为相应的检索指令发往多个单搜索引擎。给单搜索引擎执行检索指令后将检索结果传送给多元搜索引擎,经过整理后再传送给用户。,5.1 搜索引擎,3、常用的搜索引擎介绍(2)多元搜索引擎概述3)主要功能搜索引擎的选择功能较强的多元搜索引擎一般能采用并行和串行处理相结合的方式检索指令的转换检索结果的转换查询操作大多仅支持简单的布尔逻辑运算查询界面逐渐致力于满足用户进行查询操作的个人特制化要求。,5.1 搜索引擎,3、常用的搜索引擎介绍(2)多元搜索引擎概述4)多元搜索引擎的类型按照工作方式可以分为两大类:并行处理串行处理,5.1 搜索引擎,3、常用的搜索引擎介
7、绍(2)多元搜索引擎概述5)多元搜索引擎的优势由于没有网页索引数据库的建立和维护,多元搜索引擎可以集中更多的精力和财力完善检索要求的分发和检索结果的技术处理。同时链接多个独立的搜索引擎,并充分使用数据库,因而避免在多个系统之间的切换及重复输入查询要求,特别是一些采用并行处理方式的多元搜索引擎,查询的速度也会更快。使用多元搜索引擎可以省却各个独立搜索引擎在检索语法、指令差异,可由系统为用户统一处理检索的规则、语法和指令。多元搜索引擎可以很方便地配置客户端,用户可以按照自己的习惯配置成具有个人风格的WEB查询工具。,5.1 搜索引擎,3、常用的搜索引擎介绍(2)多元搜索引擎概述6)多元搜索引擎的评
8、价与选择是否允许用户浏览并选择要调用的独立搜索引擎。是否覆盖多种区资源类型,是否可提供主题范畴的目录服务。是否支持逻辑匹配检索、短语检索、自然语言检索等高级检索特性,是否能够实现检索请求的“本地化”转换。是否提供了足够多的检索选项和功能设置。是否提供多种检索结果输出格式,检索结果的信息描述是否全面等。,5.1 搜索引擎,3、常用的搜索引擎介绍(2)多元搜索引擎概述7)多元搜索引擎的局限性检索性能的局限性。调用搜索引擎的局限性。是否支持逻辑匹配检索、短语检索、自然语言检索等高级检索特性,是否能够实现检索请求的“本地化”转换。是否提供了足够多的检索选项和功能设置。是否提供多种检索结果输出格式,检索
9、结果的信息描述是否全面等。,5.1 搜索引擎,3、常用的搜索引擎介绍(3)常用多元搜索引擎介绍1)Mamma()1996年面世,自称为“搜索引擎之母”的并行元搜索引擎,可同时调用7个最常用的独立搜索引擎,并且可查询网上商店、新闻、股票指数、图像和声音文件等资源。其特点是检索界面友好,检索选项丰富,主要包括:可控制调用的独立搜索引擎、选择使用短语检索功能、设定检索时间、设定每页可显示记录数等。另外,Mamma支持常用检索语法在不同搜索引擎中的转换,还提供了专门检索页面文件标题的特殊检索服务,以及通过Email传输检索结果的特色功能。检索结果以相关性排序,内容包括网页名称、URL、文摘、源搜索引擎
10、,Mamma主页,5.1 搜索引擎,3、常用的搜索引擎介绍(3)常用多元搜索引擎介绍2)ASK Jeeves 3)Search,ASK主页,Search主页,5.1 搜索引擎,3、常用的搜索引擎介绍(3)常用多元搜索引擎介绍4)MetaCrawler 1995年由华盛顿大学推出,1997年被InfoSpace购买。支持调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服务。其检索特性非常丰富,包括常规检索、高级检索、定制检索、国家或地区的资源检索等检索服务模式。,MetaCrawler主页,5.1 搜索引擎,3、常用的搜索引擎介绍(3)常用多元搜索引擎介绍5)Profusion 6)Byt
11、eSearch,其他著名元搜索引擎,Ithaki(http:/)支持包括中文在内的14种语言检索Ixquick(http:/)可搜索网站、MP3、新闻、图象等多种网络资源InfoGrid(http:/)提供与主要搜索网站的直接连结和目录检索,具有强大的元搜索和新闻搜索功能 SavvySearch(http:/savvy.cs.colostate.edu:2000/)支持二十种语言(不包括中文),可调用全部或任意几个搜索引擎,可选择每个搜索引擎返回结果的数目,可进行目录检索,5.1 搜索引擎,4、使用搜索引擎的相关问题及发展趋势(1)使用搜索引擎的相关问题1)使用搜索引擎的主要要点2)使用搜索引
12、擎的主要事项3)搜索引擎的检索策略4)搜索引擎的检索技巧,5.1 搜索引擎,4、使用搜索引擎的相关问题及发展趋势(2)使用搜索引擎的发展趋势1)搜索引擎技术的最新研究在使用智能代理技术跟踪用户检索行为。采用人工智能技术,不断地分析用户的检索行为。采用集中式体系结构和分布式体系结构,以提高系统性能。使用交叉语言信息检索,让用户能在母语检索词的背景下,能检索到所有语言的检索结果。,5.1 搜索引擎,4、使用搜索引擎的相关问题及发展趋势(2)使用搜索引擎的发展趋势2)搜索引擎的最新技术发展内容提高了搜索引擎对用户检索提问的理解提高了对检索结果的处理能力,5.1 搜索引擎,4、使用搜索引擎的相关问题及
13、发展趋势(2)使用搜索引擎的发展趋势3)搜索引擎的研究发展方向智能化搜索个性化搜索结构化搜索垂直化专业领域搜索本土化的搜索,5.2 国际联机检索,1、联机检索系统2、国际联机检索:Dialog联机检索系统3、国际联机检索:OCLC的FirstSearch联机检索系统,5.2 国际联机检索,1)联机检索,就是人们将终端设备通过通信网络与计算机检索系统相联,采用人机对话方式,从主机中查找所需信息的过程.2)联机检索的主要步骤 与主机系统联机,并输入用户号和密码。使用选库指令进入数据库。输入检索式,开始进行检索。打印检索出来的记录内容。关机,结束检索。,5.2 国际联机检索,1、联机检索系统(1)联
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Five 搜索引擎 国际 联机 检索

链接地址:https://www.31ppt.com/p-6505636.html