《其他搜索引擎》PPT课件.ppt
第五章 其他搜索引擎,新疆师范大学,5.1 Web Search Engine(万维网搜索引擎),新疆师范大学,5.1.1 AltaVista(http:/),AltaVista是DEC公司1995年12月推出的万维网搜索引擎,其主页如图2.1所示。至1997年底,AltaVista标引的URL约有6000万个。,新疆师范大学,其特色和优势是:信息范围广泛,查全性能较好,提供多语种信息查询支持。缺点:误检率高;虽有Usenet搜索能力,但性能较差。AltaVista使用*作为通配符;支持+、-词操作,允许包含或者排除关键词;在高级搜索功能中提供了大量的选项,包括布尔运算符、嵌套、近似搜索和有日期限制的搜索等。无论是简单搜索还是高级搜索,都允许将搜索限制到页面元素,例如标题(页名)或URL,或者甚至可以限制到某个域(系统名)或Web网点。AltaVista对大小写字母敏感,当输入的查询词是大写字母时,AltaVista只查大写字母;而当输入的查询词是小写字母时,AltaVista同时查大小写字母。,5.1 Web Search Engine(万维网搜索引擎),新疆师范大学,例如,如果要查计算机通讯(computer communicat*),同时要求增加包括有关卫星(satellite)的内容并减少有关电话(telephone)的内容,5.1.1 AltaVista(http:/),可以输入”computer communicat*”;+satellite;-telephone形式的检索策略,注意用“;”将增减词隔开,“;”后应空一格,新疆师范大学,5.1.2 Excite(http:/),Excite是由斯坦福大学1993年8月创建的Architext扩展而成的万维网搜索引擎,它能为简单搜索返回很好的结果,并能提供一系列附加内容,尤其适合经验不多的用户使用。用户可以查找网上的Web、Usenet、NewsGroup或分类区。在同一个搜索框内可以输入简单的或高级的搜索策略,可以使用自然语言和布尔运算符。至1997年底,Excite标引的URL已达5000万以上。,新疆师范大学,5.1.2 Excite(http:/),其特色和优势是:对查出信息的组织精良,自身提供的信息优良,尤其是具有智能拓检功能。缺点是:高级查询功能不佳,不能使用通配符。Excite要求人名和公司名等专有名词第一字母必须大写。布尔逻辑组配包括逻辑与(用AND)、逻辑或(用OR)、逻辑非(用NOT),注意Excite中AND、OR、NOT不能小写。支持用括号来构成逻辑组。也可以使用词前加+和-号来表示需要查的词和排除不需要查的词的操作。,新疆师范大学,关于计算机与材料或能源(computer AND(material OR energy)的查询实例。,5.1.2 Excite(http:/),在搜索输入框内输入了computer AND(material OR energy),是一个既含布尔运算符、又含逻辑组(带括号来构成逻辑组)的搜索条件,新疆师范大学,5.1.3 HotBot(http:/),HotBot是万维网搜索引擎的后起之秀,它具有第一流的高级搜索功能和新闻论坛搜索功能、图形化的搜索工具以及一系列的过滤选项,无论对于初学者还是高级用户都是一种很好的工具。至1997年底,HotBot标引的URL已达5400万。,新疆师范大学,5.1.3 HotBot(http:/),其特色和优势是:高级搜索功能优良,尤其是支持目录搜索后的深入高级搜索。美中不足的是页面色彩深重,不过习惯成自然。HotBot对大小写字母敏感。可以使用通配符*截词;词前加+和-号分别表示需查词和不查词;“”和;分别指单词查询和短语查询。HotBot的高级查询支持布尔逻辑组配,包括逻辑与(用and表示)逻辑或(用or表示)逻辑非(用not表示),,新疆师范大学,5.1.4 Infoseek(http:/),Infoseek是Infoseek公司1995年2月推出的万维网搜索引擎,它是一个综合网点,提供了很多有用的附加服务,包括通过电子函件发送新闻、外国语搜索、按地理区域的搜索以及个人的金融文件夹等。它的新闻搜索能访问许多一流的资源,如Bussinesswire、路透社、CNN等。至1997年底,Infoseek 标引的URL已达8000万。,新疆师范大学,5.1.4 Infoseek(http:/),其特色和优势是:简单搜索和词组搜索优于几乎所有引擎,是一个又好又快的搜索引擎。附加的新闻搜索功能也较优良。Infoseek采用词频统计方法来确定词语重要性和相关性,可以按词序检索,区分大小写字母;可使用*作为通配符;词前加+和-号分别表示需查词和不查词;“”和;分别指词组查询和短语查询,新疆师范大学,5.1.5 Lycos(http:/),Lycos是American Online公司从Carnegie Mellon大学收购的万维网搜索引擎,它曾是最早的搜索引擎之一,具有多数的搜索选项和内容丰富的目录,执行简单搜索时能返回较好的结果。至1997年底,Lycos标引的URL已达3100万以上。,新疆师范大学,5.1.5 Lycos(http:/),Lycos使用$作为通配符,不支持+、-词操作,但提供英文举号(.)作为禁扩符,输入词后加.表示要求完全匹配,如gene.就只查gene,排除查其他词。Lycos建立标题字段,显示主页的所有标题,支持逻辑组配高级查询,包括逻辑与(用AND或and表示)逻辑或(用OR或or表示)逻辑非(用NOT或not表示),允许精确短语和自然语言搜索。它提供关键词和主题查询(主题查询叫做目录服务)。它的查询速度快、使用简便、索引很大,但最新新闻搜索却很差。允许选择搜索Web、图片、声音或个人页面。,新疆师范大学,5.1.6 WebCrawler(http:/),WebCrawler是1994年4月入网的,它也是最早的万维网搜索引擎之一,1995年被American Online收购。至1997年底,WebCrawler标引的URL已达2800万以上。,新疆师范大学,5.1.6 WebCrawler(http:/),WebCrawler的搜索功能包括:(1)支持简单搜索,性能一般;(2)支持高级搜索,性能一般;(3)支持目录搜索,性能良好。搜索类型缺省为Web(万维网页),也可查Business(商用信息,选yellow pages进入),新疆师范大学,5.1.6 WebCrawler(http:/),其特色和优势是:任意搜索性能优良,约定多个词之间的逻辑关系为AND。WebCrawler不支持通配符,不支持+、-词操作。它脱胎于Excite又不同于Excite,虽然整体性能不如Excite,但WebCrawler的分类频道提供了通往高质量的网点和聊天室的链接,其最新新闻搜索的响应准确性和及时性也超过Excite。此外,WebCrawler的信息经过精选,用户界面简单友好,响应快,适合训练新用户;支持自然语言查询,也支持高级查询。,新疆师范大学,5.2 FTP Search Engine(文件搜索引擎),FTP Search Engine(文件服务搜索引擎)是具有查询FTP资源功能的WWW网页,这里择要介绍一个。,新疆师范大学,天网搜索引擎介绍,北大天网 是国家“九五”重点科技攻关项目“中文编码和分布式中英文信息发现”的研究成果,由北大计算机系网络与分布式系统研究室开发,于1997年10月29日正式在CERNET上提供服务。2000年初成立天网搜索引擎新课题组,由国家973重点基础研究发展规划项目基金资助开发,收录网页约6000万,利用教育网优势,有强大的ftp搜索功能。,新疆师范大学,地址:http:/北京大学优点:是教育科研网内的搜索引擎,速度较快,有功能强大的FTP检索能力,可以直接搜索FTP文件,包括图片、声音、动画等。缺点:搜索范围较小,数据库中资料不够多,并且由于有很多是学生提供的网站或网页,当链接的服务器没有运行时,经常造成只能看到摘要,不能调出全文的死链接。,天网搜索引擎介绍,新疆师范大学,天网搜索引擎介绍,搜索示例:office2003,新疆师范大学,天网搜索引擎介绍,香港中文大学 ftp:/ftp.cuhk.hk,天网搜索引擎介绍,四川电子科技大学 清华大学 北京大学 北京邮电大学 华中理工大学 暨南大学 大连理工大学 上海交通大学 同济大学 南京大学 南京邮电学院 南京理工大学 浙江大学 中国科学技术大学 厦门大学 山东大学 哈尔滨工业大学 哈尔滨建筑大学,新疆师范大学,天网搜索引擎介绍,其他的FTP下载软件 CuteFTP,新疆师范大学,5.3 Email/WhitePage Search Engine(白页搜索引擎),个人信息搜索引擎是查询个人信息的搜索工具,包括WhitePage Search Engine(白页搜索引擎,个人电话号码簿通常为白页,故名)和Email Search Engine(电子函件搜索引擎)等。广义的WhitePage Search Engine即指包括Email Search Engine在内的个人信息搜索引擎,狭义的WhitePage Search Engine仅指查询个人电话号码和地址的搜索引擎。,新疆师范大学,Whowhere(),5.4 YellowPage Search Engine(黄页搜索引擎),商界信息搜索引擎是查询商界信息的搜索工具,也称YellowPage Search Engine(黄页搜索引擎,通常在电话号码薄中商界用黄页,故名)。联机商业搜索比起传统的书籍查询更具有优越性:不用离开办公桌就能找到所需商界业务信息以及公司、企业的地址和电话号码等。,新疆师范大学,5.4 YellowPage Search Engine(黄页搜索引擎),5.4.1 BigBook(http:/)5.4.2 InfoSpace(http:/www.infoS),新疆师范大学,5.4.1 BigBook(http:/),BigBook(http:/)是至今为止最好的商界搜索引擎,它具有智能化的功能、丰富的帮助以及准确的信息,这使BigBook成为搜索黄页信息的最佳选择。,新疆师范大学,5.4.2 InfoSpace(http:/www.infoS),InfoSpace是一个多功能网点,具有黄页信息(公司企业地址)、白页信息(个人地址)、投资信息、城市导游、电子商店等丰富功能 InfoSpace具有反应快捷、内容丰富的优点。在进行近似搜索时,还可以存储缺省的起始地址,可以搜索传真号码、免费电话号码、股票价格和地区天气等信息,新疆师范大学,新闻论坛搜索引擎是专门搜索Newsgroups等信息的引擎,可能用此工具查询自己感兴趣的新闻论坛和讨论组。2.5.1 DejaNews(http:/)2.3.2 Reference(http:/),5.5 Usenet Search Engine(新闻搜索引擎),新疆师范大学,Meta-search engine(元搜索引擎)是在前述搜索引擎基础上建立的可以同时查询多个搜索引擎的WWW站点,其英文原意是搜索引擎之后或之上的搜索引擎,因而也可以叫做后搜索引擎。虽然元搜索引擎依赖其他独立搜索引擎而存在,但它们集成了不同性能和不同风格的搜索引擎并发展了一些新的查询功能,查一个元搜索引擎就相当于查多个独立搜索引擎,可以收到事半功倍的效果,故值得选用。,5.6 Meta-search Engine(元搜索引擎),新疆师范大学,5.6 Meta-search Engine(元搜索引擎),新疆师范大学,