《搜索引擎原理》PPT课件.ppt
《《搜索引擎原理》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《搜索引擎原理》PPT课件.ppt(124页珍藏版)》请在三一办公上搜索。
1、搜索引擎介绍,网络信息资源分类,简单地可以分为两类:一类是来自正式文献信息源的信息:质量高、内容可靠,一般都有检索平台,花钱购买才能很方便的使用。(如CNKI数据库)一类是各类网站上的信息:包罗万象、良莠不齐,一般通过搜索引擎进行检索。注意:科学研究需要的文献资料,一般要通过图书馆主页的各种数据库获取。,网络信息资源分类,如按照采取的网络传输协议不同可分为:WWW信息资源 FTP信息资源(FTP:/)TELNET信息资源(远程医疗)用户服务组信息资源 GOPHER信息资源,网络检索工具搜索引擎,因特网上蕴藏着丰富的信息资源。它已经成为全球传播科研、教育、商业和社会信息的最主要渠道。我们怎么从着
2、信息的海洋中准确迅速地找到所需的信息?从20世纪80年代起人们开发了各种网络信息检索工具。1989年,万维网诞生了。WWW上的资源成为因特网的主流,越来越多的万维网搜索引擎成为检索网络信息资源的工具。所以我们在这里介绍WWW上的搜索引擎。,一、搜索引擎概述,本次课程内容,一、搜索引擎概述1、常用搜索引擎介绍2、搜索引擎的关键词语法规则3、Google与百度的检索技巧4、网络免费学术资源介绍,搜索引擎概述-概念,1、搜索引擎(Search Engine):人们经常将网络信息检索工具概称为搜索引擎它以一定的策略在Internet上搜集、发现信息,对信息进行提取、组织和处理,并为用户提供检索服务,从
3、而达到信息导航的目的。搜索引擎也是一类网站,即因特网上具有检索功能的网页。它能够在万维网上主动搜索其他web站点中的信息并对其自动进行索引,即记录下各个Web页面的URL地址并进行有序排列这些索引内容存放在可供的查询的索引数据库中。,搜索引擎概述-类型,2、根据搜索引擎的信息搜集方法和服务提供方式的不同来划分为以下三大类:(1)全文搜索引擎(机器人搜索引擎)(2)目录式搜索引擎(3)元搜索引擎 本质区别:目录索引搜索引擎的资料数据库中,搜索保存的是互联网上各网站的站名、网址和内容提要;全文搜索引擎的资料库中,搜索保存的则是互联网上各网站的每一个网页的全部内容,范围要大得多。,Google主页,
4、百度主页,YAHOO搜索主页,搜索引擎的工作原理,在因特网中发现、搜集网页信息,对信息进行提取和组织、建立索引库,根据用户输入的查询条件,在索引库中快速检出文档,进行相关度评价,将结果进行排序将查询结果返给用户,索引数据库,信息搜集,用户,1、全文搜索引擎介绍,全文搜索引擎,全文搜索引擎是名副其实的搜索引擎。它们都是通过从互联网上提取各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此它们是真正的搜索引擎。国外具代表性的有 Google等,国内著名的有百度(Baidu),全文搜索引擎提供的完整信息,全文搜索引擎工作原理,
5、工作原理是由网络机器人软件ROBOT,每天24小时不停地访问因特网上的网站,并根据页面上的链接从一个网页跳到另一个网页,提取网页,以及标题、关键词、超链接、元数据乃至网页全文等各种信息。搜索到的网页信息被存储在数据库中,由机器自动标引形成索引,建立索引库。,1.1、Google搜索引擎介绍,Google搜索引擎介绍,Google是由2名斯坦福大学博士生Larry Page 和Sergey Brin1998年创立,是目前世界上最大、用户最多、全球公认最佳的搜索引擎。网址(http:/)或(http:/),Google搜索引擎介绍,Google 是由英文单词“googol”变化而来表示 1 后边带
6、有 100 个零的数字。Google 使用这个词代表公司想征服网上无穷无尽资料的雄心。Google支持100多种语言,到2005年已增长至80亿网页,其对网页进行整理,为世界各地的用户提供便捷的网上信息查询。,Google概况,优点:信息量大,更新快,能给用户最全面最广泛的搜索结果。缺点:有很多无关信息出现,降低相应的命中率,必须从结果中再筛选。提供的查询结果重复链接较多。,2006年4月在中国更名“谷歌”,检索途径(网页、图片、视频、新闻、音乐等),检索途径,检索入口,高级检索页面,检索功能,GOOGLE提供基本搜索和高级搜索两种搜索方式:1、基本检索 就是直接在主页的检索框内输入检索词和短
7、语提问,自由检索,直接获取检索结果。2、高级检索 搜索结果区中的四种匹配方式依此表示and、精确短语检索、or、not。每个检索框只能输入检索词,不能输入运算符。同时还可进行时间、语言、网域等的限制。,基本检索语法规则(记住第1、4条),(1)默认检索:输入多个检索词以空格分隔,默认为AND匹配。最多可输入10个检索词。即不需使用AND或“+”号,其会在关键词之间自动添加AND。空格表示逻辑“与”。(2)逻辑“或”检索:用大写OR连接多个检索词。高级检索中仍然有相当OR逻辑关系的字段。(3)逻辑“非”检索:检索词前加上减号“-”(减号前必须留一空格),表示逻辑“非”,搜索不包含该检索词的网页,
8、基本检索语法规则,(4)短语检索:用半角的双引号括起词组或短语,进行精确短语匹配。如:“Kidney failure”.(5)GOOGLE不区分英文字符大小写:“GoD”和“god”搜索的结果是一样的。不支持“*”搜索(6)不支持“通配符”(*)搜索:也就是说,Google 只搜索与输入的关键词完全一样的字词,基本检索中的限定检索,(1)site:限定在某个特定的网域或站点中进行检索。命令格式:检索词 site:域名 例:三峡旅游 site:com,表示在商业网站中搜索含“三峡旅游”的网页。,基本检索中的限定检索,(2)intitle:表示限定在网页标题中搜索.命令格式:intitle:检索词
9、 例:intitle:王菲写真,表示在网页中搜索包含“王菲写真”的网页.,基本检索中的限定检索,(3)Filetype:用来限定命中文件的类型。命令格式:关键词 Filetype:文件类型 例:文献检索 Filetype:PPT,表示在网页中搜索包含“文献检索”内容的PPT文件.,基本检索中的限定检索,(4)inurl:在网页的url内搜索指定的内容。inurl后面的关键词则可以出现在网页的文档中。URL中文叫统一资源定位器。命令格式:inurl:限定的字符串检索词 例:inurl:MP3 宋祖英,表示宋祖英可以出现在网页的任何位置,而MP3 则必须出现在网页的URL中。,举例:搜索三峡旅游相
10、关网页,用Site:限定查三峡大学毕业论文格式,如果不限定检索也可以查到,但是查准率低 方法:检索词直接输入基本检索框,检索结果=138000条,搜索王菲的照片(intitle:王菲写真),搜索宋祖英的MP3音乐(inurl:MP3 宋祖英),在论坛上查教育技术博士点高校有哪些(教育技术博士点 inurl:bbs),Google基本检索指令表,基本检索一般方法举例,例1:查找中国人寿司歌的歌曲名称,第一种检索方法,、将中国人寿司歌作为检索词直接输入基本检索框结果:搜索引擎自动将中国人寿司歌分隔成中国人和寿司两个检索词进行查找.(2006年的检索结果),第一种检索方法,没有在前10条中发现答案(
11、2006年结果),第二种检索方法,、用户主动使用空格分隔,默认为AND 中国人寿 司歌作为两个检索词用空格隔开并输入。检索结果如下:,主动使用空格的检索效果,结果在第三条就看到了(2006年结果),结果在这里,第三种检索方法,、用半角双引号括起词组或短语,进行精确短语匹配 将其用半角双引号括起“中国人寿司歌”,输入到检索框中。,检索结果一目了然(2006年结果),2007年数据库更新完善后的检索情况,数据更新完善后的检索情况,2011年2月检索情况,高级检索,高级检索 搜索结果区中提供四种逻辑匹配方式依此表示and、精确短语检索、or、not。每个检索框只能输入检索词,不能输入运算符。同时还提
12、供了语言、更新时间、检索词位置、网域等限定,另外还可通过“类似网页”搜索相关网站。,高级检索,将搜索范围限制在某个特定的网站中 排除某个特定网站的网页 将搜索限制于某种指定的语言 查找链接到某个指定网页的所有网页 查找与指定网页相关的网页 示例1:查找微软网站上关于windows2000的安全课题资料。,高级检索,高级检索界面,security,Windows 2000,M,检索结果,高级检索中的含义解释,1、包含以下全部的字词:相当于词间“与”关系,2、包含以下的完整字句:相当于“”字符串检索,3、包含以下任何一个字词:相当于词间“或”关系4、不包括以下字词:相当于词间“非”关系,高级检索举
13、例,示例2:搜索”医学论文写作”方面的网页及PPT课件,包含以下全部的字词,结果=1500,000条,包含以下的完整字句,结果=384,000条,不包括以下字词,结果=1440,000条,搜索”医学论文写作”方面的PPT课件,PDFPPTDOCXLSSWF,检索结果=620条,Google 的特殊功能,查找某文档类型网页:PDF、PPT、swf、DOC PostScript(ps)等.网页快照:单击“网页快照”即可.定位检索功能:通过“手气不错”键实现.类似网页:点击“类似网页”键实现.,Google 的特殊功能,1、查找某文档类型网页:Google已经可以支持13种非HTML文件的搜索。除P
14、DF、DOC、PPT、xls文档外(百度可以),Google现在还可以搜索、Shockwave Flash(swf)、PostScript(ps)和其它类型文档。如果您只想查找PDF或Flash文件,而不要一般网页,只需搜索“关键词 filetype:pdf”或“关键词 filetype:swf”就可以了。举例(1)流氓兔 filetype:swf(2)查lung cancer的PDF外文全文文献 lung cancer filetype:pdf,查找PDF文档,PDF全文,Google的特殊功能,2、网页快照 Google 在访问网站时,其会将看过的网页复制一份网页快照,以备在找不到原来的网
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 搜索引擎原理 搜索引擎 原理 PPT 课件
链接地址:https://www.31ppt.com/p-5516780.html