利用搜索引擎提升信息研究.ppt
利用搜索引擎提升信息研究,Mail:2008年5月,推荐三个工具,GoogleBaidu腾讯超级旋风,Google,Baidu文档库,腾讯超级旋风,Google介绍,Googling,关于Google,Google是由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月在美国硅谷创建的高科技公司,他们所设计的Google搜索引擎,旨在提供全球最优秀的搜索引擎服务,通过其强大、迅速而方便的搜索引擎,在网上为用户提供准确、详实、符合他们需要的信息。Google自2000年正式开始商业运营以来,目前在全球范围内已拥有了一个正在快速增长的忠实用户群,其中一半以上是国际用户。Google 是由英文单词“googol”变化而来。“googol”是美国数学家 Edward Kasner 的侄子 Milton Sirotta 创造的一个词,表示 1 后边带有 100 个零的数字。Google 使用这个词代表公司想征服网上无穷无尽资料的雄心。,为什么选择Google?,Google并非只使用关键词或代理搜索技术,它将自身建立在高级的PageRank(网页级别)技术之上,可确保始终将最重要的搜索结果首先呈现给用户。网页级别可对网页的重要性进行客观的分析。用于计算网页级别的公式包含5亿个变量和20多亿个项。网页级别利用巨大的网络链接结构对网页进行组织整理。当从网页A链接到网页B时,Google就认为“网页A投了网页B一票”。Google复杂的自动搜索方法可以避免任何人为感情因素。Google的结构设计即确保了它绝对诚实公正,任何人都无法用钱换取较高的排名。Google可以诚实、客观并且方便地帮助用户在网上找到有价值的信息。,Google的特点,Google支持多达132种语言,包括简体中文和繁体中文;Google网站只提供搜索引擎功能;Google速度极快,有15000多台服务器(还在不断增长),200多条T3级宽带;Google的专利网页级别技术PageRank能够提供准确率极高的搜索结果;Google智能化的“手气不错”功能,提供可能最符合要求的网站;Google的“网页快照”功能,能从Google服务器里直接取出缓存的网页。Google具有独到的图片搜索功能;Google具有强大的新闻组搜索功能;Google具有二进制文件搜索功能(PDF,DOC,SWF等)Google还有很多尚在开发阶段的令人吃惊的设想和功能。,Google初级搜索,关键词,输入关键词:交通大学,点击 获得21,100,000条查询结果输入关键词:“交通大学”,仅获得10,600,000条查询结果,提示1:仅采用单字节字符,双引号会大大缩小查询范围,称为“强制搜索”,强制搜索,双引号使用方法,关键词可以是单词或短语,其中空格仅在强制搜索中有效对于英文关键词中的大小写不做区别对于a、an、the、的、http、www、com、星号、顿号等最常用单词或符号进行忽略如果不使用强制搜索,必须用+对忽略词进行明文约束Google仅支持*作为通配符,但必须进行强制搜索,比如:以”*”服人,提示2:忽略词仅在强制搜索中被认可,但是多数常用符号(,!?.)即便强制搜索也无效,什么是忽略词?,举例,搜索:www的历史,获得26,100,000条记录搜索:+www 的历史,获得2,460,000条记录搜索:“www的历史”,获得14,500条记录,逻辑操作,“”(空格):表示逻辑“与”操作,不需要“+”或AND表示逻辑“与”操作“-”(减号):表示逻辑“非”操作“OR”:表示逻辑“或”操作,提示3:使用逻辑“非”操作时在”-”与后续关键词之间不能留空格,之前必须留空格,Google简介,Site:表示搜索结果局限于某个具体网站或者网站频道 Link:返回所有链接到某个URL地址的网页 Inurl:返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。Allinurl:返回的网页的链接中包含所有查询关键字 Intitle:返回的网页标题中包含第一个关键词,后面的关键词则出现在链接中或者网页文档中。Allintitle:返回的网页的链接中包含所有查询关键字 Filetype:查找包含指定的关键词的某一类文件。,Google简介:Site,Site:表示搜索结果局限于某个具体网站或网站频道 示例:搜索包含“鲁迅”的中文新浪网站页面搜索:“鲁迅”,获得297,000项结果;“鲁迅”,获得47,200项结果。但是,搜索:“鲁迅”,仅返回首页8项结果!,提示4:“:”后不能有空格,域名不能使用http或www前缀,频道采用“频道名.域名”格式,Google简介:Link,Link:返回所有链接到某个URL地址的网页示例:搜索所有含指向北京交通大学“”链接的网页。搜索:link:,返回886项查询结果,提示5:Link不能与其他语法混合使用!,Google简介:Inurl,Inurl:返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。很多网站把某类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”等,可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法通常能提供非常精确的专题资料。示例:查找用flash做的马三立相声搜索:inurl:flash“马三立”,返回查询结果2,580项,Google简介:Allinurl,Allinurl:返回的网页的链接中包含所有查询关键字,查询对象只集中于网页的链接字符串。示例:查找马三立相声的flash作品搜索:allinurl:swf“马三立”,返回查询结果4项,Google简介:All/intitle,Allintitle、Intitle:用法类似于上面的allinurl和inurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中的部分,网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。示例:查找关于马三立相声的一些内容。搜索:intitle:“马三立”,返回24,300项查询结果;allintitle:“马三立”“flash”,返回289项查询结果,Google简介:Filetype,Filetype:是Google独创开发的非常强大实用的搜索语法。Google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google已经能检索微软的Office文档,Adobe的.pdf文档,ShockWave的.swf文档(Flash动画)等13种文件格式。示例:查找包含“北京交通大学”的所有ppt文档搜索:“北京交通大学”filetype:ppt,返回2,920项查询结果,提示6:Filetype与关键词之间必须留有空格!,Google文件搜索类型,PDFs pdfAdobe PostScript ps Lotus 1-2-3 wk1,wk2,wk3,wk4,wk5,wki,wks,wku Lotus WordPro lwp MacWrite mw Microsoft Excelxls Microsoft PowerPoint ppt Microsoft Worddoc Microsoft Works wks,wps,wdb Microsoft Write wri Rich Text Format rtf Text ans,txt Flashswf,Google高级搜索页,Google的高级搜索页(命令的文字界面形式)将搜索范围限制在某个特定的网站中 排除某个特定网站的网页 将搜索限制于某种指定的语言 查找链接到某个指定网页的所有网页 查找与指定网页相关的网页可以比较直观地在搜索中应用这些功能。,Google网页目录搜索,Google 网页目录按主题对网页进行组织整理,这样,就可以通过浏览分类主题来查找用于搜索的关键词。也可以一步步单击分类链接,直至找到所需要的资料。利用Google目录可以根据主题来缩小搜索范围,提高查找的精度。,Google邮件,通过好友邀请,或者直接登录http:/mail/signup 即可获得超过2.9GB的Gmail帐号,随着使用的频率提高,可以获得更多的免费空间Gmail与Google Alerts配合帮助你对竞争对手、学术热点、科技前沿、合作伙伴等进行“贴身”跟踪,Google快讯,使用关键词对学术、专业领域进行主题跟踪,跟踪范围包括网页、论坛、新闻、博客等刷新周期包括三种选项:一天一次、出现最新结果时、一周一次建议与Gmail配合使用,最好不要定制快讯到企业信箱,Google工具栏,搜索网页:在任何网页上随时使用Google的查询。检索网址:站内查询,限定搜索范围于所关注的网站内。PageRank:Google对该网页的评价。网页详情:提供更多有关网页的详情,例如和它类似的其它网页,哪些网页有链接到此,或者该网页在 Google 里的存档等等。标明:用不同的颜色标释出您的查询字词。,其他Google工具,Google地球:Google即时通讯:Google桌面:Google拼音输入法:,Google应用的进阶培训,Google Code,专门为开发人员提供的编程接口汇总,包括大量的开源软件以及Google开发人员的社区、博客、播客和工作机会。,Google API,Google推出专门针对开发人员使用的WEB APIs工具,帮助开发人员在有限范围内检索超过20亿的文档,并按照自己的需要公布检索结果。开发人员可执行1000条自动搜寻,Google API服务室采用WSDL和SOAP标准,以便支持主要的开发工具。,Google Search类别,目录类别,结果类别,百度搜索引擎,百度文档搜索,支持五种文档格式:pdf,ppt,doc,xls,rtf和All(即以上所有文档类型)书名号:,是百度搜索的独特之处在中文文档的搜索方面,以百度作为辅助工具非常有效示例:搜索“余世维”filetype:ppt,Google用时0.18秒,返回65项结果;Baidu用时0.036秒,返回76项结果,百度国学搜索,是百度与国学公司合作推出的针对中国传统文化方面的专业搜索,提供了丰富的古典名著、历史资料、人名书名等。示例:搜索“胜者之战”,Google用时0.24秒,返回16300项结果;Baidu国学用时0.136秒,返回1项结果孙子 形篇,管理好你的目录:不要从过去迷失在互联网上,变成今天迷失在硬盘中。,谢谢您的参与!,