网络信息资源的检索.ppt
网络信息资源的检索,定义,是指通过网络存储的数字化图、文、声、像等多媒体信息的集合。与传统信息资源相比较,其主要特征是数字化和网络存取。,网络信息资源的特点,信息量大,传播广泛信息层次多,品种多样自由发布,交流直接信息传播速度快,变化频繁分散无序,缺乏管理检索方便内容质量不一,网络信息检索方法,直接如:网络资源指南搜索引擎,网络信息检索工具,定义:是指在因特网上提供信息检索服务的计算机系统。原理:,网络资源,搜集资源,提供资源,搜索引擎,定义:搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务的系统。,搜索引擎,原理搜索程序,处理程序(索引),检索程序,蜘蛛或机器人,搜索引擎分类,按工作方式划分:全文搜索引擎目录索引类搜索引擎元搜索引擎,搜索引擎分类,全文搜索引擎通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,是名副其实的搜索引擎。在国外具有代表性的搜索引擎有Google等,国内著名的有百度等。,内容全,更新快,功能强,命中率低,结构不清晰,搜索引擎分类,目录索引类搜索引擎虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。在国外代表DMOZ-theOpen Directory Project等,结构清晰,内容少,更新慢,,搜索引擎分类,元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有360搜索。,搜索引擎分类,元搜索引擎,搜索引擎一般查询规则,连接符逻辑“与”一般用“and”表示,提高查准率逻辑“或”一般用“or”表示,提高查全率逻辑“非”一般用“not”表示,缩小范围,搜索引擎一般查询规则,截词符一般按截断的位置可以分为前方截词,中间截词,后方截词。一般用“?”和“*”等表示截词符。前方截词(后方一致):“?ology”可检出:methodology,biology,radiology中间截词:“wom?n”,woman和women后方截词(前方一致):“comput?”可检索出compute、computer、computing等,搜索引擎一般查询规则,空格、逗号、括号和引号空格的作用与逻辑“与”和“and”是相同的如 计算机 维护逗号相当于逻辑“或”和“or”括号用于改变复杂检索式中逻辑运算符的优先顺序,在括号中的优先执行。如:多媒体 and(计算机 or 网络)引号括中其中的多个词被当作一个短语。如:“electronic magazine”electronic magazine,搜索引擎一般查询规则,限定字段检索限定在标题,正文,网址等。,中国搜索分布情况,数据来源:http:/,数据来源:http:/,数据来源:http:/,国内外著名搜索引擎,主要国内搜索引擎百度()百度,全球最大的中文搜索引擎、最大的中文网站。2000年1月创立于北京中关村。以网络搜索为主的功能性搜索,以贴吧为主的社区搜索,针对各区域、行业所需的垂直搜索,Mp3搜索,以及门户频道、IM等,全面覆盖了中文网络世界所有的搜索需求,根据第三方权威数据,百度在中国的搜索份额超过80%。,国内外著名搜索引擎,主要国内搜索引擎百度()高级搜索:把搜索范围限定在网页标题中intitle 例如,找云南省风景相关信息,就可以这样查询:风景 intitle:云南 注意,intitle:和后面的关键词之间,不要有空格。,国内外著名搜索引擎,主要国内搜索引擎百度()高级搜索:把搜索范围限定在特定站点中site 例如,天空网下载软件不错,就可以这样查询:msn site:注意,“site:”后面跟的站点域名,不要带“http:/”;另外,site:和站点名之间,不要带空格。,国内外著名搜索引擎,主要国内搜索引擎百度()高级搜索:把搜索范围限定在url链接中inurl 例如,找关于photoshop的使用技巧,可以这样查询:photoshop inurl:jiqiao。上面这个查询串中的“photoshop”,是可以出现在网页的任何位置,而“jiqiao”则必须出现在网页url中。注意,inurl:语法和后面所跟的关键词,不要有空格。,国内外著名搜索引擎,主要国内搜索引擎百度()高级搜索:精确匹配双引号和书名号如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的。如果您对这种情况不满意,可以尝试让百度不拆分查询词。给查询词加上双引号,就可以达到这种效果。例如,搜索 上海科技大学,如果不加双引号,搜索结果被拆分,效果不是很好,但加上双引号后,“上海科技大学”,获得的结果就全是符合要求的了。,国内外著名搜索引擎,主要国内搜索引擎百度()高级搜索:精确匹配双引号和书名号 书名号是百度独有的一个特殊查询语法。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。书名号在某些情况下特别有效果,例如,查名字很通俗和常用的那些电影或者小说。比如,查电影“手机”。,国内外著名搜索引擎,主要国内搜索引擎百度()高级搜索:要求搜索结果中不含特定查询词 例如,搜 神雕侠侣,希望是关于武侠小说方面的内容,却发现很多关于电视剧方面的网页。那么就可以这样查询:神雕侠侣-电视剧。注意,前一个关键词,和减号之间必须有空格,否则,减号会被当成连字符处理,而失去减号语法功能。减号和后一个关键词之间,有无空格均可。,国内外著名搜索引擎,主要国内搜索引擎百度()高级搜索:特定文件搜索(filetype)其搜索语法为:查询词+空格+Filetype:格式,格式可以是DOC、PDF、PPT、XLS、RTF、ALL(全部文档)。例如:市场分析 filetype:doc,其中的冒号是中英文符号皆可,并且不区分大小写。,国内外著名搜索引擎,主要国内搜索引擎百度()高级搜索:记不住?http:/,国内外著名搜索引擎,主要国内搜索引擎百度()更多技巧http:/,国内外著名搜索引擎,主要国内搜索引擎Google(http:/被公认为全球最大的搜索引擎,也是互联网上5大最受欢迎的网站之一,在全球范围内拥有无数的用户。Google允许以多种语言进行搜索,在操作界面中提供多达30余种语言选择。访问不顺畅,国内外著名搜索引擎,主要国内搜索引擎Google 翻译 将文本、网页和文件在 50 多种语言之间进行即时互译。学术搜索搜索学术论文,国内外著名搜索引擎,主要国内搜索引擎360搜索(http:/,国内外著名搜索引擎,主要国内搜索引擎新浪搜索(http:/,国内外著名搜索引擎,主要国内搜索引擎中国雅虎(http:/,目录索引搜索引擎,国内外著名搜索引擎,主要国内搜索引擎搜搜(http:/,国内外著名搜索引擎,主要国内搜索引擎有道(http:/,国内外著名搜索引擎,主要国内搜索引擎有道(http:/使用带related:前缀的页面url地址搜索某个页面的类似页面。如输入【related:】,可以查看到和网易新闻频道类似的其他网页。,国内外著名搜索引擎,主要国内搜索引擎搜狗(http:/,国内外著名搜索引擎,主要国内搜索引擎必应(http:/,国内外著名搜索引擎,主要国内搜索引擎Jopee(http:/)Jopee是集合国内外多家大型搜索引擎结果为一体的元搜索引擎系统!360搜索,元搜索引擎,国内外著名搜索引擎,主要国内搜索引擎,国内外著名搜索引擎,国内外著名搜索引擎,主要国内搜索引擎重庆就业-前程无忧-中华英才-职友集-职业大百科-,职业方面垂直搜索引擎,国内外著名搜索引擎,主要国内搜索引擎中搜论坛,论坛方面垂直搜索引擎,国内外著名搜索引擎,主要国内搜索引擎http:/电子书搜索引擎,中国最大的电子图书搜索引擎。,电子书方面垂直搜索引擎,国内外著名搜索引擎,主要国内搜索引擎搜索软件吧,中国首家专业软件搜索引擎。,软件方面垂直搜索引擎,国内外著名搜索引擎,主要国内搜索引擎淘宝天猫京东苏宁易购中关村在线 太平洋电脑网等等,购物垂直搜索引擎,国内外著名搜索引擎,主要国外搜索引擎Google(http:/)Google 被公认为全球最大的搜索引擎,也是互联网上5大最受欢迎的网站之一,在全球范围内拥有无数的用户。Google允许以多种语言进行搜索,在操作界面中提供多达30余种语言选择。,国内外著名搜索引擎,主要国外搜索引擎雅虎(http:/)是全球第一门户资讯网站,业务遍及24个国家和地区,为全球超过5亿的独立用户提供多元化的网络服务。,目录索引搜索引擎,国内外著名搜索引擎,主要国外搜索引擎雅虎(http:/)是全球第一门户资讯网站,业务遍及24个国家和地区,为全球超过5亿的独立用户提供多元化的网络服务。,国内外著名搜索引擎,主要国外搜索引擎必应(http:/)必应,是微软的中文搜索品牌,2009年5月29日正式推出。“必应”是微软全球搜索品牌Bing的中文搜索品牌,是微软全球搜索服务品牌的一个重要组成部分。,国内外著名搜索引擎,主要国外搜索引擎EXCITE(http:/,国内外著名搜索引擎,主要国外搜索引擎Ask Jeeves(http:/)虽然Ask Jeeves的知名度并没有google和微软搜索引擎bing大。在诞生10周年(2010年)之际,Ask Jeeves依据过去10年时间里网民提出的逾10亿条问题,来选出过去10年10大无法回答问题。,垂直搜索引擎,国内外著名搜索引擎,主要国外搜索引擎HotBot(http:/是美国一个非常优秀的搜索引擎,它获得了许多杂志及媒体的奖项。HotBot 最大的特点在于它的界面组织和丰富的检索功能。该引擎已被Lycos收购,国内外著名搜索引擎,主要国外搜索引擎Lycos(http:/)Lycos是搜索引擎中的元老,是最早提供信息搜索服务的网站之一。数据来自looksmart,yahoo。,国内外著名搜索引擎,主要国外搜索引擎Dogiple(http:/)是一个著名的元搜索引擎,诞生于1996年,现属于InfoSpace公司,是目前性能较好的统一检索入口式元搜索引擎之一。,元搜索引擎,国内外著名搜索引擎,主要国外搜索引擎Dogiple(http:/),国内外著名搜索引擎,主要国外搜索引擎Dogiple(http:/),各搜索引擎相关知识,网络信息资源检索技巧,分析检索的主题,明确检索目的和要求信息类型,查询方式,查询范围,查询时间选择合适的检索工具中文选百度,英文选择谷歌等析取检索词先选用主题词,用常用专业术语,用同义词与相关词,避免用高频词和低频词,网络信息资源检索技巧,正确构造检索式使用前面的逻辑运算符,位置算符和截词算符等。其直接关系检索结果,网络信息资源检索技巧,及时调整检索策略检索结果过少放宽检索范围:学科领域、时间、文章类型,关键词出现的字段等;将描述检索主题的词想全,包括同义词、近义词、缩写形式;减少用“AND”或“NOT”算符联结,增加用“OR”联结检索词;采用截词检索法,网络信息资源检索技巧,及时调整检索策略检索结果过多严格限定检索范围:学科领域、时间、文章类型,关键词出现的字段等;选择与检索主题密切相关的词和专业术语避免使用过于宽泛的词汇;使用词组检索或位置检索在检索结果的基础上进行二次检索增加用“AND”或“NOT”算符联,网络信息资源检索技巧,加快检索速度,节约时间和费用建立收藏夹只用文本方式传输使用镜像资源(本地资源)选择合适时间,