欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    网络信息检索技术与搜索引擎.ppt

    • 资源ID:2210826       资源大小:1.27MB        全文页数:36页
    • 资源格式: PPT        下载积分:8金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要8金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    网络信息检索技术与搜索引擎.ppt

    内容回顾,检索技术布尔逻辑检索技术:AND OR NOT截词检索技术限制检索技术:site:inurl:filetype等等模糊检索与精准检索,作业1,检索“计算机在汽车车身中的应用”方面的信息。(写出检索表达式,利用搜索引擎进行搜索,截取检索结果第一页。)主题概念分析,提取关键词计算机 汽车车身计算机辅助设计 计算机辅助制造 汽车车身计算机辅助设计 CAD 计算机辅助制造 CAM 汽车车身,基于内容分析方法扩展检索概念,隐含概念扩展法是指文献或课题中,未用显而易见的方式表达,因而需要认真进行由表及里、由此及彼的深入分析才能找出的主题。如:“投资管理”的显见主题是“投资管理”,隐含主题还有“投资法规”、“投资法律”。,作业1,构建检索表达式(计算机辅助设计 OR CAD OR 计算机辅助制造 OR CAM)AND 汽车车身(计算机辅助设计|CAD|计算机辅助制造|CAM)汽车车身检索:直接输入检索表达式高级搜索,作业2.找到宾夕法尼亚大学癌症中心的关于乳腺癌内容的网页。,主题概念分析,抽取关键词University of Pennsylvania Cancer Center Breast Cancer构建检索表达式University of Pennsylvania AND Cancer Center AND Breast Cancer University of Pennsylvania Cancer Center Breast Cancer“University of Pennsylvania”“Cancer Center”“Breast Cancer”,作业2,检索手气不错直接输入检索式高级搜索,作业3,3.检索“温室效应对气候改变的影响”的论文资料。(利用中国知网(本地镜像)-中国期刊全文数据库检索,检索字段选择“关键词”,写出检索表达式,截取检索结果的第一页)。提取关键词:温室效应 气候构建检索表达式:温室效应 AND 气候,作业4,4.利用搜索引擎检索有关“物联网”的docpdfppt格式的文件,写出检索表达式,截取检索结果的第一页。物联网(filetype:doc|filetype:pdf|filetype:ppt)物联网(inurl:ppt|inurl:pdf)物联网 inurl:doc,3.2网络搜索引擎,搜索引擎(Search Engine)以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。,特点,收录、加工信息的范围广、速度快;检索功能强,一般可称为网络资源的关键词索引;检索时直接输入关键词或词组、短语,无需判断类目归属,比较方便;标引过程缺乏人工干预,准确性较差检索误差(噪音)较大搜索引擎适合于检索特定的信息,及较为专、深、具体或类属不明确的课题。,搜索引擎的工作原理,搜索器,索引器,检索器,用户界面,在因特网中发现和搜集信息,理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表,建立起自己的物理索引数据库。,根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。,输入用户查询、显示查询结果,提供用户相关性反馈机制。,搜索引擎的分类,按索引方式的不同,可分为目录式搜索引擎、机器人搜索引擎、元搜索引擎。,目录式搜索引擎,以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。有利于族性检索。信息大多面向网站。提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人工智能,所以信息准确、导航质量高。缺点是需要人工介入(维护工作量大)、信息量少、信息更新不及时。适合主题浏览,检索目的不太明确的用户。这类搜索引擎的代表是:国内:中文Yahoo!、网易、sohu、sina等;国外:Yahoo!、Galaxy、LookSmart、Open Dirertory、Go Guide等,机器人搜索引擎,由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在Internet中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。自动标引,数据量大。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预。缺点是返回信息过多,有很多无关信息,用户必须从结果中筛选。检索功能强大。查全率高,查准率低。适于查找目的明确的用户。这类搜索引擎的代表是:Google Baidu、天网、百度、AltaVista、Hotbot、Excite、Infoseek、FAST、Lycos等。,元搜索引擎,Meta Search Engine(搜索引擎之上的搜索引擎是一个能调用其他搜索引擎的搜索引擎。)这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量大。查全率大大提高,但查准率更难保障缺点是不能够充分使用原搜索引擎的功能,用户需要做更多的筛选。这类搜索引擎的代表是搜乐网、搜魅网、万纬搜索、WebCrawler、InfoMarket,在线搜(http:/,垂直搜索引擎,垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。Sou365:http:/http:/股票搜索引擎 叮玲玲垂直关键词搜索引擎:http:/www.dinglingling.org/,有代表性的中英文搜索引擎,Google Lycos Infoseek Excite Ask JeevesInktomiNorthern Light WisenutAOLAlltheweb,百度天网搜索中国搜搜爱问搜狗,Google(谷歌)简介,世界第一搜索引擎,搜索引擎世界第一!两位斯坦福大学的博士生 Larry Page 和 Sergey Brin 在 1998 年创立了 Google。Google 是由英文单词“googol”变化而来。“googol”是美国数学家 Edward Kasner 的侄子 Milton Sirotta 创造的一个词,表示 1 后边带有 100 个零的数字。Google 使用这个词代表公司想征服网上无穷无尽资料的雄心。,Google在中国,http:/.hk/已经不复存在关于谷歌中国的最新声明(2010年3月23日)从今天早上开始,我们已停止了在G搜索服务上的自我审查,包括 Google Search(网页搜索)、Google News(资讯搜索)和Google Images(图片搜索)。访问 G 的用 户从现在开始将被指向G.hk,在这个域名上,我们将提供未经审查的简体中文搜索结果,这些为中国大陆用户设计的服务将通过我们在香港的服务器实现。,Google检索技巧,单个关键词搜索“信息检索”相关的网页多个关键词:布尔逻辑检索(与、或、非)搜索结果包括两个或两个以上关键字(与):空格(格式:A B)搜索包含信息检索和网络的网页搜索结果要求不包含某些特定信息(非):“-”(格式:A B)搜索包含信息检索的方法,但不包含网络的网页搜索结果至少包含多个关键字中的任意一个(或):大写“OR”(格式:A OR B或A ORB)搜索包含信息检索或网络的网页,信息检索 网络,信息检索 方法 网络,信息检索 OR 网络,Google检索技巧,强制搜索或精确搜索例:查询“www的历史”相关的网页“www的历史”google会忽略常用的词和字符,如“http”、“www”、“.com”和“的”等。可用英文双引号引起来。使用书名号进行检索例如:查询电影或电视剧“手机”手气不错:自动进入google查询到的第一个网页快速进入“临沂大学”网站,Google检索技巧限制检索技术,限制文本类型例:搜索关于信息检索的pdf文档采用filetype语法。Google已经能检索微软的Office文档。如.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus1-2-3文档,Adobe的.pdf文档,ShockWave的.swf文档(Flash动画)等。(格式:关键词 filetype:文件格式)信息检索 filetype:pdf例:搜索关于信息检索的pdf或者word文档信息检索(filetype:pdf OR filetype:doc),Google检索技巧限制检索技术,搜索范围限定在特定网站格式:关键词 site:网站或域名例如:在天空网下载迅雷软件注意:site:后面的站点域名,不要带http:/迅雷 site:,Google检索技巧限制检索技术,限定在网页标题中检索格式:intitle:关键词例如:查找高等数学学习方法intitle:高等数学学习方法,Google检索技巧限制检索技术,搜索范围限定在URL链接中格式:关键词 inurl:url查找mp3曲,本草纲目本草纲目 inurl:mp3,Google总结(也可以通过高级搜索完成),百度的检索技巧(与google基本类似),

    注意事项

    本文(网络信息检索技术与搜索引擎.ppt)为本站会员(仙人指路1688)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开