欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    [互联网]第二讲 信息检索基本原理与方法.ppt

    • 资源ID:4602646       资源大小:5.97MB        全文页数:68页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    [互联网]第二讲 信息检索基本原理与方法.ppt

    网络信息检索课程 第二讲 信息检索基本原理与方法,讲解内容,信息检索基本原理,信息检索基本类型,文献检索基本步骤,小结,检索实例,知识点回顾,上一讲重要知识点,纸质文献标识代码普通图书(Monographs)M会议录(Conferences)C报纸文章(Newspaper)N期刊(Journals)J学位论文(Dissertation)D科技报告(Report)R标准(Standards)S专利(Patents)P,课堂练习答案,请指出下列文献的文献类型,王蔷.小学英语教学法教程M.北京:高等教育出版社,2003 陶仁骥.密码学与数学J.自然杂志,1984,7(7):527 Borko H,Bernier C L.Indexing concepts and methodsM.New York:Academic Pr,1978.赵均宇.略论辛亥革命前后的章太炎N.光明日报,1977-03-24(4)Piterniek A B.Functions and Capabilities of Online Searching Systems:a ChecklistJ.Online Review,1989,13(6):466-469.王亚军.整装催化剂及催化转化器若干研究D.北京理工大学,2000.辛希孟.信息技术与信息服务国际研讨会论文集:A集C.北京:中国社 会科学出 版社,1994.,一、信息检索基本原理,从“图灵实验”说起,计算机发展史上有一个重要人物,即人工智能的始祖阿伦图灵,他在上世纪50年代曾经提出了一个假想的实验,认为计算机可以具有人类的思维能力,被称为“图灵实验”。并且预言,在20世纪末,具有人工智能的计算机将会出现。但时至今日,仍未有任何一台计算机能通过“图灵实验”。,信息检索基本原理,计算机检索的奥妙:关键词匹配,计算机实现检索的奥妙,就在于它能把你输入的检索词,与它后台数据库中存储的文件关键词进行比对,如果能够匹配,就认为这条信息是你需要的,立刻输出给你。,信息检索基本原理,广义的信息检索:是指将信息按一定的方式组织和存储起来,并根据用户的需要找出相关信息的过程。,什么是信息检索?,信息检索基本原理,狭义的信息检索:一个匹配(Match)过程 即用户使用检索语言对自己的信息需求予以描述,并在一定的信息资源系统中进行描述匹配的过程。,信息存储,原始信息,主题,分析,主题信息,数据库记录及信息特征标识,著录,标引,计算机,类比,输出,检索结果,信息检索,信息需求,分析,主题,分析,检索主题,著录,标引,检索提问式及提问标示,信息检索基本原理,检索词在数据库纪录中的匹配,【题名】碳纳米管应用研究现状与进展【作者】姜靖雯 彭峰【机构】华南理工大学化学工程系,广东广州510640【刊名】材料科学与工程学报.2003,21(3).-464-468【关键词】碳纳米管 电学性能 场致发射 电子器件 力学性能 储氢材料 催化 剂 锂离子充电电池 电极材料【分类号】O613.71 TB383【文摘】本文综述了近年来碳纳米管在场发射、分子电子器件、复合增强材 料、超级电容器、储氢材料、催化剂材料、锂离子充电电池电极材料 等方面应用研究的现状与进展;并对纳米管的应用前景进行了展望。,信息检索基本原理,二、信息检索基本类型,依信息存储和检索的方式手工检索(Manual Retrieval)也称传统信息检索,是利用各种印刷型检索工具来查找文献的一种方法。计算机检索(Camputer-based Retrieval)也称现代信息检索,是指利用计算机和网络来处理和查找文献信息的检索方式。,信息检索基本类型,三、文献检索基本步骤,1.检索准备2.选择检索系统和数据库3.制定检索式和确定检索途径4.实施检索并对检索式进行调整5.筛选文献6.获取全文,文献检索基本步骤,-明确课题学科属性、专业范围及相关内容 如:超声波技术在兽医学上的应用-弄清检索课题的信息类型和时间要求 即:为文献类检索课题还是事实数据类检索课题 如:沙性土壤植物综合利用工艺 中国经济领域的统计数据、政策、会议名称-考虑课题的特殊要求-明确用户自身的信息要求,文献检索基本步骤,1 检索准备,文献检索基本步骤,2 选择检索系统和数据库基本原则,-数据库收录的信息内容所涉及的学科范围-数据库收录的文献类型、数量、时间范围及更新周期-数据库提供的检索途径、检索功能和服务方式,文献检索基本步骤,2 选择检索系统和数据库综合、专业数据库,-Derwent Innovations Index(德温特专利数据库)-中华人民共和国国家知识产权局专利检索系统-美国专利与商标局检索系统-欧洲专利局检索系统-世界专利数据库-原文传递,2 选择检索系统和数据库专利数据库,文献检索基本步骤,-Google、百度等搜索引擎(主要查产品类的)-中国科技成果网http:/(科技成果类)-Dialog检索系统-STN 检索系统,付费数据库,文献检索基本步骤,2 选择检索系统和数据库其他资源,文献检索基本步骤,3 制定检索式和确定检索途径,(1)确定检索词,自由词(任意词)关键词(专业词、非受控词)主题词(规范词、受控词、叙词)土豆 发酵制浆 洋芋 微生物制浆 注:检索词还可以包括:作者、机构名称、分类号、出版物名称等。,马铃薯,酶法制浆,文献检索基本步骤,-确定检索词,检索词是检索式的基本组成元素,能否选准、选全检索词直接影响到检索效果的优劣。确定检索词常用的方法是:从给定的课题名称出发,经过切分、删除、补充等步骤,确定检索词,最终通过组配,构成能全面、明确表达信息需求的检索式。,文献检索基本步骤,-确定检索词,切分:对语句进行切分,以词为单位划分句子或词组。删除:删除不具有检索意义的虚词、其他非关键词及过 于宽泛和过于具体的限定词。补充:补充还原词组、同义词和近义词。,例:工农业/废水/的/循环利用/的/研究 检索词包括“工业、农业、工农业、废水、循环利用”高速公路/运营/财务/管理/模式/研究 检索词包括“高速公路、高速路、运营、营运、财务”,对于需要较高查全率的检索课题,可以以降低检索词的专指度为出发点,补充选用检索词的上位词。,文献检索基本步骤,3 制定检索式和确定检索途径,(2)构建检索提问式 检索提问式是计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符、截词符以及系统规定的其它组配连接符号组成。,用布尔逻辑算符进行检索词的逻辑组配,是一种常用的检索技术。常用的逻辑运算有三种:与、或、非。,文献检索基本步骤,-布尔逻辑检索,1)逻辑“与”用and、“*”或者空格表示。A*B表示同时含有这两个词。在网络搜索引擎中习惯用空格代替*。它可以缩小检索范围提高检准率。,文献检索基本步骤,-布尔逻辑检索,例:输入“中国政府”可以找出包含“中国政府”4个汉字的网站,但像“中国政府”或“中国人民政府”,一般可以输入“中国*政府”、“中国 AND 政府”、“中国 政府”等。,2)逻辑“或”用or、“+”或逗号表示。A+B表示只要有两者中的一个就能满足检索的要求。在网络搜索引擎中习惯用逗号代替+。它可以扩大检索范围,提高检全率。,文献检索基本步骤,-布尔逻辑检索,例:在搜索引擎中输入“计算机 or 多媒体 or Windows XP”则查询至少包含“计算机”、“多媒体”、“Windows XP”三者之一的信息。,3)逻辑“非”用not 或“”号表示。A not B表示包含A且不包含B。它可以从原来的检索范围中排除不需要的概念,使检索结果更准确。在网络搜索引擎中习惯用减号代替not。,文献检索基本步骤,例:输入“automobile not car”就要求查询的结果中包含automobile,但同时不能包含car。在搜索引擎中输入“电视台中央电视台”,则查询结果中不包含“中央电视台”。,-布尔逻辑检索,截词检索主要是利用检索词的词干或者不完整的词形进行检索,其作用是可扩大检索范围,提高文献的查全率。常用的截词符号有“?”“$”和“*”等。截词检索中使用的截词方式主要有后方截词、前方截词、前后截词和中间截词四种。,文献检索基本步骤,-截词检索,后方截词:comput*可检索computer、computers、computing 等前方截词:*computer可检索 computer、microcomputer等前后截词:?大学?可检索北京大学学报、北京科技大学学报等中间截词:wom?n 可检索woman、women等,文献检索基本步骤,-截词检索,1(W)、(nW)W:检索词之间不得插入任何词,顺序不能颠倒。如:Al(W)Si(W)Alloy nW:检索词之间可以插入词,顺序不能颠倒。如:electric(1W)vehicles,文献检索基本步骤,-位置算符,规定检索词在原始文献中相对位置的符号,主要有W、nW、N、F、S等。,2(N)、(nN)N:算符两侧的检索词必须紧密相连,中间不能插 入其他词,顺序可以颠倒。如:Chemistry(N)Physics nN:算符两侧的检索词中间可以插入最多n个其他 词,顺序可以颠倒。如:computer(2N)system,文献检索基本步骤,-位置算符,3(S)S:表示其两侧的检索词必须是在文献记录的同一子字段中,且不限制它们在该子字段中的相对次序和相对位置的 距离。在文摘字段中,一个句子就是一个子字段。如:computer(W)control(S)system 可检出“This paper is concerned with a application of the computer control technique in a intelligent system for testing inner walls in pipes.,文献检索基本步骤,-位置算符,即限定检索词出现的字段 如:AU=作者;LA=语种;TI=篇名;AB=文摘 PY=年代;PN=专利等。,文献检索基本步骤,-字段符号,例如:关键词=科技英语,文献检索基本步骤,-字段符号,(3)确定检索途径,文献检索基本步骤,3 制定检索式和确定检索途径,文献检索基本步骤,4 实施检索并对检索式进行调整,检索时,应及时分析检索结果是否与检索要求一致,根据检索结果对检索提问式进行相应的修改和调整,直至得到比较满意的结果。,文献检索基本步骤,4 实施检索并对检索式进行调整,-检索结果信息量过多 a 减少同义词与同族相关词 b 增加限制概念,采用逻辑“与”连接检索词 c 使用字段限定,将检索词限定在某个或某些字段范围 d 使用逻辑“非”算符,排除无关概念 e 调整位置算符,由松变严,文献检索基本步骤,4 实施检索并对检索式进行调整,-检索结果信息量过少 a 选全同义词与相关词并用逻辑“或”将它们连接起来,增加网罗度。b 减少逻辑“与”的运算,丢掉一些次要的或者专指性太 强的概念。c 去除某些字段限制 d 调整位置算符,文献检索基本步骤,5 筛选文献,详细记录符合检索需求的文献线索,包括文献名称、作者、时间、文献出处、文献类型等。,关于检索结果的相关度的判定,判断检索词是作为一个精确的词组检索到的,还是在一条记录中被分别检索到的,被精确检索到的相关度高。如果检索词被分别检索到的,被检到的词越接近,该条记录相关度高。词或短语在检索记录中出现的次数,频次高相关度高。检索词是否是在重要的字段中,如标题、关键词字等段。,文献检索基本步骤,文献检索基本步骤,6 获取全文期刊文献,-学校订购的数据库(中文数据库如维普、CNKI、万方 数据库等;外文数据库如WorldSciNet、Springer LINK、Elsevier Science等全文电子期刊)-馆藏纸本期刊-免费资源(如 socolar、DOAJ等)-原文传递,-学校订购的数据库,文献检索基本步骤,文献检索基本步骤,-馆藏纸本期刊,文献检索基本步骤,-免费资源,文献检索基本步骤,-免费资源,文献检索基本步骤,-原文传递,文献检索基本步骤,-原文传递,文献检索基本步骤,6 获取全文专利文献,-Derwent Innovations Index(德温特专利数据库)-中华人民共和国国家知识产权局专利检索系统-美国专利与商标局检索系统-欧洲专利局检索系统-世界专利数据库-原文传递,文献检索基本步骤,-Derwent Innovations Index,文献检索基本步骤,-中华人民共和国国家知识产权局专利检索系统,文献检索基本步骤,-美国专利与商标局检索系统,文献检索基本步骤,-欧洲专利局检索系统,文献检索基本步骤,-世界专利数据库,四、检索实例,实例:工农业废水的循环利用的研究,检索要求:查证国内外关于“农工业废水的循环利 用”情况。,检索实例,通过分析得知:“工农业废水的循环利用的研究”属于化学工程、环境工程学科。根据检索要求,查阅的资料范围应为国内外资源(包括期刊文献、专利文献、会议论文、学位论文等),检索的主要内容为“工农业废水的循环利用”方面的研究报道。,检索实例,1 检索准备阶段,中文,维普期刊全文数据库中国期刊网数据库CNKI万方数据库,检索实例,2 选择数据库,外文,科学引文索引数据库(SCI)Ei village Kluwer Online期刊全文 PQDD(博硕士论文数据库)Springer LINK全文电子期刊 Scifinder Scholar(CA)ACS美国化学学会数据库Derwent Innovations Index,-确定检索词工业 industry、industrial农业 agriculture、agricultural、farming 工农业 industrial and agricultural废水 wastewater、waste water、effluent循环利用 recycling、recycle,检索实例,3 制定检索式,-编写检索式,(工业+农业+工农业)*废水*循环利用,(industry or industrial*or agricultur*or farm*)AND(wastewater OR“waste water”OR effluent)AND recycl*,检索实例,3 制定检索式,检索实例,3 确定检索途径(以中文科技期刊数据库为例),检索实例,4 实施检索,检索实例,5 筛选文献,检索实例,5 获取全文,五、小结,本讲重点内容,*确定检索词及构建检索提问式的方法,了解“碳纳米管在电极中的应用”情况;查找有关“山楂的食品加工”文献;查找有机锡、有机锑类的塑料热稳定剂资料;煤灰利用;用生物方法防治棉铃虫(排除用赤眼蜂)的文献。,本讲重点内容,*确定检索词及构建检索提问式的方法,比较下列检索式的区别:(工业+农业+工农业)*废水*循环利用 工业+农业+工农业*废水*循环利用,Thank You!,

    注意事项

    本文([互联网]第二讲 信息检索基本原理与方法.ppt)为本站会员(sccc)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开