欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第二章文献信息检索基本理论与方法ppt课件.ppt

    • 资源ID:1870067       资源大小:1.35MB        全文页数:69页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第二章文献信息检索基本理论与方法ppt课件.ppt

    1,信息检索基础理论,2,本章要点,信息检索的基本原理,3,信息检索的基本原理,信息集合,匹配与选择,特征化表示,特征化表示,需求集合,课本P12,4,存储:信息源标引 标识 检索系统 检索,5,计算机信息检索原理示意图,6,存 储,检 索,原始文献,加工整理,数据库,提 问,检 索,输 出,7,检索提问式,信息的选择与收集,信息特征,标识语言,检索工具匹配,检索结果,信息源,用户,信息需求,检索提问,数据库,8,1. 文献信息检索系统及检索语言1.1 文献信息检索系统是具有吸收信息、加工信息、存储信息和检索信息的服务工作系统 分为手工检索系统和计算机检索系统。,9,1.2 文献信息检索的原理,是通过对大量分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。 存储过程-对文献进行标引 检索过程-根据需求,确定提问式 存储是为了检索,检索又必须先进行存储。,10,2. 检索语言=标引语言,2.1 概念 检索语言(Retrieval language) 是用来描述文献特征和表达检索提问的一种专门 人工语言。检索效率的高低,在很大程度上取决于所采用的检索语言的质量以及对它的使用是否正确。 检索语言是根据文献存贮与检索的需要,在自然语言的基础上规范化了的一种人工语言(又称为情报语言、标引语言、索引语言等)。它贯穿于文献贮存和检索的全过程,是检索系统的重要组成部分,是沟通文献贮存和检索两个过程及标引人员与检索人员双方思想的桥梁。检索语言和自然语言一样,具有表达客观事物的能力,但二者又有本质的差别。检索语言是经规范化了的语言,消除了自然语言中存在的多义、同义等影响检索效果的因素,在事物概念的表达上具有唯一性,从而保证了文献标引和检索的准确性。,11,信息检索语言的作用?,检索系统的语言基础, 沟通信息存储与信息检索两个过程的桥梁。,信息存储,12,2.2 构成:2.2.1 外部特征:题名、著者、机构、 出版者、文献号、文献出处2.2.2 内容特征:A分类语言 B主题语言 a .标题词 b .元词 c .叙词 d .关键词,13,检索语言,描述文献内容特征的语言,描述文献外表特征的语言,分类语言,主题语言,代码语言,书/刊/篇名,著者姓名,引文,代码/序号,单元词语言,关键词语言,叙词语言,标题词语言,14,主题词:用以表达文献所论述和研究的具体对象和问题,即文献的“内容”的词或词组。标题词:独立定型,经过规范化处理的可直接表达主题内容的词。单元词:经过规范化处理的可直接表达主题最小、最基本的词。叙词:优选出来,严密控制的主题词和词组。关键词:从文献题名、文摘和正文中抽出,只作极少量规范化处理具有实际意义的词。,15,在社科文献信息检索系统中,常用的是分类检索语言和主题检索语言,如中图法和汉语主题词表。 为了发挥它们各自的优势,扬长避短,以满足不同的检索需要,人们将分类语言和主题语言加以结合,从而形成一种新型的检索语言,即分类主题一体化检索语言。如中国分类主题词表 随着计算机检索技术的发展,直接来自文献本身、未经规范化处理的自然语言以其标引检索简便快捷又受到人们的广泛关注。分类主题一体化语言和自然语言代表了未来检索语言的发展方向。,16,检索词是检索语言的基本成分。 检索词按语言的受控情况分为:自然语言和人工语言(1)自然语言:采用未加工整理和规范过的词语,即关键词,故又称关键词语言 (2)人工语言:采用经过规范化的词和特定的词汇来专指或网罗相应的概念,能较好地规范同义词、近义词、多义词等,如标题词、叙词语言如:plane,airplane,aeroplane,aircraft等 信用-信贷,股票交易-股票买卖,17,检索词选取时应注意的问题,避免冷僻词选择具体的检索词 如“学校活动”这个概念可以用具体的“班级活动”、“课外活动”、“学生活动”等检索词来表示。找出隐性概念 如“智力测试”,隐含着“能力测试”、“态度测试”、“创造力测试”等概念。 使用核心概念 排除掉无关概念组面,包括意义不大的概念和重复概念。 注意同义词近义词及词型变化 如跨国公司的同义词有跨国企业、跨国经营、国际化经营等;,18,2.3检索语言的类型,2.3.1根据表述文献的特征划分 (1)表述文献外表特征的检索语言:主要为书名(篇 名)、著者、机构、序号、引文等。 (2)表述文献内容特征的检索语言:主要有分类语言和主题法语言2.3.2 按结构原理划分为:分类语言和主题语言 (1)体系分类语言:是建立在科学分类体系基础上用分类号表达文献主题概念的检索语言。 它运用概念划分与概括的方法,按照知识门类的逻辑次序从抽象到具体,从一般到特殊,从简单到复杂,对知识进行科学划分,从而产生不同级别且存在隶属关系和体现知识登记体系的类目一个类目以不同的符号(分类号)作标识,从而形成了以分类号为标记的体系分类语言。 各种图书分类法的分类体系都属于体系分类语言,如中国图书馆图书分类法(简称中图法)、中国科学院图书馆图书分类法(简称科图法)、国际十进制图书分类法等。,19,分类语言的特点: 优点:系统性强,族性检索,便于按学科、专业直接检索比较广泛的课题。查全率较高。缺点:缺乏专指性,查准率不高,不能满足专深课题以及新兴学科、交叉学科和边缘学科知识的检索。,20,国内常见的分类法有:中国图书馆分类法,简称中图法我国标准图书分类法中国图书资料分类法(简称资料法)中国人民大学图书馆图书分类法中国科学院图书馆图书分类法 中图法将学科划分为5个基本部类,22个基本大类,再进行层层划分,逐级分开。,21,中图法五大部类、二十二个基本大类A、马克思主义、列宁主义 N、自然科学总论 毛泽东思想、邓小平理论 O、数理科学和化学B、哲学、宗教 P、天文学、地球科学C、社会科学总论 Q、生物科学D、政治、法律 R、医药、卫生E、军事 S、农业科学F、经济 T、工业技术G、文化、科学、教育、体育 U、交通运输H、语言、文字 V、航空、航天I、 文学 X、环境科学、安全科学J、 艺术 Z、综合性图书K、历史、地理,22,23,R1 预防医学、卫生学R2 中国医学R3 基础医学R4 临床医学 其中R47 是护理;R446是医学检验R5 内科学R6 外科学R71 妇产科学R72 儿科学R73 肿瘤科学R74 神经病学与精神病学R75 皮肤病学与性病学R76 耳鼻咽喉科学R77 眼科学R78 口腔科学R79 外国民族医学R8 特种医学R9 药学,24,分类号基本知识介绍:以 R563.1为例,它由一个字母和若干个数字构成,25,中图法类目表等级关系,R 医药、卫生,R1 预防医学、卫生学R2 中国医学R3 基础医学,R31 医用一般科学R32 人体形态学R33 人体生理学,R331 血液与循环生理R332 呼吸生理R333 消化与吸收,一级类目,二级类目,三级类目,四级类目,26,(2)主题法语言主题语言是一种描述性语言。它用语词直接表达文献的主题,这些语词是表达主题概念的标识。将这些作为标识的语词按字顺排列,并使用参照系统来间接表达各概念产的关系,这就是主题语言。根据语词的选词原则、组配方式和规范方法,主题法语言可分为标题词语言、叙词语言和关键词语言。,27,主题语言的特点:,以文献的主题内容为依据,用词语作为概念标识,并按一定的顺序排列而成的一种检索语言。优点:直观、直接性、专指性强,适用于特性检索及比较适合专深课题的检索,查准率高。缺点:但不能集中同一学科、专业或族性事物的文献。,28,主题语言分为:,标题词语言关键词语言叙词语言元词语言又称单元词目前使用较多的是叙词语言和关键词语言。,29,关键词语言与规范化主题语言的比较,前者为自然语言,没有词表的约束和复杂规则的限制,检索者可以使用在文献中出现的任何一个有实际意义的词进行检索,所以,比使用受控语言方便得多。后者对同义词、近义词、一词多义、一义多词加以规范统一,显示多种形式的相关关系,因而,查准率和查全率较高。,30,第二节 文献信息检索工具,概念:检索工具是将所收录的文献按一定的规则编制而成的具有存贮、检索和报道文献线索功能的工具。它是在一次文献基础上经过加工、整理、编辑形成的二次文献。 根据检索方式的不同,可分为手工检索工具和计算机检索工具。 手工检索工具主要指目录、题录、文摘和索引。 计算机检索工具主要指利用电子计算机检索系统等。,31,一、检索工具的作用 存贮作用 检索作用 报道作用二、检索工具的特点信息密集,能提供丰富的知识或文献线索;是编排有序,提供有规律的检索途径;以查考为主,供读者释义解难时查考之用。,32,三、 手工检索工具目录(catalogue) 又称书目,一批相关完整出版物名字的列表。重点描述文献的外表特征。通常以一个出版单位或收藏单位为基本的著录单位,对文献的描述比较简单。常见的类型有: a 馆藏目录 b 联合目录 c 国家书目题录是将图书、报刊等文献中论文的篇名按一定的排检方式编排而成的。 索引(index) 将文献中的知识单元分析摘录出来 ,并注明它的出处,按一定原则和方法组织编排,构成的检索工具。,33,索引和目录的区别目录著录的是完整的出版物,如一本书、一种期刊;而索引著录的是出版物的一部分(某一知识单元)。索引比目录对文献的揭示更深入、更细致。,34,索引分两种:一种是作为工具书的主体,如文献题名(篇目)索引。另一种是作为工具书的一部分,一种检索途径,内容索引如:主题索引、著者索引等。4. 文摘(Abstract,digest,excerpta ): 是揭示信息外表特征和内容特征的信息系统,在题录的基础上加上文献内容的摘要。使读者能以较少的时间和精力掌握有关文献的基本内容。进而判断是否需要阅读全文。分指示性文摘 和 报道性文摘。,35,5. 全文是以一次文献即原始文献为存储对象,著录项目包括了文摘和全文,能够直接为用户提供原始资料或具体数据。,36,信息检索工具的主要类型,37,目录:是以一件或一种完整的出版物(如一本书、一种期刊等)作为著录基本单位的检索工具。一般目录主要揭示、报道这些单位出版物的外表特征。,38,题录:是以单篇或单份文献为著录的基本单位的检索工具,题录也主要揭示、报道文献的外表特征,但其著录格式于目录有所不同。,【论文题名】 网络环境下信息检索与报道服务浅析 【英文题名】 Information Retrieval and Report Service in Network Environment 【作者】 丁彩云DING Cai-yun 【作者单位】 湖南化工职业技术学院,图书馆,湖南,株洲,412004 【刊名】 株洲师范高等专科学校学报 【英文刊名】 JOURNAL OF ZHUZHOU TEACHERS COLLEGE 【年 卷 期】 2005 Vol.10 No.2 【关 键 词】 图书馆;网络环境;信息搜集;信息检索;信息报道,39,索引:是根据一定的需要,把特定范围内的某些重要文献中的有关款目或知识单元(如书名、刊名、人名、地名、语词等),按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具。,40,文摘:是在题录的基础上,在每条著录款目后边再加上文献内容的摘要。,【论文题名】 网络环境下信息检索与报道服务浅析 【英文题名】 Information Retrieval and Report Service in Network Environment 【作者】 丁彩云DING Cai-yun 【作者单位】 湖南化工职业技术学院,图书馆,湖南,株洲,412004 【刊名】 株洲师范高等专科学校学报 【英文刊名】 JOURNAL OF ZHUZHOU TEACHERS COLLEGE 【年 卷 期】 2005 Vol.10 No.2 【关 键 词】 图书馆;网络环境;信息搜集;信息检索;信息报道 【摘要】 网络环境下的信息服务已对图书馆的机构组织、人员素质、服务水平和社会地位产了巨大影响.掌握网络环境下的信息服务特点和方法,尽快适应网络环境已成为图书馆提高信息服务质量的重要课题.,41,中国药学文摘著录格式:,42,全文:全文检索技术是一种面向全文、提供全文的新型检索技术。它可以使用原文中任何一个有实际意义的词作为检索入口,得到的结果是源文献而不是文献的线索。,43,参考工具书:字典、词典:在秦汉时代就有了尔雅、说文解字等,下至清代有康熙字典, 现有辞源、辞海等。年鉴、手册:人民手册,中国卫生年鉴,44,计算机检索工具1 数据库 分为:书目数据库 事实数值数据库 全文数据库 2 信息网络 分为:分类目录型 搜索引擎(Search Engine)型 混合型,45,第三节 文献信息检索方法和途径一、 文献检索的方法 常规法它又分为顺查法、倒查法和抽查法。 追溯法 综合法(一)常规法 常规法是文献检索中经常使用的方法,就是利用检索工具按年代顺序查找文献的方法,又称工具法。它可分为顺查法、倒查法和抽查法三种。,46,1. 顺查法 即从过去某一年代开始,按时间顺序由远及近逐步查找文献的方法。此种方法优点是系统、全面、漏检的可能性小,但工作量大,较费时间。 2.倒查法 与顺查法相反,是一种按时间顺序由近及远的查找方法。就是从近年的检索工具开始查找,逐年向远处回溯过去的文献,一直查到文献满足为止。此种方法重点放在近期文献上,比较节省时间,灵活性大,但查全率不如顺查法。 3.抽查法 就是根据课题发展特点,抽取该课题研究最活跃、论文发表最集中的一段时期,逐年进行文献检索的一种方法。该方法能用较少的时间获取较多的文献,但一定要在检索前对学科和课题特点掌握清楚,能准确把握其发展时期,否则难以取得预期效果。,47,(二)追溯法 追溯法就是利用已知文献后面所附的参考文献提供的文献线索,逐一查找原文,然后再利用查出的原文后面所附的参考文献进一步扩检,继续追踪下去。这样查出的文献就像“滚雪球”一样,不断增多。 在没有检索工具或检索工具不全的情况下可利用这种方法来查找文献,也可作为一种平时积累资料办法。此法缺点是工作量大,检索不全面,容易出现漏检和误检,另外越查文献越陈旧,离原课题主题越远。,48,49,50,(三)综合法综合法又称循环法、分段法,是将常规法和追溯法综合运用的一种方法。 即先利用检索工具查出一批文献(一般35年),然后根据查出的这些文献后面所附的参考文献提供的线索利用追溯法进行查找,扩大检索效果,又获得一批文献。如此交替使用两种方法,直到满意为止。这种方法效率高、速度快,针对性强,有人认为是“最佳检索方法”。上述检索方法各有特点,在实际检索工作中,应根据课题要求、检索工具情况以及学科特点,灵活掌握运用,选择合适的检索方法。,51,引自田纳西大学Carol Tenopir的研究报告,52,二、文献信息检索途径,1. 分类途径 分类途径是按文献内容所属的学科类别来检索文献的途径,通过分类号或类别进行检索。利用分类途径检索文献,需掌握一定的分类法 。 利用分类途径可以了解学科概念之间的隶属、并列、相关等关系,适用于回溯性检索和广义概念的检索,能够满足族性检索的要求。查全率高,但查准率低。,53,2. 主题途径,主题途径是通过反映文献内容主题的语词来检索文献的途径。检索时按语词字顺查找,即可找到相应主题的文献。 利用主题途径检索文献,专指性强,能集中反映同一主题而分散在不同学科中文献(特性检索),能够解决多学科、交叉学科、边缘学科之间文献交叉分散的矛盾,同时利于新课题检索(词表每年修改),查准率高,但缺点是不能集中同一学科、专业或类族事物的文献。,54,3. 关键词途径4. 著者途径5. 题名途径6. 号码途径 :书号(ISBN)、刊号(ISSN)等 7. 其他途径 :分子式索引 、药名索引、地名索引等,55,文献检索的常用途径,1 题名 :注意题名关键词的排序特征2. 作者 :通常按姓在前名在后方式检索3. 分类 :我国高校与公共图书馆的文献资料,一般采用中国图书馆图书分类法(简称中图法)进行分类。4. 主题 词:主题是指表征文献内容特征、经过规范化的名词术语。检索者通过检索这些规范的词语来找到所要的文献和情报。 现代汉语主题词表5. 关键词:直接从文献的篇名或文摘或全文中抽取出来的非规范化检索词。6. 顺序号检索:专利号,标准号,研究报告号。 7.全文检索 : 8. 引文检索:利用被引文献来查找原文献的检索方法。如: CNKI中国期刊网被引用字段,维普中文期刊数据库引文检索途径。 9. 其它:超文本检索,基于概念的自然语言检索,图象等。,56,课题分析-排除重复无关的概念,项目“河豚毒素的液相色谱分析” 从项目名称上看,其主要概念为 “河豚毒素”、“液相色谱”和“分析”,但由于液相色谱本身就是一种分析方法,它隐含了“分析”这一概念主要概念: 河豚毒素、液相色谱检索式:河豚毒素 and 液相色谱,57,比较“主题词”与“关键词”主题词举例 如:白介素2、白细胞介素2、IL2、IL-2等表达同一概念的不同书写形式规范为“白细胞介素2”。 关键词举例 如:对于“白细胞介素2”这一概念可有白介素2、白细胞介素2、IL2、IL-2等不同形式来表达。,58,第四节 文献信息检索步骤及效果评价,一、 文献检索的步骤 (重点)A.分析检索课题,明确目的和要求 B. 根据课题要求,制定检索策略 包括选工具、定方法、选途径、定标识 C. 查找文献线索D. 获取原始文献,59,二、 检索结果评价文献检索的基本要求:全面、准确、快速。检索效果是文献检索结果的有效程度。它有两个重要指标:查全率、查准率。 检出的相关文献量查全率 100 文献库中相关文献总量,60,检准的相关文献量查准率 100 检出的所有文献量,检出的文献,所有相关文献,文献总量,漏检的文献,误检的文献,检出的所需文献,61,查全率R (recall ratio)a/a+c100查准率P (precision ratio)a/a+b1000,查全率,检出的相关文献数,系统中的相关文献总数,查准率,检出的相关文献数,检出的文献总数,62,当代科技信息检索系统能达到的查全率和查准率分别是6070和40 50 。,63,漏检率 O 误检率N 查全率和漏检率是互补的,查准率和误检率是互补的,64,漏检率(Mission): O=1-R误检率(Noise): N=1-P,65,例题:如CNKI数据库中共有 “企业管理”方面的相关文献280篇,而小李同学在CNKI数据库中只检索出160篇,而且其检索出的结果中还有28篇是不相关的,那么小李这次检索的查全率和查准率各是多少?,66,KEY,查全率 160-28/280= 47.1%查准率 160-28/160=82.5%,SCI 影响因子(Impact Factor),67,三、影响检索效果的因素 1、影响查全率的因素 从文献信息存储角度来看主要有:文献库收录文献不全;索引词汇缺乏控制和专指性;词表结构不完整; 从信息检索角度来看主要有:检索策略过于简单;选词和进行逻辑组配不当;检索途径和方法太少;检索人员业务不熟练和缺乏耐心。,68,2、影响查准率的因素 影响查准率的因素主要有:索引词不能准确描述文献主题和检索要求;组配规则不严密;选词及词间关系不正确;检索式中允许容纳的词数量有限;截词部位不当,检索式中使用逻辑“或”不当等等。 查全率和查准率是呈互逆关系。,69,思考题TN919.2是几级分类号?,

    注意事项

    本文(第二章文献信息检索基本理论与方法ppt课件.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开