欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    南京大学信息检索ppt课件课件.ppt

    • 资源ID:1405988       资源大小:14.02MB        全文页数:266页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    南京大学信息检索ppt课件课件.ppt

    信息检索,第一章 绪论第一节 信息素质与信息利用一、信息素质关于信息素质的研究是从20世纪70年代开始的,对信息素质的认识经历了一个渐进的过程,信息素质可以概括为个体在现实需求的驱动下,能有效地发现、获取、评价和利用信息。它包含四个层面的含义,第一,用户有一定的信息需求,即在某个时候需要了解某方面信息。第二,掌握了主要的信息源和信息工具的知识及技能。第三,能够分析评价选择相关信息。第四,利用信息的目的是为了有效地解决具体问题。信息素质主要表现为信息理论素养和信息的实践能力,包括信息意识、信息知识、信息能力和信息道德等内容,信息意识同样重要的信息,有的人善于抓住,有的人却漠然视之。这是由于各人的信息意识强弱不同。信息技能的掌握在很大程度上取决于信息意识的提高。 所谓信息意识,简单地说,是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力。有无信息意识决定着人们捕捉、判断和利用信息的自觉程度。而信息意识的强烈与否对能否挖掘出有价值的信息、对文献获取能力的提高起着关键的作用。信息知识是关于信息的特点、性质、运动规律、信息方法与技术、信息系统的有关知识。其中信息方法是指如何以信息的观点来分析和解决人们在工作和生活中遇到的问题的方法,把无序而良莠不齐的信息转化为有效信息加以利用,创造出新的价值。信息技术是关于信息提取、检测、处理、转换、传递、控制等技术,如计算机技术、数据库技术、通信技术、网络技术等。,信息能力 是人们获取信息、分析信息、加工信息、传递信息、创造信息等能力的综合,是信息素质的核心部分和主要内容,包括信息查询与获取能力、信息交流与传播能力、信息组织与整合能力、信息利用能力、信息评价能力等,是提高信息素质的关键所在。,大学生信息能力应表现为以下6种能力:明确任务(Task Definition):了解问题的症结,确定所需信息和目的,分清任务的轻重缓急; 信息查询策略(Information Seeking Strategies):了解各种信息源,能够作出评价并确定优先查找的次序; 查找和检索(Location and Access):确定信息藏址,从信息源中找出信息; 信息利用(Use of Information):能够读懂(或听懂、理解)查出的信息,了解信息在满足需求中的特定价值; 信息综合(Synthesis):能够组织信息,提供信息产品(论文、报告等); 信息评价(Evaluation):评价查找结果和解决问题的过程(效率)。,信息道德是指在信息活动中调节和控制信息生产者、信息服务者、信息利用者及其相互关系、伦理道德和行为规范的总和。具体有遵守国家有关信息的法律法规、不制作不传播不利用违反国家政策的信息和不健康信息、不制作不传播虚假信息、不侵犯知识产权、不利用信息技术谋取不正当利益和从事违法活动等。在日趋繁杂的信息环境中,自觉而良好的信息道德,是信息素质中不可忽略的一部分。在信息素质四个方面的内容中,信息意识是前提,信息知识是基础,信息能力是核心,信息道德是准则,它们的有机结合构成信息素质整体。,美国“高等教育信息素质标准”,标准一:学生应具备明确信息需要的内容与范围的能力。具体指标包括:定义与形成信息需要;能够识别多种类型与格式的潜在信息源;知道获取信息的费用以及产生的效益;具备对所需信息内容与范围进行重新评价的能力。标准二:学生应具备高效获取所需信息的能力。具体指标包括:选择合适的调查方法或信息检索系统,以获取所需信息;构建与实施有效的检索策略;利用联机检索终端或亲自使用一组方法检索所需信息;必要时改进检索策略;获取、记录、管理信息与信息源。,标准三:学生应能客观、审慎地评价信息与信息源,并将其纳入信息库与评价系统。具体指标包括:具有从获取信息中提炼信息主题的能力;为评估信息与信息源形成最初的标准;复合主题概念以形成新的概念;能通过对新旧知识的比较而确定信息的增加值;能确定新的知识对个人的价值体系的影响,并使其融入个人的价值体系中;能通过与个人、领域专家及其他人员的交流,对信息的理解与解释的有效性加以判断;决定是否有必要修订初始的查询。标准四:学生个人或作为群体的一员能有效地利用信息以完成特定的任务。具体指标包括:能够利用各种可获得的信息完成计划,以及产生特定的信息产品或成果;修订产生信息产品或成果的过程;有效地将信息产品、成果与他人交流。标准五:了解有关信息使用的经济、法律以及社会因素,获取与使用信息要符合道德与法律规范。具体指标包括:了解信息与信息技术使用的相关法律、道德伦理以及社会经济问题;在存取、使用信息资源时能够遵守法律、法规、信息资源提供的规定以及约定俗成的一些规则;对引用的成果表示致谢。,二、信息检索与利用课的教学内容信息检索与利用是大学生信息素质教育课程体系中一门最重要基础课,它围绕相关信息的科学查询及利用这个核心,介绍信息检索与利用的基本概念、基本理论和基本方法、并结合各学科的实际问题讲解和剖析检索、分析、评价和利用。通过学习能使学生具备最基本的信息素质。,三 、信息素质、信息检索与利用的意义 世界上的文献信息已经汇集成一个巨大的知识宝库,其数量庞大、增长迅速、类型繁多、文种多样、新陈代谢频繁。信息检索是帮助人们打开知识宝库的钥匙,是开发人类智力资源的有效手段。面对人类浩瀚的知识海洋,只有具有良好的信息素质,才能迅速而全面地获得所需的信息,并通过各种处理而有效地利用信息。切实地掌握并有效地利用各种信息资源,不但可以更新知识、开拓视野、启迪思维、激发创造力,而且可以增强竞争力,提高各种效益。,1信息素质与综合素质的关系2信息素质与学习、创新能力3 。信息利用与事业进步信息是生命、是财富、是力量、是事业核心竞争力的重要组成因素。 具体体现在以下几个方面: (1)不断更新知识,增强生存能力 (2)节省时间,提高效率 (3)避免重复研究和劳动、防止浪费。 (4)帮助制定高明谋略 (5)有助于人们占领科技制高点。,信息素质的具体内涵包括六个方面:(1)一组有机联系的技能(研究方法、信息评价能力)和知识(信息工具与信息资源等方面);(2)敏锐的信息意识;(3)信息需求的能动性;(4)与计算机素质既相区别又有联系的素质;(5)不仅仅是有关信息源的知识;(6)不单纯依赖于图书馆的信息意识,不仅包括信息检索,还包括对信息的理解与评价。,90年代后,对信息素质概念的认识和研究进一步深入。1998年,全美图书馆协会和美国教育传播与技术协会专门制定了评价学生信息素质的九大标准:(1)能够有效地和高效地获取信息;(2)能够熟练地、批判性地评价信息;(3)包括精确性地、创造性地使用信息;(4)能探求与个人兴趣有关的信息;(5)能欣赏作品和对信息进行创造性表达的内容;(6)能力争在信息查询和知识创新中做得最好;(7)能认识信息对民主化社会的重要性;(8)能履行与信息和信息技术相关的符合伦理道德的行为规范;(9)能积极参与活动来探求和创建信息。,一、 信息素质教育的内涵与发展,自学能力提高人的素质最基本的能力,阅读能力,收集处理各种信息能力,熟练使用各种工具书,能检索各种信息资料,能分析利用各种信息,第二节 基本概念,一、信息 信息(information)一词在日常生活中,常被人们理解为以口头、书面或其他方式传递的消息。就信息的基本内涵来讲,信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物的存在方式和运动状态的表达。信息不是物质本身,而是物质的一种基本属性。信息与客观事物一样,无处不在,无时不在。该课所指的信息,是指经过采集、处理、记录并以可检索的形式存储的数据,属于信息资源管理学范畴对信息的描述。人类认识世界的过程,实际上就是不断从外界获取信息、加工信息和传递信息的过程。在当今信息社会中,信息与物质能源一起被视为社会经济发展的三大支柱,是促进社会经济发展的重要战略资源。,信息的特性,、信息分布的网络性,、信息形式的多样性,、信息加工的统一性,、信息获取的便捷性,、信息的共享性,、信息的时效性,、信息的互动性,、信息的唯一识别标志,信息的局限性,、信息资源分散,数量庞大。,、有价值信息不免费。,、信息加工深度不够。,、实质性信息少。,、灰色信息过度。,二、知识 知识(knowledge)是人类社会实践的总结,是人类通过信息对自然界、人类社会以及思维方式与运动规律的认识和掌握,是人脑通过思维重新组合的系统化的信息集合。 信息通过人脑的接收、选择、整理和提炼等过程,形成各种各样的知识。知识的产生离不开信息和信息传递,它是信息的一个重要组成部分。,三、情报 情报(intelligence information)是一个发展的概念,在不同的时期,起概念是有所不同。古代战时敌情报告称情报,今天人们认为情报是“作为交流对象的有用知识”,是“在特定时间,特定状态下对特定的人提供的有用知识”,“是激活了、活化了的知识”。情报的基本属性是知识性、传递性和效用性。情报的本质是知识,但知识并不等于情报,知识只有传递给用户,能满足用户的特定需要才能成为情报。,四、文献 文献(document)也是一个发展的概念。它最早出现与论语,南宋朱熹将其解释为:“文典籍也;献,贤也”。今天文献的定义为:“记录有知识的一切载体”,可见,文献具有四个要素,即知识内容、载体、记录符号和记录手段。古代的甲骨文、竹简等是文献,今天的机读资料、电子出版物、网络信息资源等等都是文献。,2022/11/20,21,文献,文献(Document/Literature)中华人民共和国国家标准文献著录总则中给文献下的定义是:文献是记录有知识的一切载体。具体说是用文字、图形、符号等技术手段记录人类知识的一切物质载体。,2022/11/20,22,信息、知识和文献的关系图,文献及概念,1、定义: 一切记录有知识的载体知识:文献的内容载体:文献的形态,如甲骨、青铜器、纸介型 、胶片,磁带,磁盘,光盘等记录:构成文献的重要手段 图11 知识、文献、创新的知识的关系,知识,文献,创新的知识,记录,传递应用,2、文献的分类,按加工深度分按出版方式分按载体形态分,一次文献 一次文献( Primary literature)是人们对自然和社会信息进行首次加工(固化)而成的文字记载,这是文献信息源的主要部分,数量极为庞大,由于在内容上是分散的、无系统的,因此不便于管理和传播。 一次文献按出版特征或内容可以分成图书、报纸、期刊、专利文献、标准文献、会议文献、样本、“灰色文献”、档案文献、科技报告、政府出版物、学位论文等类型,二次文献为了控制文献,便于人们查找,对一次文献进行再加工,通过整理、提炼和压缩,并按其外部特征(题名、作者、文献物理特征)和内容特征序化,形成另一类新的文献形式目录、书目、索引、文摘,这就是二次文献(Secondary literature)。二次文献不是一次文献本身的汇集,而是一次文献特征的汇集,通过它们可以很方便地找到一次文献,或了解一次文献的内容。,三次文献利用二次文献,选择有关的一次文献再加以分析、综合而编写出来的第三个层次的文献形式专题报告、综述、进展以及手册、百科全书、年鉴等工具书,这就是三次文献(Tertiary literature)。三次文献具有系统性、综合性、知识性和概括性的特点,它从一次文献中汲取重要内容提供给人们,便于他们高效率地了解某一领域的状况、动态、发展趋势和有关情况。因此,要在浩瀚的一次文献中查找所需资料,往往离不开二次和三次文献。,按加工的深度分类:,一次文献 (原始文献):是科研人员根据科研成果撰写的文献,具有创造性,新颖性,先进性,是文献检索的主要对象。 随着科学技术的发展, 一次文献的数量越来越多,大大超过了个人所能收集和查阅的能力, 因此需要把这些分散的, 数量庞大的一次文献加以整理和加工,这就产生了二次文献。 二次文献: (参考性文献)对一次文献进行加工,归纳,简化,将其组织成为系统的、便于查找的资料,也就是目录,题录,文摘,索引等检索工具,以提供一次文献的线索。 三次文献(工具书): 是根据一定的需要与目的对一次文献进行综合浓缩,提炼出来的成果,如百科全书词典、年鉴、手册等工具书。,文献结构示意图,书目 题录索引文摘,词典名录指南手册年鉴,综述评述论文丛集百科全书,二次文献,原始文献(一次文献),三次文献,概念,二次文献与三次文献的区别: 对象不同二次文献以“ 篇” 或“ 本” 为单位进行加工, 三次文献则归纳了较多的一次文献内容 用途不同二次文献为检索一次文献的工具;三次文献能直接提供检索答案.,2、文献的分类,按加工深度分按出版方式分按载体形态分,按出版形式分类:,图书,期刊,特种文献,其它,标准,科技报告,政府出版物,学位论文,专利文献,原始文献,会议文献,1.1 图书(Book):,对已有的研究成果或生产经验作概括论述.特 点 : 带有总结性、成熟定型;出版周期长,信息传递慢;传授知识,而不是报道最新情报。图书一般分为两类:阅读型:教科书、专著等工具型: 字典、百科全书、年鉴、手册,国际标准书号(ISBN),(International Standard Book Number)每一种正式出版的图书的唯一标识代码。ISBN7501312893北京图书馆出版社第一段:语区号,代表国家、地区、语种,如0,1英,2法,3德,4日,7中第二段:出版商代号,由国家或地区ISBN中心分配;第三段:出版图书号,由出版商按出版顺序所给第四段:校验位,1.2 期刊,journal, periodic 特 点:名称固定 有连续的卷、年月顺序号 出版周期短,报道速度快; 数量大,内容丰富;据估计,从期刊获取的科技信息占整个信息来源的60%-70%,ISSN号,正式出版的期刊有ISSN代码,即国际标准连续性出版物编号 如,ISSN1001-8867为中国图书馆学报的国际标准编号,1.3 会议文献,conference paper是指在各种学术会议上发表的论文(通称为proceedings)。特点:传递信息及时 针对性强 内容新颖一部分科研成果就是通过学术会议首次发表的,The Institute of Electrical and Electronic Engineers目前世界上最大的一个技术专业学会,宗旨是推动电气、电子学、计算机工程和计算机科学的发展而召开各种学术会议 主持编辑出版多种出版物(1988年):期刊:100多种、标准:600多种、700多种会议最大的电子、工程类信息源,IEEE,1.4 科技报告,technical report目的:向上级主管部门汇报特点:每份单独成册,有专门的编号 内容具体有科研项目的研究方案,实验记录,实验数据,图表等; 报道比期刊早;保密或控制发行,世界上著名的科技报告有:,PB美国商业部 AD美国军事国防部 NASA美国宇航局 DOE美国能源部 这四大报告每年公开和解密部分约6万件。科技人员对科技报告的需要量约占其全部文献量的10%-20%,特别在是发展迅速、竞争激烈的高科技领域。,1.4 专利文献,atent document是一切与专利制度有关的专利文件的统称。如专利申请书和专利说明书。专利说明书是公开的文献,但只能由各国专利局发行,它反映了当前最新的技术成果。中国国家知识产权局专利数据库美国专利 欧洲专利,1.5 学位论文,dissertation是作者为获得某种学位而撰写的科学论文硕士博士论文具有较高的参考价值一般偏重于理论附有大量的参考文献借此可以看出有关专题的发展过程和方向学位论文一般不出版发行,而是保存在授予学位单位的图书馆里。,UMI,University Microfilms International公司对美国、加拿大、欧洲硕士、博士论文进行报道。相应的数据库为:PQDD (ProQuest Digital Dissertations) - 网络版DAO (Dissertation Abstracts Ondisc)- 光盘版,PQDD,是美国UMI公司出版的博硕士论文数据库日前已收录了欧美1000余所大学的学位论文已达150多万篇学位论文是世界上最大和最广泛使用的学位论文数据库。PQDD具有以下特点: 1、收录年代长,从1861年开始; 2、更新快,每周更新; 3、1997年以来的部分论文不但能看到文摘索引信息,还可以看到前24页的论文原文。,1.6 标准文献,standard标准文献是对工农业产品和工程建设的质量、规格、检验方法及其技术要求等方面所做出的技术规定的文件形式。标准文献的类型: 按使用范围可分为国际标准、地区标准、国家标准、行业标准和企业标准;按内容可分为产品标准、检验标准、基础标准、方法标准和安全标准;按其成熟度可分为试行标准、推荐标准和法定标准等,1.7 政府出版物,government document是各国政府部门及其所属机构颁布和出版的文件资料,内容主要分为行政性文件(如法令、统计等)科技文件两大类。对了解一个国家的科技和经济政策及其演变情况有一定的参考价值。,2022年11月20日星期日,RealNetworks Confidential Embargoed Until 9/24,47,时间0,一年,三年,二年,情报利用,文献的分类,按载体形态分,按文献载体形态分类:1,印刷型(print form) 也称为纸介型(paper-based)。传统的文献形式缺点:存贮密度低,体积庞大,加上纸张的化学、物理特性,难于收藏保存。,按文献载体形态分类:2,缩微型(micro form) 以感光材料为载体的文献记录形式,有缩微胶片,缩微平片等. 优点:体积小、存贮密度高,便于传递、保存可节省书库面积达90以上。缺点:不能直接阅读,必须借助阅读机,按文献载体形态分类:3,声象型(audio-visual form) 通过特定设备,将信息表现为声音、图像、影视及动画(sound,image,video & animation) 等形式。 优点:直观、形象,按文献载体形态分类:4,电子型(electronic form) 通过计算机对电子信息进行存取处理。 电子信息存于磁盘、磁带或光盘等媒体中电子出版物,如电子图书期刊,各种联机信息库,光盘数据库,电子邮件等,五、信息资源 信息资源(information resource)作为一个术语,由美国人在上世纪60年提出并很快流行。不同学科的不同学者对信息资源存在理解上的差异,还没有统一的定义。但可以归纳为广义和狭义两个层次:广义的信息资源是指信息活动中各种要素的总称,既包含信息本身,也包括与信息相关的人员、设备、技术和资金等因素。狭义的信息资源只限于信息本身,是指各种载体和形式的信息集合,包括文字、声像、印刷品、电子信息和数据库等。,信息资源的特点:1、是信息的集合,只有当信息达到一定的丰富度和凝聚度时,信息才能成为信息资源。2、信息资源是有用的信息集合,无用的信息不包含在信息资源中。3、信息资源是经过人类的组织的、有序的、可存取的信息集合。4、信息资源有各种载体形式。信息资源定义为经过人类筛选、组织和加工,可以存取并能满足人类需求的各种信息的集合,第三节、信息资源的类型和特点,信息资源的类型有很多划分标准,比较有代表性的分类方法有:按信息资源的组成与内在关系分为元信息资源、本信息资源、表信息资源;按加工程度分为一次信息资源、二次信息资源、三次信息资源;按社会属性分为政治信息资源、科技信息资源、军事信息资源、经济信息资源等;按描述对象分为自然信息资源、社会信息资源;按开发程度分为潜在的信息资源、现实的信息资源;按载体和存贮方式分为天然型信息资源、实物型信息资源、文献型信息资源。,我们以信息资源的开发利用程度作为一级标准将信息资源划分为潜在信息资源和现实信息资源。潜在信息资源指储存在人们大脑中而未被记录下来的信息资源,它们可以被个人所利用,但易因忘却而消失,且不能为更多人所用。现实信息资源是已被表达出来、能够为人们所利用的信息资源,现实信息资源按其载体形式又可分为体载信息资源、实物信息资源、文献信息资源、网络信息资源等。,(一)体载信息资源 以人体为载体并能传递和为他人所识别及利用的信息资源。按其表述方式可分为口语信息资源和体语信息资源。口语信息资源是人们以口头语言表达的,有的被记录下来,有的未被记录下来。被记录下来的信息资源,包括谈话、授课、讲演、讨论、演唱等记录信息。体语信息资源是以人的体态表达的信息资源,包括表情、姿态、手势、舞蹈等。(二)实物信息资源 以实物为载体的信息资源。按实物载体的自然与人工特性可分为自然实物信息资源和人工实物信息资源,如产品、样品、模型、雕塑等。,(三)文献信息资源 以文字、数据、声频、视频等方式记录在特定载体上的信息资源。按其记录方式和载体可分为刻写型、印刷型、缩微型、机读型、声像型、电子型等类型。刻写型文献信息资源包括日记、信件、著作手稿、碑刻等;印刷型文献信息资源包括图书、报刊、档案、图片、乐谱等;缩微型文献信息资源包括缩微胶片、缩微胶卷、缩微卡片等;声像型文献信息资源包括唱片、录音带、录像带、电影胶卷、幻灯片等;电子信息资源包括CD、VCD、DVD等。,2022/11/20,59,按载体形式划分,印刷型信息缩微型信息声像型信息电子型信息,2022/11/20,60,按载体形式划分,印刷型信息 又称为书本型信息,是以纸张为主要载体,以印刷为记录手段的传统信息形式,如图书、期刊、报纸等。优点是阅读、携带、利用方便;缺点是信息存储密度小、体积大、分量重、收藏和管理困难。,2022/11/20,61,按载体形式划分,缩微型信息 是一种以缩微胶片为载体,利用缩微摄影技术为记录手段而产生的信息形式,其优点是体积小、存储密度高、保存期长,缺点是需要配备专用的缩微阅读机才能阅读。,2022/11/20,62,按载体形式划分,声像型信息 声像型信息又称为视听型文献,这是一种以磁性或光学材料为存储介质,借助特殊的机械装置直接把图像和声音记录的一种信息形式,如唱片、录音带、电影拷贝、幻灯片等。它记录的对象主要不是文字,而是富有动感的声音和图像。,2022/11/20,63,按载体形式划分,电子型信息 指以数字代码方式将图、文、声、像等信息存储到磁、光、电介质上并通过计算机阅读的信息形式。如各种电子图书、电子期刊、联机数据库、网络数据库、网络新闻、光盘数据库等。其特点是存储量大,出版周期短,传递迅速,可以融文本、图像、声音等多媒体信息于一体,易复制,共享性好。,按文献生产加工层次划分的文献形式:从对文献的生产加工层次来看,文献又可以分成一次文献、二次文献和三次文献。,(四)网络信息资源网上各种信息资源的总称,主要有动态信息、电子邮件、电子论坛、电子图书、电子期刊、电子报纸、数据库等。,第四节 信息资源评价,内容质量可以从以下几个方面评价:(1)准确性信息来源、信息内容的描述是否真实可靠,信息发布者的权威性等。(2)涵盖面指信息资源的广度和深度,反映某主题或专题信息的完整性、系统性、独特性,并具有较高的学术价值。(3)时效性如,网上信息资源的更新周期,信息越新,对用户的吸引力越大,经典作品则不受此限制。(4)使用性能便捷程度,第二章 信息检索基础,第一节 信息检索的概念及类型,一、 信息检索的概念信息检索有狭义和广义之分。狭义的检索(Retrieval)是指依据一定的方法,从已经组织好的大量有关文献信息集合中,查找并获取特定的相关文献信息的过程。广义的检索包括信息的存储和检索两个过程(Storage and Retrieval)。信息存储是指工作人员将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检 索功能的工具或检索系统,供人们检索和利用。而检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。,二、信息检索类型及特点信息检索按照不同的分类标准可以划分不同的类型(一)按检索的对象及内容区分,信息检索可以分成文献检索和非文献检索。1文献检索 以查找文献线索或文献原文为检索对象,手工检索工具主要是二次文献和各种馆藏目录,计算机检索主要利用书目数据库、题录和文摘数据库以及全文数据库。其中一种很重要的是全文检索,是以文献所含的全部信息作为检索内容的,检索时可以查找原文的任意内容,并可进行多种统计和内容分析,因此,全文检索系统必须存储文献的全部内容。2非文献检索 非文献检索是以有关的事实或数据为检索对象,这种检索通常利用能直接提供相关事实或数据的工具来检索。,(二)依据数据格式和检索技术的层次的不同,信息检索可以分为以下类型:1文本信息的检索方式 传统的文献数据库例如图书、期刊、专利文献等的数据库以及搜索引擎以文本数据为主要处理对象。 2多媒体检索 以多媒体信息为检索对象的信息检索,包括视频检索、声音检索、图像检索和综合检索等。3超媒体及超文本检索传统的文本都是线性的,用户必须顺序阅览。而超媒体是一种非线性的网状结构,用户可以沿着交叉链选择自己感兴趣的部分阅读。超媒体及超文本检索就是基于超媒体系统和超级文本系统而进行的信息检索。这种检索包括基于浏览和基于提问两种检索方式。,(三)依据用户使用信息的目的不同,信息检索可以分为以下类型:1撰写论文的信息检索 主要要求提供文献服务,要求提供新的且有代表性的文献,换句话说就是要求较新的重要论著;对文献服务有一定的量上的要求 2、学科建设和科学研究的信息检索这类用户要求所得到的信息在一定的阶段内全且系统。它不仅要求得到本学科的相关信息,而且也希望得到相近学科和交叉学科有关的信息。虽然说他们对文献类信息要求较多,但也非常重视事实信息 (1)立项查新 (2)成果查新 (3)学科建设,3、生产开发的信息检索 生产开发关心的是产品生产技术、产品的市场前景及经济效益,因此,这类用户对专利商标信息、事实、数据方面的信息要求更多,他们往往追求信息的广度而忽视信息的深度。实际上,这类信息服务是很复杂的,因为事实信息的广泛性、多样性和复杂性以及事实信息检索工具的分散性及不成熟,给这类检索造成了很大的困难 。4、回答或解决单一问题的信息检索 这类用户的提问通常单一、具体 ,这类用户在信息上对时间和信息量没有特定的要求,关键在于求得相同或相似条件下解决问题的方法。 5、对已知文献的查找 这类用户需要了解的是某信息来源出处或入藏情况 。,第二节 检索工具概述,一、检索工具的定义及类型检索工具是人们用来存储、报道、和查找各类信息的工具。主要包括二次、三次印刷型手工检索工具,面向计算机和网络的各种数据库检索系统,以及搜索引擎等各种网络检索工具。,检索工具的类型:(一)按所收信息的学科内容划分检索工具中信息的学科内容有综合性、专科及专题之分。 (二)按著录信息的特征划分、目录型检索工具这类检索工具主要报道文献的外部特征,通常以一个完整的出版单位或收藏单位为基本著录对象,及以文献的“种”、“件”为报道单位。 2、题录型检索工具题录是将文献的篇目按照一定的排检方法编排而成的,供人们查找篇目出处的工具。 3、文摘型检索工具这种工具将信息中的重要内容准确的摘录下来,并按一定的规则著录与编排 。,4、索引型检索工具 索引既能独立成为检索工具也能作为其他工具的一部分。索引可以分为篇目索引和内容索引。篇目索引的主要作用是查阅报纸、期刊、会议录中的文章。内容索引一般是附在专著或年鉴、百科全书等工具书之后以及收录内容较多的二次文献之后,按主题词、人名、地名、事件、概念等内容要项编排,是查找隐含在文章中所需情报,进行微观检索的有用工具。5、参考型检索工具(通常总称工具书) 这类检索工具收录了大量常用的名词术语、事实、数据及非文字性资料 6、数据库包括参考数据库、源数据库和混合数据库7、搜索引擎 它是一种网络检索工具。,二、检索工具的鉴别与评价鉴别和评价检索工具总体上从以下几个方面进行:1、信息收录范围与信息质量 信息收录范围是指工具中信息覆盖的学科面、信息类型及数量。信息质量是信息水平层次、真实性和准确性的集合。2、著录的详略 文献信息的特征包括外表特征和内容特征。工具对文献信息特征著录或描述的详略程度决定了使用效果。3、著录、标引的质量 著录、标引的质量主要体现在著录项目是否完全、内容的标引深度、著录和标引的准确性以及标准化等方面。4、信息报道的时效 信息报道时效主要通过报道时差来反映。报道时差是指从原始信息发布到工具报道时间间隔。5、检索功能 检索功能包括检索操作的简易程度、检索途径的多少、以及检索效果好坏。 另外可读性,权威性可作为参考型工具选择的辅助指标,而网络的速度和检索费用是机检工具选择必须考虑的因素。,三、检索工具的选择原则 选择检索工具应该是以满足信息利用要求为前提,充分考虑客观工具条件和经济能力。一般来说,应该先选择国内的检索工具,后选择国外的;先选择本地图书馆后选择其他图书馆;一般的资料查询应先查文摘型检索工具,必要时再查其他工具;而科学研究者应根据信息内容互补原则选配多种工具构成信息完整的检索工具体系,优先选用专科或专题数据库、网络数据库,必要时再进行联机检索。文献检索应以计算机检索优先,非文献型信息检索既要考虑计算机检索,也要充分考虑各种印刷型检索工具的使用。,第三节 检索语言概述,一、检索语言的概念 信息检索语言是用来描述文献特征和表达信息提问、沟通信息人员和用户双方思想的一种语言。信息检索语言是在自然语言基础上发展起来的,它在信息的存储过程中用来描述信息的内容特征或外部特征,形成检索标识;在信息的检索过程中用来描述检索提问,形成提问标识。当提问标识与检索标识完全匹配或部分匹配时,即可命中信息。,二、常用的检索语言(一)描述信息内容特征的的检索语言 1、 分类检索语言 是一种直接体现文献信息知识分类的等级概念标识系统,它以科学分类为基础,结合文献信息特点,采用概念逻辑分类,一般规则层层划分,构成具有上、下隶属关系,同位之间并列的概念等级体系。分类语言的“词语”就是等级体系中的类目及相应的分类号。分类检索语言必须依据某一种分类体系构成其标识系统,如中国图书馆图书(资料)分类法、美国国会图书馆分类法、杜威十进分类法等。,中国图书馆图书(资料)分类法分类号的构成及分类目录的编排:A 马克思主义、列宁主义、毛泽东思想、 邓小平理论B 哲学、宗教 B80 思维科学、 B81 逻辑学(论理学) B83 美学、 B84 心理学C 社会科学总论 C0 社会科学理论与方法、C8 统计学、C91 社会学 C93 管理学、C94系统科学、 C96 人才学D 政治、法律 D9 法律E 军事F 经济G 文化、科学、教育、体育 G2 信息与知识传播 G3 科学、科学研究 G4 教育,H 语言、文字 H1 汉语 H2 中国少数民族语言 H3 常用外国语 H31 英语I 文学J 艺术K 历史、地理 K81 传记 K85 文物考古 K89 风俗习惯 K9 地理,N 自然科学总论 N0 自然科学理论与方法论 N3 自然科学研究方法 N93 非线性科学 N94 系统科学 N99情报学、情报工作O 数理科学和化学 O1 数学 O4 物理学 O6 化学P 天文学、地球科学 P4 大气科(气象学),Q 生物科学 Q1 普通生物学 Q2 细胞生物学 Q3 遗传学 Q4 生理学 Q5 生物化学 Q6 生物物理学 Q7 分子生物学 Q81生物工程学(生物技术)Q89 环境生物学 Q93 微生物学 Q94 植物学 Q95 动物学 Q96 昆虫学,R 医药、卫生S 农业科学 S1 农业基础科学 S2 农业工程 S3 农学(农艺学) S4 植物保护 S5 农作物 S6 园艺 S7 林业 S8 畜牧、动物医学、狩猎、蚕、蜂 S9 水产、渔业,T 工业技术 TM 电工技术 TN 无线电电子学、电信技术 TP 自动化技术、计算机技术 TP3 计算机技术、计算技术 TQ 化学工业 TS 轻工业、手工业 TS2 食品工业 TS97 生活服务技术 TU 建筑科学TV 水利工程X 环境科学、安全科学Z 综合性图书,2 、 主题检索语言 主题语言是用于表达文献信息内容的词语标识系统,应用较多的是主题词法和关键词法。主题词法:主题词(Subject Headings)又称叙词(Discriptor),是典型的规范化语言。主题词法强调构词的规则和取词的统一性,一般都有一部词表作为检索者和标引者的取词依据。采用主题词法编制的索引称为主题索引(Subject Index),以主题词字顺排列。,主题索引样例: 基因 红细胞 血型 8762 遗传分析 统计分析 8550 诱发突变 相关分析 8772 基因表达 8724 8766 基因库 互补 DNA 肝肿瘤 8684 玉米 互补 DNA 8691,关键词法:关键词(Keyword)是指出现在文献信息中能表达文献信息主题内容的,或被人们用作检索人口的关键性专业性名词术语。关键词通常取自原文,不作规范化处理,没有特殊规定,所以又称为自然语言。采用关键词法编制的索引叫关键词索引(Keyword Index),排检方法同主题词法。3、代码语言:是以文献信息的某些代码作为标识系统的检索语言。,(二)描述文献信息外表特征的检索语言1、文献信息篇名或题名索引系统2文献信息著者姓名或团体名称作为标识的字顺索引系统3、文献信息序号索引系统4、引文索引系统随着计算机网络技术的发展和应用,现在又出现了自然语言与人工语言结合的一体化语言。,第四节 检索方法及检索途径,一、检索方法概述(一)引文法 引文法就是利用文献后所附的参考文献、相关书目、推荐文章和引文注释查找相关文献的方法。引文法虽然能查找出一些被认为重要的文献,但引文有一定的片面性,且与最新的研究有一定的时差。利用引文法查找文献的最有用的工具是引文索引。、由远及近地搜寻。即找到一篇有价值的论文后进一步查找该论文被哪些其它文献引用过,以便了解后人对该论文的评论、是否有人对此作过进一步研究、实践结果如何、最新的进展怎样等等。由远及近地追寻,越查资料越新,研究也就越深入,但这种查法主要依靠专门的引文索引,如 科学引文索引(Science Citation Index)、社会科学引文索引(Social Sciences Citation Index)。2、由近及远地追溯(追溯法)。利用原文后的参考文献由一变十,由十变百地获取更多相关文献,直到满足要求为止。,(二)交替法(三)排除、限定和合取法1、排除法是指对查找对象的产生和存在的状态在时间和空间上加以外在否定。把这一方法移植到检索中,就是在时间或空间上极大地收缩检索范围。 2、限定法是相对于排除法而言的,指对查找对象在时间和空间上加以内在的肯定。 3、合取法如果把不同资料中相关信息的汇集在一起,经过去粗取精、去伪存真地加工,构成一个完整的答案,这就是合取法。采用这种方法,不仅要对各类工具书触类旁通,灵活运用,还要学会分析来自各方面的庞杂的材料。特别是碰到复杂的难题或大课题时,要注意:(1) 善于跨种类地综合利用各种类、各文种的参考工具书,注意比较它们各自的特点,有步骤、按次序地进行查找;(2) 不仅要利用二次文献的检索工具,还要注意利用一次文献和三次文献;(3) 要注意利用多种载体和多种媒体的资料;(4) 要充分利用资料的附录。,(四)常规法 所谓常规法就是利用常规检索工具查找有关文献的方法,是信息时代应掌握的最基本的信息查找方法。常规法如果从时间上考虑有顺检法、倒检法和时间抽样法三种。1、顺检法 就是从过去某一时间起往现在逐年逐月地检索。 2、倒检法 则是从现在往过去逐年回溯。用这种方法检索的用户比较注重新的信息,同时常有一些信息量上的要求。 3、时间抽样法 就是抽检某时段的信息。这种方法是利用事物发展的不平衡性来进行的。,二、 检索途径概述 所谓检索途径就是利用信息的什么特征来查询相关的信息,也就是用什么作为检索标识通过检索工具查到所需的信息。信息的检索途径可以分为分类途径和主题途径两大类,细分的种类很多,常用的有标题检索(书名、刊名、篇名)、责任者检索(包括个人或团体的著者、编者等)、分类号检

    注意事项

    本文(南京大学信息检索ppt课件课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开