文献信息检索基本原理及方法.ppt
《文献信息检索基本原理及方法.ppt》由会员分享,可在线阅读,更多相关《文献信息检索基本原理及方法.ppt(27页珍藏版)》请在三一办公上搜索。
1、第三章文献信息检索基本原理及方法,3.1.1 文献信息检索的基本含义,一、文献信息检索的基本含义,“检索”即“查找”之意。信息检索,是将信息按照一定的方式组织、存储起来,并针对用户的需要查找所需信息的过程。因此信息检索包含了信息的存储和检索两个不可分的部分。我们通常所说的信息检索是指狭义的信息检索,即从检索工具和检索系统中查找所需信息的过程及其所采取的一系列方法和策略。,3.1.2 文献信息检索的类型,手工检索和计算机检索的关系:手检是基础,机检是发展方向。,3.1.2 文献信息检索的类型,按检索要求划分:,相关性检索是系统不直接回答用户所提出的技术问题本身,而是只提供与之相关的文献供用户参考
2、。确定性检索是以数据或事实为检索对象,系统要直接问答用户提出的技术问题,即直接提供用户需要的确切的数据或事实。,文献信息检索的类型,根据检索对象划分书目检索:是以文献线索为检索对象的文献检索,即检索检索系统存储的是以二次文献为对象(目录、索引、文摘)的信息,他们是文献信息的外部特征与内容特征的描述集合体,信息用户通过检索,获取的是原文的“替代物”。用户通过检索获得的是与检索课题有关的一系列文献线索,然后再通过阅读决定取舍。全文检索:是以文献所含的全部信息作为检索内容的文献检索,即检索系统提供的是整篇文章或整部图书的全部内容,检索时可以查找到原文以及有关的句、段、接、章等文字,并可进行各种频率统
3、计和内容分析。全文检索主要是用自然语言表达检索课题。较适用于某些参考价值大的典据性文献。全文检索是当前计算机检索的发展方向之一。数据信息检索:数据信息是指检索系统中存储的是数值型数据,如科学技术常数、各种统计数据等,信息用户可用通过检索获得的经过核实、整理的数值信息再做定量分析。事实信息检索:又称事项检索。是指系以事实为检索内容的情报检索,其检索对象包括事实、概念、思想、知识、人物的基本信息等内容,事实检索也是一种确定性检索,用户获得的是有关某一事物的具体答案。,3.2 文献信息检索原理,文献信息检索的基本原理:就是用户根据课题需要,将代表需要查找的检索提问标识与文献库中所存储的文献特征标识进
4、行比较,当文献库中所存储的文献特征标识与检索提问标识相一致,或文献特征标识包含了检索提问标识时,那么具有这些特征的标识就被检出,即是命中的结果。,文献信息,信息存储与检索原理流程图,文献信息,检索课题,文献信息特征,检索课题信息,检索语言和名称规范,文献信息标识,检索提问标识,文 献 信 息 检 索 系 统,检 索 结 果,分析,标 引,形 成,输 入,匹配 输出,输 入,形成,选 用,分析,检索语言,在信息检索工作中,检索语言亦称情报检索语言,在存储和检索过程中,检索语言起着重要的作用。它把信息的内容特征和外表特征简明而有效的揭示出来,并保证了文献存储的集中化和系统化,使有规律的检索成为可能
5、;沟通检索人员和标引人员的思想,引导检索人员和标引人员理解一致,避免检索的漏误。具体而言:它能够保证不同标引人员表达文献的一致性,保证不同检索人员检索提问的一致性,保证检索提问与文献标引的一致性。,检索语言的定义:检索语言是从自然语言精选出来的一整套词汇、符号,用以对文献内容和信息特征进行概括和规范。它是文献的标引系统,也是读者检索使用的一种符号系统,是检索工具和参考工具书的重要组成部分。,检索语言,检索语言,词汇,语法,词汇是指收录在类表和词表中的所有标识,如分类号、检索词、代码等,是可识别词汇。,语法是指如何创造和运用标识来准确表达信息内容特征,以有效实现信息检索的一整套规则。,检索语言,
6、检索语言须具备三个基本要素:有一套专用字符来构建词汇;有一定数量的基本词汇用来表达基本概念;有一套专用语法规则,用严格的句法手段和词法对词汇进行控制,以准确表达各种各样的概念。,一种较好的检索语言应具有对多种检索要求的广泛适应性,保证有较高的查全率和查准率;具有对多种学科和多种信息类型的适应性;具有与其他检索语言的兼容性和国际通用性。,检索语言,检索语言的分类划分,检索语言,分类语言,概念,是指以数字、字母或数字与字母结合作为基本字符,以基本类目为基本词汇,以类目的从属关系来表达概念间相互关系的一类检索语言。,分类原理:分类是对知识概念的划分。分类语言是用分类号来表达学科体系的各种概念,将各种
7、知识要领按学科性质进行分类和系统排列。即以学科分类为基础,按照概念划分的原理,将知识分门别类地按一定的逻辑次序,从总到分,从具体到一般,从简单到复杂、进行层层划分,层层隶属,形成一个严格有序、层次分明的知识门类体系,以便从知识分类的角度按学科、分专业地集中信息,揭示各类信息在内容上的联系与区别,提供从学科分类角度检索信息的途径。,检索语言,是一种描述概念性语言,它用语词直接表达文献的主题,这些语词就是表达主题概念的标识。将这些作标识的语词按字顺序排列并使用参照系统来间接表达各种概念之间的关系,这就是主题语言。,主题语言,检索语言,又称标题词语言,是最早使用的一种主题词语言,以标题词作为表达文献
8、内容和检索依据、完全先组式规范化的检索语言。标题词主标题词和副标题词。利用标题词语言编制的检索工具质量较好,组配固定,不易混乱,有较好通用性、直接性和专指性。可通过“见”和“参见”扩大检索范围,提高查全率。缺点是系统性差,内容相关的分散在多处,灵活性差,不能任意组配检索。,是从文献标题或文章正文中抽出来的,对表达文献主题具有实质意义的词汇,它对能否检索到文献起着关键性的作用,故称为关键词。关键词语言也是主题词语言之一,但和标题词语言、叙词语言不同,它是一种用自然语言作标识的检索语言。,是以单元词作为文献内容标识和检索依据的一种主题语言。单元词是从文献正文、摘要或题目中抽取出来的、最基本的、其概
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文献 信息 检索 基本原理 方法
链接地址:https://www.31ppt.com/p-5986620.html