《信息检索知识》PPT课件.ppt
《《信息检索知识》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《信息检索知识》PPT课件.ppt(50页珍藏版)》请在三一办公上搜索。
1、1,一、信息检索(Information Retrieval),包括两个部分:一是信息存储,即把大量分散的无序的信息集中起来,经过加工,使之有序化、系统化,成为有功能的检索工具或检索系统。二是信息检索,利用已组织好的检索工具或检索系统,按照课题的要求将所需信息查找出来。,2,信息检索类型,分为:数据检索(Data Retrieval)-特定的数据事实检索(Fact Retrieval)-特定的事实文献检索(Document Retrieval)-特定的文献是根据课题的要求,采用科学的方法,利用专门的检索工具,如书刊或数据库,从大量的文献资料中找到所需文献的过程。包括,书目检索、题录或索引检索、
2、文摘检索、全文检索。,3,二、检索原理与检索语言,1、检索原理 是指通过一定的方法和手段,使信息存储与检索两个过程所采用的特征和标识达到一致,以便有效地获取和利用文献。存储过程-对文献进行标引检索过程-根据需求,确定提问式,4,2、检索语言(检索标识,Retrieval Language)检索语言是一种在文献存储和检索过程中共同使用的语言。它的用途是描述文献特征,表达情报提问,并使两者能相互沟通。可分为规范化语言(受控语言)和非规范化语言(自然语言)。,5,规范化语言:是指对文献检索用语的概念加以人工控制和规范,把检索语言中各种同义词、多义词、近义词、同形异义词等进行规范化处理,使每个检索词只
3、能表达一个概念。例:IM的Subject Index;CA的CS、GS;中目的分类目次非规范化语言:它对检索用语中的各种同义词、多义词、近义词、同形异义词等不加处理,所以也叫自然语言,如关键词。例:CAKeyword Index,6,文献特征文献标识 目录或索引-检 外部特征文献名称文献名称索引(Title Index)引用期刊一览表等 著者名称 著者索引(Author Index)著者、专利权人索引 文献序号 序号索引(Number Index)专利号、报告号等索 引用文献 引文索引(Citation Index)SCI 内部特征分类号 分类索引(Classified Index)主题词 主
4、题索引(Subject Index)语 关键词 关键词索引(Keyword Index)分类主题 分类主题索引(Classified and Subject Index)言 其它专用索引 分子式索引,环系索引等(Formula Index),(Index of Ring system),7,三、常用文献检索算符,逻辑“与”and/*检索式“A and B”表示文献中同时包含检索词A和检索词B的文献才是命中文献。如:查找“胰岛素治疗糖尿病”的检索式为 insulin(胰岛素)and diabetes(糖尿病)。,A AND B,8,逻辑“或”OR/+检索式“A or B”表示包含检索词A的文献或
5、者包含检索词B的文献或者同时包含检索词A和B的文献为命中文献。如:查找“肿瘤”的检索式为cancer(癌)or tumor(瘤)or carcinoma(癌)or neoplasm(新生物)。,A OR B,9,逻辑“非”NOT/-检索式“A not B”表示包含检索词A同时不包含检索词B的文献为命中文献。如:查“动物的乙肝病毒(不要人的)”的文献的检索式为hepatitis B virus(乙肝病毒)not human(人类)。,A NOT B,10,邻近度算符 With 检索式“A with B”表示检索词A和检索词B不仅要同时出现在一条记录中,还要同时出现在一个字段里的文献才是命中文献.
6、如:“drug with abuse”检索出的是同一个字段中同时出现这两个词的记录。,11,邻近度算符Near 检索式“A near B”表示检索词A和检索词B不仅要同时出现在一条记录的同一字段里,还必须在同一个子字段(一句话)里的文献才是命中文献。如:drug near abuse检索出的是同一句话中同时出现这两个词的记录。(也可说成是两个词之间没有句号的文献)。,12,邻近度算符Near#其中“#”代表一个常数,检索式“A near#B”表示检索词A和检索词B之间有0#个单词的文献(A和B在同一记录、同一字段里)。在near后加一个数字,指定两个词的邻近程度,且不论语序。如:informa
7、tion near2 retrieval表示检索词 information和retrieval同时出现在一个句子中,且这两个检索词之间的单词数不超过两个的那些文献为命中文献。,13,四、文献检索工具的含义和类型,1、检索工具的定义与特点定义:检索工具(Retrieval Device)是指用于报道、存储和查找文献的工具。它具有存储(编制过程)和检索(查找过程)两大职能。特点:(1)收摘一次文献、(2)著录文献特征、(3)提供多种检索手段,14,2 检索工具的类型*按摘录方式划分如下:目录 题录或索引 文摘 全文,15,目录(Catalogue),含义:目录是对文献的外表特征的著录。它通常以完整
8、出版物(如一本书或一种刊或一个会议录的名称)作为著录的基本单位来报道和记录文献。著录内容:文献名称、著者、出版项与馆藏信息等内容。,16,按职能划分目录种类:出版发行目录 馆藏目录:按检索标目划分为 书名目录(Title Catalogue)著者目录(Author Catalogue)分类目录(Classified Catalogue)主题目录(Subject Catalogue)联合目录 资料来源目录,如IM、CA、BA,17,题录(Title)或索引(Index),概念:其一,是指检索工具,它揭示文献的外表特征和内容特征,即著录文献是以一个完整出版物的某一部分(如书的章节或刊中一篇论文题目
9、)为著录单位。其二,是指检索途径(附录式索引),如,分类索引、主题索引、生物体索引、著者索引等。著录内容:论文题目、著者、文献出处(刊名、发表年月、卷、期、页码)及文种等。如,中目、IM、CNKI免费题录等。,18,文摘(Abstract,Excerpta,Digest),含义:文摘是指对文献内容选择重要部分以简练的形式作为摘要,并按一定的原则和方法编排而成的一种检索工具。著录内容:同 文摘。如,中国医学文摘,中国药学文摘,中国生物学文摘,CA,BA,CBM,CMCC,MEDLINE/PubMed等。,19,根据摘要详简程度,文摘可分为:指示性文摘(简介,Indicative Abstract
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息检索知识 信息 检索 知识 PPT 课件

链接地址:https://www.31ppt.com/p-5464168.html