科技文献检索基础知识.ppt
《科技文献检索基础知识.ppt》由会员分享,可在线阅读,更多相关《科技文献检索基础知识.ppt(157页珍藏版)》请在三一办公上搜索。
1、科技文献检索基础知识,第一节 文献检索的基本原理第二节 检索语言及其种类第三节 文献检索工具第四节 科技文献的方法和途径,第一节 文献检索的基本原理,文献检索(情报检索):指将情报(信息)按一定方式组织存储起来,并针对用户的需求找出所需要的情报(信息)的过程。文献检索:文献信息的存储、文献检索两个过程。目的:为了解决特定的文献需求和满足用户的需要,情报检索模型是“匹配”模型 由文献特征构成的文献检索标志被认为完全反映了文献内容,而由提问特征构成的检索提问则反映了情报用户需求,因而二者的匹配程度就是文献的相关程度,相关文献就是在某种程度上匹配的文献。,一、文献检索的类型根据检索(查找)对象的划分
2、为文献检索、事实检索和数据检索。根据检索方式划分为手工检索和计算机检索。,文献检索是指以文献为检索对象,从已存储的文献库中查找出特定文献的过程。举例:“关于自动控制系统有些什么参考文献”,数据检索:是以数据为检索对象,从已收藏数据资料中查找出特定数据的过程。例如:查找喜马拉雅山有多高;,事实检索:通过对存储的文献中已有的基本事实,或对数据进行处理(逻辑推理)后得出信息的(即未直接存入或所藏文献中没有的)事实过程。如:本学期成绩优秀的学生有多少?某同类产品中,哪种牌号的销量最大?,事实和数据检索是要检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献;文献检索时最典型和最重要也
3、是最常用的情报检索。,手工检索:用人工来处理和查找所需信息的检索方式;计算机检索:利用计算机和一定的通信设备查找所需信息的检索方式;,二 手工检索的基本原理,文献信息搜集 加工检索系统 用户检索课题标识将标识文献信息按要求从检索系统中输出,比较,双方一致,三 检索系统,检索系统 是根据特定需要利用一定的检索设备、从整理加工并存储在某种载体上的文献集合中检索出所需情报的系统。它根据检索设备和软件的不同,可以分为手工检索系统和机器检索系统。,手工检索系统由手工检索设备(如书本式目录、文摘、索引)、检索语言、文献库等构成。特点:它使用方便、成本低廉,但检索效率和响应时间均较差。,机器检索系统:可分为
4、机械检索系统和计算机检索系统。机械检索系统:主要由穿孔卡片、选卡机、机械探针、编码规则、文献库等构成;计算机检索系统:有计算机检索设备(联机检索设备、光盘检索设备、微机检索设备)、检索语言、文献库等构成。特点:检索效率高、响应速度快,但是成本和检索费用高。,科技文献检索基础知识,第一节 文献检索的基本原理第二节 检索语言及其种类第三节 文献检索工具第四节 科技文献的方法和途径,第二节 检索语言及其种类,一 检索语言的概念 检索语言是信息检索系统存储与检索所使用的共同语言。即在文献存储时,文献的内容特征(如分类、主题)和外表特征(如书名、著者、出版社)按照一定的语言来描述,检索文献时的提问也按照
5、一定的语言来加以表达,这种在文献存储和检索过程中,共同使用、共同遵守的语言就是检索语言。,检索语言的种类:按照标识的性质与原理分:分类检索语言、主题检索语言、代码检索语言;按照其标识的使用方法分:先组式语言(文献标识在编表时就固定组配好)、后组式语言(文献标识在检索时才组配起来),二 分类检索语言与分类表分类检索语言是用分类号来表达各种概念,以学科体系为基础,将各种概念按学科性质进行分类和系统排列。特点:能集中体现学科的系统性,反映事物的从属、源生关系,便于按学科门类进行族姓检索。,分类检索语言通过分类表来体现:分类法根据图书的内容,按照知识门类区分图书的方法 图书分类法用分类号来表达各种概念
6、,分类法的主体是类目表。一部完整的分类表,大体可由:编制说明、大纲、简表、详表、辅助表、索引、附录等组成。,19,“物以类聚”中“类”指具有某些共同属性(特征)的个体事物的集合。分类是人类认识客观世界、区分客观事物的一种逻辑思维手段,也是根据事物的“共性”与“特性”聚集相同事物、区分不同事物的手段,同时也可以使大量的繁杂事物条理化和系统化。,20,集合论观点:具有共同属性的事物总称为一个集合(set),在一个集合S中,根据事物的某些特征值又可以细分为n个子集合S1,S2 Sn,对任意子集Si又可以进一步细分为k个子字集Si1Si2Sik.依此类推.。实际上,分类就是以事物的性质、特征为依据把事
7、物的集合进行分门别类的过程。,21,一个概念经过一次划分后形成的一系列知识概念就是种概念,又称“子类”或“下位类”,被划分的类称为“母类”或“上位类”,即属概念;由同一上位类划分出的各个下位类互称为“同位类”,也即并列概念;,22,一个概念每划分一次就产生许多类目,逐级划分,就产生许多不同等级的类目。这些类目层层隶属,形成了一个严格有序的知识门类体系。用规范化的人工符号(如字母、数字和语词)表示这些类目,就构成分类表,类号和类名组成分类检索语言。,23,从分类角度查阅文献,应使用体系分类表。查阅特色皮鞋市场的文章,至少要进行:,24,F经济,F0政治经济学F1世界各国经济概况F2经济机化与管理
8、F3农业经济F4工业经济F5交通运输经济F6邮电经济F7贸易经济F8财政经济,F71贸易经济理论方法F72中国贸易经济F73各国贸易经济F74国际贸易F75各国对外贸易F76商品学,F761一般性著作F762农产品F763医疗用品F764重工业产品F765建筑器材F766交通运输器材F767化学工业产品F768轻工业产品,(一级),(二级),(三级),(四级),体系分类法中的经济类示意图,25,类目,(1)类:是一组在某一点上彼此相同或相似的许多事物的总称。每一类必须给予相应的名称,这就是类目,或类名。类目从形式逻辑上来说就是概念,概念有其内涵和外延;内涵:即类目所反映的图书有关本质属性。外延
9、:指类目的适用范围,即类目所能包括的范围,如“人类“类目包括古今中外的一个个别人,26,(2)类目间关系,可比较的,不可比较的,相容的,不相容的,同一的,从属的,交叉的,并列的,对立的,矛盾的,类目间的关系,27,号码(标记符号),(1)号码:又称类号,即类目的代号,或称分类标识,代表各级类目的标记。各级类目按照一定的学科体系排列起来之后,虽然有一定的先后次序,但实际上还是不能处理日常排书、取书、排卡的工作,因而要有一种符号来代表类目,作为先后排列的次序和表示类目在分类表体系中的位置。要求号码:逻辑性、简易性、伸缩性,28,(2)号码的类型单纯号码:单纯数字:以阿拉伯数字为基础,但其号码数量很
10、少,因为基数只有10个单纯字母号码:基数大,但不易认、读、记、写等混合号码:通常以少量字母(一个至两个、最多三个)和大量的数字的混合。,29,例如:中图分类法的“Q959.3”Q959.3 脊椎动物门Q959.4 鱼纲Q959.6 爬行纲Q959.7 鸟纲Q959.8 哺乳纲实际上Q959.4/Q959.8均属于Q959.3脊椎动物门,但号码的位次并不反映类目的级位。,30,如中国图书馆分类法:A 马克思主义、列宁主义、毛泽东思想 1 马克思、恩格斯著作 2 列宁著作 21选集、文集 219 单行著作 22 23,31,中图法:O 数理科学和化学 1 数学17 数学分析171 分析基础172
11、微积分172.1微分学172.2 积分学,32,(3)号码的编制方式顺序制:依据号码自然顺序排列。层累制:又称等级制,根据类目的不同等级,给予相应的不同位数的号码,一级类用一个号码表示,二级类用两个号码表示,三级类用三个号码表示,依此类推。混合制:既采用顺序制,又采用层累制的一种编号方式。有的类目用顺序制,有的用层累制。,33,(4)号码编制方法由于符号数量有限(阿拉伯数字10个,汉语拼音、英文字母也只有26个),如果同级类目超过这些符号,就需要采取一定技术,用一些特殊的编制方法适用科学发展和分类表类目的需求,34,间接编号法扩展编号法双位编号法借位编号法起讫编号法连接编号法(利用冒号:连接原
12、有两个相关类目的号码)辅助编号法(“a”、“”、“”、“”、“()”、“”、“”、“”),35,(1)间接编号法 也称为留空位。主要为了满足某些学科从两个学科之间产生出来,留用一些备用的号码,给将来增订分类表时用。如1、3、5、7A、B、D、F、H,36,(2)扩展编号法也称为八分法。在某一个号码的后面,多伸展一些号码,以表示同位类。八分法即用前8个数字表示类目,从第9个类目开始,则在9的后面进行扩展,也称为扩九编号法。如:第1-8类 用1、2、3、4、5、6、7、8第9-16类用91、9298第17-24类用991、992998,37,(3)双位编号法主要目的是在同位类并列类目过多时使用。如
13、果并列类目远远不止10个时,第1类不用1,而用11;第2类不用2,而用12第9类不用9,而用19从第10类开始使用21,22,23一直到第81类用99。,38,(4)借位编号法(借号)目的一是为了缩短号码或者需要分配较大的号码时,借用上位的类号码。二是为了使用并列类目超过9个以上,借用下位类。,74.9 金属矿74.91 黑色金属矿、铁矿74.92 有色金属矿74.93 贵金属矿74.94 铜矿,55 天文学.1天体测量学及时间、历法.2天体力学.3 天体物理学.38 天体化学.39天体生物学.4 恒星,39,(5)起讫编号法(扩充编号)目的是用来表示类号的范围,一般用斜线“/”或短横“”来连
14、接一组连贯号码之中的最前和最后的两个号码,即表示两个号码之间的所有各个类目。TM51/59,40,正表,正表是整个文献分类表的主体,是分类体系的具体表现,是根据图书分类的基本原则区分的许多大小门类,编排成一个有层次的逐级展开的排列表一般有:基本部类表、基本大类表、主要类目表和详细类目表等,41,基本部类表:由基本部类组成。我国现行图书分类表的基本部类,大都是“五分法”,分为(1)马克思列宁主义、毛泽东思想;(2)哲学(3)社会科学(4)自然科学(5)综合性图书,42,基本部类表:是整个分类表的第一级概括性的类目。主要类目表;又称为“简表”,是由基本大类区分出来的类目及若干重要的三级类目共同组成
15、。详细类目表:简称为“详表”,是一切不同等级类目所组成,是分类标引的依据,要求全面、概括、详细、实际、完整、系统,世界上比较著名的分类法有:杜威十进分类法国际专利分类表美国国会图书馆分类法我国在图书情报系统广泛采用的有:中国图书分类法(简称中图法)中国科学院图书馆分类法(简称科图法),44,“中图法“是国家推荐统一使用的分类法,被许多检索工具采用或改编,分5大部类22类,类号采用汉语拼音字母与阿拉伯数字的混合号码,用一个字母代表一个大类,以字母的顺序反映大类的序列,在字母后用数字表示大类下类目的划分,数字的设置尽可能代表类的级别,并基本上遵从层累制的原则。,45,示例:中图法,社会科学,自然科
16、学,46,杜威十进分类法是由美国的威尔.杜威编制,是一部在国际上出现最早流行最广、影响最大的图书分类法。1876年出版,至1996年出版第21版,四卷本。卷一为编制说明和通用复分表,卷二、卷三为类表,卷四为索引和使用手册。,47,它依据培根的知识分类思想,将图书分为十大类:000 总论类100 哲学及相关学科200 宗教300社会科学 400 语言学 500 纯科学 600 技术工程 700艺术、美术及装饰艺术 800文学 900普通地理和历史及其辅助学科,48,体系分类法优缺点(优点)(1)具有按学科或专业集中地、系统地揭示文献信息内容的功能,具有较高的查全率,能够较好地满足族性检索的要求;
17、(2)具有良好的等级结构,便于扩大和缩小检索范围;(3)既能用于组织检索工具和检索系统,又能用于组织文献的分类排架;(4)用分类号检索,可不受文种限制;,49,缺点:(1)以分类号作为检索标识,不易被广大读者理解概念。若不熟悉分类法很难把主题概念转换为分类号;(2)修订不便,无法及时增加反映新知识主题的类目。同时,分类表也不能永无止境地细分下去,如遇到主题十分狭窄的文献,则可能很难找到相应的类目及分类号;(3)体系分类法的单维式直线序列结构,不利于处理现代科学技术交叉渗透而出现的多维性主题的文献。如教育心理学隶属于教育学,航空心理学隶属于航空飞行术类。,50,三 主题检索语言及主题词表,主题检
18、索语言是以自然语言的字符为字符,以规范化或未经规范化的名词术语为基本词汇,以概念之间的形式逻辑为语法和构词法,用一组词作为文献检索标识而构成的一种检索语言。主题检索语言包括标题词语言、叙词语言、关键词语言、单元词语言。,51,1.按描述文献的特征,检索语言的类型,描述文献外表特征的检索语言,描述文献内容特征的检索语言,文献的篇名(题目)作者姓名责任者出版者、合同号、报告号、引文,分类语言,主题语言,标题词语言、叙词语言关键词语言、单元词语言,代码语言,体系分类语言、组配分类语言、混合分类语言,分子式索引、结构式索引、专利号索引等,52,标题法,是主题法的最早类型,也称“传统式主题法”文献主题的
19、内容是用规范化了的词或词组来标识,这个词或词组简略表达信息对象论及或涉及的事物即所谓文献主题的词语,把它们按字顺序排列起来就称为标题表。标题语言中,任何一个标题,都是一个完整的标识,可以独立地标引一个文献主题;单个词和词组,分别表示单纯概念和复杂概念。,特点:具有较好的通用性、直接性和专指性。按照词表列举的标题和副标题进行标引,操作简便、但灵活性较差,使用时必须从规定的组配顺序入手进行查找,无法实现多元检索,影响检索效果。,如:一篇关于计算机的设计和另一计算机维修的文章,都可直接用“计算机”来作标题词,它们在标题词系统中都是按“计”字排列集中在一起的;,但“微型计算机”“微型电脑”“微机”虽然
20、都表同一概念,这时就不用直接用“微型电脑”或“微机”来作标题词了,这三篇都必须用“微型计算机”来作标题词(根据词表决定)。因为这三个术语都是等同概念,如果同时用三个术语来标引,便会导致文献被分散,当然,读者从“微型电脑”或“微机”入手检索时,都可以在标题词表中看到“见:微型计算机”的参照指示。,标题词语言的构成原理可归纳为:按照主题集中文献;用经过规范化的语词(标题词)直接标引文献主题;用参照系统间接显示主题之间的相关关系;用字顺序列直接提供主题检索途径;任何一个标题词,都是一个完整的标识,可以独立地标引一个文献主题;,57,把表示事物的自身概念的词称为“主标题”如“金属”;表示该事物各个方面
21、的词称为“副标题”,如“冶炼”“加工”。主标题和副标题在编表时是预先固定好的,所以是一种先组式定组型的检索语言,可在标引和检索时直接适用,不易混乱。,标题词表 将标题词按字母顺序排列的词表;标题词表是标题词的汇编,是一部标题词典;一部标题词表由以下三个部组成:编制说明、主表、附表;,1 编制说明:指出本表的编制经过,收录标题词的学科范围、选词形式、标题形式、参照系统、各种符号的意义、标引及排列规则等;2 主表:是标题词表的正文,包括全部标题词和非标题词,按字顺排列,并有参照体系和注释;3 附表:或标题细分表,副表中的标题词一般只能用作标题词的限定词,因此有时也称副标题词或限定词。,叙词语言,叙
22、词是指一些以概念为基础的,经过规范化的,具有组配功能并可以显示词间关系和动态性的词或词组。叙词语言就是以叙词作为文献检索标识和查找依据的一种检索语言。叙词语言是多种情报检索语言的原理和方法的综合,体现了情报检索语言的发展趋势。概念组配是叙词语言的基本原理。,概念组配与字面组配,在形式上有时相同,有时不同。在性质上来看两者区别是很大的:字面组配是词的分析与组合(拆词);概念组配是概念的分析与综合(拆义),字面组配“香蕉”+“苹果”组配后是“香蕉苹果”概念组配其结果应是指“一种香蕉和苹果杂交的品种”,而这种品种目前是不存在的,所谓“香蕉苹果”只能是一种有香蕉味的苹果,因此概念组配时应用“香蕉味的食
23、品”和“苹果”两个词组配,才符合概念逻辑,63,字面组配,64,字面组配,65,叙词的参照系统,叙词语言吸收了多种情报检索语言的原理和方法:1 保留了单元词法组配的基本原理;2.采用了组配分类法的概念组配,以及适当采用标题词语言的预先组配方法;3 采用了标题词语言对语词进行严格规范化的方法,以保证词与概念的一一对应;4采用并进一步完善了标题词语言的参照系统,采用了体系分类法的基本原理编制叙词范畴索引和词族索引,采用叙词轮排索引,从多方面显示叙词的相关关系。,叙词表,叙词作为标引和检索人员之间的共同语言,是通过叙词表来实现的。叙词表的结构比较复杂,一般由一个主表和若干辅表构成。,叙词字顺表(主表
24、):叙词表的核心,它是将叙词完全按字顺排列,并有标注事项和参照系统。叙词分类索引(辅表):也称分类表或范畴索引,是一种重要的辅助索引,便于从学科或专业的角度来选用叙词;叙词等级索引(辅表):也称族系表或词族索引,利用概念等级关系将叙词汇集在一起成为一族,构成一个从泛指叙词到专指叙词的等级系统。,关键词语言,关键词语言是直接选用文献中的自然语言作基本词汇,并将那些能够揭示文献提名或主要意旨的关键性自然语言作为关键词进行标引的一种检索语言。关键词是指那些出现在文献的标题(篇名、章节名)以致摘要、正文中,对表征文献主题内容具有实质意义的语词,亦对揭示和描述文献主题内容来说是重要的、带关键性那些词语。
25、,如:“国际联机检索系统”中的“国际联机”“联机”“检索”都是能描述这篇文献的主题的,可以作为检索词。,概括地说:关键词法就是将文献原来所用的,能描述其主题概念的那些具有关键性的词抽出,不加规范或只作极少量的规范化处理,按字顺排列,以提供检索途径的方法。,关键词语言、标题此语言、叙词语言的异同,相同点:关键词语言是为适应目录索引编制的自动化的需要而产生的,它与标题词语言、叙词语言同属主题法系统;不同:标题词语言、叙词语言使用的都是经规范化的自然语言,而关键词语言基本上补作规范化处理。,单元词语言,单元词(元词)是指从文献中抽取出来的,能 表达文献主体的最基本的、不能再分的、具有独立概念的名词术
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 科技 文献 检索 基础知识

链接地址:https://www.31ppt.com/p-5371822.html