第一章 医学文献检索绪论 课件.ppt
1,课时安排,第一章第二章 68学时第三章第四章(实习课)46学时第八章 第九章 6学时 任课教师:范学宁,2,医学文献检索,第一章 绪论第一节 医学文献的基础知识第二节 医学文献特点,3,科技文献检索在科研中所占比例,4,图书 60多万种/每年科技期刊 14多万种/每年专利说明书 100多万件/每年会议论文 10多万篇/每年,5,文献检索的目的,我们要了解所研究课题的历史前人做过什么?存在什么问题?别人现在做什么?有什么经验教训?,6,第一节 医学文献的基础知识,几个概念及其相互关系医学文献发展的特点文献的类型,7,一、几个概念及其相互关系,1 信息(information)信息是指事物运动的状态与方式的反映,是自然界、人类社会和人类思维活动中存在的一切物质的一种属性。通俗解释:是指一种普遍存在的客观现象,是生活的主体与外部客体之间情况的“通知”或“消息”。举例,8,2 知识(knowledge)知识是指人类在改造世界的实践中所获得的认识和经验的总和。通俗解释:是指人类在改造客观世界的时间中所获得的认识和经验的“总和”或“结晶”。举例,9,3 情报(information)情报是指运用一定的形式,传递给用户,并产生效益的知识或消息。通俗解释:是一种普遍存在的社会现象。是被传递的知识或事实,是信息与知识海洋中一部分特指的知识和信息。举例:某大学教授出国考察,10,情报的基本属性,1、知识性2、传递性3、专指性4、价值性,11,4、文献(document)文献是指记录有知识的一切载体。也就是说用文字、图形、符号、声频、视频等手段记录下来的人类知识都可以称之为文献。三个要素:知识、信息、情报;载体;文字、图形、符号、视频、声频。一个特点:记录,12,文献与信息、知识、情报的关系,信息,知识,情报,文献,13,第二节 医学文献发展的特点,(一)数量庞大,增长迅速(二)出版类型复杂多样(三)内容交叉渗透,分散重复(四)知识老化加快,新陈代谢频繁,更新周期 缩短、传播速度加快(五)语种不断增加(六)交流传播速度加快(七)文献发表的时间滞后严重(八)学科分支越来越细,14,(一)数量庞大,增长迅速,目前,世界上的文献总量约为一百多万种,期刊占全部文献的70%,而其中约有1/5为生物医学期刊为二万余种。我国正式出版的医学及与医学相关学科的期刊七百余种。国内收藏的外文期刊(核心期刊)四百余种,生物医学期刊二百余种。据统计,全世界 每一分钟 出版一本新书。每一小时 申请1520个专利。每一天有35种期刊创刊。每一年 发表500余万篇科学论文,其中生物医学100余万篇,以每年正12%左右的速度增长。,15,(二)出版类型复杂多样,传统类型:书写型 印刷型现代类型:缩微型 视听型 机读型 网上型,16,(三)内容交叉渗透分散重复,由于同一篇文献可以用不同文字,以不同形式在不同范围内多次发表。比如:一篇专业论文,它报道的内容涉及到多个学科或几个专业。此时就会出现如下情况:1/3 登在刊名为本专业的杂志上;1/3 登在刊名与本专业相关的杂志上;1/3 登在刊名与本专业无关的杂志上。另外,出版的分散,导致每年有6070万篇文献用数十种文字发表在各种刊物上。,17,(四)知识老化加快,新陈代谢频繁,科学发展的越快,文献代谢就越频繁,而文献的有效使用周期也就越短,进而知识的老化率升高。一般认为,文献资料的可利用周期为:图书 1020年;期刊论文57年;科技报告10年;技术标准 5年;据美国科学基金委员会、凯斯工学院研究基金会和日本国家统计局的初步统计。用在查找和阅读情报资料上的时间占该项研究时间的50.9%,一名科研人员在一个研究项目中而计划思考时间占7.7%实验和研究时间占32.1%编写研究报告时间占9.3%,18,(五)语种不断增加,目前,全世界约有150多个国家或地区均拥有医学文献刊物,分别以70多种文字出版。以往只用英、德、法和俄等少数文字即可阅读92%的科技文献,而今随着世界各国科技的发展,发表文献的语种急剧增多。,19,(六)交流传播速度加快,过去是以马匹、信鸽及犬等来传递文献信息。而今随着科技的发展文献多种载体的广泛应用,文献向电子化、网络化、数字化方向发展。例如:电话、电报、电视及因特网。,20,(七)文献发表时间滞后严重,有出版经费、发行数量、稿件积压和需求等问题,使有科学价值的论文不能发表,准备正式发表的时间延误12年。,21,(八)学科分支越来越细,遗传免疫学、免疫化学、医学微生物、免疫学、血液免疫学、移植免疫学、细胞免疫学、肿瘤免疫学。,22,三、文献的类型,(一)按文献记录载体划分1.书写型文献(Hand Writing Document)载体是竹简、纸张、帛等,人工抄写而成。例如:写在竹简、帛等的古代文献上、书法作品、原始记录等。2.印刷型文献(Printed Document)载体是纸张,它是一种传统类型的文献。例如:书、刊、特种文献。,23,3.缩微型文献(MicroForm Document)载体是感光材料,如缩微平片、缩微胶卷。另外,还有一种计算机输出缩微胶片。4.视听型文献(Audio-visual Document)又称声像型,载体是感光材料或磁性材料,如录像带、录音带、科技电影、幻灯片等。5.电子型文献(Electronic Document)是指以数字化技术将文献存储在光、磁载体上,通过计算机或网络进行阅读的文献。例如,数据库文献和网络文献信息。,24,(二)按文献出版形式划分1.图书(Book)2.期刊(Journal)3.特种文献(Special Document)科技报告、专利文献、会议文献政府出版物、学位论文、标准文献技术档案、产品资料等,25,(三)按文献内容的加工程度划分1、一次文献(Primary Literature)是作者以生产或研究成果为依据而创作的原始文献。种类:期刊论文、学位论文、专利文献、会议文献、研究报告、专著、译文等。,26,2、二次文献(Secondary Literature)将无序的一次文献进行收集、整理,著录其特征并以规定的格式编制成为便于管理和查找文献的工具,即检索工具。种类:目录、题录或索引、文摘、全文。,27,3、三次文献(Tertiary Literature)是指在利用二次文献的基础上,对一次文献的内容经阅读研究,浓缩提炼而编写成的文献。种类:科技动态、专题综述、情报调研报告、决策参考、指南、进展等。,28,4、零次文献(Zeroth Literature),一般认为它是在一次文献形成前出现的并未公开出版及发表的最原始的文献。种类:书信;笔记;病案;档案;秘方;各种技法等。特点:非检索性:有许多难于用文字记录,不易形成文献。及时性:开会或听报告即可获取。启发性:参观展览或看实物进行联想。隐蔽性及独有性:政府重要文件、档案及临床病案。不是正式出版物:祖传秘方、厨师技法。,29,第二章 医学文献检索的基础知识,信息检索信息意识检索原理与检索语言文献检索工具的含义和类型检索途径与步骤如何提高信息检索效率,30,一、信息检索(Information Retrieval),包括两个部分:一是信息存储,即把大量分散的无序的信息集中起来,经过加工,使之有序化、系统化,成为有功能的检索工具或检索系统。二是信息检索,利用已组织好的检索工具或检索系统,按照课题的要求将所需信息查找出来。,31,信息检索类型:数据检索(Data Retrieval)-特定的数据事实检索(Fact Retrieval)-特定的事实文献检索(Document Retrieval)-特定的文献 是根据课题的要求,采用科学的方法,利用专门的检索工具,如书刊或数据库,从大量的文献资料中找到所需文献的过程。,32,二、信息意识,信息意识是指人们在充分认识情报信息价值的基础上,对其所具有的特殊敏感的一种自觉意识。它是获取信息的思想基础与动力。举例:两步发酵法生产VC的新工艺。,33,三、检索原理与检索语言,(一)检索原理 是指通过一定的方法和手段,使信息存储与检索两个过程所采用的特征和标识达到一致,以便有效地获取和利用文献。存储过程 对文献进行标引 检索过程 根据需求,确定提问式,34,标引者 检索者 原始文献 检索工具 情报需求 数据库 特征标识 组织 查找 提问标识 索引词 检索词 规范化 检索语言(主题词表),35,(二)检索语言(检索标识)它是一种在文献存储和检索过程中共同使用的语言。用途是描述文献特征,表达情报提问,并使两者能相互沟通。按其结构及原理检索语言可划分为三大类型:主题语言;分类语言;代码语言。,36,37,(四)检索语言的种类:目前,世界上估计有数余千种检索语言,但各种检索语言的基本原理是一致的,只是它们在表达各概念及相互关系时所采用的方法不同。因而,形成了不同种类的检索语言。实际检索文献过程中仅是用几种。1、主题语言 主题语言是采用语词来表达各种概念,并将各种概念完全按字顺排列。它可分为规范化语言(受控语言主题词)和非规范化语言(自然语言关键词)。,38,(1)规范化语言:又称主题词或可控词。是指对文献检索用语的概念加以人工控制和规范,即把检索语言中各种同义词、多义词、近义词、同形异义词等进行规范化处理,使每个检索词只能表达一个主题概念。例:利用主题词表进行同义词的规范化处理:俗名和学名的处理:Nosebleed See Epistaxis 鼻出血 见 鼻 血丑音译和意译的处理:AIDS See Acquired Immunodeficiency Syndrome 艾滋病 见 获得性免疫缺陷综合症,39,近义词规范化处理:例如:Cancer/癌,癌瘤 Tumors/瘤的,肿瘤的 Neoplasms/赘生物,新生物,瘤 Carcinomla/癌,癌瘤 Sarcoma/肉瘤,肉肿 在检索工具(IM)主题索引中,利用主题词表规范化之后只用“Neoplasms”进行检索。,40,(2)非规范化语言:又称关键词。它对检索用语中的各种同义词、多义词、近义词、同形异义词等不加处理,所以也叫自然语言。关键词可划分为:题内关键词:是来源于文献题目的关键词。题外关键词:是由文献正文以及检索工具编者增加的相关概念词。例如:“阿司匹林在B型流感病毒治疗上的应用”题内关键词 阿司匹林;B型流感病毒 题外关键词 已酰水杨酸;关键词由于不必考虑规范化,抽词容易,所以使用方便灵活。目前,用于规范主题词的常用词表有“汉语主题词表”;“医学主题词表”;“中医药中医词表”,41,2、分类语言 采用“分类号”来表达各种概论,并将各种概论按学科性质进行分类和系统排列。分类语言又划分为:1、等级体系型分类语言(体系分类法)2、分析综合性分类语言(组配分类法)较常用的体系分类法:国内:中国图书馆图书分类法(简称:中图法)中国图书资料分类法(简称:资料法)其它科图法、人大法、武大法等国外:杜威十进制分类法、国际十进制分类法,42,43,(五)检索语言的特点1、能简明而又比较专一地表达文献及检索课题的主题概念。2、很容易将概念进行系统排列。3、在检索时便于将标引用语(标识)和检索用语(检索词)进行相符性比较。4、语词与概念一一对应,排除了多词一义,一词多义和含糊不清的现象。5、能显示出概念之间的相互关系。,44,中图法分类表的结构有五个部分组成,第一部分:编辑说明第二部分:基本大类(五个基本部类有22个一级类目)第三部分:简表(由三级类目构成)第四部分:详表(主表)第五部分:辅表(复分表)举例:,45,46,47,中图法图示,(一级类目)(二级类目)(三级类目)五大部类:22大类 R1预防医学、卫生A马列毛泽东思想 R2中国医学B哲学 R3基础医学 R 34人体生物学C社会科学总论 R4临床医学 宜入Q5K:R 35人体生物物理学N自然科学总论:宜入Q6R医药、卫生 R71妇产科学:R8 特种医学Z综合图书 R9 药学,48,49,3、代码语言,一般只就事物的某一特征,用某种代码系统表加以标引和排列。比如:CA化合物的分子式索引系统 CA 环状化合物的环系索引系统 专利索引专利号(国际专利分类号),50,四、文献检索工具的含义和类型,1、检索工具的定义与特点定义:检索工具(Retrieval Device)是指用于 报道、存储和查找文献的工具。它具有存储(编制过程)和检索(查找过程)两大职能。特点:(1)收摘一次文献、(2)著录文献特征、(3)提供多种检索手段,51,2 检索工具的类型 按摘录方式划分如下:目录 题录或索引 文摘 全文,52,目录(Catalogue),定义:目录是对文献的外表特征的著录。它通常以完整出版物(如一本书或一种刊或一个会议录的名称)作为著录的基本单位来报道和记录文献。著录内容:文献名称、著者、出版项与馆藏信息等内容。,53,按职能划分目录种类:出版发行目录 馆藏目录:按检索标目划分为 书名目录(Title Catalogue)著者目录(Author Catalogue)分类目录(Classified Catalogue)主题目录(Subject Catalogue)联合目录。如:全国西文期刊联合目录 资料来源目录。如:IM、CA、BA,54,题录(Title)或索引(Index),题录(Title):类似于目录,它是以图书的某一部分或期刊中某一篇论文为单位进行著录,同样只著录文献外部特征,即著录文献是以一个完整出版物的某一部分(如书的章节或刊中一篇论文题目)为著录单位。,55,索引(Index):也称“引得”。广泛存在于各种类型文献中,它是将文献中各种知识单元按一定原则和方法排列起来的一种辅助工具。如,分类索引、主题索引、化学物质索引、著者索引等。著录内容:常常只著录文献中某一部分或某一方面,而不著录完整出版单位。如:论文主题;著者;分类;专利等,56,索引的种类-文献特征文献标识 索引-外部特征文献名称文献名称索引(Title Id)引用期刊一览表 著者名称著者索引(Author Id)著者、专利权人索引 文献序号序号索引(Number Id)专利号、报告号等 引用文献 引文索引(Citation Id)SCI内部特征分类号 分类索引(Classified Id)主题词 主题索引(Subject Id)关键词关键词索引(Keyword Index)分类主题 分类主题索引(Classified and Subject Id)其它专用索引 分子式索引,环系索引等(Formula Index),(Index of Ring system),57,文摘(Abstract),定义:文摘是选择文献内容中重要部分,以简练的形式作为摘要,并按一定的原则和方法编排而成的一种检索工具。它是系统报道,积累和检索一次文献的主要工具。著录内容:同 文摘。如:中国医学文摘,中国药学文摘,中国生物学文摘等。,58,文摘种类:指示性文摘:又称简介。通常是以最简短的语言,概略指示原文的研究对象、内容、范围及研究目的,即用以补充说明文献篇名所表达的意思。一般在50-150个字,在内容上不含具体的方法和数据,以用户对所需文献内容不产生误解为原则。注意:该文摘一般不能代替原文。,59,报道性文摘:也称“指导性文摘”。它是对文献的主要内容(如论点、方法、数据、设备及结论等)作摘要报导。即对原文献内容进行浓缩,基本反映原文献的中心内容,具有较高的参考价值,一般外文在200300词,中文在5001000字左右。目前大多数文摘刊物使用该文摘类型。如:BACAEM及中国医学文摘 注意:该文摘可以代替原文。,60,结构式文摘 又称更多信息摘要。它是在传统式文摘的基础上编制的统一和规范化的摘要。每项内容为一段,各段前均写出特定的内容标题。如:研究的目的;背 景;方 法;结 果;结 论。评论性文摘:该文摘以对某篇文献内部和外部特征进行评论为主。如:文摘近期的出版情况等。,61,全文(Full-text),全文检索是指以文献所含的全部信息作为检索内容的文献检索。中文:CNKI数据库、万方数据库 外文:Nature电子全文期刊,62,五、检索的途径、方法与步骤,(一)检索途径 从文献外表特征 从文献内容特征 题名途径-Title Index 分类途径-Classified Index 著者途径-Author Index 关键词途径-Keyword Index 号码途径-Number Index 主题词途径-Subject Index 分类主题途径-Classified and Subject Index 其它-Formular Index,63,1、著者途径(Author index)该途径包括著者姓名、学术团体、机构等形式。国外十分重视著者索引的编制,几乎每一种检索工具都附有该索引。对于了解某一学科专家学者的学术及科研发展动态具有极高的参考价值。国内对该索引编制宣传重视不够,造成用户对此检索途径不习惯。近来开始逐步重视该索引的编制。如:中国医学文摘,64,使用著者途径应注意:国外的姓名习惯问题:书写格式 姓前(全称)、名后(缩写,即用首字母)如:Willian Henry HarrisonHarrison W H姓前有前缀M、Mc、Mac,在索引中一律按Mac的字顺排在一起姓前带冠词De、Della、Des、La、Van、Vanden、Von与姓名字顺一起排列;有等级制称号的著者排在无等级制称号的著者之后,先排Johs W 后排Johs W jr俄国人-按英俄文音译对照表;日本人-按黑本氏英日文音译对照表对译。,65,合著者问题:即有两名以上著者参加撰写的文献。称之为合著者。一般有两名著者时按顺序著录,三名以上时只著录第一著者其余省略,特殊情况下以“等(etal)”来表示。由于检索工具索引的编排特点不同,在检索时应注意参照系统。如:IN以第一著者为主,其它著者在其名下用“see”引见第一著者。CA,BA,EM有几个著者就在其后附几个文摘号,66,学术团体、机构名称问题:按原名称字顺排列著录其后加国别以便区别。因各国著者姓名及文字不同,拼写发音也不同,此时,在判断上有难度时应借助于各种参考工具书。如:人名词典、译名词典等。国内著者姓名问题:主要依据第一著者的第一个字的汉语拼音著录检索,第一著者发音相同查第二个字,依次类推即可。,67,2、分类途径(classified index):根据文献内容在学科分类体系中的位置作为文献信息的检索途径,它的检索标识是分类号,是一种族性检索。编排原理是以学科概念上下左右关系来反映事物的隶属、平行和等级关系。族性检索:指课题的泛指性强,所需文献的范围较广的检索过程。我国按中国图书资料分类法进行分类。如,R 医药卫生、R28 中药学、R5 内科学、R9 药学。国外有国际十进分类法;杜威法。,68,3、关键词途径(Keyword index)它是按照文献题目或内容中具有实质意义并能表达文献的主要内容、起关键作用的词或词组,从关键词字顺的检索系统中检索的一种途径,它的检索标识为关键词。即未经规范化处理的自然语言,能代表文献题目和内容,具有实质意义并起关键作用的词或词组。例如:程序性细胞死亡;细胞调零;细胞调亡;维生素B2;中风,69,4、主题词途径(Subject index)通过文献所属学科的主题对文献进行检索,是以主题词为检索标识,它是一种特性检索。特性检索:指课题的专职性强,所需文献的范围比较窄、内容专深的检索过程。主题词是用来表达文献的主题概念的,经过规范化处理的名词或词组。例如:凋 亡脱噬作用 中 风脑血管意外,70,5、分类主题途径:是分类和主题途径的结合 例如:BA的目次“主要概念主题词”(Major Concept Headings)6、题名途径(省略)7、号码途径(省略),71,直检法(即期法或浏览法)常用法(工具法)追溯法(引文法)分段法(交替法或循环法),(二)检索方法,72,1、直检法:也称即期法或浏览法,全称为直接检索法。它是从浏览查阅新到现刊的原始文献中获取一次文献的方法。优点:检索直接,操作简便,可直接看到一次文献并确定其使用价值。此法在缺少检索工具时为用户选用。缺点:查全率低,盲目性大,只适用检索工具近期最新一次文献时使用。,73,2、常用法:也称工具法。它是利用各种检索工具检索文献的方法,是在文献检索中经常使用的方法。此法还可细分为顺查法、倒查法和抽查法三种。(1)顺查法:是以检索课题起始年代为起点,按时间顺序由远及近的查找一次文献线索,直到满意为止的方法。优点:查全率和查准率较高,误检率和漏检率低。缺点:费时费力,工作量大。,74,(2)倒查法:它与顺查法相反,指由近及远逆时序检索文献,直到满意为止的检索方法。一般适用于新开课题,较注意近期的文献。优点:省时省力,工作量小。缺点:查全率较低。(3)抽查法:它是针对学科发展特点,抽出其发展迅速,发表文献较多的一段时间,逐年检索的方法。优点:以较少的时间,获取较多文献。缺点:查全率较低。,75,80年 90年 03年 89年 02年 85年 97年,76,3、追溯法:也称引文法。它是利用已有文献后所附参考文献为线索,由近及远逐一追踪检索的方法。优点:类似于浏览法,很适合检索专题性资料。缺点:查全率较低,误检率和漏检率较高。,77,追溯法举例:80年 85年 84年 88年 78年 86年 75年90年 73年 87年 79年 89年 82年 83年 74年 70年,78,4、分段法:也称交替法或循环法。它是将工具法与追溯法交替(循环)使用的一种方法,直到满足需求为止。优点:省时、查全率和查准率较高。总之,在检索时应针对实际情况或需要,恰当选择各种检索方法。注意使用检索工具的各种参照系统,以保证检索课题信息的成功率。,79,(三)检索步骤1、分析检索课题,明确检索要求:时间、范围2、选择检索工具及检索方法:常用法(顺查法,倒查法,抽查法)或分段法。3、确定检索途径、明确检索标识:制定检索提问式4、查找文献线索:论文题目、著者、文献出处。5、索取原始文献:图书或期刊。,80,六、如何提高信息检索效率,查全率 和 查准率 6070%-互逆关系-4050%手检与机检的关系检索策略的制定索取全文,81,制定检索策略,1、根据检索目的和要求,确定检索的学科范围、文献类型、回溯年限、语种。2、选择检索手段和检索系统。3、确定检索途径,注意各种检索途径的配合使用。4、确定检索标识,正确使用各种运算符,编制检索提问式。5、检索过程方案调整,通过上下位词的选择和逻辑算符的应用,可进行扩大或缩小检索范围,使检出的结果符合要求。,82,索取原文,记录文献线索掌握各种缩写的还原向著者索取利用馆藏目录、公共查询系统、联合目录利用网上全文传递服务检索网上全文数据库利用网上出版社、杂志,83,利用馆藏目录、公共查询系统、联合目录,本校图书馆IP地址:http:/http:/解放军医学图书馆 http:/,84,网上全文传递服务,国家科技图书文献中心,NSTL http:/PubMed/Order http:/www.ncbi.nlm.nih.gov/PubMed,85,第三章医学文献主题分析与检索,第一节 主题分析的基本概念第二节 主题分析的步骤第三节 主题分析内容第四节 主题文献自然语言与主题语言的转换第五节 主题分析常见的错误,86,第一节 主题分析的基本概念,一、主题的概念:它是指文献所研究和论述的具体对象或问题,是想要传递给用户或读者的主要内容。即文献的中心内容。二、主题分析:它是根据文献存贮与检索系统的需要,对文献的复杂内容进行分析,从中提炼和压缩其主题概念,确定主题类型及剖析主题结构的过程。,87,单元概念 单元概念 组合 主题要素 单元概念 一个主题:表达:,88,第二节 主题分析的步骤,一、文献的审读:(一)认真阅读并理解篇名(二)阅读引言或文摘部分(三)逐段浏览(四)按文献内容讨论的顺序逐段选定主题词(五)阅读结论,确定其新颖程度与价值(六)浏览文献所附参考资料及出版单位,确定专业范围(七)利用参考工具书、相互讨论或请教专家(八)留心参阅作者提供的关键词,89,二、主题概念的提炼:首先,应明确任何一个复杂主题都是由许多主题要素构成。由一个主题要素构成的主题称之为单元主题(简单主题)。由两个或两个以上主题要素构成的主题称之为复合主题(复杂主题)。它是主题概念提炼的重点之一。对检索系统而言,确定一篇文献需要提炼的主题概念,既不是越多越好,也不是越少越好。而是要恰到好处。,90,隐性主题的分析:文献主题有显性主题和隐性主题之分。显性主题:是指文献主题的含义一目了然,一般文献的题名即可反映出文献的主题。其主题呈显性状态,分析提炼主题概念比较容易。如;糖尿病;脑血管病;胃溃疡等。隐性主题:也称“隐含主题”。是指题名有时并不直接揭示主题含义,在字面形式上是隐含的或者某些主题要素隐含在某些概念之中也就是隐藏在主题中的主题。例如:碘缺乏症 甲状腺功能低下 克丁氏病 人体缺钙 佝偻病,91,第三节 主题分析内容,主题分析内容包括:主题数量、主题类型和主题结构。一、主题数量分析:一般应在文献审读阶段完成。单一主题 单一主题文献 主题数量 多主题 多主题文献,92,(一)单一主题,、概念:它是指一篇文献只研究和论述一个对象或问题,只有一个主题因此,也称“简单主题”。、分型:简单主题(单元主题):用一个概念单元(主题词)即可表达一篇文献主题。例如:心脏病学;老年病学。复合主题(多元主题):必须用几个概念单元组配,才能表达一篇文献主题。即主题词副主题词。例如:糖尿病中西医结合治疗,93,(二)多主题(并列主题),、概念:它是指文献所研究和论述的中心问题不只一个,而是存在几个具有既并列又独立关系的主题。即含有两个或两个以上单一主题组成的复杂主题。、结构:多主题文献在篇名字面上常出现和;与;及等字样。即将并列关系的几个主题联系在一起。例如:儿童健康与营养 注意:多主题与复合主题的主要区别,一定不能搞混。,94,二、主题类型分析,(一)按文献主题的语法关系划分(二)按文献主题结构划分(三)按文献主题揭示程度划分(四)按文献中论述主题的数量划分(五)在文献论述的重要程度划分(六)按文献主题与学科专业性质划分,95,(三)主题结构分析,1、概念:是指构成主题的各个基本要素以及它们之间的相互关系。2.、原理:在主题类型分析基本上,对复合主题进行分析提炼其主题概念,从而搞清主题构成成分及相互关系。一般医学文献中,复合主题结构比较复杂。因此,应该有一个衡量标准和依据。即医学主题词表。我们将医学主题词表中全部主题词和副主题词归纳为6个基本范畴面,每一个面即为一种类型的主题要素进行分析论述。,96,3、六个基本范畴面:主体面通用面对象通用面位置面时间面文献类型面,97,第四节 文献自然语言与主题语言的转换,(一)概念:是指把文献中分析提炼出的主题概念(自然语言)加以人工控制。即利用词表或检索工具规范化处理主题词的过程称之“转换”。其转换实际上是文献主题概念的转换。主题概念的转换是完成主题检索和主题标引的重要环节之一。(二)转换形式:一般为直接转换和分解转换两种基本形式。,98,1、概念的直接转换:它是一种针对单元主题的转换,只需使用主题词表中一个主题词,即可表达文献主题概念的转换。注意:在转换中一些复合主题词的转换,要选主题词表中收录专指性强,出现频率高的先组词转换。例如:乳腺癌 乳腺肿瘤,99,2、概念分解转换:,它是根据主题词表收词情况,将复杂的主题概念分解若干个简单主题概念。(1)交叉关系概念成分分解法:它是将一个复合主题概念分解成两个以上相互具有交叉关系的概念成分,即分解成外延有部分重合关系的若干概念成分。特点:采用此种分解法的复合主题,其各主题概念构成成分都有一个共同的上位概念,其分解后的各个子概念具有并列关系。例如:“胃、十二指肠溃疡病”分解成“胃溃疡”“十二指肠溃疡病”两个并列子概念。它们共同的上位类概念为“溃疡病”。,100,(2)限定关系概念成分分解法:它是将概念分解成邻近的种概念,采用此分解法的复合主题,各概念的构成成分中不存在共同的上位概念(属概念)。通常由表示事物、方法、材料和性质等概念组成。其分解方法是从属概念到种概念。例如:肺心脑病 肺疾病 心脏病 脑病,101,(3)概括关系概念分解法:它是推演概念到邻近属概念的过程,即从种概念到属概念,实质是减少了概念的内涵,使外延较小的种概念向外延较大的属概念转换的过程。例如:脑瘤的外科手术方案(推演)外科手术方案 手术方案,102,第五节 主题分析常见的错误,一、主题概念提炼过度:它是指在主题分析过程中,提炼的主题概念多于文献中论述的主题概念。例如:1、糖尿病的诊断与治疗,该文献中提到葡萄糖耐量试验与主题中心无关。2、抗生素在临床上的应用 正文中提到某种新的和未加以证实的抗生素,不能作为主题词。,103,二、主题概念提炼不足:它与主题概念提炼过度恰好相反,即所提炼的主题概念少于文献中论述的中主题概念。原因主要在于没有真正掌握主题分析的尺度,只从提名入手过于精炼,没有认真分析文献的主题内容,从而使查全率和查准率降低。例如:分析“器官创伤”的主题时,要提取能代表创伤的主题词(如,创伤/贯通性;创伤/非贯通性)。分析“酒后开车造成交通事故”,应注意提炼隐含的特征词“人类”即检索“人为性交通事故”或“交通事故与人类的关系”,104,三、主题概念提炼不准确,它是指所提炼出来的主题概念与文献中论述的主题概念不符,原因在于没有真正明确文献中的主题内容,或是对文献主题概念的理解有偏差,从而选择了不恰当的主题词,导致错误。在此分以下几种情况:1、以大概小或以偏概全:就是提炼出来的主题概念外延大于原文献放松的主题概念。即用上位词代替下位词或用下位词代替上位词提炼主题概念。例如:“糖尿病的饮食治疗”,提炼主题概念时“饮食治疗”的概念外延小,“治疗”的概念外延大。“常见妇产科疾病的治疗”,应用“妇产科疾病”,而不用“妇科疾病”。,105,2、主题词组配错误:尽管主题词表中收有大量的主题词,但在标引中还会经常遇到许多没有收入词表的复合概念或短语。需要用已有的主题词进行概念组配,以表达文献的主题内容。否则就会出现以下一些选词上的错误。1)字面组配主题概念:其表达的主题概念就不准确。要求按一定的逻辑关系进行概念的组配。例如:“腿骨折”不应单纯地从字面提炼出“腿/骨折”,而应选用“骨折/腿损伤”这两个相关主题词进行概念组配。,106,2)未能按规定范围组配的主题概念:这是一种比较容易出现的错误。因为词表中规定了主题词与副主题词组配规则(见教材21页)。例如:“尿的成分异常”,标引成“尿/异常”就不对了,因“异常”的定义是指器官形态,而非体液和分泌物。3)已有先组的主题词而使用组配:例如:词表中已有“糖尿病性视网膜疾病”,不应再以“糖尿病视网膜疾病”作概念组配。,107,本次课结束,下次课到图书馆三楼检索室上实习课,同学们要做好中目和外目预习。,