《文献检索语言》PPT课件.ppt
《《文献检索语言》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《文献检索语言》PPT课件.ppt(46页珍藏版)》请在三一办公上搜索。
1、文献信息检索语言,一、文献信息检索语言及其应用,(一)文献检索语言的含义及种类 1.检索语言的含义 检索语言是用于描述信息系统中文献信息的内容特征或外部特征和表达用户信息检索提问的一种专用语言。分为规范化语言和非规范化语言。规范化语言是对文献检索用语的概念加以人工控制和规范,对同义词、多义词、近义词等进行规范化处理用同一个词来表达一个概念。非规范化语言也叫自然语言,如关键词、自由词等。,2.检索语言的种类(1)文献内容特征检索语言 A分类检索语言 B主题检索语言 C代码检索语言,(2)文献外部特征检索语言 A题名索引系统 B著者索引系统 C文献序号索引 D引文索引系统,(二)分类检索语言及其应
2、用 1分类检索语言的含义 是按文献内容所属的学科或专业,结合文献内容特征根据特定分类体系而编制的检索系统。通过分类体系的分类号使同学科专业文献集中在一起,以分类号作为检索标识的一类检索语言。2分类检索语言的应用 目前分类检索语言的应用主要是体系分类语言。从知识分类角度揭示文献在内容上的区别与联系,提供从学科分类以分类号为检索标识的检索途径。,(三)主题检索语言及其应用 1主题检索语言的含义 是按文献研究内容或主题所编制的检索语言,以主题词、关键词作为检索标识的一类检索语言。2主题检索语言的应用 主题检索语言的应用主要是主题词法和关键词法。,(1)主题词法 主题词(Subject heading
3、s)又称叙词(Descriptor)是规范化的统一的科技名词术语。(2)关键词法 关键词是从文献的篇名、标题、摘要和正文中抽取出来的能表达文献主题概念,并能被人们称作检索入口的关键性名词和术语。关键词较适应计算机自动编制索引的需要。,(四)医学信息检索语言及其应用 1医学信息检索语言的含义 用以表达医学信息的语言、文字、图形、图像等都必须赋予有一定规律性、易于人和计算机识别与处理的代码,即数字、字母、字符等符号。这就是医学信息编码,它是医学数据库交换和医学信息存储、检索、交流、共享的基础,也称它是医学信息检索语言。2医学信息检索语言的应用 目前有关医学术语与编码尚无正式的国际标准,但以下医学信
4、息编码系统已为世界各国借鉴使用。,2医学信息检索语言的应用 目前有关医学术语与编码尚无正式的国际标准,但以下医学信息编码系统已为世界各国借鉴使用。(1)国际疾病分类法(ICD)(2)国际系统医学术语集(SNOMED)(3)一体化医学语言系统(UMLS)(4)当代操作术语集(CPT),二、医学主题词表及其应用,(一)自然语言和词汇控制 1自然语言 用于进行书面和口头交流的语词,其语义、情感都比较丰富。但自然语言用于情报检索存在不足之处。2词汇控制(1)对自然语言的语词进行压缩、优选和规范化处理。(2)对自然语言进行语义处理,并建立一个与概念体系相对应的具有层次结构的术语体系(即词汇体系)。,(二
5、)医学主题词表(Medical Subject Headings)简称(MeSH)该表是美国国立医学图书馆(NLM)编制用于对生物医学文献进行标引和检索的权威性术语控制工具。收集约2.2万个经过规范化的医学主题词,副主题词83个。是Medline、PubMed、CBMdisc等数据库系统的主题词检索指南,也是确保主题标引者与检索者在标引文献与检索文献时用词上的标准一致。,MeSH词表由字顺表(Alphabetic List)和树状结构表(Tree Structures)两部分组成。1字顺表(Alphabetic List)将主题词、款目词、类目词按英文字母顺序排列,并通过词下的树状结构号、注释
6、及参照系统揭示词语间复杂的语义关系,帮助读者在检索时选规范化的主题词。,2树状结构表(Tree Structure)(1)树状结构表的结构 A.类目表 B.等级表(2)树状结构表的功能 A.检索者可按学科体系进行选主题词。B.可帮助检索者扩大检索范围,提高查全率,以及缩小检索范围,提高查准率。C.通过树状结构号确定所选词的学科范围。(3)树状结构表的应用,三、文献主题分析与标引,(一)主题标引的概念 1主题标引的定义 标引从字面上解释,“标”是标记,“引“是指引,标引就是用标记来指引。这里指的标引是对文献处理的标引。即:标引是对文献进行主题分析,从自然语言转换成规范化的检索语言的过程,对文献给
7、予分类号标识的过程,称为分类标引;对文献给予主题词标识的过程,称为主题标引。,2标引与检索的关系 主题标引与文献检索有着密切的关系,标引采用的主题词,是建立检索系统索引标目的依据,是文献存储和检索的桥梁。文献靠标引纳入检索系统,检索是标引的逆过程,检索时通过对用户课题进行主题分析,将课题内容转换成主题词,当此主题词与文献存储时的主题词一致时,则表示检索命中。因此,标引是基础、手段,检索是目的。,(二)标引深度与标引等级,1标引深度 标引深度指对一篇文献内容特征和外部特征进行分析、描述所达到的深度及根据分析结果给予标识的数量。一般来说IM的标引深度2-5个,MEDLINE为十几个。标引深度,往往
8、要根据读者对象,文献数量、专业内容、检索方式来确定标引深度。,2标引等级(1)主要标引(Major MeSH Headings,Mjme)也称一级标引。是对文献论述的重点,文献核心主题概念的标识。在医学领域中最常见的是指:A某种实验研究的直接目的和结果。B临床疾病预防、诊断、治疗等重要的手段、方法及创新。C一篇文章中篇幅占得较多的内容。D尽管篇幅不多,但材料新、有创见并为读者所关心的内容。E主要标引用加权符号“*”表示。如“*Stomach Neoplasms/surgery”。F词表和标引规则中规定作为主要标引的概念。主要标引用于IM,也用于MEDLINE检索系统。,(2)次要标引(Mino
9、r MeSH Headings,Mime)也称二级标引。指对文章论述的次重点概念的标识。最常见指的是:A有的是主要标引的组配标引词。B为了某种研究目的所提供的载体、条件、方法和手段。C治疗学中提到的药物剂型、剂量、投药方式。D机械检索的特征词如:人类的性别、年龄组,动物种类(大鼠、小鼠、狗、猫),妊娠等。E文献中作为主题词的关键词、抽提词或附加成分。如:地名、时代、文献类型和语种等。次要标引仅用于MEDLINE等数据检索系统。而IM不用次要标引。,(三)主题标引的基本原则,1标引人员应根据词表选择与文献概念最相匹配的主题词进行标引。2标引的主题词专指性要恰当。如果词表中有专指的下位主题词,一般
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文献检索语言 文献 检索 语言 PPT 课件

链接地址:https://www.31ppt.com/p-5520651.html