中文医学数据库检索ppt课件.ppt
《中文医学数据库检索ppt课件.ppt》由会员分享,可在线阅读,更多相关《中文医学数据库检索ppt课件.ppt(158页珍藏版)》请在三一办公上搜索。
1、文献检索,一、文献(literature)概述,(一)相关概念(二)文献类型(三)检索途径(四)检索技术(五)检索策略(六)主题分析,(一)文献概念,文献是记录有知识的一切载体。人类积累创造的知识,用文字、图形、符号、声频、视频等手段记录保存下来并用以交流传播的一切物质形态的载体,都称为文献。文献检索:指从文献信息集合中查找所需文献或文献中包含的信息内容的过程。,(二)文献类型,按出版类型分类1、图书(Book)(教科书、专著、参考工具书等) 国际标准书号ISBN(由13位数字组成) 电子图书:超星数字图书馆、书生之家、读秀知识库、华人医学2、期刊(Journal) 国际标准刊号ISSN(由8
2、位数字组成) 国内统一刊号CN(6位数字)3、会议文献(Conference Paper)4、学位论文(Dissertation)5、科技报告(Report)6、专利文献(Patent)7、政府出版物8、标准 标准号:ISO GB GB/T9、产品资料10、科技档案,(三)文献检索途径,检索途径为检索系统的检索入口,即检索系统所提供的、用以查询获取资源的各种标识,在计算机检索中通常表现为字段检索。1、自由词检索途径2、主题词检索途径3、分类检索途径4、著者检索途径5、题名检索途径6、序号检索途径7、机构检索途径8、引文途径9、缺省检索途径10、其它途径,1、自由词检索途径,自由词来自于文献的标
3、题、文摘、关键词或正文,是一种没有规范化的自然语言。如:医学词汇的简称(乙肝、心衰),生活常用语(打摆子、拉肚子)。特点:没有严格的语法规范,个人使用的爱好不同自由词选择不同(乙肝、乙型肝炎,病毒性乙型肝炎、HBV等)缺点:要查出所有的有关乙肝的文献,需要把各种可能的用词都列出来分别查询。应同时考虑所选自由词的同义词、近义词、专指词等相关词进行检索,避免漏检。,2、主题词检索途径,主题词又称叙词:叙词是经过优选和规范化处理的词汇,由主题词表来控制,可进行概念组配、具有完善参照系统、具有范畴索引等。所谓规范化也就是说它经过了人工规范化处理,即对文献中的同义词、近义词、多义词等加以规范,使得同一主
4、题概念的文献相对集中在一个主题词下,同时在主题词表中采用参照系统间接反映主题概念之间与文献内容之间的关系,从而体现了主题词的单一性。例如:癌(非主题词)cancer, tumor, carcinoma 见 肿瘤(主题词)Neoplasms采用主题词进行检索,能较好地实现较高的查全率和查准率,缩短时间,节省费用,是提高检索技能的关键。主题词可以集中语言表达不同但是相同概念的文献,命中的文献比自由词准确。如:医学主题词表(MeSH) 中国中医药学主题词表支持系统:CBM、PubMed等,医学主题词表(MeSH),1、概述医学主题词表(Medical Subject Headings,简称MeSH)
5、,是美国国立医学图书馆编制的权威性主题词表。它是一部规范化的可扩充的动态性叙词表。美国国立医学图书馆以它作为生物医学标引的依据,编制医学索引(Index Medicus)及建立计算机文献联机检索系统MEDLINE数据库。MeSH汇集约18,000多个医学主题词。 中文版中国生物医学文献数据库(CBM)的MeSH表获取:MeSH Browser UMLS Metathesaurus(超级叙词表) MeSH网站/ PubMed 中 MeSH Databases (http:/www.ncbi.nlm.nih.gov/mesh),医学主题词表(MeSH),2、主题词(Main headings)3、
6、副主题词(Subheadings)又称限定词(Qualifiers),与主题词进行组配,对某一主题词的概念进行限定或复分,使主题词具有更高的专指性。如诊断(Diagnosis,DI)、药物治疗(Drug Theray,DT)、血液供给(Blood Supply,BS)等。例如肺发育不全,输入主题词“肺”后,在副主题词菜单中选择“畸形”表示发育不全;再例如,双子宫用子宫/畸形检索。4、款目词(Entry terms) 是主题词的同义词或相关词,作用是将自由词引见到主题词。,医学主题词表(MeSH),5、范畴表范畴表又称树形结构(Tree Structure),是将字顺表中的主题词(主要叙词)、次
7、要叙词按其学科性质、词义范围的上下类属及派生关系,分别划为16大类。大类又分若干子类目,子类目下面又分若干更小的类目,这就是通常供检索使用的主题词,共一万六千多个,都按其医学概念的性质分别列入各自所属的类目之下。,3、分类检索途径,文献在分类体系中的位置(类目名称或分类号)中图法,4、著者检索途径,文献上署名的作者、编者或者机关团体名称外文个人著者的处理方法:1)常规姓名:姓在前用全称,名在后用首字母缩写, 例:William Henry Harrison(威廉亨利哈里森) Harrison WH2)姓名前有前缀de,des,du,la,della,von,van,den, dan, der等
8、时,将前缀和姓作为一个整体,并参与排序。 例:Kinder Von Werder Von Werder K3)复姓人名:将复姓作为一个整体对待。如 Martin-Smith M4)中国人姓名按汉语拼音著录如:韩启德 Han QD,5、题名检索途径,利用题名(如书名、刊名、篇名)作为检索入口,提高查准率。6、序号检索途径利用文献特有序号查找,如专利号、报告号、化学物质登记号等。7、机构检索途径 以机构/单位名称为检索入口,8、引文(参考文献)途径,引文索引是提供某一作者及其著作在别的作者的著作中被引用状况的一种索引 引文数据库,就是将各种参考文献的内容按照一定规则记录下来,集成为一个规范的数据集
9、。通过这个数据库,可以建立著者、关键词、机构、文献名称等检索点,满足作者论著被引、专题文献被引、期刊、专著等文献被引、机构论著被引,个人、机构发表论文等情况的检索。,9、缺省检索途径,指自动在检索系统预先设定的多个字段中同时进行检索。如中国知网默认的字段为“主题”,包括篇名、关键词、及摘要字段。10、其他途径化学文摘的分子式索引,生物学文摘的生物体索引。,(四)文献检索技术,布尔逻辑检索截词检索邻近检索字段检索扩展检索加权检索精确检索和模糊检索跨库检索相关信息反馈检索智能检索,布尔逻辑检索,在检索过程中用于表达词于词之间的逻辑关系的算符就称为布尔逻辑运算符。分为三种逻辑关系:逻辑与、逻辑或、逻
10、辑非;分别用AND、 OR、 NOT如检索“流行性感冒或者咳嗽”,应写成: influenza or cough如检索“流行性感冒引起咳嗽”,应写成: influenza and cough如检索“流行性感冒不带咳嗽”,应写成: influenza not cough如果含两个或两个以上的逻辑算符,应先算NOT,然后算AND,最后算OR。也可以用()来改变计算次序,因为()里的部分可最先算,截词检索,截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。用截词符号“?”“*”或“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的词
11、。举例: Child*可代表child, children, childly, childhood,等等Colo?r可检索出color, colourDra?t可检索出drat, draft, draught, 等等,邻近检索,用来表示检索词之间位置关系的检索技术,通过位置运算符来实现,采用的位置算符有with、near等。near: 表示检索词位置相邻,检索词出现的顺序可前可后,如gene near apoptosis.with:表示检索词位置相邻,且两词出现的顺序与输入顺序一致,如 liver with cancer.,字段检索,利用检索词出现的字段进行检索。采用缩写形式的字段标识符如:T
12、I表示Title AU表示Author甚至采用限定符号,如:如:hepatitis in TI如:LA=ENGLISH,扩展检索,是同时对多个相关检索词执行逻辑或检索的技术即当用户输入一个检索词后,系统不仅能检出该检索词的文献,还能检索出与该检索词同属于一个概念的同义词或下位词的文献,如:PubMed中主题词的扩展检索。,加权检索,基本方法:在每个提问词后面给定一个数值表示其重要程度,这个数值称为权,在检索时,先查找这些检索词在数据库记录中是否存在,然后计算存在的检索词的权值总和。权值之和达到或超过预先给定的阈值的记录,才能在数据库中被检出来。运用加权检索可以命中核心概念文献,因此它是一种缩小
13、检索范围提高检准率的有效方法。但并不是所有系统都能提供加权检索这种检索技术,而能提供加权检索的系统,对权的定义、加权方式、权值计算和检索结果的判定等方面,又有不同的技术规范。如:CBM,精确和模糊检索,精确检索是指所检信息与输入的词组完全一致的匹配检索技术。许多系统用引号来表示,如检索“acute pancreatitis”,只有包含与acute pancreatitis 完全相同词串的文献才能被检索出来。模糊检索允许所检信息与检索提问之间存在一定差异,如检索acute pancreatitis,只要包含acute 和pancreatitis 两个词串的文献均能检索出来,并不要求 acute
14、pancreatitis 一定要按输入顺序相邻。,跨库检索,是一次对多个数据库同时进行检索。能为用户提供统一的检索入口将检索需求转化为不同数据库的检索表达式整合检索结果,以统一的格式将结果呈现给用户不用担心这些数据库的协议、平台、产品或生产商减轻用户学习检索不同数据库的负担有效节省检索时间,相关信息反馈检索,将与已检结果存在某种程度相关的信息检索出来的检索技术,多由检索系统自动进行检索。如Google 的“类似网页” PubMed的“Related Articles ”,智能检索,自动实现检索词、检索词对应主题词、及该主题词所含下位词的同步检索。如:中国生物医学文献服务系统(SinoMed)的
15、智能检索。 PubMed的“自动词语匹配检索”,(五)检索策略,检索策略是为实现检索目标而制定的全盘计划或方案1、分析检索课题,明确检索要求(1).目的是使用户清楚其课题要解决的实质问题。是制定检索策略的根本出发点,也是检索效率高低或成败的关键(2).明确检索目的及要求(课题所属的学科范围、要求的文献类型、年限、语种、需要的文献量等) 2、选择检索系统,确定检索方法1.手工检索工具(目前很少读者使用此方式)2.计算机检索系统:根据课题内容,选择合适数据库,(五)检索策略,3、确定检索途径,编写检索策略表达式反映文献内容特征: 主题途径、分类途径等反映文献外部特征: 著者途径、书(刊)名途径、
16、代码途径用各种算符如逻辑运算符、位置算符等构造提问表达式4、根据检索结果,调整检索策略必要时对检索词或检索式进行修改,直至检出结果符合要求5、文献筛选,原文获取,(六)主题分析,主题是一组具有共性事物的总称,用以表达课题所研究的具体对象和问题,即课题的中心内容。主题概念是所表达对象概念属性的确定性的语词,“确定性”可以理解为对象的“本质属性”“特有属性”“共同属性”“固有属性”等主题分析是在分析信息需求的结构、类型和内容的基础上,从中提炼主题概念,确立主题类型、剖析主题结构和确定概念间关系的过程。例如,汽车追尾首先分析主题概念:交通事故然后查阅主题词表,得出相应的主题词:事故,交通,要注意主题
17、概念之间的并列关系、交叉关系、限定关系、因果关系、影响关系、应用关系、相关关系等。 因果关系:阿司匹林引起消化性溃疡。阿司匹林/副作用;消化性溃疡/化学诱导眼结核引起失明。结核,眼/并发症;盲/病因学影响关系:支气管扩张剂对肺的作用肺/药物作用;支气管扩张剂/药理学阿司匹林对胃黏膜的影响阿司匹林/副作用;胃黏膜/药物作用,(六)主题分析,(六)主题分析,要注意主题概念之间的并列关系、交叉关系、限定关系、因果关系、影响关系、应用关系、相关关系等。应用关系:阿司匹林治疗感冒。阿司匹林/治疗应用;感冒/药物疗法相关关系:眼弓形体病并发青光眼。弓形体病/并发症;青光眼/并发症,36,课题:如何获取阿司
18、匹林预防大肠癌的国内专业文献?熟悉你的课题对课题名称进行概念组面分析查找各概念组面的背景知识,初步拟定检索提问词及检索提问式,37,课题:阿司匹林能否预防大肠癌?Q1:该课题可分解为哪些概念组面?Q2:这些概念对课题重要性如何?逻辑关系?Q3:如何确定上述概念的提问词?(上述概念有何同义词?近义词?上位词?下位词?其规范化用词是什么?),38,该课题可分解为哪些概念组面? 这些概念的逻辑关系?,第一个重要概念 :“大肠癌”第二个重要概念: “阿司匹林” 两个概念逻辑组配符:AND,39,如何确定“大肠癌”的中文提问词,经典图书百库百科(质量参差不一,仅供参考)维基百科参考工具书(数值事实数据库
19、)CNKI工具书馆(http:/ )查找相关期刊论文全文(最新综述)CBM医学主题词表,40,利用百度百科获取相关知识,41,利用CNKI工具书库获取课题相关知识,42,利用CNKI工具书库获取课题相关知识,大肠包括盲肠、阑尾、升结肠、横结肠、降结肠、乙状结肠、直肠和肛管。-临床应用解剖学,43,初步拟定中文检索策略,“大肠癌”提问词:大肠癌/肿瘤、结肠癌、直肠癌、盲肠癌、阑尾癌“阿司匹林”提问词:阿斯匹林、aspirin、阿司匹林、乙酰水杨酸同一概念的提问词之间用逻辑组配符:OR不同概念之间逻辑组配符:AND,提高查全率的若干办法,查全率的办法用主题词用主题词、关键词、同义词,用or 组配用
20、上位词(扩展下位词)用截词少用副主题词组配,提高查准率的若干办法,查准率办法用主题词用下位词(专指度)副主题词组配限检 检索词的字段限定使用适当的位置算符,排除误检,提高查准率减少检索年限限制检索结果的文献类型(如综述)限制语种及出版国限定在核心期刊检索,选择数据库注意事项,各类数据库在文献储存、收录范围等方面各具特色,应适当选择, 选择时需考虑:数据库收录的文献内容数据库收录的文献的出版类型数据库中收录文献的时间范围数据库的更新频率等,47,二、中文医学数据库检索,大纲,(一)概述 (二)CNKI资源及其检索 (三)万方数据资源及其检索 (四)维普资源及其检索 (五)中国生物医学文献服务系统
21、检索,(一)概述,按学科划分综合性检索系统:中国知网、万方数据资源、重庆维普、国家科技图书文献中心(NSTL)、中国高等教育文献保障系统(CALIS)、中国科学引文数据库(CSCD)等专业性检索系统:中国生物医学文献服务系统(SinoMed)、万方医学网、中国疾病知识总库等按记录完整性分文摘型检索系统:SinoMed,全国报刊索引全文检索系统:中国知网、万方、重庆维普等,50,三大通用中文数据库平台,CNKI中国知网,维普资讯,万方数据资源系统,帮助您在信息海洋中聚焦专业学术瑰宝,三大通用中文数据库,51,(二)CNKI资源及其检索,1、CNKI知识精要CNKI即中国知识基础设施工程(Chin
22、ese National Knowledge Infrastructure)是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起,始建于1994年。主体为中国知识资源总库及CNKI网格资源共享平台,通过产业化运作,为全社会知识资源高效共享提供丰富的知识信息资源和有效的知识传播与数字化学习平台,52,2. CNKI资源,53,3. CNKI特色,(1)资源丰富(2)强大的工具书检索功能在工具书检索方面CNKI优势明显 ,成为能与其学术文献总库并驾齐驱的第二大主力产品CNKI工具书馆(http:/ )中国年鉴网络出版总库(http:/,54,CNKI工具书馆,C
23、NKI工具书馆收录了6400多种工具书,类型涵盖汉语词典、双语词典、专科辞典、百科全书、图录表谱、年鉴、标准、手册、语录、名录、医学图谱等,可按学科浏览,也可进行单本书检索或全库检索,功能非常强大。,55,中国年鉴网络出版总库,中国年鉴网络出版总库收录1912年以来国内年鉴2600多种,2万多本,近2千万条数据,可按地域、行业、专辑导航,并进行全文检索。,56,3. CNKI特色,(3). 注重二次加工,提供增值服务 知识元搜索服务CNKI E-learning,57,CNKI E-Learning数字化学习与研究平台,58,CNKI数字搜索,CNKI数字搜索可以利用公开发表的文献补充获取一般
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中文 医学 数据库 检索 ppt 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1662181.html