中文全文数据库检索技巧课件.pptx
中文全文数据库检索技巧,浙医一院 陈小萍E-mail:,1,大纲,文献检索基础知识中文全文数据库检索技巧维普中文科技期刊数据库CNKI中国期刊全文数据库万方数据资源,2,文献检索基础知识,文献类型检索语言检索途径文献检索步骤文献检索的基本技术检索结果评价,3,文献信息资源类型,按载体类型划分: 手写文献、印刷型、缩微型、机读型、声像型按文献出版形式划分:图书期刊会议文献科技报告政府出版物专利文献技术标准产品资料学位论文技术档案,4,按内容加工深度分:一次文献定义:即原始文献,是指作者以本人的工作经验或研究成果为依据而创作的 原始论文。种类:期刊论文、专著、科技报告、学位论文、研究报告、专利说明、会议 论文、技术标准等等。二次文献:定义:指对许多无序的一次文献进行收集、加工、整理而成的报道性、检索 性的文献资料,是对知识的二次加工。种类:题录、书目、索引、文摘等。三次文献:定义:指利用二次文献并在其指引下,对大量一次文献进行综合分析研究, 加以浓缩和提炼而写成的文献,是对知识的第三次加工。种类:综述、年鉴、进展、述评、手册、指南等。,5,检索语言,描述文献外部特征的检索语言: 著者索引:译者、编者、文摘人、专利权人、学会和机关团体名、学术会议名等。 题名索引:书名、刊名、篇名等。 文献序号索引:专利号、科技报告序号、技术标准号、国际标准书号(ISBN)等。 引文索引:以文献所附注的参考文献为检索标识。描述文献内部特征的检索语言: 分类检索语言:按文献所属学科或专业,根据特定分类体系(如中图法)而编制的检索系统,如分类号。 主题检索语言:按文献研究主要内容或主题编制的检索语言系统,包括主题词、关键词、代码语言。,6,主题词与关键词,主题词是能够表达文献主要内容的规范化名词术语. 特点是采用的词语有较严格的限定。通过对一个概念的同义词、近义词及拼法变异词等进行“规范”,以保证词语与概念的一一对应,是典型的规范化语言。 医学主题词表(MeSH) , 中医药学主题词表 关键词是能够表达文献主要内容的非规范化名词术语,通常取自原文,不作规范化处理,没有特别的限定,因而能直接取自最新文献,即时反映科学领域的新观点、新方法、新发现以及新的名词术语。 缺点:由于一个概念的不同表达多种多样,不加以限制,会使同一类文献分散,如果不能找全同义词,则很容易造成漏检。,7,检索途径,1.根据文献的外部特征检索文献的途径 题名途径:书名、刊名或文章名索引进行查找 著者途径:著者姓名,单位 序号途径:专利说明书、科技报告2.按文献内容特征检索文献的途径: 分类途径:按照文献内容在分类体系中的位置作为文献的检索途径,检索标志就是所给定的分类号码 主题词途径:通过文献内容、学科性质的主题进行检索文献 的途径。 关键词途径: 指以从文献题名、摘要、或正文中提取具有实质意义的语词为检索标识,按关键词字顺查找文献。 其他途径: 分子式索引、生物分类索引、属类索引,8,文献检索步骤,分析检索课题,明确检索要求选择检索工具,确定检索方法选择检索途径,确定检索策略检索文献获取原文文献,9,文献检索的基本技术,布尔逻辑检索(Boolean searching)逻辑与:AND、*、与、并且逻辑或:OR、+、或者、或含逻辑非:NOT、-、不含、 作用:表达两个或两个以上检索词之间的关系 逻辑与: 在结果中检索 逻辑或:在结果中添加 逻辑非:在结果中去除,10,检索规则:一个检索策略需多个检索词表达时,可同时运用多个逻辑符号;多个逻辑符号同时运用遵循一定的运算顺序: NOT AND OR可用()来改变这种运算顺序.,11,2. 限定检索(limit searching) 限制符: = 作用:对常用字段的限定检索,可以将检索词限制在特定的字段中。 举例: AU=张三,表示检索结果的著者是张三,AU代表著者字段(Author) KY=胃癌,表示以胃癌为关键词进行检索,KY代表关键词(KeyWords),12,3. 扩展检索与缩检,扩展检索范围的主要方法增加同义词用OR组配;使用上位词;使用截词符;减少字段限定;从文献中选择合适的检索词,缩小检索范围的主要方法增加检索词用AND组配使用NOT选择专指性检索词;增加副主题词;主题词加权检索;增加字段限定;从文献中选择合适的检索词,VS,13,检索结果评价,查全率(recall ratio)和查准率(precision ratio)是目前文献检索理论中流行着的衡量检索效果最重要且最常用的指标。查全率指系统在进行某一检索时,检索出的相关文献与系统 文献库中的相关文献总量之比率。 R=被检出相关文献量/相关文献总量 *100% 结果在60-70%较好查准率指系统在进行某一检索时,检索出的相关文献量与检 索出的文献总量之比率。 P=被检出相关文献量/被检出文献总量 *100% 结果在40-50%较好 在查全率和查准率之间存在着矛盾的互逆关系。在同一检索系统中查全率提高,查准率就会降低,而查准率提高,查全率必然降低。,14,全文数据库介绍,CNKI维普中文科技期刊数据库万方数据资源,15,全文数据库的特点,收录特定某一出版集团出版或代理商代理的全部或部分期刊,收录文献的数量和范围都有限。 如:中华医学系列杂志由万方数据库购买。文献标引不全面、深入;无主题词检索途径(各全文数据库现在都在逐步推出主题词检索功能)检索途径少,可应用的检索技术少,一般仅有二次检索功能没有检索史,无法进行复杂课题的多步检索组合检索结果为全文,可提供全文文献,16,CNKI,CNKI 概况CNKI 检索项CNKI 检索方式CNKI 检索结果处理,17,CNKI概况,CNKI,(National Knowledge Infrastructure )为国家知识基础设施的简称。登录:http:/ 可以通过购买CNKI阅读卡,注册后可检索和下载资源。研制单位:清华同方光盘股份有限公司、 光盘国家工程研究中心、 中国学术期刊(光盘版)电子杂志社。类型:涉及各学科的全文数据库更新频率:每日更新收录范围:1979年至今,6600多万篇全文。,18,CNKI文献来源,期刊硕博士论文会议论文报纸年鉴工具书学术辑刊统计年鉴指数法律专利标准图片成果古籍外文文献引文,19,CNKI检索项,全文:在文章的全文中进行检索。主题:复合检索项,由篇名、关键词、摘要三个检索项组合而成。在中英文篇名、中英文关键词、机标关键词、中英文摘要中进行检索。关键词:揭示文献内容主题的、不受规范词表控制的一个或多个词语。分两类:一类是由作者根据规则提供,编排于文章中的特定位置;另一类是由系统根据一定的运算规则从文章内容中自动提取的,称机标关键词。在中文关键词、英文关键词、机标关键词中进行检索。篇名:数据库中收录期刊中文章的题名。在中文篇名、英文篇名中进行检索。作者:在作者中文名、作者汉语拼音名、作者英文名中进行检索。第一作者:指文章发表时,多个作者中排列于首位的作者。作者单位:指文章发表时,作者所任职的机构。摘要:在中文摘要、英文摘要中进行检索。,20,CNKI检索项,参考文献:在文章后所列“参考文献”中综合检索,而不是按条目、题名、作者分别检索。中图分类号:根据中国图书馆分类法为文献内容而给出的一个或若干分类号。直接以分类号检索,如R9。文献来源:文献的来源名称,如刊名、会议名等。基金:文章所属或相关项目在实施过程中所受资助的基金名称及资助说明。一个项目可受一项基金或多项基金资助。ISSN:以ISSN原有形式进行检索,如1000-2871。ISSN是某一期刊所拥有的国际标准刊号,是中国标准刊号的组成部分。统一刊号:以统一刊号原有形式进行检索,如31-1296/TQ。统一刊号是中国内地地区所出版期刊所拥有的中国标准刊号的重要组成部分。ISBN:以ISBN原有形式进行检索, ISBN是国际标准书号。,21,CNKI检索方式,快速检索高级检索专业检索作者发文检索科研基金检索句子检索文献来源检索,22,快速检索,23,24,进 入 相 应 子 库,25,高级检索页面,可进入文献来源页面、基金来源页面,增减检索项,匹配选择,26,高级检索功能,高级检索具有多项双词逻辑组合检索和双词频控制特有功能。 多项:指可选择多个检索项,通过“ ”、“ ”来增减检索项 双词:指一个检索项中可输入两个检索词(在两个输入框中输入) 检索项之间可进行布尔逻辑组合:并且、或者、不含 每个检索项中的两个检索词之间可进行3种组合:并含、或含、不包含;组合顺序自上而下。 每个检索项中的两个检索词可分别使用词频控制 。,27,高级检索功能,词频设置:词频指检索词在相应检索项中出现的频次。词频默认为空,表示至少出现一次,若为数字,如4,则表示至少出现4次,依此类推。匹配选择: 1.精确:检索结果完全等同或包含与检索字/词完全相同的词语; 2.模糊:检索结果包含检索字/词或检索词中的元素。,28,高级检索功能,中英文扩展功能: 由所输入的中文检索词,自动扩展检索相应检索项中英文语词的一项检索功能。前提条件是该检索项中同时以中英文两种文字形式提供内容。,29,高级检索功能,检索控制条件: 1. 发表时间:可在1979年至今任意限定 2. 更新时间:不限、最近一周、最近一月、最近半年、最近一年、今年迄今 3.文献来源:可直接输入期刊名称进行检索或点击 进入文献来源页面。 1)检索功能:首先选择文献来源(有期刊来源、博士学位授予点、硕士学位授予点、报纸来源、年鉴来源供选择);再选择检索项;进行检索; 2)浏览功能:选择文献来源;按各文献来源的分类项进行浏览。 4. 支持基金:可直接输入基金来源名称或课题编号进行检索,或点击 进入基金选择页面。 1)检索功能:可选择基金名称或基金管理单位名称进行检索; 2)浏览功能:按基金管理机构进行基金浏览。 5. 作者、作者单位,30,高级检索,案例: 1.阿司匹林引起的消化性溃疡 提取关键词:阿司匹林 消化性溃疡思考: 是否有同义词? 是否代表其他词? 阿司匹林 消化性溃疡 乙酰水杨酸 胃溃疡十二指肠溃疡,31,32,案例2.国际内分泌代谢杂志上有关非胰岛素依赖型糖尿病的文章。 关键词: 非胰岛素依赖型糖尿病 同义词: 非胰岛素依赖糖尿病 2型糖尿病 型糖尿病,33,34,专业检索,特点:可按照需求来组合逻辑表达式以便进行更精确检索的功能入口。,35,专业检索,检索步骤: 1.选择检索项 可检索字段: SU=主题, TI=题名 , KY=关键词, AB=摘要, FT=全文, AU=作者, FI=第一责任人, AF=机构, JN=文献来源, RF=参考文献, YE=年, FU=基金, CLC=中图分类号, SN=ISSN, CN=统一刊号, IB=ISBN , CF=被引频次,36,专业检索,2.填写检索条件 构造检索条件注意事项,点击 进行查看 1)根据下表规则构造表达式,37,专业检索,2)多个检索项的检索表达式可使用“AND”、“OR”、“NOT”逻辑运算符进行组合,且三种逻辑运算符的优先级相同,可用英文半角圆括号“()”将条件括起可以改变组合的顺序 3)一个检索项中的多个检索词之间用逻辑运算符“*”、“+”、“-”进行组合,分别代表与、或、非。 4)所有符号和英文字母,都必须使用英文半角字符; 5)逻辑关系符号与(AND)、或(OR)、非(NOT)前后要空一个字节;,38,案例: 1.中国医科大学发表的关于幽门螺杆菌和消化性溃疡的文献。(SU=(消化性溃疡+胃溃疡+十二指肠溃疡)*幽门螺杆菌) AND AF=中国医科大学 SU=主题,AF=机构 一个检索项中的检索词之间的逻辑组配用“+”、“-”、“*” 检索项之间的逻辑组配用AND、OR、NOT2.2000年国际内分泌代谢杂志上题名中有糖尿病的文章。 TI=糖尿病 AND JN=中华医学杂志 AND YE=2000 TI=题名,JN=刊名,YE=年,39,作者发文检索,姓名用精确检索,模糊检索,案例.浙医一院的郑树森院长作为第一作者发表的论文,40,科研基金检索,可进入基金选择页面,基 金 选 择 页 面,41,句子检索,42,文献来源,进入文献选择页面,直接输入文献来源名称,可直接输入期刊名称进行检索或点击 进入文献来源页面。,43,1)检索功能:首先选择文献来源(有期刊来源、博士学位授予点、硕士学位授予点、报纸来源、年鉴来源供选择);再选择检索项;进行检索 2)浏览功能:选择文献来源;按各文献来源的分类项进行浏览。,44,检索结果处理,以高级检索结果页面为例1浏览 概览页 细览页2保存题录3全文下载及浏览,45,检索结果页面-概览页,1. 右下角为检索结果题名列表栏: 1)可浏览题名、作者、来源、发表时间、数据库、被引频次、下载次数、预览。点击 “ ”可浏览摘要。 2)可对检索结果进行分组浏览:按来源数据库、学科、研究层次、作者、机构、基金等 3)可对检索结果进行排序:按主题、发表时间、被引次数、下载次数 4)可设定每页记录数,有10、20、50供选择2. 左上角可以选择学科领域3. 左下角为检索结果分析:发表年度、文献来源、关键词、检索历史4. 右上角为检索:可在此检索页面进行重新检索和二次检索,以调整检索条件和缩小检索范围。其他检索方法与高级检索的检索结果页面基本一致,不再赘述。,46,47,检索结果页面-细览页,点击篇名即可进入细览页,细览页内容包括:参考文献引证文献相似文献同行关注文献相关作者文献相关机构文献等,48,保存题录,1.选择需保存的文献题录2.点击,选择需保存的文献,导出、分析文献,49,保存题录,选择导出格式,选 择 导 出 方 法,50,全文下载及浏览,51,练习1.检索发表在国际内分泌代谢杂志上的文献2.浙江省自然科学基金资助的论文3.浙江大学医学院附属第一医院的郑树森院士1998年发表的期刊论文。4.医院电子病历系统的专利。,52,万方数据资源,万方数据资源概况万方数据资源检索方式 快速检索 跨库检索:高级检索、专业检索 高级检索:高级检索、经典检索、专业检索,53,万方数据资源概况,登录方式:通过万方主页(http:/)或镜像站点登录。个人用户可以通过购卡注册后检索和下载资源。研制单位:北京万方数据股份有限公司类型:涉及各学科的全文数据库更新频率:不定期收录范围:1998年至今,八大类100多个类目8100多种期刊的全文和题录,其中医药卫生类期刊1159种。,54,快速检索即万方首页,55,在结果中检索,快速检索即万方首页,选择文献来源,可对文献来源进行浏览,按学科浏览,按地区浏览,按字母浏览,56,期刊浏览,或在万方首页直接输入刊名点击进入后可浏览期刊的相关信息 浏览期刊论文 选择期刊年卷期,即可对该期整本阅读期刊征稿启事 统计分析:影响因子、发文量、总被引频次关于本刊:期刊简介、主要栏目、期刊信息、获奖情况等,57,期刊浏览-统计分析,影响因子(IF值):该刊前两年发表论文在统计当年被引用的总次数 该刊前两年发表论文总数,刊均影响因子(学科内): 所在学科内所有期刊的 影响因子相加 学科内期刊数。,58,期刊浏览-统计分析,59,期刊浏览-统计分析,本刊被引频次指本刊在创刊以来所登载的全部论文在统计当年被引用的总次数。刊均被引频次(学科内)指统计当年本刊所在学科内所有期刊的平均总被引频次。,60,跨库检索,跨库检索包含高级检索和专业检索两个界面检索功能: 可选择文献类型,单选或多选 支持匹配选择:精确或模糊 支持逻辑组配:多个检索项间可用与、或、非进行逻辑组配 一个检索项的多个检索词间用*、+、,分别代表逻辑与、或、非 推荐检索式:提供一段文本(比如科学技术要点), 由系统推荐检索词,61,跨库检索,可检索文献来源: 期刊论文 学位论文 会议论文 中外专利 科技成果 中外标准 法律法规,62,跨库检索高级检索,案例:导师为浙江大学的郑树森院士的博士论文,选择文献类型,逻辑词与、或、非,63,关键词:(),64,跨库检索,科技成果 中外专利 会议论文 法律法规 期刊论文 中外标准,选择不同的文献类型出现对应的检索项,65,跨库检索,案例.阿司匹林引起的消化性溃疡,文 献 在 各 个 字 库 中的 分 布,两种显示模式,66,检索词之间可以进行逻辑组配,检索结果:浏览检索历史 选择检索结果显示模式:详细模式、精简模式查看高频关键词、了解热点问题显示相关文献在各个字库中的分布导出文献导出检索历史,67,导出文献,选择文献导出格式,68,高级检索,*选择不同的文献来源可以进入相应的高级检索页面*以“学术论文”为例进入高级检索页面,该库包括期刊论文、学位论文、会议论文、外文文献,69,高级检索,选择不同的文献类型出现对应的检索项,70,高级检索,案例.2000年中华医学杂志上题名中有糖尿病的文章。,71,高级检索,检索结果,72,进入文献导出页面,高级检索,检索结果: 在结果中检索 查看被引频次 对检索结果进行排序: 按相关度、新论文、经典论文、出版时间、被引次数导出文献查看文献分布: 按学科分类、按年份、按论文类型等,73,练习1.检索发表在中华医学杂志上的文献2.浙江大学医学院附属第一医院的的郑树森院士1998年发表的期刊论文。3.医院电子病历系统的标准。4.临床超声医学杂志2010年的影响因子。,74,维普中文科技期刊数据库概况,登录:通过维普主页()或镜像站点登录 研制单位:科学技术部西北信息中心下属的维普资讯有限公司 类型:涉及各学科的期刊全文数据库 更新频率:不定期 收录范围:1989年至今,13000种期刊,1000余万篇文献,并以每年180万篇的速度递增。收录医药卫生类期刊1101种,生物科学类期刊111种。,75,维普中文科技期刊数据库,五种检索方式:快速检索传统检索高级检索分类检索期刊导航,76,维普中文科技期刊数据库,快速检索:首先选择检索项,然后在检索窗口中输入一个或多个检索词,点击检索即可执行一次检索。如果多个检索词之间用空格隔开, 则默认其为“逻辑与”关系。 检索词之间支持逻辑组配: 检索符号“*”、“+”、“-”分别代表与、或、非。 检索结果处理: 1)通过选择“在结果中搜索”、“在结果中添加”、“在结果中去除”选项实现逻辑与、或、非组配功能。 2)可限定某一类期刊,如核心期刊、重要期刊、SCI期刊、CA期刊等。 3)对年限、更新时间、显示方式(按概要、摘要、全记录)进行限制和选择。,77,快速检索,案例:阿司匹林引起的消化性溃疡。,个性化服务,输入多个检索词,78,79,传统检索 限定范围: 学科类别:根据中图法分类体系对检索范围进行学科类别限制 期刊范围:如核心期刊、重要期刊、SCI期刊等 期刊类别、数据年限。辅助检索功能: 同义词:系统自动扩展检索所有同义词,以提高查全率。适用于关键词、题名或关键词、题名三个检索字段。 同名作者:显示作者的单位列表,供进一步确认后选择,适用于作者、第一作者字段,80,传统检索,只用“艾滋病”,检索结果:21913篇同义词全选后检索结果26457,提高查全率,81,3.高级检索 向导式检索:多检索条件任意组合检索 ,一次命中; 直接输入检索式:进行复合检索。,向 导 式 检 索,直 接 输 入 检 索 式,82,高级检索,向导式检索规则逻辑组配: 检索项间用“”、“”、“”进行逻辑组配 一个检索项中的多个检索词间“+”、“*”、“-”检索字段代码: 任意字段(U)、题名或关键词(M)、关键词(K)、刊名(J)、作者(A)、第一作者(F)、机构(S)、 题名(T)、文摘(R)、分类号(C)、作者简介(Z)、基金资助(I)等扩展功能: 查看同义词(只适用于关键词)、查看同名作者、查看分类表、查看相关机构、期刊导航扩展检索范围: 可根据需要以时间条件、专业限制、期刊范围进一步限制检索范围,83,高级检索,案例.发表在胃肠病学杂志上关于阿司匹林引起的消化性溃疡的文章。,84,直接输入检索式规则逻辑关系同向导式检索中的逻辑关系检索字段代码同向导式检索中的检索字段代码无括号时逻辑与“*”优先运算,有括号时先括号内再括号外。括号()不能作为检索词进行检索扩展检索条件同向导式检索中的扩展检索条件案例.发表在胃肠病学杂志上关于阿司匹林引起的消化性溃疡的文章。M=(消化性溃疡+胃溃疡+十二指肠溃疡)*(阿司匹林+乙酰水杨酸)*J=胃肠病学,85,分类检索: 可浏览中图分类表,通过分类检索可对文章中图分类号做检索学科范围组合,灵活限制检索范围。,86,案例:心血管疾病的微量元素代谢R 医药、卫生 R5 内科学R54 心脏、血管(循环系)疾病,87,选择分类,88,期刊导航: 直接输入刊名或ISSN 按刊名第一个字首字母浏览 按学科分类 通过以上三种方式找到想要的期刊,在期刊内进行关键词检索或按卷期浏览期刊上的文献,89,90,个性化服务我的数据库(需申请个人标志码和验证码)关键词定制期刊定制分类定制保存检索式保存文章(电子书架) 在检索结果页面上选择标记文献后,点击“加入电子书架”可保存到电子书架中,亦可定制某医学科、某些期刊或某一主题的快捷检索方式可将检索结果和检索表达式保存至“我的数据库中”。,91,个性化服务,92,练习1.浙江大学医学院附属第一医院的的郑树森院士1998年发表的论文。2.检索发表在国际内分泌代谢杂志上的文献。3.艾滋病患者的健康教育。,93,94,实习题,1.检索发表在国际内分泌代谢杂志上的文献。 2.浙江省自然科学基金资助的论文。 3.医院电子病历系统的专利。4.医院电子病历系统的标准。 5.浙江大学医学院附属第一医院的的郑树森院士1998年发表的期刊论文。 6.临床超声医学杂志2010年的影响因子。7.艾滋病患者的健康教育,保存检索结果、Email,下载几篇全文。比较三个数据库的检索结果,95,