文献检索第二章信息检索基础.ppt
第一节 信息检索及其类型第二节 信息检索语言第三节 信息检索技术第四节 检索工具,第二章 信息检索基础知识,第一节 信息检索及其类型,一、信息检索的概念二、信息检索的类型三、信息检索的意义,一、信息检索 信息检索:是指将信息(主要指文献信息)按一定的方式组织和存储起来,并根据用户的需要找出相关信息的过程。,信息检索,存储,检索,存储:是对信息进行著录、标引、整序,编制检索工具和建立检索系统的过程。,检索:是指面向信息需求而进行高度选择性的查找过程。,二、信息检索的类型,(一)按检索内容划分,2、数据检索 是以数据为检索内容的信息检索,要求从检索系统存储的大量原始调查数据和其它统计数据中查出所需的数字资料。,1、书目检索 是以文献线索为检索内容的信息检索。,3、事实检索 是以具体事项为检索内容的信息检索,要求从检索系统存储的各种原始信息资源中查出专门的事实材料。,4、全文检索 即检索系统存储的是整篇文章或整本图书。5、图像检索 即以图形、图像或图文信息为检索内容的信息检索。6、多媒体检索 是以文字、图像、声音等多媒体信息为检索内容的信息检索。,(二)按是否使用检索工具划分 1、直接检索 就是指利用一次文献进行检索,这是以前比较常用的一种查找方法。所花时间多和精力大,检出文献少。2、间接检索 就是指利用各种检索工具获得文献线索,再根据线索去查找原始文献的方法。,(三)按信息检索手段划分 1、传统信息检索 就是手工信息检索,是利用各种印刷型检索工具来查找文献的一种方法。2、现代信息检索 现代信息检索即计算机信息检索,是指利用计算机和网络来处理和查找文献信息的检索方式。,1、信息检索是现代人才的基本生存技能2、信息检索是现代人才信息素质的重要方面3、信息检索是科学交流的重要途径4、信息检索是开发信息资源的工具5、信息检索是管理决策的基础6、信息检索是继承和借鉴前人成果,避免重 复研究的必由之路7、信息检索是治学之道,三、信息检索的意义,第二节 信息检索语言,一、检索语言的含义及作用二、检索语言的类型,一、检索语言的含义及作用,检索语言:是根据检索需要而创造的一种人工语言。,作用:1、保证不同标引人员表征文献信息的一致性。2、使内容相同及相关的文献集中化。3、保证检索提问与文献信息标引的一致性。4、保证检索者按不同需求检索文献信息时,都能获得最高的查全率和查准率。,二、检索语言的类型,检索语言的类型,表述文献外表特征的语言,表述文献内容特征的语言,题名责任者号码引文,分类法,主题法,标题词法叙词法关键词法,分类语言 按知识门类的逻辑次序将信息系统地组织和划分的语言,具体体现为用分类号和类名来表达信息的主题概念。中国图书馆图书分类法(X 环境科学、安全科学)美国国会图书馆分类法 杜威十进位分类法 IPC国际专利分类法,标题词语言 是从文献的题目和内容中抽出来,经过规范化处理的主题语言。关键词语言 直接从文献信息的标题、摘要或内容本身抽取出来的用于揭示信息主题内容的自由词。,叙词语言 是以表达文献主题内容的概念单元为基础,经过规范化处理,可以进行逻辑组配的一种主语语言。,第三节 检索技术,一、概念检索二、布尔逻辑运算符组配检索三、截词检索四、字段限制检索五、位置运算符六、检索技巧和方法,一、概念检索 检索标识是具体的检索词或词组,每个检索词表达一个概念,具体检索时,将检索词与数据库中的文献特征标识进行类比,两者相同,则该记录为命中文献。,二、布尔逻辑算符组配检索 布尔逻辑组配运算是采用布尔代数中的逻辑“与”逻辑“或”、逻辑“非”等算符,将检索提问式转换成逻辑表达式,限定检索词在记录中必须存在的条件或不能出现的条件。凡符合布尔逻辑所规定的条件的文献,既为命中文献。,布尔逻辑运算符,1、逻辑“或”2、逻辑“与”3、逻辑“非”,1、逻辑“或”(和),用符号“or”或“+”表示,其逻辑表达式为:A or B 或 A+B 其意义为检索记录中凡含有检索词A或检索词B,或同时含有检索词A和B的,均为命中文献。,2、逻辑“与”,用符号“and”或“*”表示,其逻辑表达式为:A*B 或 A and B 其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。,3、逻辑“非”,用符号“not”或“-”,其逻辑表达式为:A not B 或 A-B 其意义为:检索记录中含有检索词A,但不能含有检索词B的文献,才算命中文献。,布尔逻辑运算符,在三种逻辑运算符中,其运算优选级顺序为逻辑“非”(not)、逻辑“与”(and)、逻辑“或”(or),但可以用括号改变它们之间的运算顺序,则先执行括号内的运算。如:(A or C)and B,三、截词检索,截词检索主要是利用检索词的词干或不完整的词形进行检索。截词符一般用“?”、“*”等表示1、后方截词:用于前方一致的派生词检索。如:信息?则表示在数据库中含有信息、信息技术、信息检索等方面的文献记录均为命中文献。2、前方截词:用于后方一致的派生词检索。如:?经济 则数据库中含有经济、工业经济、农业经济等方面的文献均为命中文献。,3、有限截词 在检索词后面加上一个或一个以上(最多4个)的“?”,空一格,再加一个“?”。如:Comput?可检索出:Computer,Computers,Computing,注意:截词检索在不同的计算机检索系统中规定不同,请使用时注意。,四、字段限制检索,为了缩小检索范围,可利用字段代码来限制检索词出现的字段,以提高检索速度和命中率。如:rice in ti(表示只在题目字段中查找文献)rice in ab(只在文摘中查找)au=Smith,J.C(查作者为Smith,J.C 的 文献)py=1998(只查1998年的文献)la=Chinese(只查语种为中文的文献),五、位置运算符,With:设定需检索的两个词或词组在同一字段中,但不限制位置的先后。Near:设定需检索的两个词或词组在同一语句中,相对于“with”更接近。此外,在使用“near”运算符时,还可以在该运算符后添加一个数字以便进一步限定两个词之间的邻近程度,如“near3”设定需检索的两个词或词组在同一句子中且相隔不超过3个单词。,1、检索策略 计算机检索,实际上是由计算机将用户输入的检索策略与系统中存储的文献特征标识及逻辑组配关系进行类比、匹配,并把完全匹配的文献输出的过程。检索策略是科学地运用检索词和逻辑运算符正确地构造逻辑提问式的原则和方法。其核心内容在于检索策略的构造与检索的步骤。,六、检索的技巧和方法,A、弄清提问要求,并确定要查找的文献学科范围、类型、文种、时间等。B、选择相关的数据库并确定在待检数据库中的检索途径,以便制定适合所选择数据库的检索策略。C、对情报提问进行概念分析D、拟定检索逻辑式E、对数据库文档进行查找,检出相关文献并分析检索结果。F、如有必要,对提问式进行反馈、修改,重复上步,直到用户满意为止。,制定检索策略的步骤:,A、扩大检索范围,2、检索技巧和方法,*概念的扩大。*范围的扩大。*增加同义词、近义词、相关词和缩略词。*用“or”、”?”、等*去掉连字符可扩大检索范围。*换另外的数据库或是另外的光盘继续进行检索。,B、缩小检索范围的方法,*核心概念的限定。*核心期刊的限定。*语种的限定。*用布尔逻辑算符“and”或者“not”组配检 索词。*使用位置算符“near”和字段算符“in”提 高查准率。*使用“Index”和叙词表,选择确切的检索 词缩小检索范围,分析课题 选择检索系统及数据库 确定检索词构建检索提问式实施检索并调整检索策略输出检索结果,3、信息检索的一般程序,第四节 检索工具,检索工具:是在不同学科范围内对某阶段出版的有关文献进行收集、整理或对新文献加以及时报道的二次文献。,一、检索工具的作用二、检索工具的特点三、检索工具的类型,一、检索工具的作用,1、报道作用2、存储作用3、检索作用,二、检索工具的特点,1、详细而又完整地记录了文献的外部特征和内部特征。2、对所著录的文献,标引了可供检索的检索标识。3、提供必要的检索手段,配备各种体系的索引。,三、检索工具的类型,1、目录,是一批相关文献的著录集合。对文献的描述较简单,只报道其外部特征,通常以一个完整的出版单位或收藏单位为基本著录对象。(书/刊名、作者、出版年、卷期号等)。,2、题录,是将书籍、期刊等文献中所刊载的论文题目、作者、出处及学科主题等分别摘录出来,并按一定的原则和方法排列起来的一种检索工具。,3、文摘,是一种著录文献题录和内容摘要的检索工具。,4、搜索引擎,通过网络搜索软件或网站登录等方式,将互联网上大量信息资源组织起来建成数据库。,数据库概述,数据库是计算机技术与信息检索技术相结合的产物,是现代重要的信息资源,也是信息检索的重要资料来源。,定义:将信息标引、著录后形成的信息记录,按一定格式录入计算机,形成供计算机检索用的数据库。数据库是被收集在一起的一组有序的信息单元,每个信息单元由若干个独立的结构单元组成,数据元存储在字段中,每个数据元描述信息单元的一个特征(如作者、标题、出版年等)。,一个数据库可能包含数千甚至几十万条记录,每条记录又包含若干个数据字段(构成记录的最小信息单元)。,检索字段,为方便检索,每一个字段都有自己特定的标识符(字段名)。如:TI代表篇名字段,AU代表著者字段,CS代表著者所在单位字段,SO代表文献出处字段(刊名、卷期、页等),LA代表语种字段,PY代表出版年字段,AB代表文摘字段,,注意:不同的数据库,其记录的字段种类、数目、名称、代码等不尽相同,在检索时可根据数据库的说明查询字段的设置情况和使用方法进行操作。,我校图书馆可查询本专业信息的中文数据库,超星数字图书馆;CNKI(含期刊全文、优秀博士/硕士论文、工具书、重要会议论文、重要报纸全文等7个子库);万方数据(含数字化期刊全文、科技信息、商务信息、中国学位论文、中国会议论文全文等5个子库);维普资讯(含中文科技期刊、外文科技期刊等4个子库);,方正Apabi(含教学参考书、中国工具书、中国报纸、中国年鉴4个全文子库);超星名师讲坛视频资源;读秀知识库-读秀学术搜索;台湾科学期刊数据库(TEPS),三种主要中文期刊全文数据库的比较,我校图书馆可查询本专业信息的外文数据库,Ei Village 2-Engineering Village 2;Elsevier-SDOL(Science Direct Online);ISI-SCIE(Science Citation Index Expanded);Springerlink(施普林格);WSNWorld SciNet(世界科技出版公司科技期刊网)ACS Publications(美国化学学会电子期刊)RSC-Royal Society of Chemistry(英国皇家化学学会电子期刊),世界三大检索系统,SCI:Science Citation Index 科学引文索引EI:Engineering Index 工程索引ISTP:Index to Scientific&Technical Proceedings 科技会议录索引对于以上三大检索工具,有印刷版(print)、光盘版(CD-ROM)、网络版(web)和联机版(online)四种利用方式。,SCI 创刊于1961年,1961-1965年不定期出版;1966年改为季刊,1979年改为双月刊。SCI是目前世界上最权威的多学科综合性检索工具。收录了世界上40多个国家和地区自然科学领域的5000多种期刊、会议录及论文集。对工程技术及应用科学方面的文献报道相对较少。,EI创刊于1884年,由美国工程协会联合会下设的工程索引公司编辑出版;1906年起,由美国工程杂志公司出版;1919年起,由美国机械工程师学会购买所有权。EI是世界著名的工程技术类综合性检索刊物,为文摘类索引刊物,报道美国工程科学图书馆收藏的各种期刊、会议录、技术报告、论文集、政府出版物和图书等。及时报道尖端科学,但对各学科纯理论方面的文献一般不予报道,也不报道专利文献。,ISTP是专门检索会议文献的权威性检索工具,每年收录报道4000多种会议录及其论文20多万篇,约占每年全世界主要会议论文的75%以上,覆盖学科150多个,几乎囊括了科学和工程方面的所有领域,是检索全世界会议文献的综合性检索工具。出版类型:印刷版(月刊+年度累积本)、光盘版(季更新)、网络版(检索平台 ISI Web of Knowledge)。,CA 美国化学文摘,CA(Chemical Abstracts),于1907年创刊,由美国化学学会下属的化学文摘服务社编辑出版。其前身为1895年创刊的美国化学研究评论和美国化学会志两种期刊的文摘部分,1969年合并了著名的德国化学文摘,现为周刊。是检索化学、化工、材料、生物、农业、医药科学等领域的主要文摘刊物。是目前世界上最全面、最准确的化学信息系统。,CA特点:(1)收录范围广。CA摘录了150多个国家56种语种的近17000种期刊论文、会议录、科技报告、档案资料、学位论文、图书、综述和30多个国家的专利。(2)检索途径多。经常使用的有9种。(3)报道迅速。原始文献发表以后,CA在三个月后即有报道。,