文献信息检索方法技术.ppt
第四章 科技文献检索技术,网络信息检索第4章 张胜光制作,3,本章内容,网络信息检索第4章 张胜光制作,4,网络信息检索,找什么?What,怎么找?Where,怎么下载?How,网上资源分布,检索原理与技巧,下载技巧,网络信息检索第4章 张胜光制作,5,一个原则:选择合适的关键词,制定正确的检索策略。两大搜索引擎 三大系列中文网站四次文献 零次文献 一次文献 二次文献 三次文献五大多媒体技术十大文献信息资源 图书 期刊 特种文献,本章学习要点:信息检索一四十,网络信息检索第4章 张胜光制作,6,十大文献信息资源 科技图书 科技期刊 特种文献(科技报告 政府出版物 会议文献 标准文献 专利文献 科技档案 学位论文 产品样本),本章学习要点:信息检索一四十,第一节四次文献和 十大文献信息源,网络信息检索第4章 张胜光制作,8,网络信息检索第4章 张胜光制作,9,网络信息检索第4章 张胜光制作,10,零次文献 按对文献 一次文献 信息内容 二次文献 加工深浅 三次文献 科技图书 按文献的 科技期刊 出版形式 特种文献 划分,四次文献,十大文献信息源,网络信息检索第4章 张胜光制作,11,文献信息,零次文献:普通网页,电子邮件等一次文献:正式在期刊上发表的论文等二次文献:数据库中的题录、目录等三次文献:文献综述、进展报告等,网络信息检索第4章 张胜光制作,12,网络信息检索第4章 张胜光制作,13,网络信息检索第4章 张胜光制作,14,零次文献的特点,数量多,内容新,更具有启发性;信息反馈迅速、及时、准确;具有高度选择性和针对性;有限性和不可靠性,要特别提防虚假信息。例如:清华女生朱令的铊中毒病因确诊,就是应用零次文献成功的范例。,网络信息检索第4章 张胜光制作,15,(2)一次文献(Primary Document),网络信息检索第4章 张胜光制作,16,网络信息检索第4章 张胜光制作,17,网络信息检索第4章 张胜光制作,18,网络信息检索第4章 张胜光制作,19,网络信息检索第4章 张胜光制作,20,一次文献的特点,内容比较具体、丰富,具有新颖性、创造性、系统性等特点;经过权威机构筛选,科学性基本有保证;可以回溯检索,不像新闻那样有时效性;由于数量巨大,往往检索困难。一般都是首先检索二次文献后,再去查阅一次文献。另外网上一次文献资源相对较少。,网络信息检索第4章 张胜光制作,21,(3)二次文献(Secondary Document),网络信息检索第4章 张胜光制作,22,网络信息检索第4章 张胜光制作,23,什么是目录?,目录是指对产品或图书的简要介绍。当然,也可以是对一本书内容的简要描述。世界上第一个目录诞生于15世纪的欧洲,是一个关于书籍的目录。在美国,本富兰克林(Ben Franklin)于1744年印制了美国第一份目录,其中列出了数百本图书。,网络信息检索第4章 张胜光制作,24,什么是题录?,题录是二次文献中的一种,通俗地说,是指文献工作者对大量的原始文献的题名、作者及刊登(发表)的处所进行著录,并有序排列供人们了解查找原始文献的一种工具。实际上,题录就是计算机数据库中的一条条记录。,网络信息检索第4章 张胜光制作,25,按中图法著录的图书在版编目,网络信息检索第4章 张胜光制作,26,网络信息检索第4章 张胜光制作,27,清华库中的期刊论文题录格式,网络信息检索第4章 张胜光制作,28,什么是索引?,索引是将图书、报刊等文献资料中具有检索意义的信息,如字词、语句、主题、人名、地名、物名、书名、篇名、名词术语、引用文献名等,分类摘录,标明出处,页码,并按照一定次序加以编排,指引读者据此查寻原始文献的检索工具。索引的印刷型载体是一本书或期刊,电子型载体则是索引数据库。搜索引擎之所以能实现快速检索,就是靠索引数据库的支持。,网络信息检索第4章 张胜光制作,29,清华库中关于Flash的索引,网络信息检索第4章 张胜光制作,30,清华库中某篇文献的题录,网络信息检索第4章 张胜光制作,31,什么是文摘?,文摘(abstract),又分为报道性文摘、指示性文摘、报道指示性文摘、评述性文摘、模块式文摘、专用文摘等几种,它是指对一份文献(或称一个文献单元)的内容所做的简略、准确的描述。这种二次文献意义上的文摘,是索引形式的发展。,网络信息检索第4章 张胜光制作,32,清华库中某篇文献的文摘,网络信息检索第4章 张胜光制作,33,该文献的原文?次文献,网络信息检索第4章 张胜光制作,34,二次文献的特点,具有浓缩性、汇集性、有序性等特点,检索方便,网上二次文献资源丰富;除网上图书馆目录可以免费获取外,大型国际联机数据库的检索一般均须付费;受加工和出版周期的影响,一般二次文献比一次文献要晚几个月甚至一年。,网络信息检索第4章 张胜光制作,35,(4)三次文献(Tertiary Document),网络信息检索第4章 张胜光制作,36,三次文献的特点,权威性强,一般读一篇综述即可了解某一领域某段时间的全部发展情况,对科研指导性强;资源相对稀少,没有专门的三次文献数据库,一般分散在二次文献数据库中,或字典、词典、辞典、百科全书、专题目录、数据手册等工具书中加工和出版周期更长,甚至可能比二次文献还晚数年。,网络信息检索第4章 张胜光制作,37,网络信息检索第4章 张胜光制作,38,文献信息,零次文献:普通网页,电子邮件等一次文献:正式在期刊上发表的论文等二次文献:数据库中的题录、目录等三次文献:文献综述、进展报告等,网络信息检索第4章 张胜光制作,39,三次文献之相互关系,作者发表,出版社发表,专家发表,一次文献,二次文献,三次文献,读者查找,网络信息检索第4章 张胜光制作,40,几点启示,1、使用搜索引擎得到的绝大多数是零次文献,但这绝不是无用的文献,要善于从零次文献中获取有用信息,作为获取一次文献的线索。2、写作科技论文必须依据一次和三次文献。著录格式则必须按二次文献的格式写作。3、检索信息主要靠二次文献,因此,熟悉二次文献的著录格式和检索点非常重要。4、三次文献是“关于文献的文献”,是最难写作的文献类型。毕业论文文献综述恰恰属于此类。,网络信息检索第4章 张胜光制作,41,零次文献 按对文献 一次文献 信息内容 二次文献 加工深浅 三次文献 科技图书 按文献的 科技期刊 出版形式 特种文献 划分,四次文献,十大文献信息源,网络信息检索第4章 张胜光制作,42,特种文献,2、十大信息源按出版形式划分,网络信息检索第4章 张胜光制作,43,1、科技图书(Sci-Tech book),一般分为两大类:阅读类图书(reading book)和参考类图书(reference book),前者有教科书(text book)、专著(monograph)和论文集(anthology)等,后者是参考工具书(reference book),它们是百科全书(encyclopedia)、手册(handbook)、年鉴(yearbook)等。,网络信息检索第4章 张胜光制作,44,科技图书内容比较成熟、全面、可靠、系统,它是对已有研究成果、生产技术和经验或某一知识体系的论述或概括。科技图书的基本素材来自期刊论文、会议论文、研究报告、学位论文等一次文献,其中包括作者本人的研究、见地。,网络信息检索第4章 张胜光制作,45,科技图书的出版周期较长,信息传递较慢,这是它的一大遗憾。为获得最新研究信息,科技人员首选的出版物是科技期刊。,网络信息检索第4章 张胜光制作,46,按中图法著录的图书在版编目,网络信息检索第4章 张胜光制作,47,2、科技期刊(Sci-Tech journal),科技期刊是指有固定刊名、并标有刊物系列序号的连续性出版物,它有定期和不定期出版的。科技期刊有较高的学术性,它与娱乐性、生活性大众期刊不同,所以一般不应属magazine(杂志)范畴。在英语科技刊名中,多见有periodic、serial(连续出版物)、transaction(汇刊)等术语。,网络信息检索第4章 张胜光制作,48,科技期刊按其性质可以划分成学术性期刊、综述与评论性期刊、检索性期刊以及快报、简讯、资料等刊物。科技期刊的特点是:数量大、品类多、内容丰富、出版周期短、报道及时、发行面广、连续性强等,这是科技人员最常阅读的一种出版物,有较高的参考、实用价值。,网络信息检索第4章 张胜光制作,49,网络信息检索第4章 张胜光制作,50,3、科技特种文献,科技报告 科技会议文献 专利文献 学位论文 标准文献 政府文献 产品资料 科技档案,网络信息检索第4章 张胜光制作,51,(1)科技报告(technical report),科技报告是报道科学研究项目和开发调查工作的成果总结,或是其进展中的阶段性进展情况报告。科技报告的内容不少涉及国家部署、支持的高科技研究项目,包括生产技术方面的、基础理论方面的。它专业性强,报道详尽,有技术数据、图表,有研究比较,出版速度快。此类文献资源要到专门网站去找。,网络信息检索第4章 张胜光制作,52,(2)科技会议文献(conference paper),是在各种学术会议、专题研讨会上发表的论文和报告,它是最新研究成果公布于世的一种主要方式。它是人们及时了解有关学科领域发展状况的重要渠道。它包括会前文献、会间文献和会后文献,后者是正式出版的会议文献,常以会议文集、会议录等形式发行。会议文献具有专业性强、内容新颍、出版发行方式多样等特点,其数量增长快,现已成为排名于期刊文献后的第二大科技文献信息源。,网络信息检索第4章 张胜光制作,53,网络信息检索第4章 张胜光制作,54,网络信息检索第4章 张胜光制作,55,(3)专利文献,专利文献(patent document)是一切与专利制度有关的文件的统称,其内容集技术、经济、法律于一体。它的出版量大,实用性强。专利文献包括专利说明书、专利公报、专利分类表、专利检索工具以及有关专利的法律性文件。专利文献具有标准化、时间性强、实用性强等特点,专利说明书是专利文献的技术内容的主体。,网络信息检索第4章 张胜光制作,56,失效专利文献,专利文献中除了有效专利外,大量的是失效文献。而失效专利文献是你寻找投资方向的最好的指南和金矿!,网络信息检索第4章 张胜光制作,57,网络信息检索第4章 张胜光制作,58,网络信息检索第4章 张胜光制作,59,(4)学位论文,学位论文(thesis,dissertation)是学位制度的产物,它是作者为取得专业资格的学位而提交的研究论文,论文介绍其调查、发现或研究成果,它有学士、硕士和博士论文层次之分。学位论文通常不正式出版,收藏在各个研究机构或院校,及专门的信息机构。,网络信息检索第4章 张胜光制作,60,网络信息检索第4章 张胜光制作,61,网络信息检索第4章 张胜光制作,62,(5)标准文献,标准文献(standard)是经公认的权威机构批准的标准化工作成果,它是协调统一技术所做的一种规定,是组织现代化生产、进行科学管理的具有法律约束作用的重要文献。标准文献采用文件或规定基本单位两种形式固定下来,形成文献,反映当时的技术政策和工艺水平。,网络信息检索第4章 张胜光制作,63,网络信息检索第4章 张胜光制作,64,(6)政府文献,政府文献(government document)是各国政府部门及其所属机构发表的文献,包括行政性文件和科技文件两类。政府文件具有指导意义,通过政府文献还可以了解到各国的方针政策、经济状况、社会状况和科技发展状况。政府文献要到政府网站上去找。,网络信息检索第4章 张胜光制作,65,(7)产品资料,产品资料(product literature)是各家厂商为推销其产品而印发的商业宣传品,包括产品样本、产品目录、说明书和厂商的情况介绍等。此类文献要到各厂家网站上去找。,网络信息检索第4章 张胜光制作,66,(8)技术档案,技术档案(technical records)是指在生产建设和科技活动中形成的、有一定工程对象的技术性文件的总称,包括任务书、协议书、技术经济指标和审批文件、研究计划、研究方案、技术措施、调查材料、设计计算、数据、图纸和工艺卡等一系列文件。此类文献一般不公开发表。,网络信息检索第4章 张胜光制作,67,特种文献,小结:十大信息源,网络信息检索第4章 张胜光制作,68,几点启示,1、科技期刊是报道信息最快的权威文献信息源,是写作科技论文的首选信息源。2、科技图书是系统性很强的一次和三次文献,是学生学习新知识的首选。3、特种文献是很重要的文献信息资源,其来源非常多样,要善于发现和获取。,网络信息检索第4章 张胜光制作,69,一个原则:选择合适的关键词,制定正确的检索策略。两大类搜索引擎 三大系列中文网站四次文献 零次文献 一次文献 二次文献 三次文献五大多媒体技术十大文献信息资源 图书 期刊 特种文献,本章学习要点:信息检索一四十,网络信息检索第4章 张胜光制作,70,十大文献信息资源 科技图书 科技期刊 特种文献(科技报告 政府出版物 会议文献 标准文献 专利文献 科技档案 学位论文 产品样本),本章学习要点:信息检索一四十,第二节 科技文献 检索方法,网络信息检索第4章 张胜光制作,72,基本概念预览,1、信息检索原理:信息存储和检索2、检索点、检索途径、检索策略、关键词:分类检索和主题检索3、检索表达式:用逻辑表达式连接起来的关键词,用NOT、AND缩检,用OR扩检。一般搜索引擎空格代表AND。4、检索工具:手工检索工具和计算机检索工具5、检索方法:直接检索和间接检索 追溯法和工具法,网络信息检索第4章 张胜光制作,73,网络信息检索第4章 张胜光制作,74,顺查法举例,题目:Moodle快速架站实例视频教程1、抽取关键词:moodle 快速架站 视频教程其中最主要的关键词是moodle2、打开清华库,输入关键词检索3、阅读题录,确定需要下载的文献4、下载原文,网络信息检索第4章 张胜光制作,75,输入关键词,网络信息检索第4章 张胜光制作,76,阅读题录,网络信息检索第4章 张胜光制作,77,阅读文摘,网络信息检索第4章 张胜光制作,78,下载原文,网络信息检索第4章 张胜光制作,79,阅读一次文献,网络信息检索第4章 张胜光制作,80,网络信息检索第4章 张胜光制作,81,网络信息检索第4章 张胜光制作,82,重新检索,网络信息检索第4章 张胜光制作,83,滚雪球式查找,网络信息检索第4章 张胜光制作,84,网络信息检索第4章 张胜光制作,85,网络信息检索第4章 张胜光制作,86,网络信息检索第4章 张胜光制作,87,网络信息检索第4章 张胜光制作,88,网络信息检索第4章 张胜光制作,89,网络信息检索第4章 张胜光制作,90,网络信息检索第4章 张胜光制作,91,网络信息检索第4章 张胜光制作,92,实际课题的检索选用哪一种方法,要根据具体情况而定。一是根据课题研究的需要,二是视所能利用的检索工具和检索手段。,网络信息检索第4章 张胜光制作,93,Keyword原则,既然计算机信息检索的实质是数据库中的标引词与用户提问的检索词的比照,比对结果正确则输出,不正确则不输出,所以,在网络信息检索中,用户提问时所采用的关键词非常重要,Keyword原则是用户检索能否成功的关键。,网络信息检索第4章 张胜光制作,94,Keyword原则,所谓Keyword原则,是用户检索时,首先要把你的问题变成若干个关键词,然后对这些关键词进行组配,形成所谓“检索表达式”,让计算机能够理解和执行,并输出你想要的结果。这是你的检索能否成功的关键。,网络信息检索第4章 张胜光制作,95,应用Keyword检索实例,1谁根据小仲马的茶花女改编了同名歌剧?()A奥斯汀 B威尔第 C福楼拜,网络信息检索第4章 张胜光制作,96,网络信息检索第4章 张胜光制作,97,网络信息检索第4章 张胜光制作,98,应用Keyword检索实例,2生存还是死亡,这是一个问题。出自莎士比亚的哪部作品?A哈姆雷特 B李尔王 C麦克白,网络信息检索第4章 张胜光制作,99,网络信息检索第4章 张胜光制作,100,网络信息检索第4章 张胜光制作,101,“学生上机计时的计算与查询”,3、学生上机计时的计算与查询,网络信息检索第4章 张胜光制作,102,?,网络信息检索第4章 张胜光制作,103,网络信息检索第4章 张胜光制作,104,网络信息检索第4章 张胜光制作,105,网络信息检索第4章 张胜光制作,106,网络信息检索第4章 张胜光制作,107,第三节检索点和检索途径,网络信息检索第4章 张胜光制作,109,检索点=检索途径 关键词,检索点(access point)是检索的出发点,以前常用“检索途径”(approach)这一术语。在计算机检索中,所有类型的检索点形式上都表现为“关键词”,但在数据库检索中,检索点和关键词的含义还是有所区别的。文献信息特征是多方面的,用于文献检索的检索点很多,反映文献信息内容特征的有:分类检索和主题检索;反映文献外部特征的有:作者检索、名称检索和号码检索等。,网络信息检索第4章 张胜光制作,110,检索点=关键词,文献内容特征 分类检索(目录检索)的检索点 主题检索(字段名检索)文献外部特征 作者检索(字段名检索)的检索点 名称检索(字段名检索)号码检索(字段名检索),网络信息检索第4章 张胜光制作,111,分类检索,主题检索,题录和检索点,题录和检索点,网络信息检索第4章 张胜光制作,112,分类(classification)检索是从文献内容所属的学科类别出发来检索文献,它依据的是一个可参照的分类体系(classification system)。,1.分类检索,网络信息检索第4章 张胜光制作,113,广泛用于图书资料的是图书分类法。图书分类法的作用是指示用户根据学科内容检索图书资料,指导用户从开架书库(open shelf)中按类号顺序找到指定的图书及其内容相关的资料。许多出版物上都有图书在版编目CIP(Cataloging In Print)。在我国出版的图书、专著上图书在版编数据中有中图法分类号一项。,网络信息检索第4章 张胜光制作,114,按中图法著录的图书在版编目,网络信息检索第4章 张胜光制作,115,较权威的图书分类法有:,中国图书馆图书分类法 中国科学院图书馆图书分类法 美国国会图书馆分类法(Library of Congress Classification)杜威十进分类法(Dewey decimaldecimal Classification system),网络信息检索第4章 张胜光制作,116,中国图书馆图书分类法,网络信息检索第4章 张胜光制作,117,网络信息检索第4章 张胜光制作,118,网络信息检索第4章 张胜光制作,119,分类检索实例,一、请查阅八一农学院学报在维普库和清华库中的收录情况。二、请查阅新疆农业大学学报在维普库和清华库中的收录情况。三、请查阅在维普库和清华库中都收录了哪些计算机科学方面的学术期刊,其中核心期刊有哪些。,网络信息检索第4章 张胜光制作,120,2、主题检索,主题(subject)检索是从反映文献内容的有关主题词出发来检索文献,主题是检索点,它对应文献主题概念。检索按主题词的音或形的字顺进行,其方式如查字典、词典。,网络信息检索第4章 张胜光制作,121,网络信息检索第4章 张胜光制作,122,主题词有多种类型:有规范词和自由词,有单元词和多元词,有先组结构和后组结构等。主题词的合理选择与使用对检索结果的优劣直接相关。,网络信息检索第4章 张胜光制作,123,主题检索实例,请查找并阅读科学画报上有关人工智能的科普文章,并把它下载下来,转变成word文章。,网络信息检索第4章 张胜光制作,124,作者(author)检索是从文献的作者姓名出发来检索其文献。作者广义上还应包括:汇编者(compiler)、编者(editor)、主办者(sponsoring body)、译者(translator)等,此外,还有代表机构、单位的团体作者(corporate author),包括作者所在单位(authors affiliation)。,3.作者检索,网络信息检索第4章 张胜光制作,125,网络信息检索第4章 张胜光制作,126,名称(title)检索点是从各种事物的名称出发来检索文献信息。这些名称包括:书名、刊名、资料名、出版物名、出版社名、会议名、物质名称等等,也包括人名和机构名。检索的对象既包括对应的文献,也包括有关的信息、事项等。,4.名称检索,网络信息检索第4章 张胜光制作,127,网络信息检索第4章 张胜光制作,128,书名目录、馆藏目录普遍使用书名、刊名等出版物名称作为其检索点,而论文、文章篇名一般不用作检索点。检索按名称字顺进行,这时,名称起始用的冠词如:A,An或The等不计入,专门术语称作“禁用词”。,网络信息检索第4章 张胜光制作,129,号码包括文献的编号(number)、代码(code)等,它们是文献信息的一些特有的外部标识,号码检索点以号码特征来检索文献信息。号码多种多样,通常用数字、字母或用它们结合的形式或以分段的方式来表示其各部分的含义,5.号码检索,网络信息检索第4章 张胜光制作,130,比如科技报告有报告号,还有其合同号、拨款号等,比如专利文献有专利号、入藏号、公司代码等;比如分类号也是号码,等等。它们各自按号码顺序,或以数序、或以字序、或以混合序列检索。分类检索可看作一种特殊的号码检索,分类号是它的检索点,网络信息检索第4章 张胜光制作,131,在对图书和期刊检索时常用到两个号码:国际标准书号ISBN(International Standard Book Number)及国际标准刊号ISSN(International Standard Serial Number),它们分别是一种图书和一种期刊的唯一标号。,网络信息检索第4章 张胜光制作,132,由于文献加工的细化,计算机标引的介入,新型电子文献出现等情况,形成了更多的可检索点,比如:文献类型、文献属性、参考文献、语种、出版年份等检索点,它们提供了更多的检索途径。,第四节逻辑运算符和检索表达式,网络信息检索第4章 张胜光制作,134,检索表达式,确定检索途径后,就可以在网上检索工具(搜索引擎)检索式输入窗口中输入检索表达式 检索表达式可以是一个检索词或者是一个逻辑表达式。简单的检索只要输入一个检索词即可,复杂的检索则需要输入检索表达式。如“新闻*美学”等。,网络信息检索第4章 张胜光制作,135,将多个检索词用布尔运算符组合在一起来进行检索,我们称之为布尔逻辑检索。用NOT、AND缩检,用OR扩检。一般搜索引擎空格代表AND。例如,计算机AND农业、计算机OR农业、计算机NOT农业检索出来的文献是完全不同的。,网络信息检索第4章 张胜光制作,136,用于计算机检索的布尔运算符有:逻辑与(*)、逻辑或(+)、逻辑非(-)。(注意:有些数据库不遵循此规律,如人民日报全文库中,逻辑与则为“+”,在检索前需看使用说明。,网络信息检索第4章 张胜光制作,137,网络信息检索第4章 张胜光制作,138,逻辑与(AND)*缩检,假设A和B是两个检索词,则A*B表示A与B必须同时存在。运用“逻辑与”表达式,有助于明确限定检索范围。,网络信息检索第4章 张胜光制作,139,逻辑与(AND)*缩检,例如用户想在题名中检索有关新闻美学的文献,如只输入“新闻”或“美学”,则命中文献太多,且有许多不是自己所要的。如果输入“新闻*美学”,则检索出题名中同时含有“新闻”和“美学”的文献,检索结果大大缩小。,网络信息检索第4章 张胜光制作,140,逻辑与(AND)*缩检,换一个角度看,“逻辑与”又能防止漏检。例如,用户输入“新闻美学”作为检索词,可命中戈公振的新闻美学实践这样的文献,但漏检了新闻的美学属性、新闻标题中的美学这些文献。如果用“新闻*美学”来进行检索,则上述三篇文献都检中。,网络信息检索第4章 张胜光制作,141,逻辑或(OR)+扩检,A+B,表示A或B中任何一个词存在都可以(当然A和B同时存在也可以)。“逻辑或”表达式,有助于提高查全率,网络信息检索第4章 张胜光制作,142,逻辑或(OR)+扩检,例如某用户想查找研究杜甫的文献,检索途径选择题名后,输入“杜甫”,命中540篇。但考虑到研究杜甫的文献题名中未必都出现“杜甫”两字,也可能会出现“杜诗”、“李杜”,于是改用“杜甫+杜诗+李杜”表达式,结果命中608篇。,网络信息检索第4章 张胜光制作,143,逻辑非(NOT)-缩检,A-B,表示A必须存在,但不能有B。“逻辑非”表达式,主要用于排除那些与检索意图无关的文献。,网络信息检索第4章 张胜光制作,144,关于“优先级”问题,当布尔运算符在一个检索式中连续出现时,它们的“级别”是不同的。大部分数据库是这样规定的:-优先级最高,*次之,+最低。例如要查找研究唐宋诗歌的文献,可以用“(唐+宋)*诗”、“唐*诗+宋*诗”,而不能用“唐+宋*诗”。“唐+宋*诗”查找的是含有“唐”的文献或者同时含有“宋”和“诗”的文献,这样就把涉及到的唐代、唐姓的文献都找出来了。,网络信息检索第4章 张胜光制作,145,精确匹配和模糊检索,不同的数据库,检索途径设定的检索规则有所不同,有的检索途径允许用户用“任意一致”的方式检索,有的只允许用“完全一致”或“前方一致”的方式检索。,网络信息检索第4章 张胜光制作,146,“完全一致”即精确匹配,要求输入的检索词,与数据库中的文献标识完全匹配,才能命中。如要查找作者“刘开扬”的文献,则必须准确输入“刘开扬”三字,如输入“刘开杨”或“刘开”,则不能命中。一般在使用网上搜索引擎进行检索时,可以用双引号把输入的检索词括起来,就可以达到“完全一致”的检索效果。,网络信息检索第4章 张胜光制作,147,“前方一致”属于模糊检索的一种。如在作者字段中输入“刘开?”便可查到作者“刘开”、“刘开扬”、“刘开强”的文章。又如以关键词为检索途径,输入“经济?”,便可查到“经济”、“经济法”、“经济学”、“经济预测”、“经济效益审计”等等。(注意,匹配符通常用“?”,但也有的数据库用“*”),网络信息检索第4章 张胜光制作,148,“任意一致”是模糊检索中的最为自由者。如用篇名作为检索途径,输入“出版”,则可检出篇名中任一处含有“出版”一词的文献,如出版系统探讨、广东出版史概述、商务印书馆与近代教科书的出版等。,网络信息检索第4章 张胜光制作,149,计算机网络检索实例,检索题目:毕业论文各种多媒体视频文件剪辑 及格式转换方法综述1、分析研究课题,明确检索要求 首先选取第一个关键词多媒体视频文件,用搜索引擎或数据库进行试检索,以弄懂本课题的检索要求。,网络信息检索第4章 张胜光制作,150,2、选择检索工具,作为毕业设计论文,所引用的文献必须是权威性的最新一次文献,所以,首选中国三大网上期刊数据库清华裤、维普库和万方库联合进行检索。其次,也可以参考数字图书馆中的专著、教科书等科技图书文献资源。,网络信息检索第4章 张胜光制作,151,3)确定检索点即关键词,通过对主题的分析和初步检索,可以看出本课题的检索点应当是三组:一是多媒体视频文件的类型,二是各种多媒体视频文件的剪辑方法,三是各种多媒体文件的格式转换。由此就不难确定出合适的关键词。,网络信息检索第4章 张胜光制作,152,4)使用检索工具,打开确定的检索数据库,输入由关键词和逻辑运算符组成的检索表达式,一边检索一边分析取舍,文献少时用OR扩检,文献多时用AND和NOT缩减,以获得符合需要的文献。,网络信息检索第4章 张胜光制作,153,5)索取和打印原文,数据库中如果可以直接查到原文,可以下载并打印。如果数据库中没有全文或需要付费,则必须找到原文线索付费购买。外文文献的题录,其刊物和出版社的名称常常是缩写的,需要找到缩写对照表来获取其刊物和出版社的准确名称。俄文文献在网上传输时,往往用英文字母表助成其读音,必须找到相应的对照表将其翻译成原来的俄文才能读懂。,网络信息检索第4章 张胜光制作,154,网上数据库检索实例,一、请查阅八一农学院学报在维普库和清华库中的收录情况。二、请查阅新疆农业大学学报在维普库和清华库中的收录情况。三、请查阅在维普库和清华库中都收录了哪些计算机科学方面的学术期刊,其中核心期刊有哪些。,网络信息检索第4章 张胜光制作,155,网上数据库检索实例,四、请用搜索引擎查阅中文核心期刊表,查看其计算机方面的核心期刊维普库和清华库是否都已经收录。五、请阅读最近一期的新疆农业大学学报上你感兴趣的一篇文章,并把它下载下来。六、请查找并阅读科学画报上有关人工智能的科普文章,并把它下载下来,转变成word文章。,网络信息检索第4章 张胜光制作,156,七、试做以下题目的文献综述:(必要时使用 搜索引擎扩大检索范围)1、网上教学资源库的发展现状分析、问题与对策2、关于如何提高计算机实习效果的探索3、远程屏幕图像实时传输的原理与实现4、用Authorware开发基于网络的自测系统及实例5、学生上机计时的计算与查询,网络信息检索第4章 张胜光制作,157,基本概念回顾,1、信息检索原理:信息存储和检索2、检索点、检索途径、检索策略、关键词:分类检索和主题检索3、检索表达式:用逻辑表达式连接起来的关键词,用NOT、AND缩检,用OR扩检。一般搜索引擎空格代表AND。4、检索工具:手工检索工具和计算机检索工具5、检索方法:直接检索和间接检索 追溯法和工具法,网络信息检索第4章 张胜光制作,158,一个原则:选择合适的关键词,制定正确的检索策略。两大搜索引擎 三大系列中文网站四次文献 零次文献 一次文献 二次文献 三次文献五大多媒体技术十大文献信息资源,本章学习要点:信息检索一四十,网络信息检索第4章 张胜光制作,159,十大文献信息资源 科技图书 科技期刊 特种文献(科技报告 政府出版物 会议文献 标准文献 专利文献 科技档案 学位论文 产品样本),本章学习要点:信息检索一四十,课件制作:张胜光,Thank You!,