信息检索基础知识通用模板课件.ppt
《信息检索基础知识通用模板课件.ppt》由会员分享,可在线阅读,更多相关《信息检索基础知识通用模板课件.ppt(73页珍藏版)》请在三一办公上搜索。
1、,文献检索(信息检索) 第三章 信息检索概述第二节信息检索基础知识,G252.7/160=2,1,谢谢观赏,2019-8-17,一、信息检索的概念(一)信息检索的概念信息检索有广义和狭义之分:广义的信息检索是指将信息按一定的方式组织和存储,根据信息用户的需求从信息集合中找出信息的过程和技术。其全称为:信息存储和检索。存储的过程是信息组织加工和记录的过程,即建立检索系统(编制检索工具)的过程输入的过程;检索的过程是按一定的方法从检索系统(检索工具)中查出信息用户需要的特定信息的过程输出的过程。狭义的信息检索是对信息用户而言,就是信息集合中找出所需的信息。,2,谢谢观赏,2019-8-17,二、信
2、息检索的类型(一)按存储和检索的内容划分1.文献检索:以文献全文为检索对象的一种检索,从文献集合中检索出所需的、切题的文献的过程、方法和策略。凡是查找某一主题、学科时代、地区、著者等相关文献圴属此类。2.事实检索:从文献中抽取的事项为检索内容的检索。亦即从存储有大量知识信息、事实信息和数据信息的检索工具和检索系统中获取某一事物的现状、结果、发生的时间、地点和过程的检索,如查找某产品的生产企业、性能、人物的基本情况、历史变迁等。,3,谢谢观赏,2019-8-17,3.数据检索:从存储大量数据、图表的检索系统中获取数值型信息,检索结果是经过评估的各种数据,可直接应用于比较分析、定性或定量分析。4.
3、多媒体检索:随着计算机和网络技术的发展而产生的新的检索类型,是利用特定的搜索引擎从存储有多媒体文件的检索系统中获取多媒体信息的一种检索方式。其检索结果是文字、图像、声频、视频等或静、或动的信息形式。事实检索和数据检索是以从文献中提取出来的各种事实、数据为检索对象的一种确定性检索。,4,谢谢观赏,2019-8-17,(二)按检索手段划分1.手工检索手工检索(manual retrieval)使用的多为印刷型或书本型检索(paper-based retrieval) 工具,早些时候有检索卡片,现在使用最多的是检索刊,它们定期地将最新收集到的信息、文献加以汇总、组织和报道。手检的技术要求不高,以人的
4、劳动为本,由人来翻阅,由人来进行比较、选择,完成匹配。 以印刷文献为主要检索对象,以各类文摘、题录和目录性工具书为可利用的主要检索工具,以图书馆的参考咨询部为开展信息检索服务的中心机构。,5,谢谢观赏,2019-8-17,2.计算机检索计算机的信息检索主要经历了早期的脱机批处理,后来的联机实时检索、联机网络化和多元化信息检索,到目前的以因特网的搜索引擎为核心的网络化检索时期。检索过程是在人与机器的合作、协同下完成的,它们经常用实时的、交互的方式从计算机存贮的大量数据中自动分拣出用户所需要的信息。计算、比较、选择的匹配任务是由机器来执行的,而人则是整个检索方案的设计者和操纵者。检索用户由专业检索
5、人员向个人终端用户转移。,6,谢谢观赏,2019-8-17,三、信息检索工具(一)信息检索工具的概念信息检索工具是用来报道、存储和查找的工具.也是借以鸟瞰科技发展历程以及学科进展状况的重要工具。由专业人士将文献的外表和内容特征转换成具有检索意义的标识,为信息检索者提供有章可循的途径。检索系统由一定的检索设备和加工整理好并存储在相应的载体上的文献集合(如文献数据库)及其他必要设备共同构成的,具有存储和检索功能的信息服务设施。,7,谢谢观赏,2019-8-17,检索系统和检索工具的区别(1)检索工具常指纸质的书本或卡片,检索系统指多个子系统构成的,需借助专门机器进行检索的设施。(2)检索工具结构简
6、单,需要依靠人的智力和知识进行信息比较和选择;检索系统依靠机器语言来进行信息服务。注:二者之间没有绝对的界线。,8,谢谢观赏,2019-8-17,检索工具必备条件:(1)对所收录的文献的各种特征(包括外部特征和内容特征)有详细的描述;( 体现报道和存储功能)(2)每条记录有可供检索用的标识;(体现查找功能)(3)全部记录科学地组织成一个有机的整体;( 查找功能,使记录存放有序)(4)具有多种必要的检索手段。(查找功能,满足用户多角度查找文献),9,谢谢观赏,2019-8-17,知识的产生 记录 原始文献 文献整理 知识重组 知识浓缩书目、目录 词典、名录 述评、专著索引、文摘 指南、手册 教科
7、书、论文丛书新书通报 年鉴 百科全书 二次整理 研究、实验 书目之书目 实践、综合 词典的指南 文献指南 知识的创新 传 播 科技信息的利用 检索工具在文献结构系统中的位置,10,谢谢观赏,2019-8-17,(二)常用检索工具的类型1.目录,也称书目,以整本图书、期刊作为报道单元,收录文献的题名、著者、出版者、收藏情况等外部特征信息,按类编排。亦就是对一批相关文献外表特征(文献名称、著者、文献出处等)的加以整理和分编,并按一定顺序组织起来形成的一种检索工具。根据编制目的和用途的不同,目录可分为国家目录、馆藏目录、联合目录、出版商目录等。,11,谢谢观赏,2019-8-17,传统的卡片式目录,
8、12,谢谢观赏,2019-8-17,电子目录,13,谢谢观赏,2019-8-17,题录著录格式 如下:,030301007 网络时代的管理创新/高维钫(北京邮电大学文法经济学院)/经济管理.2002,13(6),53-55,记录号,题名,著者姓名,著者单位,原文出处,2.题录,与目录基本相同,也是对文献外部特征(如文献题名、著者、文献出处等)的揭示和报道,只是内容上是以独立的单篇文献(如一篇文章或书中某一部分以至整个出版物)为著录单元。(广、快、新),14,谢谢观赏,2019-8-17,与目录区别,著录对象不同,目录,单位出版物,题录,单篇文献,15,谢谢观赏,2019-8-17,3.索引将收
9、录范围内的文献中的题名、主题、人名、地名等名词术语以及其他有关款目抽出,注明出处,并按一定的排检方式组织而成的一种检索系统。是以文献中的“知识单元”为单位,揭示各种文献外部特征或内容特征的系统化记载工具。索引揭示文献内容比目录更为深入和细致,比目录应用更广泛。,16,谢谢观赏,2019-8-17,4.文摘也提要、摘要,文摘不仅描述文献的外表特征,而且还揭示文献的内容特征,是带有文摘内容的、扩展了的题录 。可以获取文献的核心内容观点,是一种经济的文献形式。,印刷版本文摘著录格式如下:,9807471 OODB中的模式更改框架刊,中/郭 江/计算机应用与软件.1997,14(3).23-34 模式
10、演化是面向对象系统中的一个关键问题。由于OODB(面向对象数据库系统)的应用。参4,文摘号,题名,文献类型,文种,著者姓名,原始文献的出处,摘要,参考文献数目,17,谢谢观赏,2019-8-17,电子版本文摘著录格式 如下:,18,谢谢观赏,2019-8-17,文摘的作用(1)通报最新的科学文献;(2)深入提示文献内容,吸引读者去阅读原文;(3)节约阅读时间;(4)确定原文内容与课题的相关程度;(5)帮助用户克服语言障碍 ;(6)有助于提高标引质量;(7)便于读者进行回溯性检索;(8)是撰写综述、述评、研究科技发展史的重要素材。,19,谢谢观赏,2019-8-17,5.参考工具书是汇集某一方面
11、的知识和资料,按某种体例编排的专供查考和检索特定知识或信息,而不需要系统阅读的工具性著作,如字、词(辞)典,百科全书、年鉴、手册、名录、类书、政书、表谱、图录等(1)字、词典:字典解释字形、读音、含义和用法;词典解释词语的概念、意义及用法,可分语文词典、专科词典和综合词典三大类。语文词典有现代汉语词典、汉语大字典、汉语大词典;专科词典有经济大词典、数学词典;综合性词典有辞源(1884年以前)和辞海(兼顾古今),20,谢谢观赏,2019-8-17,(2)百科全书是以条目的形式,全面、系统地概述各学科(人类一切门类)或某一学科领域知识,并按词典形式编排的工具书,有“工具书之王”之称。百科全书可供一
12、般阅读和学习使用,具有教育性;它有完善的目录、索引和参见系统,具有检索性;它的再版、补编等工作,保证其所含内容的新颖性。百科全书是人类最有用的知识的系统概述。世界三大著名的英语百科全书不列颠百科全书、美国百科全书、科里尔百科全书,21,谢谢观赏,2019-8-17,(3)年鉴是按年度连续出版的工具书,是对一年内的重大事件、最新成果和统计数据等汇集。年鉴的内容和数据主要取材于政府公报、相关文件、部门统计、重要报刊的报道以及专业撰述等,具有专业性、权威性、资料性、时效性和新颖性。年鉴可分为综合性和专业性两大类,前者如中国百科年鉴,后者如中国经济年鉴、中国法律年鉴等。,22,谢谢观赏,2019-8-
13、17,(4)手册它汇集某一主题或学科领域的各种基础知识和基本数据资料,通常针对当前实践所需,供随时翻检查阅之用,是一种便捷的查检参考工具书。故又称“便览”,也常冠以“概览”、“大全”、“要览”、“指南”、“必备”等名称。(5)名录是一种系统编排的个人或机构名单,用以指示地址及相关资料,是人们进行经济、文化、学术交流的参考工具书。有机构名录和人名录。,23,谢谢观赏,2019-8-17,(6)类书根据一定的意图,把群书中可供参考的文献资料辑录出来,分类编排(也有分韵编排)的工具书,类似于百科全书式的资料汇编。类书主要用于查找辞藻典故和诗词文句出处,查考史实和事物掌故,亦可用于辑佚和校勘古籍。百科
14、全书是以条目形式,对各种知识作概述性的介绍,着重反映科学文化的最新成就;类书是文献资料的分类辑存,以继承传统文化为主要目的。三国曹丕皇览、虞世南北堂书钞、解缙永乐大典(22877卷)、陈梦雷古今图书集成(1万卷),24,谢谢观赏,2019-8-17,(7)政书辑集历代或某一朝代有关典章制度方面的文献资料,分类编排与叙述。唐杜佑通典、宋马端临文献通考、南宋郑樵通志,清续通典、续通志、续文献通考,清朝通典、清朝通志、清朝文献通考,刘锦藻清朝续文献通考,以上十部大书,著名的“”十通。还有一类断代型政书,记某一朝代或某一时期典章制度,称“会要”,如西汉会要等。,25,谢谢观赏,2019-8-17,(8
15、)表谱用编年、表格等形式来揭示时间概念或谱列历史事实的工具书。特点是眉目清晰,简要易查。纪年表:不同的纪年系列进行对照。如中国历史纪年表历表:将不同历法的年月日进行对照。大事年表:按年月编录大事,又称大事记。专门性表谱:为某学科、某专题、某人物编撰的表谱。如查官制历代职官表,查地理沿革历代地理沿革表,查人物历代人物年里碑传综表,个人年谱、年表等。,26,谢谢观赏,2019-8-17,(9)图录以图像为主体,辅以文字说明的工具书,又称图谱。地图:中国历史地图集历史地图:中国古代史参考图录文物图录:中国历代货币、中国古代服饰研究、中国版刻图录人物图录:明清人物肖像画选、中国历代名人图鉴、中国历代人
16、物图像集以及科技图录、艺术图录等,27,谢谢观赏,2019-8-17,6.全文数据库全文数据库是以原始文献为著录单元,文献中每个有意义的实词均可用作检索词,信息用户可得到文献的全文或其中的某些部分。全文数据为是近年来发展最快的检索工具,极受信息用户欢迎。7.搜索引擎以网页为著录单元,在Web中自动搜索信息(搜索网页上的单词和简短的特定的描述内容)并将其自动索引的Web服务器。为了搜集这些信息,网页搜索软件沿着Web的超链,搜索整个Web上的主页,将主页上的每个文字建立索引并返回集中管理的索引数据库,索引信息包括文档的Web地址、每个文档中单字出现的频率、位置等。,28,谢谢观赏,2019-8-
17、17,四、信息检索工具结构(一)手工检索工具结构一般由使用说明、目次表、正文、辅助索引、附录组成。(首次使用新检索工具,阅使用说明,并据所查的学科,利用目次表从分类途径查或利用索引中主题、著者等查)1.使用说明:有称凡例、包括编制目的、收录范围、著录格式、代号说明、使用举例及注意事项等,是用户使用前必读内容。2.目次表:检索工具的正文一般按分类组织编排,前面大多有详简不同的目次表,作为从分类查找文献的依据。,29,谢谢观赏,2019-8-17,3.正文:检索工具记录的不是文献的全文,仅著录文献的外部特征和内容特征,包括文献篇名、著者、出处或文摘等。4.辅助索引:检索工具正文只提供单一线性检索方
18、式,为了快、准、全地查找所需信息,检索工具都编有索引,提供从主题、著者、序号等多种途径检索所需信息。(掌握检索工具的实质就是熟悉各种辅助索引的使用方法)5.附录:主要是使用该检索工具时必须参考的一些内容,如引用期刊一览表、文献来源名称缩写与全称的对照表、缩略语的解释以及收藏单位代码等。,30,谢谢观赏,2019-8-17,(二)计算机检索工具结构一般由检索软件和数据库组成。检索软件确定了该检索工具的检索方式,规定了检索系统的检索算符,不同的计算机检索工具采用不同的检索软件。数据库主要由字段、记录、文档、帮助文件等组成。1.字段:是数据库最基本的著录单元。如题名、著者、文摘、主题词、关键词字段等
19、。每一个字段均有其标志符,其内容是字段值或属性值。,31,谢谢观赏,2019-8-17,2.记录:多个字段组成记录。不同数据库中其记录的字段数多少不同。记录是按一定标准格式化的,以便于计算机识别和存储。3.文档:经过有序化外理并附有检索标志的信息集合称为文档,包括顺排文档和倒排文档。顺排文档:又称线性文档,由每件信息的全记录按一定顺序组成,是数据为的主文档,相当于手工检索工具的正文部分。倒排文档:又称索引文档,将记录中可检索字段及其属性值提取出来,按一定的顺序组织起来,成为用作索引的文档。4.帮助文件:使用户了解数据库的使用方法。,32,谢谢观赏,2019-8-17,五、信息检索语言(一)检索
20、语言概念信息检索语言是信息资源存储和检索的共同语言。 其实质是从自然语言中精选出来并加以规范化的一套词汇符号,是概括信息资源内容特征或外在特征及相互关系的概念标识体系。它是用于描述信息系统中信息的内容特征及外部特征和表达用户信息提问的一种专门语言。它要求文献的标引者和检索者共同遵守。在信息存储时,检索语言用来描述信息的内容和外部特征,从而形成检索标识;在检索过程中,检索语言用来描述检索提问,然后形成提问标识。,33,谢谢观赏,2019-8-17,(二)信息检索语言种类1、按规范化(受控)程度划分,人工语言,人为对标引词和检索词加以控制和规范,使每个检索词只能表达一个概念,自然语言,直接从原始信
21、息中抽取出自由词作为检索点的检索语言,34,谢谢观赏,2019-8-17,2.按检索时组配方式,先组式语言,指在检索前检索词已按固定关系组配好,并编制在词表中,后组式语言,是指在检索前,检索词在词表中没有被预先组配,检索时用户可根据不同的检索需求对某些词进行任意组配,35,谢谢观赏,2019-8-17,3.按描述信息外部特征的检索语言划分是指文献信息的题名(书名、刊名、篇名)、著者姓名/单位名称、出版者、代码/序号(专利号、标准号、报告号)等,将不同的文献信息按照题名、著者等字顺进行排列或按报告号、专利号等顺序进行排列,就形成了以文献题名、著者、号码等检索途径来满足用户的需求的,用来描述文献特
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 检索 基础知识 通用 模板 课件

链接地址:https://www.31ppt.com/p-1457846.html