第二章信息检索的基本原理ppt课件.ppt
《第二章信息检索的基本原理ppt课件.ppt》由会员分享,可在线阅读,更多相关《第二章信息检索的基本原理ppt课件.ppt(83页珍藏版)》请在三一办公上搜索。
1、QQ群:186097216,目 录,第一节 信息检索的涵义及类型,第二节 信息与信息源,第三节 信息检索方法与步骤,第四节 信息检索效果的评价,4,1,2,3,第一节 信息检索的涵义及类型,信息检索的原理:就是将读者(用户)的信息需求与存贮在信息集合体中的信息进行比较和选择,即匹配(match)的过程。即对信息集合与需求的匹配与选择。,信息检索的类型根据信息检索对象形式不同,分为:,信息检索的类型根据信息储存媒体和检索手段不同,分为:,信息检索的类型 根据信息检索信息形式不同,分为:,检索的作用,1.与时俱进,跟踪所关注问题的最新动态2.节省查找信息的时间,提高学习或工作效率3.知识创新需要检
2、索信息,避免重复研究走弯路,找什么?,怎么找?,怎么利用?,信息资源的类型(类型、特点、作用),检索原理与技术(检索原理、方法和途径;常用数据库介绍、网上资源检索、特种文献检索等),分析、组织、管理,信息检索,第二节 信息与信息源,信息论的奠基人,美国数学家克劳德香农(Claude E. Shannon):“信息是用来消除不确定性的东西。”,控制论的创始人,美国科学家维纳(N. Wiener):“信息是人们在适应外部世界并使这种适应反作用于外部世界的过程中,同外部世界进行相互交换的内容的名称。”,中国学者钟义信:“信息是事物运动的状态与方式,是物质的一种属性。”,一、信息,(一)什么是信息?
3、(Information),(一)什么是信息“信息是事物运动的状态与方式,是物质的一种属性。”“信息”是我们的一个生存环境,吸收信息的内容和层次决定所处水平和层次,吸收与获得信息的层次越高越准确,则思考方式就越准确,找到问题的解决方案也就越准确,获得的物质与精神报酬就越来越高。,信息爆炸,信息的使用周期越来越短,可以进行加工和处理,必须依附于一定的载体才能流通和传递,是实现信息资源共享的基础,可被多个用户使用,信息,可被感知、获取、传递和利用,(二)信息的特征,二、信息源,信息源,顾名思义,就是信息的来源。联合国教科文组织出版的文献术语将其定义为:个人为满足其信息需要而获得信息的来源。表达方式
4、潜在信息资源-在认识和创造过程中储存在大脑中的信息资 源,不具有广泛传播和长久保存的能力,不 能被他人利用现实信息资源-表达后能为他人利用的资源,口语信息资源-讲演体语信息资源-舞蹈实物信息资源-文物文献信息资源-文字,第二节:信息源的主要类型,1、根据载体形式划分2、按结构等级(文献的加工程度)划分3、根据编辑出版形式划分,1、 根据载体形式划分,印刷型,缩微型,机读型,视听型,图 书,连续出版物,资 料,缩微平片,缩微胶卷,缩微胶片,磁带、磁盘,光 盘,联机网络版,录音带、录像带,唱片、幻灯片,电影胶卷,信息等级,2、按加工处理的深度划分,零次信息:普通网页,电子邮件等一次信息:以作者本人
5、的生产和科研工作为依据而创作的原始信息。如正式在期刊上发表的论文、专著等。二次信息:将分散无序的一次信息进行加工整理后,使之成为系统有序的信息。如数据库中的题录、目录、搜索引擎等。 三次信息:根据二次信息提供的线索,利用一次信息,经过调研、分析、综合而形成的。如百科全书、文献综述、进展报告等。,零次信息,未正式发表的口头、书面或电子形式的文献,也称为“半文献”。如私人笔记、文章草稿、会议记录、书信文稿及各种内部档案等。,网上零次信息,对应于网上信息资源,属于零次信息范畴的有:E-mail、BBS、QQ、NEWSgroup以及非专业权威网站上发布的信息等等。,零次信息的特点,数量多,内容新,更具
6、有启发性;信息反馈迅速、及时、准确;具有高度选择性和针对性;有限性和不可靠性,要特别提防虚假信息。,一次信息(多指一次文献),一次文献通常是指发表在正式出版的书刊上的的文献,一次文献通常是以作者自己的研究成果、工作经验和实践体会为原始依据而形成的,这类文献中包含有大量的最新信息。,一次文献的特点,内容比较具体、丰富,具有新颖性、创造性、系统性等特点;经过权威机构筛选,科学性基本有保证;可以回溯检索,不像新闻那样有时效性;由于数量巨大,往往检索困难。一般都是首先检索二次文献后,再去查阅一次文献。另外网上一次文献资源相对较少。,二次信息,是对一次文献加工、提炼和浓缩而成。 是将分散、无序的信息转变
7、成有序的、便于管理的系统。 包括目录、题录、文摘和索引等检索工具,可对一次文献进行报道和线索指引。 对应于网上信息资源,属于二次信息范畴的有题录数据库、网上图书馆目录等等。,二次信息的特点,具有浓缩性、汇集性、有序性等特点,检索方便,网上二次信息资源丰富;除网上图书馆目录可以免费获取外,大型数据库的检索一般均须付费;受加工和出版周期的影响,一般二次信息比一次文献要晚一段时间。,三次信息源,用科学方法和专业知识对一次文献和二次文献进行汇集、综合、分析、详述等深度加工而形成的。它包括手册、百科全书、年鉴、名录、指南等参考工具书。还有二次书目、指南以及综述性、评论性文献都属三次文献范畴。,三次文献的
8、特点,权威性强,一般读一篇综述即可了解某一领域某段时间的全部发展情况,对科研指导性强;资源相对稀少,没有专门的三次文献数据库,一般分散在二次文献数据库中,或字典、词典、辞典、百科全书、专题目录、数据手册等工具书中加工和出版周期更长,甚至可能比二次文献还晚数年。,一次信息,二次信息,三次信息,期刊论文,会议论文,科技报告,专利说明书,学位论文,标 准,目 录,文 摘,索 引,百科全书,手 册,年 鉴,词 典,综 述,述 评,记录,知识的产生,传播,信息的利用,某些数据库,信息级别示意图,几点启示,1、使用搜索引擎得到的零次文献较多,但这绝不是无用的文献,要善于从零次文献中获取有用信息,作为获取一
9、次文献的线索。2、写作论文必须依据一次和三次文献。著录格式则必须按二次文献的格式写作。3、检索信息主要靠二次文献,因此,熟悉二次文献的著录格式和检索点非常重要。4、三次文献是“关于文献的文献”,是最难写作的文献类型。论文文献综述恰恰属于此类。,.根据信息源的编辑出版形式划分,图 书,连续出版物,特种文献,普通图书,工具书,期刊型书籍,报 纸,期 刊,科技报告,专利文献,学位论文,标准规范,政府出版物,产品资料,会议文献,小结:十大信息源,(1)科技图书 (6)科技报告 (2)科技期刊 (7)政府出版物 (3)会议文献 (8)标准文献 (4)专利文献 (9)科技档案 (5)学位论文 (10)产品
10、样本,特种文献,第三节 信息检索途径与步骤,(一)信息检索的途径1、文献外部特征的检索途径(1)责任者途径(著者姓名途径)(2)题名途径(书名途径)(3)文献类型途径(4)代码途径(序号途径) 以文献的编号为特征,检索文献的途径。根据一些文献类型的特有标识,如科技报告的报告号;专利文献的专利号、入藏号,合同号,技术标准的标准号;ISSN,ISBN等作为检索点。,常用文献类型用单字母标识,具体如下:,(1)期刊J(journal) (2)专著M(monograph) (3)论文集C(collected papers) (4)学位论文D(dissertation) (5)专利P(patent) (
11、6)技术标准S(standardization) (7)报纸N(newspaper article) (8)科技报告R(report),各种文献的识别要素、特点与主要用途对比,各种文献的识别要素、特点与主要用途对比,国际通行的出版物代码,由13位阿拉伯数字组成,ISBN号具有专指性,唯一代表某种书的某一版本,2007年1月1日起正式使用13位ISBN号。,前缀号:国际物品编码协会( ENA)为图书分配的商品代码。目前使用978,预留979。组号:组号是国家、地区、语言或其他组织集团的代号。由国际书号中心(International ISBN agency)负责分配。中国组号为一位数字“7”。
12、出版社号:由国家标准书号中心负责分配,其位数视申请出版社图书出版量多少而异。 书序号:由出版社负责管理分配,每个出版社所出各种图书的序号校验号:是校验ISBN编号是否合法。,978-7-118-05497-2,前缀号,例:国际标准书号,(一)信息检索的途径,2、文献内容特征的检索途径(1)分类途径 是一种按照文献信息所属学科(专业)属性(类别)进行检索的途径。一般检索系统均提供数据库所使用的分类表的分类号索引。如:中国图书馆分类法(2)主题途径 是根据表达文献主题内容的主题词及其派生出的关键词为标识查找文献信息的途径。(3)分类主题途径 是分类途径与主题途径的结合,能够尽量避免两者的不足,取其
13、多长。(4)其他检索途径 出处途径 时间途径 任意词途径 专门术语途径,分类途径,描述文献内容特征,分类语言,主题语言,描述文献外部特征,著者,出版事项,代码/序号,标题词语言,自然语言,叙词语言,关键词语言,题名,检索语言,A 马克思主义、列宁主义、毛泽东思想、邓小平理论,B 哲学、宗教,C 社会科学总论D 政治、法律E 军 事F 经 济G 文化、科学、 教育、体育H 语言、文字I 文 学J 艺 术K 历史、地理,N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医学、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、安全科学,Z 综合
14、性图书,社 会 科 学,自 然 科 学,中图法(知识分类),(二)计算机检索技术,1、布尔逻辑检索 是应用布尔逻辑代数的原理设计的、应用于计算机信息检索系统的一种主流检索技术与方法。三种类型: 逻辑与( AND) 逻辑或( OR ) 逻辑非( NOT ),布尔逻辑检索,1) 逻辑“与”运算符:AND 或 *检索式: A AND B或A*B含 义:检出的信息中必须同时含有“A”和“B”两个检索词。提高检准率,增强检索专指性。,例:逻辑与(AND或*),计算机在图书馆的应用,计算机,图书馆,计算机 AND 图书馆,人类活动对群落多样性的影响 检索概念: 人类活动 群落多样性 影响 检索式 人类活动
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二章 信息检索的基本原理ppt课件 第二 信息 检索 基本原理 ppt 课件
链接地址:https://www.31ppt.com/p-1929902.html