信息检索基础 课件.ppt
《信息检索基础 课件.ppt》由会员分享,可在线阅读,更多相关《信息检索基础 课件.ppt(53页珍藏版)》请在三一办公上搜索。
1、第2章 信息检索基础,以知识经济为显著特征的信息社会已经成为社会发展的趋势。人类社会的发展,科技技术的进步都离不开信息资源的开发利用。 我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。,2.1.1 信息的定义: 申农:信息是用来消除随机不确定性的东西。从哲学的角度理解:1)从本体论角度考虑,信息是一种客观存在的现象,是事物的运动状态及其变化方式。2)从认识论层次出发,即信息就是主体所感知或所表述的事物运动状态及其变化方式,是反映出来的客观事物的属性。一般性说法:具有新的内容、新知识的消息、情报,以及语言、文字、图形等所揭示的内容。,信息含义的广义和狭义之分(王立清): 广义的信息
2、指自然界和一切人类活动所传达出来的信号和消息,是事物表现的一种普遍形式。 狭义的信息指经过搜集、记录、处理和存储的可供检索的文献、数据和事实。它是人类对客观事物的认识,是实践经验的总结,是认识的结果,是我们检索的对象。,第2章 文献信息概论,1. 时效性(收、发、更新速度)2. 可扩散性 (传递性、传播媒介、信息网络)3. 可扩充性(信息的积极和扩充是无限的)4. 可替代性(物质形态的转变)5. 可共享性(不因分享而减少,便于共享) 社会进步赋予信息更丰富的内涵,信息的膨胀与人们对其需求的激增,使信息成为当今社会生的一大支柱,成为一种与能源、材料并存的重要资源。,2.1.2 信息的特点,1.1
3、.3 信息分类,依据信息的产生,可以分为社会信息和自然信息,依据信息的运动状态,可以分为自在信息、自为信息和再生信息,第2章 文献信息概论,2.2知识及其分类,2.2.1 知识的含义 是人类社会实践的总结,是人的主观世界对客观世界的概况和如实反映; 是人类在改造客观世界实践中所获得的认识和经验的总和,是信息的一部分; 是人类科学认识世界、改造世界的力量。 狭义理解:是一种有组织的经验、价值观、相关信息和洞察力的结合,是关于事实与思想的陈述。简言之,知识是经过人脑加工处理过的、系统化的信息,是有组织的信息。,2.2.2 知识的类型知事(Know-what)关于事实的知识:如文秘速录专业在那些行业
4、就业?知因(Know-why)关于科学原理和自然科学方面的知识。知如(Know-how)关于做事的技巧和能力,如秘诀或窍门。知谁(know-who)关于谁知道什么和谁如何做什么的信息。检索知识( know-where ):它是一种如何在知识与信息的海洋中寻觅、获取、利用信息资源的知识。是一种获取知识的方法。,2.2.3 文献人类的信息、知识的存在形式基本上有三种:1)存在于人脑的记忆中,属于人们主观精神世界的东西;2)存在于实物中,如古文物、样品、物品等,人们通过研究实物获得某种知识;3)用文字、图形、代码、符号、声频、视频等技术手段记录在一定的载体上,如甲骨上、纸、胶片、光盘、磁盘等载体上,
5、这就是文献。 文献记录和反映着社会发展、科学技术的成就及水平,汇集着世世代代的广大人民群众对自然界认识的结晶,记录无数的成功或失败的经验教训,反映着人类的文明程度,是人类进步的重要基础。,2.2.4信息、知识与文献的关系,事物发生发出信息;信息经人脑加工变为知识 信息只有经过加工,上升为对自然和社会发展客观规律的认识,才构成知识。知识被记录形成文献;文献经传递、应用于理论与实践产生新的信息。,2.4信息社会和信息财富,2.4.1信息社会的特点:信息总量剧增,多媒体技术和信息高速公路网络被广泛应用,成为信息社会的重要表征,同时,信息渗入到社会生活的各个角落,影响和改变了人们的生活和生存方式。一个
6、国家的信息化程度,代表着其社会生产力的发展水平,也决定着这个国家在下一个世纪中存在与发展的实力和地位,而国家的信息化需要大批具有信息素质的创造性人才。,2.4.2 信息财富,物质、能量、信息是现代社会发展的三大支柱,缺一不可,而信息资源起着主导作用.人类财富观:古代农业社会农业财富观、货币财富观。工业社会股票成为这一时期的财富代言。20世纪50年代以来信息资源成为财富的象征。,2.5 信息查询与利用的重要性,数字化时代生存的基本技能:是终身学习的技能,即具有较强的信息发现、吸收、创新能力。在信息时代一个人生存的质量如何取决于其信息化程度与信息素质能力的高低。在信息社会中,个人的信息获取能力,会
7、对个人的事业成功、经济收入、社会地位即个人的生存能力产生直接的影响,信息获取能力的差异有可能形成社会中信息富有和信息贫穷的对立的不平等情形:一部分人因拥有知识及技巧而能在许多方面处于有利地位,另一部分人则有可能陷入不利境地。,2.6 信息检索概述,1信息检索的概念广义的信息检索:是将信息按一定的方式组织和存储起来, 并根据信息用户的需要找出有关信息的过程和技术。全称为“信息存储与检索”。狭义的信息检索:指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻。2信息检索的本质 是信息用户的需求和信息集合的比较与选择,即匹配(match)的过程。用户根据检索需求,对
8、一定的信息集合采用一定的技术手段,根据一定的线索与准则找出相关的信息。,3.信息检索方式(1)根据信息的存储载体和检索技术手段的不同分类手工检索:传统检索方法,是指手工翻检的方式,利用工具书等各种印刷版的检索工具(包括文本式目录、文摘、索引以及各种卡片等)来检索信息的一种手段。适用于纸质印刷的书刊文献。例如:计算机应用文摘、电子科技文摘等。计算机检索:使用的是检索系统。系统包括计算机设备、终端、通信设施、数据库和检索、应用软件等。检索是针对数据库进行的。即利用计算机检索系统从数据库中检索所需文献信息。 例如:Dialog、Ei、ISTP、万方数据资源系统等。,(2)根据检索对象形式的不同分类,
9、文献检索:是一种相关检索,凡以文献(包括文摘、题录或全文)为检索对象的检索,一般它不直接解答用户所提出的技术问题本身,只提供与之相关的文献供用户参考。例如:检索北京交大的作者2005年发表的科技文献被SCI、Ei、ISTP收录的情况。数据或事实检索:是一种确定性检索,凡以数据或事实为检索对象的, 直接回答用户提出的技术问题,提供用户所需要的确切数据或事实。检索结果一般是确定性的有或无,对或错。例如:查找“行”字的古体写法、读音各有几种?查找某年度诺贝尔物理学奖的得主情况? 文献检索文献检索工具或系统间接或直接答案(文献)信息检索 数据或事实检索参考工具书或系统直接答案(数据、事实),2.7科技
10、文献的类型与识别,传统的图书馆是专用于典藏书籍的处所,其收藏的主要是纸本文献。随着科技的迅速发展,现代的记录形式和出版方式有了很大变化,“图书”这个概念已经不能囊括当前所有的出版物。今天,人们将数据、期刊、资料等出版物统称为“文献”,图书馆文献资源类型的划分标准纷繁复杂,这里主要介绍三种划分方法。根据文献的载体形式划分按文献的结构等级(文献的加工程度)划分根据文献的编辑出版形式划分,2.7.1按物质载体和记录形式划分,1.印刷型 主要指以纸张为载体,通过印刷手段把负载知识的文字固化在纸上。2.缩微型 以感光材料为载体,以光学缩微技术为记录手段 。3.声像型 以磁性、感光材料为载体,直接记录声音
11、、图像的一种文献。4.机读型 利用计算机进行存储和阅读的一种文献形式。5.手写型 古代各种非印刷型文献如甲骨、简策、帛书等以及还没有正式付印的手稿。,2.7.2 按出版形式和内容划分,1. 图书2. 期刊3. 报纸4. 专利5. 标准6. 学位论文7. 科技报告8. 会议论文9. 政府出版物10.产品样品资料11.技术档案,1. 图书,按照联合国教科文组织的定义,图书是指50页以上的以印刷方式单本刊行的出版物。包括专著、汇编本、多卷本、丛书等。1.形式特征 图书的著录格式反映其形式特征 见表1-1【实例】 在参考文献列表里,图书的著录格式是: 美R.霍克著.Internet通用搜索引擎检索指南
12、.沈阳:辽宁科学技术出版社.2003.2.ISBN 7-5381-3849-8,表1-1,1.图书,2)内容特征优点: 图书的内容全面系统,基础理论性强,论点成熟可靠。缺点: 图书的撰写、编辑、出版所需要的时间较长,传递信息速度慢,内容相对陈旧。适用范围: 如果需要对大范围问题获得一般性知识,对陌生问题进行一般了解,对熟悉问题进行历史 性的全面系统的回顾,查阅图书一般来说是行之有效的办法。,1.图书,3)图书类型 图书按其用途可分为三种类型: (1)阅读用书 (2)参考工具书 是供人们释疑解难、翻检查考的出版物。 【实例】参考工具书中国大百科全书是我国现阶段最大的一部综合性百科全书,主要用来检
13、索中外百科知识和当代科学发展水平。(3)检索用书 是以图书形式刊行的书目、题录、文摘等,是供人们查找一定范围内信息线索的出版物。 【实例】我国历史上最大的一部官修目录四库全书基本收入了我国先秦至清代传世的重要古典文献。四库全书编纂时,存目和著录的书都在各书卷首写上一篇提要,后将这些提要汇集起来,加以审改,辑成四库全书总目提要一书,分经、史、子、集四大类,下分细目,具有检索作用。,2.期刊,期刊也称杂志,是“一种以印刷形式或其他形式逐次刊行的,通常有数字或年月顺序编号,并打算无限期地连续出版下去的出版物” 1)形式特征 有相对固定的名称和版式、有连续出版的时间顺序标识即出版年、月、卷、期号。【实
14、例】 图1-1所示期刊中国科学论坛有固定的ISSN号“1883-036X” ,国内统一刊号(C N 号)“62-3699”。,图1-1,2.期刊期刊论文的著录格式,【实例】在EBSCO数据库的期刊论文著录格式如下: China Investment:Which Way To Profit? By: Wang Yong; Chen WenBeijing Review,11/6/2003,Vol46 Issue 45,p10,4p, 1c;(AN 11588866)【实例】在参考文献列表里,期刊论文的著录格式是: 刘志强我国农业生态环境可持续发展评价及对策J农业系统科学与综合研究,200l,17(
15、3):24-26 【实例】英文参考文献格式: Fan LJ and BM Hu. 2000. A comparative study on three methods of estimating discrimination of test sites for the best genotypes. J.Biomathematics(China), 15(2):175-179(in Chinese) 其中“J.”是“Journal of”的缩写。“J.Biomathematics”是生物数学杂志。因此需要检索J of Biomathematics获取原文。,2. 期刊,2、内容特征(1)内容新
16、颖,能及时反映最新研究成果和动态。(2)信息量大,发行与流通面广,便于获取。(3)按期连续出版,便于研究者长期跟踪研究。,2.期刊,3)类型期刊按其性质和用途不同,可分为:(1) 学术性与技术性期刊 主要刊登科学研究和生产方面的学术论文、研究报告、会议论文、实验报告等原始文献。(2) 检索性期刊 以期刊的形式出版的专供人们用于查找文献线索的一类刊物。(3) 其他期刊 包括快报性刊物、资料性刊物等。例如:The Kiplinger Agricultural Letter。,3.报纸,1)定义 以刊载新闻和评论为主的出版周期较短的定期连续性出版物。2)特点 传递信息快,信息量大,现实感强,传播面广
17、,具有群众性和通俗性,是重要的社会舆论工具和情报源。3)分类 按出版发行周期分为: 日报、双日报、周报等 按内容分为: 时事政治类、科技类、商业类、文教类等。,4. 专利,专利是专利制度的产物,广义上是指所有与专利有关的资料。狭义上的专利文献仅指专利说明书 1)形式特征 【实例】图1-2是一篇中国专利信息的著录格式:2)内容特征 内容新颖、技术性强、实用性强并具有法律效力等特点。 它是寓技术、法律和经济于一体的带有启发性的一种重要文献信息。,图1-2,5. 标准,标准又称为规范1)形式特征 标准编号(标准号)是由“标准代号+顺序号+年代号”组成。2)内容特征(1)法律约束力(2)从技术的新颖程
18、度看,当前的标准往往是5年前最新的专利。也有少数专利很快成为标准。,GB 7907-87 (核桃丰产与坚果品质) 标准名称 标准发布年号 标准顺序号标准代号,5. 标准,3)类型 (1)按照使用范围划分 中华人民共和国标准化法将我国标准分为国家标准、行业标准、地方标准、企业标准四级。 【实例】 标准号“GB/T 15310.3-1994”表示1994年的国家推荐性标准。 (2)按照内容特点划分 方法标准 【实例】 GB/T 19497-2004 农业车辆牵引车上钩型机械连接装置试验方法和要求。 术语标准 【实例】 GB/T 167861997 术语工作 计算机应用 数据类目,6.学位论文,学位
19、论文是高等院校或研究机构的学生为获取某种学位而撰写的学术论文。按学位的不同分为学士论文、硕士论文和博士论文。 形式特征 【实例】 图1-3是学位论文数据库收录的湖南大学的一篇硕士论文首页,图1-3,6.学位论文,【实例】参考文献列表中的学位论文著录格式: 熊回香.网络信息检索及其发展趋势研究(全文);硕士;华中师范大学;20030501【实例】外文印刷型学位论文文摘的著录格式:122:229172tSynthesis and Characterization of magnesium aluminum phosphates, and related compounds. Shea, Wei-L
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息检索基础 课件 信息 检索 基础

链接地址:https://www.31ppt.com/p-1523295.html