信息检索与分析讲稿(1).docx
《信息检索与分析讲稿(1).docx》由会员分享,可在线阅读,更多相关《信息检索与分析讲稿(1).docx(18页珍藏版)》请在三一办公上搜索。
1、信息检索与分析讲稿(1)课程目录第一章 信息检索与分析理论基础 (4次)第二章 文献信息源及其数字化发展(4次)第三章 网络资源与搜索引擎(4次,其中2次上机;内容包括网络免费资源的获取和搜索引擎知识的介绍和运用)第四章 中文数据库的使用(6次,其中2次上机;主要以本馆数据库为讲授对象)第五章 外文数据库的使用(6次,其中2次上机;主要以本馆数据库为讲授对象)第六章 基于图书情报平台的信息检索(4次,其中2次上机;)第七章 文献信息的分析与利用(2次)第八章 个人文献信息管理软件介绍与利用(4次;其中2次上机)第九章 知识汇总与考试准备(2次)考试方式:统一考试(笔试、闭卷)作业网上学习方式:
2、下载课件和讲义的地址推荐网站:1、哈尔滨工业大学信息检索研究室2、中国科学院现代信息检索(Modern Information Retrieval) 3、吉林大学信息检索与利用网络课程4、复旦大学信息检索与利用http:/202.120.76.227/jiaoyanshi/dzjc/index.htm5、中文Web信息检索论坛(北京大学)http:/www.cwirf.org/6、大连理工大学信息检索研究室7、云南大学精品课程信息检索网站8、南京大学精品课程信息检索网站9、华东理工大学精品课程文献检索经典网站:1、中国国家图书馆2、中国科学院国家科学图书馆3、北京大学图书馆网站4、上海图书馆5
3、、浙江大学图书馆6、中文维基百科http:/zh.wikipedia.org/7、温州大学图书馆网站:参考文献:1.叶继元.信息检索导论.北京:电子工业出版社,2003年2.黄如花.网络信息的检索与利用. 武昌:武汉大学出版社,2002年3.叶鹰.信息检索:理论与方法.北京:高等教育出版社,2004年4.焦玉英等.信息检索. 武汉:武汉大学出版社,2002年5.马费成.信息管理学基础. 武汉:武汉大学出版社,2002年6.沈固朝.信息检索(多媒体)教程. 北京:高等教育出版社,2002年7.王知津.科技信息检索.天津:南开大学出版社,2002年8.信息检索与利用,鄢春根主编,人民邮电出版社 ,
4、2008年9.信息检索与利用,洪全主编,清华大学出版社,出版时间: 2007年10.信息资源检索与利用(第2版),林豪慧,孙丽芳主编, 电子工业出版社, 2007年导言 信息检索与分析解析一、对本课程的理解和解释:信息检索与分析1、信息检索课程的出现信息、能源和材料,并称为现代社会的三大支柱。20世纪以来,人类创生的信息量高速增长,浩如烟海。信息检索,就是从浩如烟海的信息海洋中查找出所需信息的过程。为实现这个过程是需要适当理论和方法的,信息检索课应运而生。2、信息检索(Information Retrieval)作为一门学科,信息检索历史可追溯到19世纪下半叶。但在20世纪中期以前,信息存储和
5、传播主要以纸质为载体,信息检索活动也是围绕和文献的获取和控制展开的,因此,信息检索研究关注的是如何检索利用文献中记载的信息,文献检索一度成为信息检索的同义词。现代意义的信息检索作为一个独立的领域,是1946年计算机出现后在国际上逐步得以确立的。3、信息检索教育教育部(当时是国家教委)1984年发出的“高教一字004号”文件要求在高等教育院校开设“文献检索与利用”课程。20余年来,文献检索教育尤其是手工检索教育方面已取得了很大的成绩。然而随着计算机、多媒体等信息技术的发展,以多种载体多种记录方式的非纸信息急剧的增加,靠“手翻、眼看、大脑判断”的手工检索模式已经难以适应信息社会的发展要求,计算机信
6、息检索应运而生;以Internet为代表的全球性计算机网络迅速发展和普及,更进一步的推动了信息检索的发展,使得网络化信息检索逐渐成为信息检索的主流。二、和信息检索相关的几个术语的解释和理解1、信息定义物质存在的一种方式,一般指数据、消息中所包含的意义。可以使消息中所描述的事件的不定性减少。(*注:中国情报与文献工作词汇基本术语(GB48944-85)有关信息的定义。据不完全统计,信息的定义有100多种,至今仍无法统一,为各界普遍认同。这种情况主要是由于信息本身的因素,以及认识层次上的差别造成的。不同的学科,从不同的角度对信息这个概念有不同的解释。经济学、心理学、新闻学和哲学的定义不同于图书情报
7、学对信息的定义。控制论专家N维纳(N. Norbert Wiener)从信息自身具有的内容属性给信息下定义被许多研究所引用。信息论的创始人申农(C.E.Shannon)1948年在通信的数学原理一文中将信息定义为“两次不定性之差”。国内在这方面也有许多争论。信息的定义之所以呈现多样化,主要原因有三:第一,信息本身的复杂性,它是一个多元化,多层次、多功能的综合物;第二,信息科学是一门新兴学科,它的许多分支学科仍在随着社会、经济和科学技术的发展而发展,其内涵和外延不很确切;第三,人们出于不同的研究和使用目的,从不同的角度或层次出发,对信息概念就会作出不同的解释。因此,许多学者建议将信息的要领分为不
8、同的层次来解释。在诸多层次中,最重要的是两个层次:一是没有任何约束条件的本体论层次,即信息是一种客观存在的现象,是事物的运动状态及其变化方式的表征,不受主体意志的影响。不停运动着的事物不断产生本体论意义上的信息;二是受主体约束的认识论层次,即信息就是主体所感知或所表述的事物运动状态及其变化方式,是反映出来的客观事物的属性。例子:信息的要领是十分广泛的,世间万物的运动,人间万象的更迭,都离不开信息的作用。据说上古时期,诺亚的方舟在洪水中飘荡许久,当放出的飞鸽衔回一束橄榄,意味着带回了洪水已退的信息。那么李太白的诗“日照香炉生紫烟,遥看瀑布挂前川,飞直下三千尺,疑是银河落花流水九天。”给我们带来的
9、显然就是庐山瀑布的信息;苏东坡的词“大江东去,浪淘尽,千古风流人物。”给我们传递的是赤壁怀古的信息。从自然界角度看,表征物质的属性:地球昼夜的变化是一种信息,它反映出地球绕太阳自转的运动特性和状态;山的高度是一种信息,它反映出山的空间特性;树干的年轮是一种住处它反映了树木成长的时间特性树龄;闪电是一种信息,它反映了云层中所含能量的不知所云 性;花的香味也是一种信息,它反映了花分子结构的化学特性等等。)2、知识是人类的主观世界对客观世界概括和反映,是大量有组织的信息,是关于事实和思想的有组织的陈述。提供某种经过思考的判断和某种实验的结果。(1)知识的分类根据国际经济合作与发展组织(OCED)出版
10、的以知识为基础的经济报告:第一类 “知事(Know-what)”,指关于事实方面的知识,也可理解为Know-when、Know-where;即在什么样的时间(Know-when)、什么样的地点或条件下(Know-where)能解决什么样的问题第二类 “知因(Know-why)”,指自然原理和规律方面的科学理论,知识的生产是在专门研究机构如实验室和大学完成的;第三类 “知道怎样做的知识(Know-how)”,指做某些事情的技艺和能力,被称为技术情报和商业秘密,其典型是企业开发和保存于其内部的技术诀窍或专有技术;第四类 “谁以及是怎样创造知识的(Know-who)”侧重创造思想、方法、手段、过程以
11、及特点等的了解。还有一种分类:把知识分为显性知识(Explicit Knowledge)和隐性知识(Tacit Knowledge)。所谓显性知识是指经过人的整理和组织后,可以编码化和度量,并以文字、公式、计算机程序等形式表现出来,还可以通过正式的、系统化的方式(如出版物、计算机网络等)加以传播,便于其他人掌握的知识。典型的显性知识主要是指以专利、科学发明和特殊技术等形式存在的知识,它是有载体的、可以表达的,OECD的分类中“知事(Know-what)”和“知因(Know-why)”;隐性知识是与人结合在一起的经验性知识,很难编码化,并将其文字化或者公式化,它们本质上以人为载体,因此难以通过常
12、规的方法收集到它,也难以通过常规的信息工具进行传播。隐性知识往往是个人或组织经过长期积累而拥有的知识,通常不易用语言表达,也不可能传播给别人或传播起来非常困难。例如:技术高超的厨师或艺术家可能达到世界水平,却很难将自己的技术或技巧表达出来从而将其传播给别人或与别人共享。隐性知识对应的是OECD中的关于Know-how和Know-who的知识,其特点是不易被认识到、不易衡量其价值、不易被其他人所理解和掌握。(2)知识的来源第一类是人脑之中,以主观意识存在,只有当以一定的形式,通过一定的载体表达时,才能为其他人所感知;第二类是存在于实物之中,如古文物、样品、样机、物品等。人们可以通过研究实物而获得
13、某种知识;第三类是用文字、图形、代码、符号、声频、视频等技术手段记录在一定的载体之上,例如刻在甲骨上、印在纸张上等,这就是文献。3、文献是记录有知识的一切载体。(*注目前有关文献的较权威的定义主要有两个,一是文献情报术语国际标准(草案)(ISODIS5127)的定义,“为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录到唱片上,或存贮在磁盘上。这种附着在各种载体上的记录统称为文献。” 另一个是中国的国家标准。是各种媒介和形式的信息集合,包括文字、声像印刷品、电子信息、数据库等。)文献的构成要素(1)文献信息是
14、文献的内容(2)符号系统是信息的携带者(*注:文字已不再是表达思想的唯一手段,图形、声频、视频等同样成为表达思想、传递感情的重要手段。总的说来,文献中的符号系统指图画、文字、公式、图表、编码、声像和电磁信息等。)(3)载体是符号赖以依附的“寄主”(*注:随着生产力的发展,存贮和表达人们思想的物质载体不同了,从金石、竹简、羊皮、丝帛、纸张发展到用感光介质和磁性介质。从非人工材质的泥版、岩石、石板、兽骨、木板、竹片、 兽皮、树叶、桦树皮等到各种人工材质,如无机材质(陶、砖瓦、瓷,玻璃等)、金属材质(青铜、铁、铝、金银等)、高分子材质(帛、纸、胶片、醋酸纤维等)、复合材质(磁带、光盘等)。纸质文献已
15、经多得不便于快速传输信息、高效查阅和高密度存贮了,于是其他介质的文献应运而生,这些文献主要包括:纸质文献具有价格低廉、质地柔软、易于书写、携带和收藏等其它一些载体所无法比拟的性能而成为文献家族的主干。)(4)记录方式是将文献的符号进入载体的方法和过程(*注:按记录方法分可有手工记录、机械记录、光记录、电记录、声记录和磁记录。其中最常见的是印刷。随着科技的发展,文字记录可以转变为数据记录,并用电子方法存贮到磁介质上去。此外,还有光学字符识别(Optical Character Recognition,简称OCR)技术就代表了这种崭新的技术,它通过光学方法对字符、标记表示的书面数据进行自动识别,转
16、换成机器可以处理的信息,这样就实现了纸质文献信息向电子信息的转换,而且可以通过不同接口装置向不同设备输入数据,这些设备进而与通信网络相连,实现远距离数据传送。)4、信息、知识与文献的关系(1)区别信息,有形的、独立于行动和决策、经过处理改变形态、物质产品、与环境无关、可以复制;知识,无形的、与行动和决策相关、经过处理改变思维、精神产品、环境改变涵义、经过学习才能转让、无法复制。”(2)联系知识是有组织的大量的信息,获得知识有赖于获得信息;信息是知识得以形成和传播的中介,而不是知识本身,知识是经过精心研究、领会后的有用信息,是人类对信息加工处理后的产物;并非所有信息都可成为知识,在信息时代,源于
17、众多复杂客体的大量信息,只有借助于现代化的信息手段,并通过掌握现代信息科学技术的认知主体,才能真正转化为知识。(*注:例如,人们对于卫星照片,气象云团的识读能力是不同的,所获得的信息的量和质将会有差别。)传递运用后事物运动知识新的信息信息产生人脑有序化用于实践文 献记录在载体上信息、知识与文献的关系关系示意图5、信息素质信息素质(information literacy)是一个综合性的概念,包含信息意识,信息技能,信息道德。信息社会人们必须具备的素质,也是当今素质教育一个重要方面。(1)信息意识 是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力。(*注
18、:同样重要的信息,有的人善于抓住,有的人却漠然视之。这是由于各人的信息意识强弱不同。信息技能的掌握在很大程度上取决于信息意识的提高。信息意识的强烈与否对能否挖掘出有价值的信息、对文献获取能力的提高起着关键的作用。日本人在这方面做得非常好,例如:大庆油田事件。)(2)信息能力(信息技能) 寻求有关新知识的能力。 具体表现为以下6种技能:明确任务(Task Definition):了解问题的症结,确定所需信息和目的,分清任务的轻重缓急; 信息查询策略(Information Seeking Strategies):了解各种信息源,能够作出评价并确定优先查找的次序; 查找和检索(Location a
19、nd Access):确定信息藏址,从信息源中找出信息; 信息利用(Use of Information):能够读懂(或听懂、理解)查出的信息,了解信息在满足需求中的特定价值; 信息综合(Synthesis):能够组织信息,提供信息产品(论文、报告等); 信息评价(Evaluation):评价查找结果和解决问题的过程(效率)。 (3)信息道德信息道德指人们在信息活动中应遵循的道德规范。信息犯罪运用信息技术故意实施的严重危害社会并应负刑事责任的行为。三、信息检索的概念信息检索(Information Retrieval)是在1949年国际数学会议上由Galvin W. Mooers 在把信息检索
20、看作是时间性的通讯一文中首次提出的。信息检索的概念有狭义和广义之分:(1)狭义的检索是指依据一定的方法,从已经组织好的大量有关信息集合中,查找并获取特定的相关信息的过程。这里的信息集合,不是通常所指的信息本身,而是关于文献的信息或文献的线索。 (2)广义的检索包括信息的存储和检索两个过程(Storage and Retrieval)。信息存储是将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的数据库或检索系统,供人们检索和利用。而检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定
21、信息。四、信息检索与分析意义和作用 现代科技的发展,每时每刻都有新的发明创造,信息也出现新陈代谢加快、老化加剧、使用寿命缩短的趋势。而现代信息技术的发展,特别是计算机技术、电子技术、远程通讯技术、光盘技术、网络技术发展,使信息的载体从传统的纸质印刷型媒介向光学、磁性媒介发展,信息的传递速度越来越快,传播面也越来越广,信息检索手段越来越先进。面对爆炸式增长的信息量,信息检索是进行科学研究必不可少的手段之一 。如何从这浩如烟海的信息中找出所需信息,是信息检索的重任。充分利用信息资源,避免重复劳动 :积累、继承和借鉴前人的研究成果是科技发展的重要前提,在研究工作中,任何一个项目从选题、实验研究或设计
22、,到成果鉴定,每一步都离不开信息。只有充分掌握了有关信息,才能避免重复,少走弯路,保证研究工作在尽可能高的层次上起步,并缩短研究周期。更新自身知识积累,适应社会发展需要 :掌握信息检索的方法与技能,是形成合理知识和更新知识的重要手段,是做到无师自通、不断进取的主要途径。 信息检索基础理论一、信息检索及其发展1、信息检索信息检索(Information Retrieval)是在1949年国际数学会议上由Galvin W. Mooers首次在把信息检索看作是时间性的通讯论文中提出的。一句话概括信息检索的基本原理:信息检索是对信息集合与需求集合的匹配和选择。信息检索基本原理示意图需求集合:人们为了满
23、足某种需求时,感到需要补充知识,因此产生了对信息的需求。信息集合:是有关某一领域的文献或数据的集合体,它是一种公共知识结构,可能弥补用户的知识结构缺陷。匹配和选择:是一种机制,负责把需求集合和信息集合进行比较,然后根据一定的标准选出需求的信息。2、信息检索的发展阶段(1)手工检索(18761954)(2)脱机批处理检索(1954-1965)(3)联机检索(1965-1991)(4)网络化联机检索(1991今)3、信息检索发展的趋势(1)深度:传统西西检索向全文本、多媒体、多载体、多原理等新型信息检索的发展,在深度上提高管理和组织信息的能力,如探索自动抽词、自动索引、自动检索、自动文摘、自动分类
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 检索 分析 讲稿

链接地址:https://www.31ppt.com/p-1851901.html