《第9章 网络信息资源管理要点课件.ppt》由会员分享,可在线阅读,更多相关《第9章 网络信息资源管理要点课件.ppt(59页珍藏版)》请在三一办公上搜索。
1、57,1,第九章 网络信息资源管理,9.1 网络信息资源概述 9.2 网络信息资源管理的相关技术 9.3 网络信息资源的检索 9.4 网络信息资源管理与应用,57,2,网络信息资源有哪些?网站,社区,微博网络信息资源的获取网络信息资源的传输网络信息资源的存储网络信息资源的分析网络信息资源的使用网络信息资源的维护,57,3,9.1 网络信息资源概述,目前关于信息资源的含义有很多不同的解释,但归纳起来主要有两种:一是侠义的理解,认为信息资源就是指文献资源或者数据资源,或者各种媒介和形式的信息的集合,包括文字,声像,印刷品,电子信息,数据库等,这都是限于信息本身。二是广义的理解,认为信息资源是信息活
2、动中各种要素的总称,包含了信息相关的人员,设备,技术和资金等各种资源。,57,4,网络信息资源可以理解为“通过计算机网络可以利用的各种信息资源的总和”。作为知识经济时代的产物,网络信息资源也称虚拟信息资源,它是以数字化形式记录的、以多媒体形式表达的、存储在网络计算机的磁介质,光介质以及各类通讯介质上,并通过计算机网络进行传递信息内容的集合。简言之,网络信息资源就是通过计算机网络可以利用的各种信息资源的总和。,57,5,9.1 网络信息资源概述,网络信息资源有狭义与广义之分。狭义的网络信息资源通常指在各种网络(包括互联网、局域网)上可以利用的、能满足广大用户科研与工作需求的各种信息资源的总和。广
3、义的网络信息资源指所有互联网上的信息资源,包括技术,各种设备、标准规范等,,57,6,9.1.1 网络信息资源的分类与组织,网络信息资源的特点网络信息资源作为一种新型的信息源,有不同于传统信息资源的特点,主要表现在数量、结构、分布、类型、传播范围、载体形态、控制方式等方面。,57,7,以网络为传播媒体传播迅速,数量大,增长快内容丰富、形式多样信息组织的局部有序性与整体无序性并存信息质量良莠不齐结构复杂、分布广泛信息资源组织方式非线性化分布式存储、但关联程度强,9.1.1 网络信息资源的分类与组织,57,8,9.1.1 网络信息资源的分类与组织,网络信息资源的分类网上信息资源浩如烟海,可以从不同
4、的角度进行划分和归类。依据不同的标准,网络信息资源可分成不同的类型,较典型的有如下几种。 按信息资源的媒体形式,分为:文本信息图片信息。音频信息视频信息三维虚拟影像,57,9,9.1.1 网络信息资源的分类与组织,按照人类信息交流方式,可将网络信息资源分为:非正式出版信息半正式出版信息正式出版信息。按信息内容的表现形式和用途,可分为:全文型的 事实型的数值型实时活动型其他类型:如图形、音乐、影视、广告等各种媒体,57,10,9.1.1 网络信息资源的分类与组织,按信息来源划分,可分为政府信息资源公众信息资源商用信息资源按信息时效划分,可分为电子邮件型信息资源图书馆目录资源书目与索引资源全文资料
5、及电子出版物资源数据库信息资源,57,11,9.1.1 网络信息资源的分类与组织,按网络传输协议划分,可分为www信息资源 Telnet 信息资源 FTP 信息资源 用户服务组信息资源 Gopher 信息资源 其他分类方法IDG Book World Wide1996 年出版的WWW指南就将网络信息资源进行混合分类,它以学科领域为依据将网络信息资源分为57 类日本的户田慎一把网络信息资源分成 7 类 网络信息资源按信息源提供信息的加工深度分,可分为一次信息源、二次信息源、三次信息源等,57,12,网络信息资源的组织是指人们根据网络信息本身的特征,运用各种工具和方法,对网络信息资源进行加工、整理
6、、排列、组合,使之有序化、系统化、规律化,从而利于网络信息的存储、传播、检索、利用,以满足人们的网络信息需求的活动过程。网络是网络信息资源的载体,由于载体的特殊性而呈现出独特的组织形式。有学者结合网络信息资源组织开发形式的现状,将网络信息资源组织与开发形式归纳为超文本方式、搜索引擎方式、指引库方式、元数据方式、图书馆编目方式等。,9.1.2网络信息资源的组织方式,57,13,9.1.2 网络信息资源的组织方式,文件方式文件方式是网上数字化信息资源的一种主要存储形式。以文件方式组织网络信息资源有如下优势简单易操作文件是存储非结构化信息的单位,57,14,9.1.2 网络信息资源的组织方式,文件方
7、式是网络信息资源组织的简单方式。随着网络信息、资源利用的不断普及和信息量的不断增多,以文件为单位共享和传输信息的不足逐步显现。随着网络信息资源利用的普及和信息量的增加,以文件来传递信息会使得网络的负载量越来越大。对结构化信息组织与管理显得不足。随着以文件形式保存和管理的信息资源的增多,文件本身也需要作为对象来管理。,57,15,9.1.2 网络信息资源的组织方式,超文本方式超文本是一种将网上相关文本的信息有机地组织在一起,以节点为基本单位,节点间以链路相连,将信息组织为网状结构的组织方式。人们可以通过高度链接的网络在各种信息库中自由航行,找到所需要的各种媒体形式的信息。超媒体的优势在于:非线性
8、编排,符合人们思维联想和跳跃的习惯;节点中的内容可多可少,结构可以任意伸缩,具有良好的包容性和扩充性;可组织各类媒体的信息,方便地描述和建立各媒体信息之间的语义联系,超越了媒体类型对信息组织的限制;通过链路浏览的方式搜索信息,将信息控制机制融合进系统数据中,避免了检索语言的复杂性。,57,16,9.1.2 网络信息资源的组织方式,超文本方式同样有它的局限性 :它在文本之间的来回跳跃链接,很容易打断读者的思路,分散读者的注意力,甚至可能使读者被五花八门的链接牵着鼻子走而偏离了信息浏览查询的初衷。 由于超文本方式本身的特点,一组逻辑与联系较强的信息往往由各个节点,多个web页组成,从而导致用户在浏
9、览和查询时,难以从整体上把握节点和页面的完整的逻辑关系,检索结果往往失去整体性和全局性。 很难保存遍历过程中所有的历史记录,故无法在需要时立即返回到曾经浏览过的某一节点,即出现“迷航”现象。,57,17,9.1.2 网络信息资源的组织方式,数据库方式所谓数据库方式,就是将网络信息资源以固定的记录格式存储,并提供一些检索入口,用户通过检索入口,就可以找到所需要的信息线索,并利用超级链接功能直接链接到相关站点或一次信息本身的方式。利用数据库技术组织网络信息资源具有如下优势 对大量的结构化数据的处理效率有了很大的提高 数据的最小存取单位是信息项(字段),可以根据用户需求灵活地改变查询结果集合的大小,
10、从而大大降低了网络数据传输的负载 以数据库技术为基础已建立了大量的信息系统,形成了一整套系统分析、设计与实施的方法,为人们建立网络信息系统提供了现成的经验和模式,57,18,9.1.2 网络信息资源的组织方式,以数据库方式组织网络信息资源,其不足之处在于:对非结构化信息的处理困难较大,对网络环境中日益增加的多媒体信息及表格程序、大文本等非结构化信息的组织处理能力较差无法有效处理结构日益复杂的信息单元 缺乏直观性和人机交互性 为了满足利用数据库技术处理非结构化文本信息的需要,人们试图对全文文本进行结构化处理,并用数据库技术对经过处理的文本信息进行管理,称之为“全文数据库”。,57,19,9.1.
11、2 网络信息资源的组织方式,搜索引擎方式 自动搜寻工具主要有自动搜寻网络资源、自动索引、自动摘要、提供检索方法和用户界面等功能。由于是自动搜寻,故这种方式的不足之处是收录的信息良莠不齐耗费大量的计算机资源查全率高但查准率低搜索引擎“命中”的网上一次信息动辄上百成千,因此越来越多的搜索引擎提供二次检索功能,以及对检索结构进行再处理的功能。,57,20,9.1.2 网络信息资源的组织方式,目录指南方式 目录指南方式,又可称为主题树方式,组织信息资源的方法是将信息资源按照某种事先确定的主题分门别类地加以组织,用户通过浏览的方式层层遍历,直到找到所需的信息的线索,再链接到相应的网页。 目录指南方式的优
12、点是信息的专题性较强,信息质量高,且能较好地满足族性检索的要求用户按照规定的范围和分类体系,逐级查看,按图索骥,目的性强,查准率高 屏蔽了网络资源系统相对于用户的复杂性,提供了一个基于树浏览的简单易用的网络信息检索与利用界面,并且具有严密的系统性和良好的可扩充性,57,21,9.1.2 网络信息资源的组织方式,目录指南方式的不足主要体现在 :很难确定一个全面的范畴体系作为目录指南结构的基础来涵盖所有的网络信息资源。用户为了迅速地找到所需信息还须对相应的体系有较全面的了解,这就增加了用户的智力负担。 要保证目录结构的清晰性,每一类目下的条目也不宜过多,这就大大限制了所能容纳网络信息资源的数量。因
13、此,目录指南结构不适合建立大型的综合性的网络资源系统 。但在建立专业性或示范性的网络信息资源体系时,就显示出其结构清晰、使用方便的优点。,57,22,9.1.2 网络信息资源的组织方式,图书馆编目方式 目前,图书馆编目已成为一种组织网络信息资源的重要方式,它用传统的机读目录格式来组织整理网络信息资源。网上资源编目需要精干的咨询机构、自动化系统的专门知识、馆藏发展与参考部门的共同合作,才能为用户提供最为有效的目录产品。采用馆内合作的方式对网上资源进行编目,分为三个步骤:由负责馆藏建设的馆员选择网上资源,填写“网络资源著录申请表”;由编目人员根据 MARC/AACRII对网上资源进行编目;由自动化
14、系统工作人员将确切的网址和检索方式添加到856 字段中。由于网上信息常常修改、变动,故人们要时刻关注 856 字段相关内容的变化,这并不是一件容易的事。,57,23,9.1.2 网络信息资源的组织方式,数据库与超媒体结合方式 数据库技术与超媒体技术的结合,是网络信息资源组织与开发技术的发展趋势 两者的结合途径从当前来看,通常是将数据库作为超媒体系统的一个节点来进行处理。在这种方式中,数据库看成超媒体系统中一个独立的特殊节点,由特殊的链接将数据库节点和其他的超媒体节点相连。其具体实现方法有: CGI (Common Gateway Inter-face)方法 Web API (Applicati
15、on Program Interface)方式 Active X技术 JDBC(Java Database Connectivity)技术,57,24,9.1.2 网络信息资源的组织方式,从网络信息组织对象的范围看,网络信息组织的模式可以划分为4个层次: 第一个层次为微观的组织模式第二个层次为中观的组织模式,第三个层次为宏观的组织模式,第四个层次为对网络信息进行分布式组织的数字图书馆,其组织的资源己经远远超出网上信息的范围。,57,25,9.1.3 网络信息资源组织的三个层次,语法信息、语义信息和语用信息分别对应着信息的形式、内容和效用三个层次,与此相关,语法信息组织、语义信息组织和语用信息组
16、织也就形成了网络信息组织方法的三个层次。语法信息组织是以信息的形式特征为依据序化信息的方法。语义信息组织是以信息的内容或本质特征为依据序化信息的方法。 语用信息的组织是以信息的效用特征为依据序化信息的方法。,57,26,9.1.4信息系统资源组织的发展趋势,理想的网络信息组织模式应是以用户为中心,遵循系统性、实用性、易用性原则,综合运用自然语言和人工语言,充分利用新兴技术和人们经验的积累,朝着更符合用户需要的方向发展。网络信息资源组织模式的发展呈现在以下几个方面。信息描述标准化 组织技术智能化 用户界面可视化 组织方法多样化 面向内容的信息组织 面向对象的信息组织 组织活动合作化,57,27,
17、9.2网络信息资源管理的相关技术,超文本标记语言(HTML)HTML是一个简单的标记语言,它主要用来描述Web文档的结构, HTML文档由两部分组成:一种是HTML标记(tag);另一种是普通文本。,57,28,9.2网络信息资源管理的相关技术,HTML的弊端主要表现在:难以扩展交互性差语义性差 是一种表示技术,它包含了关于如何显示信息的标签,但是标签和数据是结合在一起的,很难进行分割 不允许用户对数据进行变换以便进一步进行处理 对数据只提供了一个“视图,如果你想要得到不同的视图的话,你必须重新生成一个HTML网页;格式既不适合机器分析也不适合人阅读它的源码,而且它的格式要求比较松散,HTML
18、解释器采用的是尽量解释的机制。,57,29,9.2网络信息资源管理的相关技术,可扩展标记语言(XML)XML的组成元素 模式(Schema) 可扩展样式语言(XSL,Extensible stylesheet Language) 可扩展链接语言(XLL,Extensible Link Language) XML是建立在数据由它的创建者和维护者管理这一信念的基础上的,对于那些准备提供内容的个人或团体将可以从中得到最好的数据格式服务。因此,它被认为是“21世纪Web领域的世界语”。,57,30,9.2网络信息资源管理的相关技术,XML的出现大大弥补了HTML和SGML的局限性,主要表现在: XML
19、可以用于本地计算的数据 XML可以为用户提供正确的结构化数据视图 XML允许集成不同来源的结构化数据 XML描述来自多种应用程序的数据 XML通过粒度更新来提高性能 XML的特点 跨平台性 自描述性 灵活性,57,31,9.2网络信息资源管理的相关技术,XML的优势 设计与特定领域有关的标记语言 异质系统间的通信开发灵活的Web应用软件 在Web上发布数据 更有意义和更准确的搜索 提供多语种支持,57,32,9.2网络信息资源管理的相关技术,元数据(Metadata) 元数据的概念:元数据即英文的Metadata。是关于数据的数据(data about data)。 IFLA将Metadata
20、定义为:“描述数据的数据,可用来协助对网络电子资源的辨识、描述、指示其位置的任何数据”。 目前出现了很多种元数据规范 ,还有许许多多应用于各个专业领域的Metadata标准 。在众多的元数据标准中,都柏林核心元数据已成为国际上最通用的元数据,也是万维网联盟( W3C)推荐的元数据标准口。,57,33,9.2网络信息资源管理的相关技术,元数据在网络信息资源整合方面的作用有: 描述(Description)定位(Location) 发现(Discovery) 评估(Evaluation) 选择(Selection) 从系统的角度审视元数据,元数据的功能还包括提供浏览及检索的功能、管理功能以及组合各
21、个对象以及藏品的再呈现等。,57,34,9.2网络信息资源管理的相关技术,资源描述框架(RDF) 资源描述框架Resource Description Framework,简称RDF应运而生,为多种元数据的交互操作性提供平台。资源描述框架使用XML作为交换和加工元数据的通用语法。 RDF是由W3C组织开发的一种元数据格式,它的模型结构包括资源(Resources)、属性(Properties)和声明(statement)三种对象,采用“资源一属性一属性值”的“主谓宾”结构(或称三元组),提供一种框架容器,并通过XML定义了一套形式化的方法,为机器语义理解的结构基础。,57,35,9.2网络信息
22、资源管理的相关技术,目前RDF应用于:资源发现,以使搜索引擎功能更强定位(Location) 智能软件,实现知识的共享与互换 描述站点及其相关的内容,即站点编目等RDF有两个重要特点:独立性 ,它可以嵌入DC元数据,也可以嵌入别的类型的元数据。 使用XML作为其描述语法,xML摒弃了SGML过于复杂及不利于在Web上传送的选项功能,又弥补了HTML过于简单的不足,是目前最具发展前景的标记语言。,57,36,9.2网络信息资源管理的相关技术,本体(Ontology)Studer等认为ontology是共享概念模型的明确的形式化规范说明。这包含4层含义:概念模型(conceptualization
23、)明确(explicit)形式化(formal)共享(share)Ontology的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义。,57,37,9.3.1 网络信息资源的检索,网络信息检索自身的特点主要表现在:必须借助网络检索工具。基于超文本结构。检索方法的多样性。多媒体检索。,57,38,9.3.1 网络信息资源的检索,网络信息检索的一般步骤有七个主要过程:明确检索需求。确定检索范围。确定有效的检索词。构造合适的检索表达式。选择合适的检索工具。正式检索。评价检索结果。,57,39,9
24、.3.1 网络信息资源的检索,网络信息资源的一般查询方法有:基于超文本的信息检索基于目录的信息检索基于搜索引擎的信息检索,57,40,9.3.1 网络信息资源的检索,影响网络信息检索的因素:信息资源质量检索软件用户水平等,57,41,9.3.1 网络信息资源的检索,信息资源质量对信息检索的影响 :信息资源收集不完整、不系统、不科学,导致信息检索必须多次进行,造成人力、物力和时间上的浪费。信息资源加工处理不规范、不标准、使信息检索的查全率、查准率下降。信息资源分散、无序、更换、消亡无法预测,因此用户无法判断网上有多少信息同自己需求有关,检索评价标准无法确定。,57,42,9.3.1 网络信息资源
25、的检索,信息资源由于版权和知识产权问题,也给信息检索带来麻烦。信息的语言障碍问题。,57,43,9.3.1 网络信息资源的检索,检索软件对信息检索的影响 :互联网上的信息存放地址转换和更名频繁,根据检索工具检索的结果并不一定就能获得相应的内容。基于一个较广定义的检索项,往往会获得数以千万计的检索结果,而使用户难于选择真正所需的信息。每种检索工具虽然仅收集各自范围内的信息资源,但也难免使各种检索工具的信息资源出现交叉重复现象。,57,44,9.3.1 网络信息资源的检索,用户水平对信息检索的影响 :用户对信息检索需求的理解和检索策略的制定关系到信息检索的质量。用户的计算机操作能力及网络相关知识的
26、掌握程度影响着信息检索的效率。用户对网络信息检索工具的应用熟练程度影响着信息检索的效果。用户的外语水平影响着信息检索的广度与深度。,57,45,9.3.2 网络检索工具,搜索引擎是一种信息搜索的软件。狭义理解,它是利用网络自动搜索技术(Robot)对网络资源进行搜集、标引、储存和检索的一种技术和系统。广义上,搜索引擎可以看作是提供搜索和分类导航信息查询服务的一系列网站。,57,46,9.3.2 网络检索工具,搜索引擎的类型(按检索机制划分) :检索型搜索引擎 :以信息查询、检索为主目录型搜索引擎 :以分类目录导航为主混合型搜索引擎 :分类目录和关键词检索并重评价搜索引擎的优劣查询时间短、命中率
27、高、重复率低,57,47,9.3.2 网络检索工具,网络信息检索工具的核心是其检索功能。从现有的检索工具来看,它们都已具备诸如布尔检索、截词检索和邻近检索这些基本检索功能。,57,48,9.3.2 网络检索工具,布尔检索指通过标准的布尔逻辑关系词来表达检索词与检索词间逻辑关系的检索方法。 截词检索指在检索式中用专门符号(截词符号)表示检索词的某一部分允许有一定的词形变化,因此检索词的不变部分加上由截词符号所代表的任何变化形式所构成的词汇都是合法检索词,结果中只要包含其中任意一个就满足检索要求。,57,49,9.3.2 网络检索工具,邻近检索(proximity search):通过检索式中的专
28、门符号来规定检索词在结果中的相对位置。 准字段检索 :虽然网络信息实际上不分字段,但是以万维网为用户界面的网络信息检索工具设计了类似于字段检索的功能 。许多网络检索工具可让用户选择是否要求分辨检索词的大小写。区分大小写检索功能尤其有助于对专有名词的查询。,57,50,9.3.2 网络检索工具,高级检索功能:加权检索自然语言检索 相关信息反馈检索 模糊检索 概念检索,57,51,9.3.2 网络检索工具,与检索相关的功能 :检索提问的修改与限制 按相关度排列结果 检索与浏览相结合 检索结果的翻译和多语种检索,57,52,9.3.2 网络检索工具,英文综合型网络信息检索工具 :检索型网络信息检索工
29、具 浏览型网络信息检索工具 集合型网络检索工具,57,53,9.3.2 网络检索工具,中文网络信息检索工具 :雅虎-Yahoo!中文版: http:/ 天网: http:/:8000/hbindes.htm 新浪网:http:/ 百度:http:/,57,54,9.3.2 网络检索工具,地图、地理信息的网络检索工具 : MapBlast: http:/ 既反映它收录的信息是地图,又体现了其创始者的雄心壮志,要为用户提供疾风般的地图信息服务。 MapQuest: http:/ 主要服务包括地图查找、驾驶线路、旅游导游,另外有购买地图、免费会员服务、商业机构查询、地图及相关产品与服务。,57,55
30、,9.4.1数字图书馆,数字图书馆的基本要素包括:数字图书馆不是一个简单的图书馆实体;数字图书馆需要用多种技术连接众多资源;数字图书馆和信息服务之间的连接对终端用户是透明的;数字图书馆的目标是为广泛地存取和利用信息服务;数字图书馆的馆藏并不局限于文献替代品,它们延展到了不能以印刷形式表现或传递的数字化制品。,57,56,9.4.1数字图书馆,数字图书馆是用来描述网络环境下数字化信息资源的体系结构。数字图书馆属于以现代通信与网络技术为基础的信息服务业的范畴。作为一种分布式的数字化信息资源系统,它把各种不同载体、不同地理位置的信息资源用数字技术进行采集、组织,以网络方式提供持续、有效的信息存取服务
31、。数字图书馆的基本特征是信息资源的数字化、信息存取的网络化和分布式的信息资源管理。,57,57,9.4.2 图书馆中的网络信息资源,图书馆中的网络信息资源 :网络数据库(Online Databases) 联机公共查询目录(online Public Access Catalogue) 电子图书(Electronic Books) 电子期刊(Electronic Journals),57,58,9.4.2 图书馆中的网络信息资源,各类网络数据库是联机存取信息资源的主体。 目前,许多图书馆、学术机构都纷纷在网上创建网站,并将馆藏机读目录库放在主页上供用户免费查询,用户通过查询各个图书馆、学术机构的OPAC,即可得到原文的收藏地。国内的网上图书馆公共目录收录的基本上是单个图书馆的馆藏目录,而在国际上己有超越单个图书馆的网上公共目录可供查询。,57,59,9.4.2 图书馆中的网络信息资源,Internet上的电子图书越来越多,电子图书涉及的领域也越来越广泛,包括文学、艺术、科学、人文等各个领域。一些大型的出版商如:方正Apabi、博库、书生之家、超星数字图书馆等都提供有大量的电子图书,用户通过在线浏览,可以很方便地进行阅读。 许多期刊出版商在出版印刷型期刊的同时,也纷纷在网上抢滩设点。,
链接地址:https://www.31ppt.com/p-1525693.html