数字图书馆的体系结构.ppt
《数字图书馆的体系结构.ppt》由会员分享,可在线阅读,更多相关《数字图书馆的体系结构.ppt(42页珍藏版)》请在三一办公上搜索。
1、第3章 数字图书馆的体系结构,教学目标:了解数字图书馆的体系结构的重要性;理解数字图书馆体系结构的发展变化;同时分析数字图书馆所具的通用功能模块以及相 应的技术。,教学要求,第3章 数字图书馆的体系结构,3.1基础结构,数字图书馆在硬软件基础之上在内容与功能上的融合 具体体现:数字图书馆总是处在最为复杂的和先进的系统系统之中数字图书馆之间的互操作被认为是最具挑战性的研究工作数字图书馆(DL)、数字图书馆系统(DLS)、数字图书馆管理系统(DLMS),以及它们之间的关系:数字图书馆管理系统是一个通常的软件系统,从两方面提供合适的软件结构:制造和管理具有基本功能的数字图书馆系统整合额外软件为数字图
2、书馆提供更精确的、专门的、高级的功能,3.1基础结构,三层结构即浏览器/Web服务器/数据库服务器(B/S/D)的引入解决了两层的不足,相比两层结构具有以下优势:客户端零维护;可扩展性好安全性好资源重用性好三层结构典型的应用是基于Z39.50协议的数字图书馆结构,该结构如图3.2所示。,3.1基础结构,IBM提出了三角形客户机/服务器模型的数字图书馆体系架构,该体系结构主要包括图书馆服务器、对象服务器以及客户机,核心是图书馆服务器,如图3.3.图3.3 IBM数字图书馆三角形结构,3.1基础结构,数字图书馆体系结构的八条原则:数字图书馆技术框架应该服务与经济、法律和社会框架,入对知识产权的保护
3、与支持等;数字图书馆概念基于术语的统一;数字图书馆的基础体系结构应与其中保护的内容分离;名字和标识符是数字图书馆的基本构件;数字图书馆对象不仅包括内容数据,还包括元数据;数字图书馆对象的使用、存储和传输形态可能完全不同;仓储必须妥善管理其存储的信息;用户需要知识作品,它通常是数字对象集合。,3.1基础结构,数字图书馆的体系结构描述为:用户界面、句柄系统、搜索引擎系统、资源库系统四个部分如图3.4示。图3.4 数字图书馆结构组成要素,3.1基础结构,图书馆生命周期模型:该层次模型说明了社会因素、系统因素与信息因素共同搭建数字图书馆的基石,在该基石上进行图书馆引进、探索、整合、传播、使用等业务工作
4、,如图3.5。同时,他在生命周期模型基础上描述了数字图书馆的综合模型,该模型充分考虑生命周期模型中的社会因素、系统因素、信息因素,在此基础上进行设计、实施、评估数字图书馆,并以技术为核心,考虑怎样由理想世界转到现实世界。该模型可看做数字图书馆的综合模型,为后续数字图书馆的建设提供启示。,3.2分布式结构,中间件结构:图3.6 中间件结构 中间件平台产品很多,基于目的和实现机制的不同,可以将平台分为:远程过程调用(Remote Procedure Call)、面向消息的中间件(Message-Oriented Middleware)、对象请求代理(Object Request Brokers)。
5、,3.2分布式结构,远程过程调用(RPC):远程过程调用是一种广泛使用的分布式应用程序处理方法;一个应用程序使用RPC来“远程”执行一个位于不同地址空间里的过程,并且从效果上看和执行本地调用相同。一个RPC应用分为两个部分:server和clientserver提供一个或多个远程过程;client向server发出远程调用;server和client可以位于同一台计算机,也可以位于不同的计算机,甚至运行在不同的操作系统之上它们通过网络进行通讯相应的stub和运行支持提供数据转换和通讯服务,从而屏蔽不同的操作系统和网络协议。,3.2分布式结构,面向消息的中间件(MOM):面向消息的中间件指的是利
6、用高效可靠的消息传递机制进行平台无关的数据交流,并基于数据通信来进行分布式系统的集成;通过提供消息传递和消息排队模型,它可在分布环境下扩展进程间的通信,并支持多通讯协议、语言、应用程序、硬件和软件平台;目前流行的MOM中间件产品有IBM的MQSeries、BEA的MessageQ等。,3.2分布式结构,对象请求代理(ORB):随着对象技术与分布式计算技术的发展,两者相互结合形成了分布对象计算,并发展为当今软件技术的主流方向;1990年底,对象管理集团OMG 首次推出对象管理结构OMA(Object Management Architecture),对象请求代理(Object Request B
7、roker)是这个模型的核心组件。它的作用在于提供一个通信框架,透明地在异构的分布计算环境中传递对象请求;CORBA规范包括了ORB的所有标准接口;1991年推出的CORBA1.1定义了接口描述语言OMG IDL和支持Client/Server对象在具体的ORB上进行互操作的API;CORBA 2.0规范描述的是不同厂商提供的ORB之间的互操作。,3.2分布式结构,目前中间件的技术规范有DCE体系、DTP模型、J2EE、CORBA、互联网规范等.DCE体系:DCE(Distrbuted Computing Environment)由Open Software Fondation制定,现在这个组
8、织被称为Open Group。DCE由多个共同在一起工作的组件组成:远程过程调用(RPC)本地和全局目录服务(CDS和GDS)安全服务DCE线程分布式时钟服务(DTS)和分布式文件服务(DFC)线程、RPC、CDS、安全服务和DTS组件通常被成为安全核心,并且是组成任何DCE环境所必须的组件,DTS是可选件。DCE环境中,还包括用于管理这些组件的管理工具DCE被称做中间件或使其具有能力的技术,它不是独立存在的,而是被捆绑在供应商操作系统中,或者由第三方供应商进行集成。,3.2分布式结构,DTP模型:DTP模型是X/OPEN组织提出的一种软件结构,这种结构允许多个应用程序去共享多个资源管理器提供
9、的资源,并且具有协调全局事物的能力。X/OPEN是一个独立的、具有全球影响力的开放系统组织,它得到了世界大多数的最大的信息系统供应商的支持,其根本任务是通过规范开放系统的具体实现,从计算的观点考虑如何让用户获得更大的利益。X/OPEN的DTP模型的组成:由应用程序资源管理器(RM)事物管理器(TP)通信资源管理器(CRM)等基本模块组成,各个模块之间X/OPEN模型定义了这样一些模块与模块之间的接口规范。,3.2分布式结构,CORBA:CORBA是Common Object Request Broker Architecture的缩写,简称公共对象请求代理结构,它由国际对象管理组织OMG制定,
10、这个组织是一个国际性组织,始建于1989年,现已拥有包括生产厂商与软件开发商800多个会员;其目的是在分布和已构计算机环境下为应用软件的开发提供一个公共框架,使开发出来的软件即面向对象又具有可重用性、可移植性以及可操作性等特点。,3.2分布式结构,J2EE:J2EE是Java 2 Platform Enterprise Edition的缩写,是一种多层应用模式的结构体系整个规范由SUN公司提出,它将业务逻辑从系统服务功能和用户界面中分离出去,放置在客户层和应用基础设施这两层之间的中间层,是目前应用的最为广泛的面向Web的应用系统结构规范。Web:Web是一种网络化的信息资源,它依赖于3个基础机
11、制,使这些信息资源可以面对广大的使用者:一种唯一的命名机制,为网上的资源进行定位,如URI;一种通信规程,以便在网上可以存取这些被命名的资源,如HTTP;混合文本,以便更好地驾御这些信息资源,如HTML。,3.2分布式结构,数字图书馆为解决分布式异构互操作问题主要采用中间件互操作协议,一些主要的互操作协议有Z39.50、OAI、Dienst、Emerge、SDLIP等。下面介绍应用广泛的两种协议Z39.50与OAI。Z39.50:Z39.50是一个美国国家标准,基于ISO的OSI(开放系统互联)参考模型的应用层协议,目的是为了信息系统的开放互联,将个系统的不同数据库软件,不同数据描述格式、访问
12、方式建立一个抽象、通用的用户视图,将各个系统的具体实现映射到抽象模型上,使不同的系统在一个相互理解的、标准的通信平台上进行交互,满足互操作的需要;Z39.50采用了客户机/服务器的灵活架构,定义了所提供的服务和应用层数据包格式两方面的内容;信息服务包括11项内容:初始化、搜索、获取、删除结果集、访问控制、记帐、排序、浏览、解释(获得细节)、扩展服务(如周期搜索计划)、终止等。Z39.50最初由美国国会图书馆、OCLC、美国研究图书馆集团(RLG)等机构之间实现数据交换;在1988年推出第一版;1992年和1995年分别推出了第二版和第三版;1998年成为ISO23950国际标准;2001年和2
13、003年又修订了两个版本;2003年推出第五版:Z39.50:2003.,3.2分布式结构,OAI:全称为OAI-PMH(Open Archives Initiative Protocol for Metadata Harvesting)由美国数字图书馆联盟(DLF)、网络信息联盟(CNF)等组织于1999年提出的一个应用框架;最初目的是为了解决电子期刊的预印本的互操作和元数据收割(metadata harvesting)问题;2000年OAI协议的应用扩展到数字图书馆领域,目的是实现分散的、不同系统平台之间的元数据交换和共享,提高系统的互操作能力;OAI分为OAI 服务提供者与数据提供者两部
14、分;以OAI协议为基础的联合目录架构中,主要由OAI的服务提供者定期的向数据提供者主动抓取其中的元数据,建立集中的元数据联合目录;由于OAI是建立在HTTP协议上的应用层协议,所以其命令集是通过HTTP发送OAI给相应的服务器端程序的,服务器根据指令准备数据返回相应的记录集合,记录集合是遵循OAI协议的XML Schema的XML的格式数据服务提供者集中维护从各个系统中抓取来的元数据,并在获得的元数据上建立增值服务;数据提供者主要维护特定范围的数字资源,并且支持OAI协议来获取其中资源的内容,3.2分布式结构,OAI的结构图 图3.7 OAI协议结构,3.2分布式结构,EU-NSF联合数字图书
15、馆研讨会专门讨论了分布系统互操作性问题,提出了一个分布式数字图书馆参考框架,它由三个功能层构成:第一层为数字图书馆客户系统(Digital Library Clients),包括用户界面、自然语言处理、检索式分析处理、专门数据内容处理和浏览、多重数据结果处理等客户模块,经过用户界面客户通过一定机制调用;第二层为协调调解层(Coordinator/Mediator),在外部功能模块和元数据登记系统支持下对分布和异构的资源进行虚拟化整合,支持对分布式资源的透明利用;第三层是数据资源层(Data Sources),各个数据资源作为自主系统,支持本地客户及本地功能,同时通过封装件和代理模块与协调调解层
16、连接,从而被集成到整个分布式数字图书馆体系中。,3.2分布式结构,EU-NSF 分布式数字图书馆参考框架:图3.8 EU-NSF 分布式数字图书馆参考框架,3.2分布式结构,分布式异构结构在数字图书馆建设领域著名的应用案例是NCSTRL和NSDL。NCSTRL:NCSTRL(Networked Computer Science Technical Reference Library)是有代表性的数字图书馆建设项目,它是由DARPA资助的,来自北美、欧洲和亚洲的160多家学术研究机构参与了该项目;体系结构以Dienst体系结构为基础,该体系结构的一个重要特征就是分布式搜索;NSDL NSDL(N
17、ationalSTEM Digital Library,STEMScience,Technology,Engineering and Mathematics)是NSF资助的、由多家单位来实施数字图书馆项目,它包括64个子项目;其目的是支持科学、技术、工程和数学教育,提供广泛接入和方便使用的分布式资源网络和学习机制;NSDL一期工程已于2002年底为公众提供服务,它是目前规模最大的数字图书馆项目;由于NSDL的内容和用户的多样性,为让各种用户共享不同的信息,最初的体系结构设计就是通过共享元数据,并利用元数据开发核心服务。,3.2分布式结构,NCSTRL体系结构,3.2分布式结构,斯坦福大学基于C
18、ORBA技术开发出了InfoBus中间件,InfoBus方案并专注于实现异构系统的互操作,提出了多达5层的独立服务:互操作层、元数据结构层、搜索协议层、通用支付接口和可互操作的权限管理框架,为在现有技术环境下实现数字图书馆进行了全面的探索,提供了一整套复杂的分布式结构模型,该结构模型如图3.10示。图中IC表示客户接口,PM表示协议机,LS表示图书馆服务,IS表示信息资源,IPS表示信息处理服务。InfoBus模型是一个虚拟的总线结构,各异构的仓储、服务与界面如同插件一样插入总线集成一起。个对象系统间的交互协议为DLIOP,实现夸仓储的信息访问与查找,由一个元数据结构来实现对新增用户界面及查询
19、翻译的支持。异构的仓储封装在图书馆服务代理中,并向客户程序屏蔽其异构件。组建到总线中的图书馆服务提供所需的功能,如查询翻译、元数据工具、权限管理等。,3.3新一代体系结构,2004年6月在意大利召开的“数字图书馆的体系结构:对等网、网格和面向服务”会议中,学者围绕网格(grid)、对等网(peer to peer network,p2p)与面向服务(service-oriented architecture,SOA)等技术讨论构建数字图书馆新体系结构问题。德国的Ingo Frommholz在”supporting information access in next generation di
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图书馆 体系结构
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5984602.html