分布式软件体系结构.doc
《分布式软件体系结构.doc》由会员分享,可在线阅读,更多相关《分布式软件体系结构.doc(114页珍藏版)》请在三一办公上搜索。
1、分布式软件体系结构编写目标:l 面向计算机专业高年级本科生与研究生的教程。l 可供从事基于Internet/Intranet的分布式软件开发人员参考使用。要求读者:l 已掌握面向对象程序设计方法与一门面向对象程序设计语言(Java最佳)。l 具备软件工程的基本知识。总体构思:l 强调理论与实践相结合:理论上以CORBA 2.4为模型,实践中以VisiBroker for Java 4.0为工具。l 强调深度与广度相结合:重点介绍CORBA的同时,兼顾DCOM与EJB两种模型,最后总结对比这三种典型体系结构的特点。主要内容:l 分布式计算的基本概念:从C/S过渡到分布式体系结构、OMA体系结构、
2、CORBA基本概念。l 分布式应用程序的开发:分布式应用程序框架、用IDL编写对象接口、编写服务程序与客户程序、部署应用程序。l 分布式计算更深入的课题:探讨分布式应用程序的可靠性、伸缩性、安全性、性能等课题可能提出的问题以及解决途径。l 不同体系结构的比较:总结CORBA、DCOM、EJB、XML等特点。l 配合教学需要的内容:在前言部分提供教学进度供参考,每一章后均配有课后练习思考题和上机实习题。引 言分布式计算是当前软件开发技术的一个重要发展方向。C.A.R.Hoare指出:“分布式计算是一个具有重大理论与实践意义的迷人课题,其迷人之处在于理论与实践的同步发展,一方面实践推动了理论,另一
3、方面理论又指导着实践。”本书为读者介绍分布式计算领域的基本概念、开发过程、规范标准等内容。分布式计算有两种典型的应用途径。第一种应用途径是将分布式软件系统看作直接反映了现实世界中的分布性,例如当今许多业务处理流程通常呈现一种分布式运作方式,负责加工或制造的工厂可能位于珠江三角洲一带,而负责销售与市场营销的部门则可能分别位于北京、上海和广州,这时负责业务流程的软件系统也可作相应的分布式处理。第二种应用途径主要用于改进某些应用程序的运行性能,使它们比单进程的集中式实现更具有效率,此时软件系统的分布性并不是现实世界中分布性的映射,而是为充分利用额外的计算资源而人为引入的。在计算机硬件技术与网络通信技
4、术的支持下,应用需求驱使计算机软件的规模与复杂度不断增长。面对这种情况,对整个软件系统的体系结构进行分析与设计就远远重要于对算法与数据结构的选择。软件体系结构关心的正是整个软件系统的结构,它决定了一个软件系统由什么样的组件组成,以及这些组件之间的交互关系如何。典型的软件体系结构风格有设计图形用户界面常用的事件驱动风格、操作系统常用的层次化设计、设计编译程序常用的管道与过滤器风格、许多应用程序都会使用的面向对象风格等。分布式软件系统通常基于客户机服务器风格,其中客户程序提出信息或服务的请示,而服务程序提供这些信息或服务。客户机服务器计算模型的发展大约经历了三个里程碑:局域网文件服务器、数据库服务
5、器以及分布式对象。由于当前面向对象技术几乎已渗透到软件开发的每一个角落,先进的分布式软件开发方法当然离不开与面向对象技术的结合,因而分布式软件体系结构通常是客户机服务器风格与面向对象风格的有效组合,典型的例子有OMG的公共对象请求代理体系结构(CORBA)、Microsoft的分布式组件对象模型(DCOM)、Sun Microsystems的企业JavaBeans(EJB)等。在这些模型中,CORBA以其规范的严格性、供应商的无关性和其他许多先进的分布式计算特性成为我们教学的首选。在理论教学方面,我们可参考OMG发布的一系列规范和关于CORBA的丰富读物;在课程实验方面,我们既可下载使用ION
6、A Orbix、Inprise VisiBroker等商品化CORBA产品的30或60天试用版,也可使用OmniORB、TAO等免费CORBA产品。相对于其他分布式计算模型而言,CORBA在理论更为严格与完善,即使读者采用的开发平台未必是CORBA兼容的,CORBA中提出的许多问题也应加以考虑,并可借鉴CORBA提出的问题解决方案。本书从软件体系结构的角度介绍分布式软件系统分析与设计的基本概念,描述了分布式软件的开发与布署过程,并探讨分布式软件的可靠性、性能、可伸缩性等高级概念。本书的主要内容分为四个部分。第一部分“基本概念”介绍分布式计算中的基本概念与基本原理,从客户机服务器计算模型过渡到真
7、正的分布式计算模型,并掌握OMA与CORBA的基本概念。为避免为传统集中式软件的开发人员一次性引入太多分布式对象计算的新概念,我们需要一个过渡性介绍以实现循序渐进的教学目标,Java RMI以其简单性与实用性自然进入我们的视野。第二部分“开发过程”首先利用一个完整而简单的分布式应用例子程序介绍一个典型CORBA应用程序的开发过程,然后详细讨论如何利用接口定义语言(OMG IDL)编写对象接口,如何编写服务端程序与客户端程序,以及如何部署最终的应用程序。第三部分“高级课题”探讨分布式应用程序中的高级课题,提出可能产生的问题以及这些问题的可能解决途径,包括分布式环境下对象查找、如何提高分布式应用程
8、序的可靠性、如何提高服务端程序的可伸缩性等。第四部分“其他与展望”通过简介与对比其他分布式体系结构(如DCOM、EJB、XML等)拓宽读者在分布式计算领域的知识面,探讨分布式计算进一步的发展方向。本书可供从事基于InternetIntranet的分布式软件开发人员参考使用,也可作为计算机专业高年级本科生与研究生学习分布式计算课程的教材。本书假设读者已掌握面向对象程序设计方法与Java语言,并具备面向对象软件工程的基本知识。如果选用本书作为授课教材,对具有面向对象程序设计基础并熟练掌握C+和Java语言的学生宜讲授60课内学时,安排课外实验36学时,教学进度安排可参考如下(括号中分别标明了课内学
9、时数与课外实验学时数):第1章(66)、第2章(40)、第3章(46)、第4章(40)、第5章(86)、第6章(66)、第7章(20)、第8章(20)、第9章(40)、第10章(60)、第11章(66)、第12章(46),第四部分的第13至15章(40)。对于不熟悉Java语言和Web应用的学生宜讲授80课内学时,安排课外实验40学时。本书课后练习中规模较大或复杂性较高的题目以星号“*”标出,这些题目适合作为课程设计的选题。在即将由ACMIEEE-CS修订发布的计算教学大纲2001(CC2001)中,“以网络为中心的计算(NC)”已成为14个知识领域之一,其中包含客户机服务器计算、开发Web应
10、用、通信与网络、分布式对象系统、协作技术与群件等专题。本书内容覆盖了该知识领域的许多专题。本书中所有例子程序均使用Inprise公司的VisiBroker for Java 4.0和WebGain公司的VisualCaf Enterprise Edition 4.0平台开发,这些例子很容易移植到其他开发平台。读者可从我们的教学网站下载这些例子程序的全部源代码。分布式软件系统是软件开发的一个新兴领域,并且各种分布式计算模型还在不断地迅速发展。由于作者水平有限,书中谬误之处在所难免,恳请广大读者不吝批评指正。李文军(lnslwj)周晓聪(lndcs01)李师贤(lnslsx)2001年5月于广州康
11、乐园第一部分 基本概念第 1 章 客户机服务器体系结构本章利用Java语言的远程方法调用RMI与数据库接口JDBC开发一个简单的电话计费查询分布式应用程序,通过这个完整的例子帮助读者复习客户机服务器体系结构的基本概念,并分析与探讨该应用程序需要进一步考虑与改进的不足之处,从而引出分布式软件体系结构要解决的问题。 1.1 软件设计的基本概念 1.1.1 隐式地 vs 显式地隐式地(implicitly)与显式地(explicitily)是软件开发技术中经常出现的两个修饰术语,用于表示程序设计语言、编程工具或软件开发环境等对软件开发人员的两种不同支持方式。例如一个采用面向对象方法完成的设计同样也可
12、以利用C语言实现,然而C语言对面向对象设计的支持是一种隐式的方式,面向对象设计的许多概念在C语言中无法直接地表达出来,显然这种隐式支持远远比不上C+、Java、Ada、Eiffel、Smalltalk等面向对象程序设计语言提供的显式支持。软件开发人员获得显式支持的本质可看作是将许多原来必须由程序员动手实现的任务交由更底层的编译程序、开发工具或运行环境完成。例如在数据库管理系统的帮助下,应用程序员开发数据处理应用程序时减轻了许多数据定义、查询、完整性、安全性等方面的负担。程序设计技术或软件开发技术的发展方向之一是不断为软件开发人员提供更完善、更有效的显式支持。例如在C语言或Pascal语言中无法
13、显式地描述一个求平方根函数square_root()中可能引发的异常(譬如计算对象是一个负数),而C+语言或Java语言允许在函数原型中显式地将函数体可能引发的异常表达出来,这种显式表达使得编译程序可帮助程序员检查该函数体中是否真的可能引发这些异常,以及约束使用这些函数的程序必须处理哪些异常。此外,将异常作为函数原型的一部分也有助于使用函数的程序员更全面地理解这些函数的语法与语义。又如在面向对象程序设计中一个实体除了属性与行为外,还应包含该实体的属性与行为应满足的约束。譬如一个银行帐户ACCOUNT除了拥有帐户标识、存款余额等属性以及存款、取款、查询余额等行为之外,还至少必须满足一个约束,即在
14、帐户生存期的任一时刻存款余额不得小于0(如果是允许透支的信用卡帐户,则应将约束修改为透支不得超过某一上限,而透支上限必须是帐户的一个属性)。在C+语言或Java语言中,程序员无法将这一约束显式地表达出来,只能在对象初始化、存款、取款等行为的实现中隐式地表达,使用这些组件的其他程序员也只能通过理解这些行为的实现才能了解到ACCOUNT的这种约束。当然通过注释将约束表达出来是一种良好的程序设计风格,但编译程序不能为此提供任何帮助。相比之下,Eiffel程序员可显式地描述ACCOUNT必须满足的约束,以及每一操作之前或之后必须满足的条件,程序员不必再考虑正常条件之外的异常,而交由运行环境负责引发相应
15、的异常。在分布式软件开发中比传统的集中式软件开发有更多的问题需要解决,程序员可以自己动手解决这些问题,但更理想的情况是由底层的支持(如语言、工具、环境等)帮助程序员完成这些任务。本书着重讨论在分布式软件开发中需要解决的重要问题,以及当前的分布式软件开发规范与产品对解决这些问题提供的支持。随着分布式软件开发技术的发展与成熟,程序员将获得越来越完善与有效的支持。对显式支持与隐式支持的讨论可以提醒我们,必须留意在分布式软件开发中存在哪些问题需要解决,这些问题并不会因为得不到显式支持而消失,在只有隐式支持的情况下程序员仍要自行解决这些问题。因而对解决关键问题的显式支持是评价与选择分布式软件的体系结构规
16、范、程序设计语言、开发工具与环境的一个重要因素。当然更重要的一点是提醒我们,在软件开发过程中应考虑可为分布式软件开发添加哪些新的显式支持,从而为分布式软件在我国的推广应用作出自己的贡献。 1.1.2 逻辑的 vs 物理的逻辑的(logical)与物理的(physical)分别代表着两个不同的抽象层次。早在10年前由IEEE-CS/ACM联合制订的91计算教学计划中,就将抽象层次列为计算机科学与工程专业学生必须掌握的一个核心概念,这一概念贯穿了计算机学科的众多领域。抽象是人类认知世界的最基本思维方式之一。罗素曾断言:“发现一对鸡、两昼夜都是数的实例,一定需要很多年代,其中所包含的抽象程度确实不易
17、达到;至于是一个数的发现,也必定很困难。”抽象源于人类自身控制复杂性能力的不足:我们无法同时把握太多的细节,复杂的问题迫使我们将一些相关的概念组织成不同的抽象层次。例如日常生活中的is-a关系是人们对概念进行抽象和分类的结果,例如苹果是一种水果,水果是一种植物等,生物学采用的界、门、纲、目、科、属、种标准生物分类方法是这一思维方式的经典应用。将这种is-a关系在程序中显式地表达出来而形成的继承机制,是面向对象程序设计最重要的特征之一。 在软件设计中太容易找到抽象层次的实例,例如变量类型、对象类抽象数据类型、实现规格说明、数据流图分解与平衡等。逻辑层与物理层组织是一种常见的抽象层次。一个典型的C
18、+程序从逻辑上看由m个类与1个主函数main()组成,但同样的逻辑组织形式却在物理上可根据不同需要组织为不同形式的文件模块,整个程序既可能划分为n1个文件模块,也可能划分为n2个文件模块。从不同的抽象层次来看,这两个程序的物理组织形式虽然不同,但其逻辑组织形式却是一样的。又如在管理信息系统的开发过程中,系统分析的主要任务是根据现有管理信息系统的物理模型建立更高抽象层次的逻辑模型,在逻辑模型中抛弃了物理模型中那些开发者不关心的细节,仅表达了系统边界之内用户最关心的内容,这一建模过程的本质就是一个抽象过程。系统分析员通过对逻辑模型的研究与改进,进一步实现在计算机平台上的一个新的物理模型。在分布式软
19、件系统中,有许多机制虽然与传统的集中式软件在物理层次表现出很大差异,但从逻辑层次上看它们却是统一的,例如普通函数调用与远程过程调用(RPC)、对象消息传递与远程方法调用(RMI)、接口与实现的分离、同一接口多种实现等。因而在分布式软件体系结构的学习与研究中,利用不同的抽象层次可帮助我们从更高层次掌握分布式软件系统的各种机制,并且可以用一种统一的知识框架来理解分布式软件与传统的集中式软件的基本概念、表示技术以及开发过程。同理,一个软件系统在逻辑层次表现为分布式的,但在物理层次部署时却可能是集中式的。对于同一个分布式软件系统,可以用一台单机同时充当客户机与服务器,并包含了两者之间的通信,从而让我们
20、有可能在家中的一台电脑上就能学习开发与调试分布式应用程序,然后再将这些应用程序部署到真正的分布式运行环境中。 1.1.3 面向对象技术在二十世纪80年代兴起的面向对象技术已在软件生存期的各个阶段取代传统的结构化方法,成为当前软件开发的主流技术。在分布式软件开发领域也不例外。面向对象开发过程本质上是一个建模过程。开发人员通过分析问题域中实体的属性、行为、约束等,抽象出能描述这些实体共同结构与特征的概念,然后在计算机中利用类建立这些概念的系统模型,再通过类创建具体的对象实例模拟问题域的实体行为。面向对象开发方法强调将系统功能建立在系统模型之上,所有系统功能采用底层的系统模型提供的术语来表达,从而提
21、高了软件系统的可扩展性与可维护性。除了封装与信息隐藏、数据抽象、模块化等特征外,面向对象技术的最主要特色是继承与多态性。继承是日常生活中的is-a关系在程序中的显式表达,是重用数据与操作的重要手段。多态性有十分广泛的含义,这里主要是指运行期间程序表现出来的多态性,它建立在继承与动态绑定的基础上,使得一个对象可以具有多种不同的动态类型,从而大大提高了面向对象程序的表达能力。先进的分布式软件体系结构必须与面向对象技术结合在一起,从而可分享面向对象技术带来的众多好处。例如由开放软件基金会(OSF)于1992年发布的分布式计算环境(Distributed Computing Environment,缩
22、写为DCE)采用的是远程过程调用(Remote Procedure Call,缩写为RPC)技术,RPC支持开发人员进行结构化程序设计,使得客户程序可以像调用本地过程一样调用服务程序中的过程。而由Sun Microsystems于1996年发布的远程方法调用(Remote Method Invocation,缩写为RMI)技术是一种分布式对象模型,保持了Java语言的对象语义,支持分布式应用程序员进行面向对象程序设计,在客户程序中可以像将消息传递给本地对象一样,将消息传递给服务程序中的对象。当前几种主流的分布式软件体系结构均融合了分布式计算与面向对象技术,包括OMG的公共对象请求代理体系结构(
23、CORBA)、Microsoft的分布式组件对象模型(DCOM)、Sun Microsystems的企业版JavaBeans(EJB)等。 1.1.4 软件体系结构随着计算机软件系统的规模不断增大并且系统复杂度不断提高,在软件开发过程中对整个软件系统的体系结构进行分析与设计远比对算法与数据结构的选择更加重要。软件体系结构关心的正是整个软件系统的结构,它决定一个软件系统由什么样的组件构成,以及这些组件之间的交互关系如何,并提供一种模式指导组件的合成。尽管严格的形式化工作仍处于实验阶段,软件体系结构在软件工程中已扮演着越来越重要的角色。典型的软件体系结构风格有设计图形用户界面(GUI)常用的事件驱
24、动风格、设计操作系统常用的层次化设计风格、设计编译程序常用的管道与过滤器风格、设计分布式应用程序常用的客户机服务器风格等。一个实用的软件系统通常是几种典型体系结构风格的组合。分布式软件系统通常基于客户机服务器(client/server)模型,因而组成系统的最核心组件是客户程序与服务程序,然而不同的分布式软件体系结构还决定了各自不同的组件以及这些组件之间的交互方式。例如在OMG的CORBA模型中,存在若干称为对象请求代理(ORB)的组件,这些组件之间采用因特网ORB间协议(IIOP)进行通信;又如在OSF/DCE中,客户程序与服务程序之间通过远程过程调用(RPC)进行交互,参数与返回值的编码采
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分布式 软件 体系结构
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-2397697.html