分布式数据库概念.ppt
《分布式数据库概念.ppt》由会员分享,可在线阅读,更多相关《分布式数据库概念.ppt(60页珍藏版)》请在三一办公上搜索。
1、分布式数据库,计算机科学与技术系姚全珠,第2章 分布式数据库基本概念,一、分布式系统分布式系统的定义 总结了分布式系统的五个基本原则 分布性的刻画 几个典型的非分布式系统 分布式系统面对的问题 分布式系统设计上的一些重要原则二、分布式数据库系统 分布式数据库的定义 分布式数据库管理系统概述 分布式数据库系统的组成 分布式数据库的分类,一、分布式系统,1、分布式系统的定义 美国电工电子学会下属的计算机学会给出的分布式系统定义为:“包含多个相连的处理资源,这些资源能在系统的控制下,对单一问题进行合作,而且最少依赖集中过程,数据或硬件。”英国计算机学会给出的描述为:“包含多个独立的但又交互作用的计算
2、机,它们可以对公共问题进行合作,这个系统的特点是包含多个控制路径,他们执行一个程序的不同部分而且相互作用。”,2、总结了分布式系统的五个基本原则,(1)资源的重复性 指分布式系统中硬件,软件以及数据的冗余配置。(2)物理上的分布性 从硬件,软件以及数据上看都是相互独立地分布。(3)高层操作系统(或者分布式操作系统)高层操作系统负责对分布性的资源进行统一的控制,它使一个简单的硬件堆积转变为一个统一协调的工作系统。(4)系统的透明性 透明性是分布式系统的灵魂,实现不同层次的透明性是分布式系统必须解决的关键问题之一。(5)协作的自治性 每一节点都是一个完整的处理系统,同时又是合作的。简而言之:分布式
3、系统是一个多节点的,处理或数据分布的,在统一下提高综合处理能力的协作体。,3、分布性的刻画,从三维空间来表征处理系统的分布特征(1)硬件构成层次 以处理器为核心划分为:A 单CPU:单一控制器,单一运算器,单一内存 B 多执行部件:单一控制器,多运算器或存储器 C 具有专用功能部件:单一通用控制器,多运算 器或存储器,配有通道/输入输出处理机/向量运算部件/辅助数学运算部件等专用功能部件。D多处理机:多个控制器,多运算器或存储器,单一输入输出系统。E多计算机:多台通用计算机(D E:分布式硬件环境),(2)控制方式层次,多节点系统中按控制方式划分为:A 单个控制点:物理上的或概念上的一个控制节
4、点 B 固定主从关系:有一个节点是主节点,其他的是从节 点 C 动态主从关系:可以通过程序修改主从关系 D 多个控制节点独立工作:例多个计算机最多是在I/O级 别上交换信息 E 多个控制节点在某个层次上(如任务分割)协同工作 F 多个同构控制点完全协同工作 G 多个同构或异构控制点完全协同工作(EFG:分布式系统),计算机学院HPC系统结构,(3)、数据分布层次,根据数据的分布性特点,可划分为:A 集中式数据库:在文件及目录上只有单一的拷 贝。B 文件分布式但中央集中式目录:没有本地目录,所有访问都要通过这个中央集中式目录。C 重复的数据库拷贝:在每个节点都有一份完整的数据 拷贝D 主节点存放
5、完整数据,其他节点存放所需的数据或数 据分片。E 主节点存放数据分布图或目录,其他节点存放所需的 数据或数据分片。F 所有节点都存放最重要的数据或数据分片,而且任何节 点都能形成对其他节点的访问。参见 图1,图1 分布特征示意图,控制方式,硬件构成,数据分布,4、几个典型的非分布式系统,A 系统中引入专用处理部件B 系统中主从关系明显。(例 具有智能终 端的系统)C 简单网络互连结构:简单互连网络具有 很好的自治性,且可交换信息但不能协 同工作。(例 双机或多机备份系统),5、分布式系统面对的问题,A 不完整系统状态信息B 时间延迟C 通信的代价D 负载均衡,6、分布式系统设计上的一些重要原则
6、,A 内核较小:重点集中在通信控制,任务 分割,透明访问等全局工作上B 充分利用节点信息:不完整甚至是不精 确的状态信息。C 通信方法和协议:通信参数都必须通过 完善的定义而且有严格执行的接口。,二、分布式数据库系统,2.1 分布式数据库的定义1.分布式数据库的发展 始于20世纪70年代,主要是应用的需要(1)符合现代企业管理方式:企业跨地区,跨国家经营。(2)提高性能价格比:集中存放要求性能提高,甚至无法满 足。(3)硬件的发展:为DDBS奠定了物质基础(4)网络技术的发展:为DDBS提供了必要条件(5)数据库应用系统的普及:为DDBS提供了技术与经验2.分布式数据库的定义 分布式数据库是一
7、个物理上分散的而逻辑上集中的数据集。它有三大特点:数据分布性 逻辑关联性 站点自治性,2.2 分布式数据库管理系统概述,1、DDBMS应具有如下功能分布式数据库定义功能:提供定义数据结构及其数据分布等功能分布式查询处理功能:提供分布化环境下的查询处理及优化功能。分布式数据库维护功能:数据的完整性及一致性,并发控制,安全检查以及版本控制等诸多方面都需要有效合理的机制保证,还要有转移任务的能力。调度处理功能:DDBMS必须具有分解全局事务并转换成对应数据交换的能力。还必须解决并发控制等问题。,2、分布式数据库管理系统应遵循的12条原则,1987年,CJDate提出了完全的分布式数据库管理系统应遵循
8、的12条原则:场地自治性 不依靠中心站点持续操作性 位置透明和独立性数据分割独立性 分布式独立性分布式查询处理 分布式事务管理硬件独立性 操作系统独立性网络独立性 数据库管理系统独立性,2.3 分布式数据库系统的组成,1 硬件:CPU、内存、外存、通信设备。2 数据:LDB、GDB、分散在各个站点上软件:LOS LDBMS 高层DDBMS 以及与的接口程序人员:全局用户、局部用户、全局数据库管理员()、局部数据库管理员、系统分析员、应用程序员。,2.4分布式数据库的分类,按照各节点的结构来划分:同构型和异构型两类 异构型表现在:硬件的异构:CPU或硬件体系结构不同。网络结构的异构:不同网络的结
9、构有所差异。软件的异构:不同站点的操作系统或DBMS不同2 从分布式数据库系统控制方式的角度可划分为:,紧耦合式DDBMS:全局控制信息放在一个称为中心站点的站点上。所有的全局访问都必须通过中心站点来确定远程数据片的位置。优点:容易实现数据的一致性和完整性。缺点:易产生访问瓶颈,系统效率不高,可靠性较差。,集中式控制的紧耦合式DDBMS结构示意图,DDBMS/DD,全局用户,LDBMS1,LDBMSn,LDB1,LDBn,局部用户,局部用户,联邦式DDBMS:每个站点都包含全局控制信息的一个副本,都可以接受全局访问。任何对远程数据的请求,都可以通过广播方式传播到其他节点。优点:具有较好的可靠性
10、和可用性,并行性好,更容易适应旧有的系统集成和异构分布式数据库系统的建立。缺点:保持数据的一致性很困难,实现难度大。,分布式控制联邦式DDBMS结构示意图,DDBMSLDBMS1,DDBMS/DDLDBMSn,全局用户,全局用户,局部用户,局部用户,LDB1,LDBN,组合式DDBMS:是上述方案的折衷,它把站点分为两类,一类具有全局控制信息,称为主节点,可以接受全局任务,另一类没有全局信息,只能为主节点提供数据服务。优点:灵活性较好,易于实现层次控制结构。缺点:设计复杂。,第3章 分布式数据库设计,3.1 分布式数据库的构成方式 分布式数据库可以以单层结构(SL)和多层结构(ML)两种基本方
11、式进行数据组织。单层分布式数据库(SL DDB)它只有一个独立的逻辑数据库,它们分布在相联的数据节点上,每个节点没有独立的数据库,SL DDB 对应的DDBMS是一个单层次的全局总控制系统,任何访问都必须通过它来完成,节点的自治性完全丧失。节点可以是同构的或异构的,典型的例子是POREL 和 VND。,多层次分布式数据库(ML DDB)每个节点都有自己的独立数据库(LDB),而它们(或其中的部分)又构成一个逻辑上统一的全局数据库(GDB)。ML DDB 需要为每个节点配备局部DBMS,同时DDBMS进行全局处理总控工作。本节点数据的局部访问通过本地DBMS完成,而全局访问要通过DDBMS来完成
12、。节点可以是同构的,也可以是异构的。ML DDB 的典型例子是R*和DATANET。,分布式数据库的模式结构,全局应用模式(GAS)它是面向特定应用用户的GDB数据视图全局表示模式(GRS)它是GDB的逻辑描述,它需要刻画GDB涉及的所有实体(关系),同时它也描述GDB中数据在节点的分布,还应描述完整性约束。节点应用模式:(NAS)它是面向本节点特定用户的LDB数据视图。节点表示模型(NRS):它主要是本地LDB的逻辑描述,如果本节点包含LDB以外的数据,还需要对这些外部数据和GDB的关联加以描述。存储模式(SS)它主要是本地LDB的存储描述。如果本节点包含LDB以外的数据,还需要对这些外部数
13、据的存储加以描述。,模式间的映射,1 GAS/GRS的映射:把用户通过外视图对GDB的访问和它的GRS描述对应起来,完成所涉及数据的逻辑定位。2 GRS/NRS映射:GRS/NRS映射把GDB的统一逻辑描述转换成对应相关节点数据的逻辑描述,完成所涉及的数据在节点上的逻辑定位。3 NAS/NRS 映射:NAS/NRS 映射是针对基于LDB的局部访问的,它完成节点的局部访问到LDB的逻辑描述的转换。4 NRS/SS映射:NRS/SS映射把来自全局或局部的应用所转换的NRS对应到相应的存储表示上,以完成对节点数据的物理存取。,各部分功能介绍:,3个(分布式)全局数据库DDB1、DDB2、DDB3,它
14、们分别由GRS1、GRS2、NRS3实现全局的逻辑描述。5个局部数据库(LDB1 LDB2 LDB3 LDB4 LDB5)它们通过局部表示模式LRS1LRS5来完成逻辑定义,通过存储模式SS1SS5实现物理组织,并通过不同的局部应用模式LASn来完成局部访问。,3.2分布式数据库系统中的透明性,分布透明性:即在分布式数据库系统中用户不必关心数据的分布情况。分为三个层次:分片透明性(FragmentationTransparence)位置透明性(Location Transparence)数据模型透明性(Data model Transparence).,1.分片透明性,它是分布式数据库系统的最
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分布式 数据库 概念
链接地址:https://www.31ppt.com/p-5929685.html