《第二章分布式数据库系统设计-Read课件.ppt》由会员分享,可在线阅读,更多相关《第二章分布式数据库系统设计-Read课件.ppt(21页珍藏版)》请在三一办公上搜索。
1、第二章 分布式数据库系统设计,2008.9,第二章 分布式数据库系统设计,分布式数据库系统设计概述自顶而下设计分布式数据库系统自顶而下设计分布式数据库系统设计实例自底向上分布式数据库系统设计分布式数据库系统的优点和存在的技术问题,分布式数据库系统设计概述,分布式数据库系统的构建方法分布式数据库设计的内容分布式数据库设计目标分布式数据库设计方法,分布式数据库系统的构建方法,组合法:自底向上重构法:自顶向下,组合法,网络,DBMS1,DBMS2,DBMSn,分布式协调管理系统,用户1,用户2,用户m,重构法,网络,分布式数据库管理系统,用户1,用户2,用户m,分布式数据库设计的内容,集中式数据库设
2、计内容数据库设计概念模式设计(描述数据库应用所使用的全部数据)内模式设计(概念模式到存储模式的映射)围绕数据库而展开的应用设计分布式数据库的设计内容分布式数据库设计全局模式设计每个站点的局部数据库的设计数据分片设计位置分配设计围绕分布式数据库而进行的应用设计,需要考虑:各应用的原发站点各应用在每个站点被激活的次数各应用对所要求访问的每个数据对象的访问次数、类型和统计分布,分布式数据库设计的目标,分布式数据库的本地性或近地性:尽量减少对网络的使用,减少网络通信次数和通信量,90%的数据在本地访问控制数据的适当冗余:为提高本地性、并发度和可靠性要增加副本;为维护数据一致性,要减少副本工作负荷分布:
3、将工作负荷分布到各个站点,充分利用每个站点的计算机能力和资源,提高并行运行程度存储能力和费用:虽然存储费用与CPU、I/O、以及传输的费用相比不重要,但必须考虑各站点的存储能力,分布式数据库设计的方法,自顶向下设计方法:从头开始构建数据库自底向上设计方法:聚集现存数据库来设计分布式数据库,自顶而下设计分布式数据库系统,自顶向下设计分布式数据库的步骤和内容数据的分片设计数据库片段的位置分配设计,自顶向下设计分布式数据库的步骤和内容,需求分析:收集用户数据库应用的规格说明,产生一种无歧义的定义和在设计数据库中要考虑的元素分类,这些信息被收集在设计的数据字典中概念设计:产生全局、综合数据库模式的一种
4、概念规格说明和在此模式上执行应用的概念规格说明逻辑设计:将综合概念模式转换成一给定DBMS类型的数据库模式分布设计:以全局的、与站点无关的模式作为输入,以产生分布式数据库各站点的子模式作为输出,包括分片设计和片段的分配设计物理设计:要遵照选定DBMS的能力和特点进行,数据的分片设计,分片设计的基本目的产生一个对全局数据合适的划分方案,使得在数据分配和存储时减少应用中的操作量,增加应用的本地性数据分片的基本类型和方法水平分片垂直分片混合分片,水平分片初级水平分片:以关系自身的属性性质为基础,执行选择操作,将关系划分成若干不相交的片段对全局关系进行合适的水平分片,需要确定一组不相交的、完整的限定语
5、,即:令P=P1,P2,Pn是一简单谓词的集合,为了正确而有效地分片,则P必须是“完整的”和“最小的”,满足:只有当属于同一分片中的任意两个元组被任一应用以同等概率进行访问时,称谓语集合P是完整的。如果集合P的全部谓词与应用密切相关,称P是最小的。例:全局关系EMP(E#,NAME,DEPT,JOB,SAL,TEL,)DEPT=1,2 JOB=P,-P,若应用经常查询的内容是属于部门1且是程序员的雇员。P=DEPT=1是不完整的P=DEPT=1,JOB=P是正确的,也是合适的,因为这样可以分为:DEPT=1,JOB=P、DEPT=2,JOB=P、DEPT=1,JOB=-P、DEPT=2,JOB
6、=-P四个片段,满足完整、最小、不相交P=DEPT=1,JOB=P,SAL500是完整的,但不是最小的,导出水平分片:不是以自身的属性性质为基础,而是从另一个关系的属性性质或水平分片推导出来的,采用导出式水平分段可以使片段之间的连接变得更容易连接图:又称结合图,当一个应用需要对两个全局关系进行连接操作时,理论上应该对两个关系的全部元组进行比较。如果R水平分片为Ri,i=1,2,n;S水平分片为Sj,j=1,2,m,需要将Ri与S进行比较,有以下可能:,不相交,无相同属性值元组存在,相交,有相同属性值元组存在,当连接增多时,这种连接不容易判断,用连接图:圆圈表示关系的片段,小圆圈之间的无向边表示
7、非空片段之间的连接,全连接:连接图中包括两个关系R和S之间的片段之间的所有连接,全连接图,简单连接图,分区连接图,分区连接图:连接图中不包含某些连接,且一个连接图由两个或多个子图组成,而这些子图之间无连接边,简单连接图:连接图中不包含某些连接,且每个子图只有一条边,垂直分片:确定一个全局关系R的垂直分片需要根据应用以“同样方式”访问的属性来进行分组,垂直分片不同于垂直集群,垂直分片的组必须只在某个键属性上重叠,其他属性不可重叠;垂直集群的组在其他属性上也可以重叠。垂直集群有时候更好的实现本地性垂直分片的基本目标:使频繁使用的属性聚集在一起,当各个应用只使用一个属性子集时,存在一个理想的垂直分片
8、垂直分片的方法分裂法:将全局关系逐渐分成片段,分成组法:将属性逐步聚集成片段,合,数据片段的位置分配设计,数据片段位置分配方法分配方式非冗余分配:每个片段在一个站点上,用最佳适应法冗余分配:每个片段映射到一个或多个站点,需要确定片段复制的程度,复制的利益随着检索与更新间的比值而增加所有得益站点法:先确定非复制问题的解,然后在全部站点中确定一组站点,给这组站点中的每个站点分配片段的一个副本,这样做的好处要比付出的代价大附加复制法:首先确定非复制问题的解,然后从最有益处起逐步附加复制的副本,此过程直到“附加复制”已无明显的好处为止,数据片段分配的费用和得益估算i表示片段下标J表示站点下标K表示应用
9、下标Fkj表示应用k在站点j上被激活的频率Rki表示应用k被激活一次,对片段i进行检索访问的次数Uki表示应用k被激活一次,对片段i进行更新访问的次数Nki=Rki+Uki表示应用k被激活一次,对片段i进行访问的总次数,水平分片非冗余分配使用“最佳适应法”。将片段i分配到访问Ri次数最多的那个站点,在站点j上Ri的本地访问次数为:,冗余分配使用“所有站点得益法”。将片段i的副本分配到所有得益站点j上,所谓得益站点是指在这些站点上,应用的检索访问费用总比从任何一个其他站点发出的应用对Ri的更新访问的费用要低,估算差额:,估算max(Bij)=,C是更新访问与检索访问的代价比,如果Bij0则,在站点j上存放Ri的一个副本,,Ri就被分配在j上,冗余分配使用“附加复制法”。另Di表示片段Ri的冗余度,(副本个数),Fi表示Ri在每个站点全都复制的得益,Di与Fi之间存在如下关系:,其中:(1)=0,(2)=Fi/2,(3)=3Fi/4,修改得益公式,得到求站点j上引入Ri新副本的得益公式,垂直分片假设把站点r上的关系R垂直分片成两个片段Rs和Rt,并将Rs和Rt分别分配在站点s和t上,然后将应用分组并估算它们的得益情况:,
链接地址:https://www.31ppt.com/p-4095115.html