第一章分布库概述10.ppt
《第一章分布库概述10.ppt》由会员分享,可在线阅读,更多相关《第一章分布库概述10.ppt(65页珍藏版)》请在三一办公上搜索。
1、分布式数据库,分布式数据库,教师:申德荣电话:83691218办公室:主楼 407 e_mail:S,分布式数据库系统课程介绍,分布式数据库,1.课程名称 分布式数据库系统2.学时:323.教材:Principles of Distributed Database Systems M.Tame Ozsu&Patrick Valduriez Prentice-Hall,1999 2002.6 影印版(清华大学出版社),分布式数据库系统课程介绍,分布式数据库,4.参考教材分布式数据库系统及其应用 科学出版社 邵佩英分布式数据库 科学出版社 郑振楣 于戈 5.先修课 本科数据库原理、计算机网络 6.
2、考试 40%:作业+测验 60%:考试,主要内容,分布式数据库,第一章 概论 第二章 分布式数据库系统体系结构 第三章 分布式数据库的设计第四章 全局查询处理和优化 第五章 分布查询的存取优化第六章 分布式事务管理第七章 分布式恢复第八章 分布式并发控制第九章 典型的分布式系统介绍,引言及准备知识分布库系统的基本概念分布库系统的作用和特点主要问题,系统结构功能结构模式结构软件结构分布式数据库系统分类字典信息的组织,分片的定义水平分片的设计垂直分片的设计分片的表示方法分配设计基于复制技术的数据分片,基本概念查询优化的基础全局优化的一般规则全局查询的分解和变换片段查询的优化,基本概念存取优化的理论
3、基础半联接优化方法SDD-1系统优化技术枚举法优化技术,事务的基本概念分布式事务分布式事务的提交协议分布式事务管理的实现两段提交协议(2PC)的分类,基本概念集中式数据库的故障恢复方法分布式事务的恢复非阻塞分布式事务提交协议,基本概念基于锁的并发控制方法两段封锁协议(2PL)并发控制理论基础分布库并发控制方法其它典型的并发控制方法,第一章 概论,分布式数据库,引言及准备知识分布库系统的基本概念分布库系统的作用和特点主要问题分布式数据库系统介绍,第一章 概论 引言及准备知识,分布式数据库,数据库领域的发展历程 1960s-IBM IMS(层次模型的数据库管理系统)-DBTG(美国数据库任务组)提
4、议的network data model 1970s-E.F.Codd RDB model Pioneering systems:INGRES,System R 1980s-Booming of RDBs-Federated,Multi-databse-DDB-OODB,第一章 概论 引言及准备知识,分布式数据库,数据库领域的发展历程 1990s-Merge of RDB and OODB-Internet Fame-P2P model 2000s-XML DB-Web data processing-Semantic Web-Data Integration,第一章 概论1.1引言及准备知识
5、,分布式数据库,数据库领域的发展历程 Status of Commercial DDB-Server side P2P Support Horizontal fragmentation and 2PC Trend for Data Processing-data intensive scalable computing-cloud computing-non-relational data model,et al.分布式数据库的基本原理是分布式系统的基础了解:基本概念、问题描述、关键技术问题、算法、系统的设计与实现,第一章 概论 1.1 引言及准备知识,分布式数据库,分布数据库管理系统兴起于7
6、0年代中期,推动其发展来自两方面:一方面是应用需求,另一方面是硬件环境的发展。如:全球及全国范围内的航空/铁路/旅游订票系统、银行通存通兑系统、水陆空联运系统、跨国公司管理系统、连锁配送管理系统等等。这些应用都涉及地理上分布的团体、组织的局部业务管理和系统全局管理,采用成熟的集中式数据库管理系统已无法实现应用需求。在硬件环境上提供了功能强大的计算机和成熟的广域范围公用数据网及局域范围局域网的硬件环境支持。,第一章 概论1.1 引言及准备知识,分布式数据库系统(Distributed Database Management System,DDBMS)是地理上分散而逻辑上集中的数据库系统。即通过计
7、算机网络将地理上分散的各局域结点连接起来共同组成一个逻辑上统一的大数据库系统。因此可以说:分布式数据库系统是计算机网络技术和数据库技术的结合的产物。分布式数据库系统与集中数据库系统一样,包含两个重要部分:分布式数据库和分布式数据库管理系统。,分布式数据库,基本概念 数据库(DB)从用户使用数据库的角度出发,可定义如下:数据库是长期存储在计算机内、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述、存储,具有较小的冗余度、较高的数据独立性和易于扩展性,并可为各种用户共享。数据库设计是对一个给定的应用环境(现实世界)设计最优的数据模型,然后,按模型建立数据库。见图1.1。,分布式
8、数据库,第一章 概论1.1 引言及准备知识,数据库管理系统(DBMS)数据库管理系统(DBMS)是人们用于管理和操作数据库的软件产品。为有效地管理和操作数据库,研制出数据库管理系统(Database Management System),使用户不必涉及数据的结构描述及实际存储,方便、最优地操作数据库。其模型见图1.2。,分布式数据库,第一章 概论1.1 引言及准备知识,数据库管理系统(DBMS),数据库管理系统可描述为用户接口、查询处理、查询优化、存储管理四个基本模块和事务管理、并发控制、恢复管理三个辅助模块组成。,图1.2 数据库管理系统模型,分布式数据库,第一章 概论1.1 引言及准备知识
9、,数据库系统数据库系统=DB+DBMS 模式 现实世界的信息抽象到数据库存储的数据是一个逐步抽象的过程。美国国家标准协会(ANSI)和标准需求计划委员会(SPARC)根据数据的抽象级别定义了三层模式参考模型。,分布式数据库,第一章 概论1.1 引言及准备知识,三层模式,分布式数据库,第一章 概论1.1 引言及准备知识,模式-概念模式:,RELATION EMP KEY=ENO ATTRIBUTE=ENO:CHAR(9)ENAME:CHAR(15)TITLE:CHAR(10),RELATION PAY KEY=TITLE ATTRIBUTE=TITLE:CHAR(10)SAL:NUMBER(5)
10、,分布式数据库,第一章 概论1.1 引言及准备知识,INTERNAL_RELA EMPLINDEX ON E#CALL EMINXFIELD=HEADER:BYTE(1)E#:BYTE(9)ENAME:BYTE(15)TITLE:BYTE(10),分布式数据库,第一章 概论1.1 引言及准备知识,模式-内部模式:,CREATE VIEW PAYROLL(EMP_ENO,EMP_NAME,SAL)AS SELECT EMP.ENO,EMP.NAME,PAY.SALFROM EMP,PAYWHERE EMP.TITLE=PAY.TITLE,分布式数据库,第一章 概论1.1 引言及准备知识,模式-外
11、部模式:,基础知识 介绍关系模型、关系代数和SQL语言知识。关系模型 是数据库数据模型的三种模型(层次数据模型、网状数据模型和关系数据模型)之一。关系是二维表,关系也称表。表中的一行称关系的一个元组,表中的一列称关系的一个属性。关系代数关系是一个集合,关系的元组是集合的元素。关系代数包括5个集合运算和3个特殊关系运算。,分布式数据库,第一章 概论1.1 引言及准备知识,关系代数 假设关系R和S,则集合运算为:并(UNION)运算:表示RUS或R+S。两个关系的并运算是将两个关系中的所有元组构成一个新关系。交(INTERSECT)运算:表示RS。两个关系的交运算的结果是由两个关系中公共元组组成一
12、个新的关系。差(DIFFERENCE)运算:表示R-S。两个关系的差运算结果是由属于一个关系R,且不属于另一个关系S的元组构成的新关系。乘(PRODUCT)运算:表示RS。结果是两个关系中所有元组组成一个乘积关系。若R有m个属性,S有n个属性,则RS由(m+n)个属性组成关系;若R有i个元组,S有j个元组,则RS由(ij)个元组组成关系。除(DIVIDE)运算:表示RS。两个关系的除运算结果是满足关系S的R关系的子集。,第一章 概论1.1 引言及准备知识,关系代数,关系运算为:选择(SELECT)运算:表示(R)。选择是从指定的关系中选择满足条件的元组构成一个新的关系。投影(PROJECT)运
13、算:表示A(R)。投影是从指定的关系中选择某些属性的所有值组成的新关系。连接(JOIN)运算:表示RS。连接是将两个关系按条件连接在一起,形成一个新关系。也可多个关系连接在一起。,分布式数据库,第一章 概论1.1 引言及准备知识,关系代数举例,分布式数据库,第一章 概论1.1 引言及准备知识,关系代数举例,第一章 概论1.1 引言及准备知识,第一章 概论1.1 引言及准备知识,关系代数举例,第一章 概论1.1 引言及准备知识,关系代数举例,是一种非过程性语言。提供了数据定义(建立数据库和表结构)、数据操纵(输入、修改、删除和更新、数据查询)、数据控制等数据库操作命令,较好地满足数据库语言的要求
14、。由于国际标准化组织指定了SQL标准,具有可移植性,SQL又提供了灵活而强大的查询功能方便复杂的查询操作,使SQL为广大用户所采用。具体SQL命令略。,分布式数据库,第一章 概论1.1 引言及准备知识,SQL(Structured Query Language),第一章 概论 1.2分布库系统的基本概念,节点/场地,分布式数据库系统是地理上分散而逻辑上集中的数据库系统。管理分布式数据库的软件称分布式数据库管理系统。分布式系统通常是由计算机网络将各地理上分散的逻辑单位连接起来。被连接的逻辑单位称为节点(node)或场地(site)。节点/场地可是单独一台计算机也可是局域网组成。,分布式数据库,集
15、中数据库系统,所有数据驻留在同一场地上。如图1.4:我们称传统的数据库系统为集中式数据库系统(DB)。网络节点上的集中数据库系统,分布式数据库,第一章 概论 1.2分布库系统的基本概念,分布式数据库(DDB),分布式数据库是分布在一个计算机网络上的多个逻辑相关的数据库的集合。也就是说,分布式数据库是一组结构化的数据集合,逻辑上属于同一系统,物理上分布在计算机网络的各个不同节点上。如图1.5所示。,分布式数据库,第一章 概论 1.2分布库系统的基本概念,分布式数据库管理系统(DDBMS),分布式数据库系统由分布式数据库(DDB)和分布式数据库管理系统(DDBMS)组成。分布式数据库管理系统是分布
16、式数据库系统的一组软件。负责管理分布式数据库的数据管理和操作。由于分布式数据库管理系统基于分布环境下实现,必保证逻辑数据的一致性、完整性等,因此,其复杂度远高于集中数据库管理系统。,分布式数据库,第一章 概论 1.2分布库系统的基本概念,分布式数据库 用户视图,分布式数据库,第一章 概论 1.2分布库系统的基本概念,分布式数据库 举例,分布式数据库,第一章 概论 1.2分布库系统的基本概念,第一章 概论 1.2分布库系统的基本概念,分布式数据库 举例,分布式数据库的特性 数据透明性 场地自治性 数据透明性:基于分布库的划分层次:全局外层(用户层)、全局 概念层、局部概念层和局部内层。可知:应用
17、程序与系统实际数据组织相分离,即数据具有独立性或透明性。具体体现为分布透明性、复制透明性和分片透明性。,分布式数据库,第一章 概论 1.2分布库系统的基本概念,数据透明性,分布透明性:全局用户看到的是全局数据模型的描述,用户象使用集中数据库一样,不需考虑数据的存储场地和操作的执行场地。复制透明性:分布数据库支持有控制的数据冗余,即数据可重复存储在不同的场地上,提高系统的可用性和可靠性,加强系统处理的并行性。分片透明性:分片是将一个关系分成几个子关系之中的一个子关系。根据实际需求,一个分片可能存储在不同的场地上(实际存储在场地上称分段)。,分布式数据库,第一章 概论 1.2分布库系统的基本概念,
18、数据透明性,逻辑层是用户语义层,物理层是具体实现细节。逻辑层的语义与物理层的实现分离开来,对高层系统和用户隐蔽了实现细节。即应用程序无须考虑数据分片细节,对分片的调用(分片到分段的映射)由系统自动完成。,分布式数据库,第一章 概论 1.2分布库系统的基本概念,场地自治性,在分布式数据库系统中,为保证局部场地独立自主能力,分布场地具有自治性。多个场地或结点的局部数据库在逻辑上集成为一个整体,并为分布式数据库系统的所有用户使用,这种应用称全局应用,其用户称全局用户。分布式数据库系统也允许用户只使用本地的局部数据库,该应用称局部应用,其用户为局部用户。这种局部用户独立于全局用户的特性称局部数据库的自
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一章 分布 概述 10
链接地址:https://www.31ppt.com/p-6002561.html