数据库技术新进展 (2).ppt
《数据库技术新进展 (2).ppt》由会员分享,可在线阅读,更多相关《数据库技术新进展 (2).ppt(41页珍藏版)》请在三一办公上搜索。
1、第12章 数据库技术新进展,12.1 新一代数据库技术的研究与发展12.2 数据模型的发展12.3 数据库技术与其他相关技术相结合12.4 面向应用领域数据库新技术,12.1 新一代数据库技术的研究与发展,数据库技术经过短短三十年,已从第一代的网状、层次数据库系统,第二代的关系数据库系统,发展到第三代以面向对象模型为主要特征的数据库系统。数据库技术与网络通信技术、人工智能技术、面向对象程序设计技术、并行计算技术等等互相渗透,互相结合,成为当前数据库技术发展的主要特征。从八十年代以来,数据库技术在商业领域的巨大成功刺激了其它领域对数据库技术需求的迅速增长。另一方面在应用中提出的一些新的数据管理的
2、需求也直接推动了数据库技术的研究与发展,尤其是面向对象数据库系统(Object Oriented Database System 简称OODBs)的研究与发展。,12.1 新一代数据库技术的研究与发展,一、新应用领域的需求新的数据库应用领域,如CAD/CAM、CIM、CASE、OIS(办公信息系统)、GIS(地理信息系统)、知识库系统、实时系统等,需要数据库的支持,而其所需的数据管理功能有相当一部分是传统的数据库系统所不能支持的。例如它们通常需要数据库系统支持以下功能:存储和处理复杂对象。这些对象不仅内部结构复杂,很难用普通的关系结构来表示,而且相互之间的联系也有复杂多样的语义。支持复杂的数据
3、类型。包括抽象数据类型、半结构或无结构的超长数据、时间和版本数据等。还要具备支持用户自定义类型的可扩展能力。需要常驻内存的对象管理以及支持对大量对象的存取和计算。实现程序设计语言和数据库语言无缝地集成。支持长事务和嵌套事务的处理。,12.1 新一代数据库技术的研究与发展,二、传统数据库系统的局限性面向机器的语法数据模型传统数据库中采用的数据模型强调数据的高度结构化,是面向机器的语法数据模型。关系模型只有一个非常简单的结构性概念-关系,在传统应用中,数据对象具有同形结构,这样它们很容易映射到关系来表示;而工程对象拥有许多异形结构,一个复杂对象可能由许多具有不同结构的子对象组成。对这些复杂对象比较
4、自然的(即对于用户来说是友好的)表示,就需要有比关系模型更复杂的抽象机制。在关系数据库系统中必须将在逻辑上是一个整体的复杂对象分解为好几个基本关系。在这种结构下内部数据库结构与外部对象不再是一一对应的。对许多操作来说,人们更希望把所操作的部分抽象为一个逻辑单位,而关系模型不支持这一点。于是人们必须从关系模式的片段中构造复杂对象,其结果常常是带有许多冗余数据的不自然的复杂查询。进一步讲,重构复杂对象还带来另一个问题,那就是,由连接构造的视图一般是不可更新的。,12.1 新一代数据库技术的研究与发展,二、传统数据库系统的局限性数据类型简单、固定传统的DBMS只能理解、存储和处理简单的数据类型。如整
5、数、浮点数、字符串、日期、货币等。传统的RDBMS只支持某一固定的类型集,不能依据某一应用所需的特定数据类型来扩展其类型集。例如,不能定义包含三个实数分量的数据类型vector来表示三维向量。结构与行为分离从应用程序员角度来看,在某一应用领域内标识的对象应包含两个方面的内容:*结构表示*行为规格说明 前者可映射到数据库模式(带着前面所提到的缺陷),而后者在传统数据库系统中则完全失去了。传统数据库主要关心数据的独立性以及存取数据的效率,是语法数据库,语义表达差,难以抽象化地去模拟行为。例如,用户在CAD设计中用某些数据结构来表示的对象,对他们的操作(如成形、显示和组合等)就无法存放到数据库中。这
6、样,对象的行为特征在传统数据库系统中最多只能由应用程序来表示。因此在传统数据模型中,结构与行为被完全分割开了。,12.1 新一代数据库技术的研究与发展,二、传统数据库系统的局限性阻抗失配在关系数据库系统中,数据操纵语言如SQL与通用程序设计语言之间的失配称为阻抗失配。这种不匹配表现在两个方面:一是编程模式不同,描述性的SQL语言与指令式的编程语言如C 语言不同;二是类型系统不匹配,编程语言不能直接表示诸如关系这样的数据库结构,在其界面就会丢失信息。进一步地,由于是两个类型系统,自动的类型检查也成了问题。被动响应传统数据库管理系统只能响应和重做用户要求它们做的事情,从这种意义上说,它们是被动的。
7、而在实际应用中,往往要求一个系统能够管理它本身的状态,在发现异常情况时及时通知用户;能够主动响应某些操作或外部事件,自动采取规定的行动;应该能够在一些预定的(或动态计算的)时间间隔中自动执行某些操作。这就是说,要求系统更加主动、更加智能化,而传统的数据库系统显然不能适应这一要求。,12.1 新一代数据库技术的研究与发展,二、传统数据库系统的局限性存储、管理的对象有限传统的DBMS只存储和管理数据,缺乏知识管理和对象管理的能力,不具有演绎和推理的功能,因而无法满足MIS、DSS、OA和AI等领域中进行高层管理和决策的要求,从而限制了数据库技术的高级应用。事务处理能力较差传统数据库只能支持非嵌套事
8、务。对长事务的响应较慢,而且在长事务发生故障时恢复也比较困难。,12.1 新一代数据库技术的研究与发展,三、新一代数据库技术的特点一方面立足于数据库已有的成果和技术,加以发展进化,有人称之为“进化论”的观点和方法。另一方面的努力是立足于新的应用需求和计算机未来的发展,研究全新的数据库系统,有人称之为“革新论”的观点和方法。可以说新一代数据库技术的研究,新一代数据库系统的发展呈现了百花齐放的局面。其特点是:面向对象的方法和技术对数据库发展的影响最为深远八十年代出现的面向对象的方法和技术对计算机各个领域,包括程序设计语言、软件工程、信息系统设计,以及计算机硬件设计等都产生了深远的影响,也给面临新挑
9、战的数据库技术带来了机会和希望。数据库研究人员借鉴和吸收了面向对象的方法和技术,提出了面向对象数据模型(简称对象模型)。该模型克服了传统数据模型的局限性,为新一代数据库系统的探索带来了希望,促进了数据库技术在一个新的技术基础上继续发展。,12.1 新一代数据库技术的研究与发展,三、新一代数据库技术的特点数据库技术与多学科技术的有机结合数据库技术与多学科技术的有机结合是当前数据库技术发展的重要特征。计算机领域中其它新兴技术的发展对数据库技术产生了重大影响。传统的数据库技术和其它计算机技术的互相结合,建立和实现了一系列新型数据库系统,如分布式数据库系统、并行数据库系统、演绎数据库系统、知识库系统、
10、多媒体数据库系统等等。它们共同构成了数据库系统大家族。面向应用领域的数据库技术的研究为了适应数据库应用多元化的要求,在传统数据库基础上,结合各个应用领域的特点,研究适合该应用领域的数据库技术,如数据仓库、工程数据库、统计数据库、科学数据库、空间数据库、地理数据库等,这是当前数据库技术发展的又一重要特征。研究和开发面向特定应用领域的数据库系统的基本方法是以传统数据库技术为基础,针对某一领域的数据对象的特点,建立特定的数据模型,它们有的是关系模型的扩展和 修改,有的是具有某些面向对象特征的数据模型。,12.1 新一代数据库技术的研究与发展,四、第三代数据库系统新一代数据库技术的研究和发展导致了众多
11、不同于第一、二代数据库的系统诞生,构成了当今数据库系统的大家族。这些新的数据库系统无论它是基于扩展关系数据模型的、还是OO模型的;是分布式、客户/服务器或混合式体系结构的;是在SMP 还是在MPP并行机上运行的并行数据库系统;是用于某一领域(如工程、统计、GIS)的工程数据库、统计数据库、空间数据库,我们都可以广泛地称之为新一代数据库系统。经过多年的研究和讨论,对第三代数据库系统的基本特征已有了共识:,12.1 新一代数据库技术的研究与发展,四、第三代数据库系统第三代数据库系统应支持数据管理、对象管理和知识管理除提供传统的数据管理服务外,第三代数据库系统将支持更加丰富的对象结构和规则,应该集数
12、据管理、对象管理和知识管理为一体。由此可以导出第三代数据库系统必须支持OO数据模型。第三代数据库系统必须保持或继承第二代数据库系统的技术即必须保持第二代数据库系统的非过程化数据存取方式和数据独立性。第三代数据库系统必需对其它系统开放数据库系统的开放性表现在:支持数据库语言标准;在网络上支持标准网络协议;系统具有良好的可移植性、可连接性、可扩展性和可互操作性等。,12.2 数据模型的发展,在讨论数据模型发展之前,我们首先回顾关于数据模型的概念和定义。物理层数据抽象的最低层,用来描述数据物理存储结构和存储方法。例如一个数据库中数据和索引是存放在不同的数据段上还是同一数据段中。数据的物理记录格式是变
13、长的还是定长的,数据是压缩还是非压缩的,索引结构是B+树还是HASH结构等等。这一层的数据抽象称为物理数据模型,它不但由DBMS的设计决定,而且与操作系统、计算机硬件密切相关。物理数据结构一般都向用户隐蔽,用户不必了解其细节。逻辑层数据抽象的中间层,描述数据库数据整体的逻辑结构。这一层的数据抽象称为逻辑数据模型(简称数据模型)。它是用户通过数据库管理系统看到的现实世界,是数据的系统表示。因此它既要考虑用户容易理解,又要考虑便于DBMS实现。不同的DBMS提供不同的逻辑数据模型,传统的数据模型有层次、网状、关系模型,非传统的数据模型有面向对象数据模型(简称OO模型)。,12.2 数据模型的发展,
14、概念层概念层次的数据模型称为概念数据模型,简称概念模型。概念模型离机器最远,从机器立场看是抽象级别的最高层。目的是按用户的观点来对世界建模,因此它应该是:语义表达能力强。能够方便、直接地表达各种语义。易于用户理解。概念模型是用户与数据库设计人员之间交流的语言。用户一般缺乏计算机知识,因此概念模型应当简单、清晰、易于用户理解。独立于任何DBMS 容易向DBMS所支持的逻辑数据模型转换。概念模型的例子有实体-联系模型(Entity-Relational Model 简称ER 模型)。,12.2 数据模型的发展,数据库的发展集中表现在数据模型的发展。从最初的层次、网状数据模型发展到关系数据模型,数据
15、库技术产生了巨大的飞跃。关系模型的提出,是数据库发展史上具有划时代意义的重大事件。然而,进入八十年代,随着数据库应用领域对数据库需求的增多,传统的关系数据模型开始暴露出许多弱点。为了使数据库用户能够直接以他们对客观世界的认识方式来表达他们所要描述的世界,人们提出并发展了许多新的数据模型。这些尝试是沿着如下几个方向进行的:,12.2 数据模型的发展,对传统的关系模型(1NF)进行扩充引入了少数构造器,使它能表达比较复杂的数据类型,增强其结构建模能力。我们称这样的数据模型为复杂数据模型。按照它们进行扩充的侧重点,复杂数据模型可分为两种:一种是偏重于结构的扩充。首先出现的这类模型是嵌套关系模型(NF
16、2)。它能表达“表中表”,并且表中的一个域可以是一个函数(称为虚域)。另一种是侧重于语义的扩充。它支持关系之间的继承,也支持在关系上定义函数和运算符。但关系的结构仍然是一张平面表。“表中表”只能通过关系上定义的函数来模拟。总的来说,在复杂数据模型和支持它们的数据库系统里,客观世界中的每一个实体都用一个元组和它的码(KEY)来表示。不支持太多的语义关联,不区分类和型。这种数据模型和数据库系统的主要缺点是不能保证客观世界中实体的确定性;实体的引用只能通过码和数据冗余来达到。其主要优点是支持这类模型的系统实现起来相对比较容易。,12.2 数据模型的发展,全新的数据构造器和数据处理原语提出全新的数据构
17、造器和数据处理原语,以表达复杂的结构和丰富的语义。这类模型常常统称为语义数据模型。它们的特点是引入了丰富的语义关联(如ISA,ISP)。能更自然,更恰当地表达客观世界中实体间的联系。加上比较丰富的结构构造器(如TUPLE,LIST,SET等),因此它们也具有很强的结构表达能力。也许是由于它们比较复杂,在程序设计语言和技术方面没有相应的支持,计算机硬件也没有发展到一定的程度,因此,它们都没有在数据库系统实现方面有重大的突破。至多被当做数据库设计中概念建模的一种工具(如E-R模型)。将上述语义数据模型和OO程序设计方法结合起来提出了面向对象的数据模型面向对象的数据模型吸收了面向对象程序设计方法学的
18、核心概念和基本思想。一个面向对象数据模型是用面向对象观点来描述现实世界实体(对象)的逻辑组织、对象间限制、联系等的模型。一系列面向对象核心概念构成了面向对象数据模型的基础。,12.3 数据库技术与其他相关技术相结合,数据库技术与其它学科的内容相结合,是新一代数据库技术的一个显著特征,涌现出各种新型的数据库系统,例如:数据库技术与分布处理技术相结合,出现了分布式数据库系统;数据库技术与并行处理技术相结合,出现了并行数据库系统;数据库技术与人工智能相结合,出现了演绎数据库系统、知识库和主动数据库系统;数据库技术与多媒体处理技术相结合,出现了多媒体数据库系统;数据库技术与模糊技术相结合,出现了模糊数
19、据库系统;等等。,12.3 数据库技术与其他相关技术相结合,一、分布式数据库系统随着地理上分散的用户对数据库共享的要求,结合计算机网络技术的发展,在传统的集中式数据库系统基础上产生和发展了分布式数据库系统。分布式数据库应具有以下特点:(1)数据的物理分布性数据库中的数据不是集中存储在一个场地的一台计算机上,而是分布的在不同场地的多台计算机上。它不同于通过计算机网络共享的集中式数据库系统。(2)数据的逻辑整体性数据库虽然在物理上是分布的,但这些数据并不是互不相关的,它们在逻辑上是相互联系的整体。它不同于通过计算机网络互连的多个独立的数据库系统。(3)数据的分布独立性(也称分布透明性)分布式数据库
20、中除了数据的物理独立性和数据的逻辑独立性外,还有数据的分布独立性。即在用户看来,整个数据库仍然是一个集中的数据库,用户不必关心数据的分片,不必关心数据物理位置分布的细节,不必关心数据副本的一致性,分布的实现完全由分布式数据库管理系统来完成。,12.3 数据库技术与其他相关技术相结合,一、分布式数据库系统(4)场地自治和协调系统中的每个结点都具有独立性,能执行局部的应用请求;每个结点又是整个系统的一部分,可通过网络处理全局的应用请求。(5)数据的冗余及冗余透明性与集中式数据库不同,分布式数据库中应存在适当冗余以适合分布处理的特点,提高系统处理效率和可靠性。因此,数据复制技术是分布式数据库的重要技
21、术。但分布式数据库中的这种数据冗余对用户是透明的,即用户不必知道冗余数据的存在,维护各副本的一致性也由系统来负责。,12.3 数据库技术与其他相关技术相结合,二、多媒体数据库媒体是信息的载体。多媒体是指多种媒体,如数字、正文、图形、图象和声音的有机集成,而不是简单的组合。其中数字、字符等称为格式化数据,文本、图形、图象、声音、视象等称为非格式化数据,非格式化数据具有大数据量、处理复杂等特点。多媒体数据库实现对格式化和非格式化的多媒体数据的存储、管理和查询,其主要特征有:能够表示多种媒体的数据。非格式化数据表示起来比较复杂,需要根据多媒体系统的特点来决定表示方法。如果感兴趣的是它的内部结构且主要
22、是根据其内部特定成份来检索,则可把它按一定算法映射成包含它所有子部分的一张结构表,然后用格式化的表结构来表示它。如果感兴趣的是它本身的内容整体,要检索的也是它的整体,则可以用源数据文件来表示它,文件由文件名来标记和检索。,12.3 数据库技术与其他相关技术相结合,二、多媒体数据库(2)能够协调处理各种媒体数据。正确识别各种媒体数据之间在空间或时间上的关联。例如,关于乐器的多媒体数据包括乐器特性的描述,乐器的照片,利用该乐器演奏某段音乐的声音等,这些不同媒体数据之间存在着自然的关联,比如多媒体对象在表达时必须保证时间上的同步特性。(3)提供更强的适合非格式化数据查询的搜索功能。例如可以对Imag
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库技术新进展 2 数据库技术 进展

链接地址:https://www.31ppt.com/p-6296472.html