Access基础与应用教程PPT课件第1章数据库基础概述.ppt
第1章,数据库及其应用是计算机科学中一个重要的分枝。数据库技术应用非常快、非常广泛,现在,许多单位的正常业务开展都离不开数据库。,数据库基础概述,第1章 数据库基础概述,本章主要内容,退出,1.1 数据管理发展概况1.2 数据库系统简述1.3 数据模型1.4 关系数据库1.5 关系运算1.6 数据库设计简述,1.1 数据管理发展概况,自从世界上第一台电子数字计算机(简称计算机)诞生以来,数据管理经历了从较为低级的人工管理到先进的数据库、数据仓库、数据挖掘的演变。,1.1.1 数据及数据处理,数据是描述事物的符号记录,例如:“黄山”、“95”。也可以说,数据是存储在某一种媒体上能够识别的物理符号。数据不仅可以包括数字、字母、文字和其他特殊字符组成的文本形式,而且还可以包括图像、图形、影像、声音、动画等多媒体形式等,它们经过数字化后可以存入计算机。数据处理是把数据加工处理成为信息的过程。信息是数据根据需要进行加工处理后得到的结果。,1.1.1 数据及数据处理(续),信息对于数据接收者来说是有意义的。例如:“黄山”、“95”只是单纯的数据,没有具体意义,而“黄山同学本学期英语期末考试成绩为95分”就是一条有意义的信息。此外,“旅游景点黄山的门票费是每人95元人民币”也是一条有意义的信息。,1.1 数据管理发展概况(续),数据管理技术的发展阶段1.1.2 人工管理(外存储器只有纸带、卡片和磁带,而没有磁盘)1.1.3 文件系统阶段 文件中只存储数据,不存储文件记录的结构描述信息。文件的建立、存取、查询、插入、删除、修改等所有操作,都要用程序来实现。1.1.4 数据库系统,1.1 数据管理发展概况(续),1.1.5 分布式数据库系统 分布式数据库是数据库技术与网络技术相结合的产物,分布计算主要体现在客户机服务器模式和分布式数据库体系结构两个方面。1.1.6 面向对象数据库系统 将面向对象技术与数据库技术结合产生出面向对象的数据库系统。1.1.7 数据仓库 数据仓库是支持管理决策过程的、面向主题的、集成的、稳定的、随时间变化的数据集合。1.1.8 数据挖掘 数据挖掘,又称为数据库中的知识发现,就是一个从数据库中获取有效的、新颖的、潜在有用的、最终可理解的模式(注:模式又称为知识)的复杂过程。,1.2.1 数据库 数据库(Database,简称为DB)是长期存储在计算机内、有组织的、可共享的、统一管理的相关数据的集合。数据库中的数据按一定的数据模型进行组织、描述和存储,具有较小的冗余度、较高数据独立性和易扩展性。数据库中的数据不只是面向某一种特定的应用,而是可以面向多种的应用,可以被多个用户、多个应用程序所共享。例如:图书管理数据库、财务管理数据库、学生管理数据库。,1.2 数据库系统简述,1、数据库管理系统 数据库管理系统(DataBase Management System,简称 DBMS)是数据库系统的核心软件,其主要任务是支持用户对数据库的基本操作,对数据库的建立、运行和维护进行统一管理、统一控制。注意:用户不能直接接触数据库,而只能通过DBMS 来操作数据库。,1.2.2 数据库管理系统,2数据库管理系统的功能,(1)数据定义功能 DBMS 提供了数据定义语言(Data Description Language,简称DDL)供用户定义数据库的结构、数据之间的联系等。(2)数据操纵功能 DBMS 提供了数据操纵语言(Data Manipulation Language,简称 DML)来完成用户对数据库提出的各种操作要求,以实现对数据库的插入、修改、删除、检索等基本操作。,(3)数据库运行控制功能 DBMS 提供了数据控制语言(Data Control Language,简称DCL)负责数据完整性、安全性的定义与检查以及并发控制功能,(4)数据库维护功能 DBMS 还可以对已经建立好的数据库进行维护,比如数据字典的自动维护,数据库的备份、恢复等。(5)数据库通信功能 DBMS 应提供网络环境的数据通信功能。,数据库管理系统的功能(续),1.2.3 数据库系统,1数据库系统的组成 数据库系统(Database System,简称 DBS)是指采用了数据库技术的计算机应用系统。它实际上是一个集合体。,(1)数据库(DB)。(2)数据库管理系统(DBMS),它是数据库系统的核心组成部分。(3)计算机硬件环境、操作系统环境及各种实用程序。(4)管理和使用数据库系统的各类人员。,数据库系统(DBS)通常包括:,管理和使用数据库系统的各类人员可以分为:数据库管理员(Dadabase Administrator,即 DBA)。全面负责建立、维护、管理和控制数据库系统。系统分析员。系统分析员是数据库系统建设期的主要参与人员,负责应用系统的需求分析和规范说明,确定系统的基本功能,数据库结构和应用程序的设计,以及软硬件的配置,并组织整个系统的开发。应用程序员(Application Programmer)。应用程序员根据数据库系统的功能需求,设计和编写应用系统的程序模块,并参与对程序模块的测试。终端用户(End User)。按照用户需求的信息以及获得信息的方式的不同,一般可将终端用户分为操作层、管理层和决策层,他们通过应用系统的用户接口使用数据库。,2、数据库系统的特点,(1)数据低冗余、共享性高。(2)有统一的数据控制功能。包括数据的安全性控制、数据的完整性控制、并发控制、数据备份、数据恢复等。(3)数据独立性高。数据的独立性包括逻辑独立性和物理独立性。,数据的逻辑独立性是指当数据的总体逻辑结构改变时,数据的局部逻辑结构不变,由于应用程序是依据数据的局部逻辑结构编写的,所以应用程序不必须修改,从而保证了数据与程序间的逻辑独立性。例如,在原有的某些记录类型中增加新的数据项,而应用程序不必须修改,体现了数据的逻辑独立性。,数据的物理独立性是指当数据的存储结构改变时,数据的逻辑结构不变,从而应用程序也不必改变。例如,改变存储设备(如换了一个磁盘来存储该数据库),而应用程序不必须修改,体现了数据的物理独立性。,注意三个概念:数据库(DB)、数据库管理系统(DBMS)、数据库系统(DBS)是三个不同的概念。数据库强调的是数据。数据库管理系统是管理数据库的工具软件。数据库系统强调的则是一个整体系统。数据库系统(DBS)包含数据库(DB)及数据库管理系统(DBMS)。,数据库应用系统是为最终用户使用数据库而开发的软件系统。例如:图书馆的管理系统、企业的信息管理系统、财会信息管理系统、高校的教务管理系统等等。,1.2.4 数据库应用系统,1.2.5 数据库系统的三级模式及二级映射结构,根据美国国家标准化协会和标准计划与需求委员会提出的建议,数据库系统的内部体系结构是三级模式和二级映射结构。三级模式分别是概念模式、外模式和内模式。二级映射分别是概念模式到内模式的映射和外模式到概念模式的映射。,1数据库系统的三级模式(1)概念模式 概念模式也称为模式。它是数据库中全局数据逻辑结构的描述,是所有用户(应用)的公共数据视图。定义模式时不仅要定义数据的逻辑结构(例如数据记录由哪些数据项构成,数据项的名字、类型、取值范围等),而且要定义与数据有关的安全性、完整性要求,定义这些数据之间的联系。对概念模式的描述,DBMS一般都提供有相应的模式描述语言(模式DDL)来定义模式。,(2)外模式 外模式也称子模式或用户模式。它是数据库用户所见到和使用的局部数据逻辑结构的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。一个概念模式可以有若干个外模式,每个用户只关心与他有关的外模式,这样不仅可以屏蔽大量无关信息而且有利于数据库中数据的保密和保护。对外模式的描述,DBMS一般都提供有相应的外模式定义语言(外模式DDL)来定义外模式。,(3)内模式 内模式也称存储模式或物理模式,它是数据库物理存储结构和物理存储方法的描述,是数据在存储介质上的保存方式。例如,数据的存储方式是顺序存储、还是按照 B 树结构存储等等。内模式对一般用户是透明的,但它的设计直接影响数据库的性能。对内模式的描述,DBMS一般都提供有相应的内模式定义语言(内模式DDL)来定义内模式。一个数据库只有一个内模式。,2数据库系统的二级映射 数据库系统的三级模式之间的联系是通过二级映射来实现的,当然实际的映射转换工作是由DBMS来完成的。(1)外模式到概念模式的映射 外模式到概念模式的映射(即外模式概念模式映射)定义了外模式与概念模式之间的对应关系。外模式是用户的局部模式而概念模式是全局模式。当概念模式改变时,由数据库管理员对各个外模式概念模式映射作相应改变,可以使外模式保持不变,从而应用程序不必修改,保证了数据的逻辑独立性。,(2)概念模式到内模式的映射 概念模式到内模式的映射(即概念模式内模式映射)定义了数据全局逻辑结构与物理存储结构之间的对应关系。当数据库的存储结构改变时(例如换了另一个磁盘来存储该数据库),由数据库管理员对概念模式内模式映射作相应改变,可以使概念模式保持不变,从而保证了数据的物理独立性。,1.3 数据模型,数据是现实世界符号的抽象,而数据模型则是数据特征的抽象。数据模型所描述的内容包括三个方面,即是数据结构、数据操作与数据约束条件。数据模型是从现实世界到机器世界的一个中间层次。现实世界的事物反映到人的大恼中,人们把这些事物抽象为一种既不依赖于具体的计算机系统又不依赖于具体的DBMS的概念模型,然后,再把该概念模型转换为计算机中某个 DBMS 所支持的数据模型。,数据模型包括如下三类:1概念数据模型 概念数据模型是面向数据库用户的现实世界的数据模型,也简称概念模型。概念模型主要用来描述现实世界的概念化结构。它使数据库的设计人员在设计的初始阶段,摆脱计算机系统及DBMS的具体技术问题,集中精力分析数据以及数据之间的联系等。概念模型与具体的计算机平台无关、与具体的 DBMS 无关。,2逻辑数据模型 逻辑数据模型也简称数据模型。逻辑数据模型主要用来描述数据库中数据的表示方法和数据库结构的实现方法。它是计算机实际支持的数据模型,是与具体的DBMS有关的数据模型。它包括层次数据模型、网状数据模型、关系数据模型、面向对象数据模型等。3物理数据模型 物理数据模型也简称物理模型,它是一种面向计算机物理表示的模型。物理数据模型给出了数据模型在计算机上物理结构的表示,它是描述数据在储存介质上的组织结构的数据模型。,1.3.1 概念模型E-R模型,概念模型是一种面向客观世界、面向用户的模型。概念模型也称信息模型。概念模型是按用户的观点,从概念上描述客观世界复杂事物的结构以及事物之间的内在联系,而不管事物和联系如何在数据库中存储,即是概念模型与具体的数据库管理系统(DBMS)无关,与具体的计算机平台无关。概念模型是整个数据模型的基础。在此,仅介绍最广泛使用的概念模型设计方法E-R方法设计概念模型的有关内容。,1概念模型中的基本概念(1)实体 客观存在并可相互区别的事物称为实体。实体可以是具体的人、事、物,也可以是抽象的概念或联系。例如一个教师、一门课、一本书、一次作业、一次考试等。(2)属性 描述实体的特性称为属性。一个实体可以由若干个属性来刻画,如一个学生实体有学号、姓名、性别、出生日期等方面的属性。属性有属性名和属性值,属性的具体取值称为属性值。例如,对某一学生的“性别”属性取值“女”,其中“性别”为属性名,“女”为属性值。,(3)关键字 能够唯一标识实体的属性或属性的组合称为关键字。如学生的学号可以作为学生实体的关键字,但学生的姓名有可能有重名,因此不能作为学生实体的关键字。(4)域 属性的取值范围称为该属性的域。例如,学号的域为8个数字字符串集合,性别的域为“男”和“女”。,(5)实体型 属性的集合表示一个实体的类型,称为实体型。例如,学生(学号,姓名,性别,出生日期)就是一个实体型。属性值的集合表示一个实体。例如,属性值的集合(02091001,李楠,女,1986-01-12)就是代表一个具体的学生。(6)实体集 同类型的实体的集合称为实体集。例如,对于“学生”实体来说,全体学生就是一个实体集。,2、两个实体之间的联系 现实世界中事物内部以及事物之间是有联系的,在概念模型中反映为实体内部的联系和实体之间的联系。实体内部的联系通常是指组成实体的各属性之间的联系,而实体之间的联系通常是指不同实体集之间的联系。,两个实体之间的联系可分为如下三种类型:(1)一对一联系(1:1)实体集 A 中的一个实体至多与实体集 B 中的一个实体相对应,反之亦然,则称实体集 A 与实体集 B 为一对一的联系,记作 1:1。例如,一个学校只有一个校长,一个校长只能管理一个学校。,(2)一对多联系(1:n)如果对于实体集 A 中的每一个实体,实体集 B 中有多个实体与之对应,反之,对于实体集 B 中的每一个实体,实体集 A 中至多只有一个实体与之对应,则称实体集 A 与实体集 B 之间为一对多联系,记为 1:n。例如,学校的一个系有多个专业,而一个专业只属于一个系。,(3)多对多联系(m:n)如果对于实体集 A 中的每一个实体,实体集 B 中有多个实体与之对应,反之,对于实体集 B 中的每一个实体,实体集 A中也有多个实体与之对应,则称实体集 A与实体集 B 之间为多对多联系,记为 m:n。例如,一个学生可以选修多门课程,一门课程可以被多名学生选修。,3、E-R方法 E-R方法(即实体-联系方法)是最广泛使用的概念数据模型设计方法,该方法用 E-R 图来描述现实世界的概念数据模型。E-R方法描述说明如下:(1)实体(型)实体(型)用矩形表示,矩形框内写上实体名称。(2)属性 属性用椭圆形表示,椭圆内写明属性名,并用连线将其与相应的实体型连接起来。(3)联系 联系用菱形表示,菱形框内写明联系名,并用连线分别与有关实体连接起来,同时在连线旁标上联系的类型(如1:1、1:n 或 m:n)。,图 1-3 E-R 图示例,1.3.3 逻辑数据模型,逻辑数据模型分为:层次模型、网状模型、关系模型和面向对象模型。,1.层次数据模型,层次数据模型(简称层次模型)采用树型结构来表示实体和实体间的联系。如图1-4所示是层次模型的一个例子,在该例子中树型反映出整个系统的数据结构和它们之间的关系。在层次模型中,只有一个根结点,其余结点只有一个父结点,每个结点是一个记录,每个记录由若干数据项组成。记录之间使用带箭头的连线连接以反映它们之间的关系。,2.网状数据模型,网状数据模型(简称网状模型)可以看成是层次模型的一种扩展。一般来说,满足如下基本条件的基本层次联系的集合称为网状模型:(1)可以有一个以上的结点无父结点;(2)允许结点有多个父结点;(3)结点之间允许有两种或两种以上的联系。如图1-5所示是网状模型的一个例子。,3.关系数据模型,关系数据模型(简称关系模型)以二维表的方式(如表1-1所示)组织数据。关系模型建立在严格的数学概念基础之上,自从出现后发展迅速。20世纪80年代以来,几乎所有的数据库系统都是建立在关系模型之上。基于关系模型建立的数据库系统则称为关系数据库系统。,4.面向对象数据模型,面向对象数据模型(简称面向对象模型)是用面向对象的观点来描述现实世界实体的逻辑组织、实体之间的限制和联系等的模型。在面向对象数据模型中,所有现实世界中的实体都可看成对象。一个对象包含若干属性,用于描述对象的特性。属性也是对象,它又可包含其他对象作为其属性。这种递归引用对象的过程可以继续下去,从而组成各种复杂的对象,而且,同一个对象可以被多个对象所引用。除了属性之外,对象还包含若干方法,用于描述对象的行为。方法又称为操作,它可以改变对象的状态。,1.3.3 物理数据模型,物理数据模型(简称物理模型)是一种面向计算机物理表示的模型。物理数据模型给出了逻辑数据模型在计算机上物理结构的表示,它是描述数据在储存介质上的组织结构的数据模型,它不但与具体的DBMS有关,而且还与操作系统和硬件有关。每一种逻辑数据模型在实现时都有与其相对应的物理数据模型。DBMS为了保证其独立性与可移植性,大部分物理数据模型的实现工作是由系统自动完成,而设计者只需设计索引等特殊结构。,1.4 关系数据库,关系数据库是基于关系模型的数据库。Access 就是一个关系数据库管理系统,使用它可以创建某一具体应用的 Access 关系数据库。,1.4.1 关系模型的基本术语,1关系 一个关系就是一个二维表,每一个关系都有一个关系名。在关系数据库管理系统中,通常把二维表称为数据表,也简称为表。二维表中含有几列就称为几元关系。对关系的描述称为关系模式,一个关系模式对应于一个关系的结构。关系模式的一般格式:关系名(属性名1,属性名2,属性名n)在Access中,关系模式表示为表模式,它对应于一个表的结构。即:表名(字段名1,字段名2,字段名n)例如,“学系”表的关系模式为:学系(学系代码,学系名称,办公电话,学系简介),2属性 二维表中的一列称为一个属性,每一列都有一个属性名。在Access中,表中的一列称为字段,属性名也称为字段名。3元组 二维表中的从第二行开始的每一行称为一个元组或记录。在Access中元组称为记录。“关系”是“元组”的集合,“元组”是属性值的集合,一个关系模型中的数据就是这样逐行逐列组织起来的。,关系术语(续),4分量 元组中的一个属性值称为分量。关系模型要求关系的每一个分量必须是一个不可分的数据项,即不允许表中还有表。5域 属性的取值范围称为域,即不同的元组对同一属性的取值所限定的范围。例如,性别只能从“男”、“女”两个汉字中取其中一个汉字。,关系术语(续),6候选关键字 关系中的某个属性组(一个属性或几个属性的组合)可以唯一标识一个元组,这个属性组称为候选关键字。7主关键字(简称主键)一个关系中可以有多个侯选关键字,选择其中一个作为主关键字,也称为主键或主码。例如,在“学生”表中,由于每个学号是唯一的,故可以设置“学号”字段为主键。,关系术语(续),8外部关键字(简称外键)如果一个属性组(一个属性或几个属性的组合)不是所在关系的主关键字,而是另一个关系的主关键字或候选关键字,则该属性组称为外部关键字,也称为外键或外码。9主属性 包含在任一候选关键字中的属性称为主属性。,关系术语(续),1.4.2 关系的性质,关系是一个二维表,但并不是所有的二维表都是关系。关系应具有以下性质:(1)每一列中的分量是同一类型的数据,来自同一个域。(2)不同的列要给予不同的属性名。(3)列的顺序无所谓,即列的次序可以任意交换。(4)任意两个元组不能完全相同。(5)行的顺序无所谓,即行的次序可以任意交换。(6)每一个分量都必须是不可再分的数据项。由上述可知,二维表中的每一行都是唯一的,而且所有行都具有相同类型的字段。,1.4.3 关系完整性约束,关系模型允许定义三种完整性约束,即是实体完整性约束、参照完整性和用户定义完整性约束。其中实体完整性约束和参照完整性约束统称为关系完整性约束,是关系模型必须满足的完整性的约束条件,它由关系数据库系统自动支持。用户定义完整性约束是应用领域需要遵循的约束条件。,1实体完整性约束,由于每个关系的主键是惟一决定元组的,故实体完整性约束要求关系的主键不能为空值,组成主键的所有属性都不能取空值。例如,有如下“学生”关系:学生(学号,姓名,性别,出生日期)其中学号是主键,因此,学号不能为空值。例如,有如下“修课成绩”关系:修课成绩(学年度,学期,学号,课程代码,课程类别,成绩性质,成绩)其中学年度、学期、学号和课程代码和共同构成主键,因此,学年度、学期、学号和课程代码都不能为空值。,2参照完整性约束,参照完整性约束是关系之间相关联的基本约束,它不允许关系引用不存在的元组,即在关系中的外键取值只能是关联关系中的某个主键值或者为空值。例如:学系代码是“学系”关系的主键、“专业”关系的外键。“专业”关系中的学系代码必须是“学系”关系中一个存在的值,或者是空值。,3用户定义的完整性约束,用户定义的完整性约束是针对具体数据环境与应用环境由用户具体设置的约束,它反映了具体应用中数据的语义要求,它的作用就是要保证数据库中数据的正确性。例如,限定某属性的取值范围,学生成绩的取值必须在 0,100 范围。,1.4.4 关系规范化,在关系数据库中,如果关系模式没有设计好,就会出现数据冗余、数据更新异常、数据删除异常、数据插入异常等问题。关系模式的优良程度直接影响数据库中的数据完整性等方面的性能。关系规范化就是将结构复杂的关系模式分解成结构简单的关系模式,从而使一个关系模式描述一个实体或实体间的一种联系,以达到概念的单一化。关系规范化目的就是要把不好的关系模式转变为好的关系模式。,把关系数据库的规范化过程中为不同程度的规范化要求设立的不同标准称为范式。由于规范化的程度不同,就产生了不同的范式,如第一范式、第二范式、第三范式、BCNF范式、第四范式、第五范式等。每种范式都规定了一些限制约束条件。第一范式(1NF)是最基本的规范形式,即在关系中每个属性都必须是不可再分割的数据项。在关系数据库中,任何一个关系模式都必须满足第一范式,即表中的每个字段都是不可再分割的数据项,也就是说,表中不能再包含表。其他级别的范式在此不作详述。,1.5 关系运算,关系的基本运算有两类,一类是传统的集合运算(包括并、交、差和广义笛卡儿积等运算),另一类是专门的关系运算(包括选择、投影、联接和除等运算)。关系基本运算的结果也是一个关系。,1.5.1 传统的集合运算,传统的集合运算包括并、交、差和广义笛卡儿积等运算。要进行并、交、差运算的两个关系必须具有相同的结构。对于Access 数据库来说,即是指两个表的结构要相同。,假定专业A(如表1-2所示)和专业B(如表1-3所示)两个关系结构相同。,表1-3 专业A 表1-4 专业B,1并运算,假设 R 和 S是两个结构相同关系,R 和 S两个关系的并运算可以记作 RS,运算结果是将两个关系的所有元组组成一个新的关系,若有完全相同的元组,只留下一个。例1-1专业A 专业B 的并运算结果如表1-4 所示。表1-4 专业A 专业B的并运算结果,2交运算,假设 R 和 S是两个结构相同关系,R 和 S两个关系的交运算可以记作RS,运算结果是两个关系中公共元组组成一个新的关系。例1-2专业A 专业B 的交运算结果如表1-5所示。,表1-5 专业A 专业B的交运算结果,3差运算,假设 R 和 S是两个结构相同关系,R 和 S两个关系的差运算可以记作RS,运算结果是由属于R,但不属于S的元组组成一个新的关系。例1-3专业A 专业B 的差运算结果如表1-6所示。,表1-6 专业A 专业B的差运算结果,4集合的广义笛卡儿积运算,设 R 和 S 是两个关系,如果 R 是 m 元关系,有 i 个元组,S 是 n 元关系,有 j 个元组,则笛卡儿积 RS 是一个 m+n 元关系,有 ij 个元组。例1-4学生A(表1-7)课程A(表1-8)的笛卡儿积运算结果如表1-9所示。,表1-9 学生A 课程A的笛卡儿积运算结果,1.5.2 专门的关系运算,在关系代数中,有4种专门的关系运算,即选择、投影、联接和除运算。,1、选择,选择运算是指从指定的关系中选择出满足指定条件的元组组成一个新关系。通常选择运算记作:(R)其中,是选择运算符,R 是关系名。例1-5在关系 专业(专业代码,专业名称,学系代码)中,选取学系代码为“02”的专业元组,可以记成:学系代码=02(专业),2、投影,投影运算是指从指定关系中选取某些属性组成一个新关系。通常投影运算记作:A(R)其中,是投影运算符,A是被投影的属性或属性组,R 是关系名。例1-6在关系 专业(专业代码,专业名称,学系代码)中,选取所有专业的专业名称、学系代码,可以记成:专业名称,学系代码(专业),补充选择运算与投影运算组合使用,例如,在关系 职工(职工号,姓名,性别,年龄,职位,工资)中,选取所有工资1500元以上(含1500)的女的职工的姓名,职位,工资。可以记成:姓名,职位,工资(工资=1500 and 性别=女(职工)例如,在关系 职工(职工号,姓名,性别,年龄,职位,工资)中,选取所有工资1500元以下(含1500)或2500以上的职工的姓名,职位,工资。可以记成:姓名,职位,工资(工资2500(职工),3、联接运算,联接运算用来联接相互之间有联系的两个或多个关系,从而组成一个新的关系。联接类型有内联接、自然联接、左外联接、右外联接、全外联接等。其中最常用的联接是自然联接。自然联接是按照公共属性值相等的条件进行联接,并且消除重复属性。例1-7将表1-10所示的“学生B”与表1-11所示的“修课成绩B”两个关系进行自然联接运算,其自然联接运算的结果如表1-12所示。,表1-12 学生B 与修课成绩B 的自然联接结果,4、除运算,关系 R与关系 S的除法运算应满足的条件是:关系 S 的属性全部包含在关系 R 中,关系 R 的一些属性不包含在关系 S 中。关系 R与关系 S的除法运算表示为 RS。除法运算的结果也是关系,而且该关系中的属性由 R 中除去 S 中的属性之外的全部属性组成,元组由 R 与 S 中在所有相同属性上有相等值的那些元组组成。例1-8将表1-13所示的“学生修课”表与表1-14所示的“所有课程”表进行除运算,以找出已修所有修课程的学生,其除运算的结果如表1-15所示。,表1-13 学生修课 表1-14 所有课程,表1-15 学生修课所有课程的除运算结果,1.6 数据库设计简述,由于数据库具有数据量厐大(许多称为海量级)、数据保存时间长、数据关联比较复杂,应用多样化等特点,因此,设计出一个结构合理、满足实际应用需求的数据库就至关重要。,1.6.1 数据库应用开发,数据库应用系统的设计目前一般大多采用生命周期法,即是将整个数据库应用系统的开发分解成目标独立的若干阶段,即分为需求分析阶段、概念设计阶段、逻辑设计阶段、物理设计阶段、编码阶段、测试阶段、运行阶段、维护阶段等。与数据库设计关系最密切的是上述几个阶段中的前四个阶段,即需求分析、概念设计、逻辑设计和物理设计阶段,如图1-7所示。,图1-6 数据库设计阶段示意图,1.6.2 数据库需求分析阶段,1调查用户的需求 调查用户对数据库的各种要求,调查的重点是“数据”和“处理”。具体包括:(1)信息要求 用户对数据库的信息要求是指用户需要从数据库中获得信息的内容与性质。(2)处理要求 用户对数据库的处理要求是指用户要完成什么处理功能。(3)安全性和完整性的要求,2分析和表达用户的需求 分析和表达用户的需求,经常采用的方法有结构化分析方法和面向对象的方法。结构化分析(Structured Analysis,简称 SA 方法)方法用自顶向下、逐层分解的方式分析系统。用数据流图(Data Flow Diagram,简记为 DFD)表达数据和处理过程的关系,用数据字典(Data Dictionary,简记为 DD)对系统中的数据的进行详尽描述。数据流图是描述数据处理过程的工具,是需求理解的逻辑模型的图形表示,它直接支持系统的功能建模。,1.6.3 数据库的概念设计阶段,数据库概念设计的目的是分析数据间内在的语义关联,在此基础上建立一个数据的抽象模型概念数据模型(简称概念模型)。概念模型是根据用户需求设计出来的,它不依赖于任何的数据库管理系统(DBMS)。概念模型设计的描述最常用的工具是 E-R 图,具体步骤如下:(1)确定实体;(2)确定实体的属性;(3)确定实体的主键;(4)确定实体间的联系类型;(5)画出ER图。E-R图也称为ER模型(实体联系模型)。,1.6.4 数据库的逻辑设计阶段,数据库的逻辑设计主要是将概念数据模型转换成为DBMS所支持的逻辑数据模型。对于关系数据库管理系统(即RDBMS)来说,就是将概念数据模型转换成关系数据模型,即是将E-R图转换成指定的RDBMS所支持的关系模式。在数据库的逻辑设计过程中,形成许多的关系模式。如果关系模式没有设计好,就会出现数据冗余、数据更新异常、数据删除异常、数据插入异常等问题。故在设计过程中,要按照关系规范化的要求去设计出好的关系模式。,1.6.5 数据库的物理设计阶段,数据库的物理设计是设计数据库的存储结构和物理实现方法。数据库的物理设计主要目标是对数据库内部物理结构作调整并选择合理的存取路径,以提高数据库访问速度以及有效利用存储空间。目前,在关系数据库中已大量屏蔽了内部物理结构,因此留给用户参与物理设计的任务很少,一般的关系数据库管理系统留给用户参与物理设计的内容大致有索引设计、分区设计等。,