数据库原理与应用(VFP)概述.ppt
第1章概述,1.1数据处理1.2数据模型1.3概念模型1.4关系运算1.5关系数据库规范化理论*,学习目标,理解数据与信息的关系;了解数据管理发展阶段;理解三种常用的数据模型;掌握E-R方法的图形画法;理解并掌握关系运算的原理与方法;了解关系数据库规范化的基本理论。,重点与难点,重点在于数据模型、概念模型和关系运算;难点在于画出正确的E-R图。,1.1数据处理,数据与信息1.1.2 数据处理1.1.3 数据管理1.1.4 数据库管理系统,数据与信息,数据(Data)是客观事物属性的描述和记录。信息(Information)是对客观事物或情况属性的反映,从哲学的观点,信息可以消除事物的不确定性。数据与信息既相互联系,又有区别。数据是信息的表现形式,是外在的表示;而信息是数据所隐含的联系,是内在的表示。信息通过数据符号进行表示、传播,对数据进行处理获得的数据才是信息,可以说信息是数据的浓缩和精华,是有用的数据。这里的有用是指可以帮助人们进行决策,消除某种不确定性。,1.1.2 数据处理,数据处理(Data Processing)就是对数据进行加工、提炼以获得信息为目的,它可以使用手工计算的方式,也使用计算机处理的方式。计算机方式的数据处理包括数据的采集、整理、存储、分类、索引、排序、检索、统计、维护、传输、输出和数据安全等一系列的操作过程。,1.1.3 数据管理,数据管理也经历了从低级到高级的发展过程,根据数据共享、程序与数据的独立、数据冗余等特征来划分。一般认为经历三个阶段:(1)人工管理阶段(2)文件系统管理阶段(3)数据库系统管理阶段,人工管理阶段,由于缺少必要的软件、硬件环境的支持,用户只能在“裸机”(指没有必要的系统软件支持)上操作,采用程序管理方式。应用程序中不仅要设计数据的逻辑结构,还要说明数据在存储器中的存储位置(地址),应用程序与数据之间相互结合不可分割,当数据有所改变时,程序也必须改动,另外各个应用程序之间的数据不能相互传递。,文件系统管理阶段,计算机的软硬件资源在操作系统的统一协调、管理下使用出现了文件系统,相关的数据可以组织成一种数据文件。数据文件已经可以脱离应用程序而单独存在。文件系统为应用程序和数据文件之间提供了相应的数据调用接口,应用程序通过文件系统完成对数据的管理,一组应用程序可以共享同一个数据文件。,数据库系统管理阶段,所有相关的数据以数据库(Database)方式进行管理。数据库是存储在计算机外存(如硬盘、光盘)上的相关数据构成的集合。数据库的基本思想是对所有相关的数据实行统一、集中和独立的管理。数据库中的数据能够独立于应用程序,可以满足所有用户的不同要求,实现数据共享。,数据库系统管理优点,数据与程序的相互独立;数据能够较好地被程序所共享;数据文件间的关联关系使得数据的冗余大大减少;数据管理效率明显地被提高;通过不同的授权来提高数据的安全性。,1.1.4 数据库管理系统,数据库管理系统(DataBase Management System,DBMS)是对数据库管理的软件系统,是数据库系统的核心,中文Visual Foxpro 6.0就是一种DBMS,它是运行于操作系统之上的一种系统软件,是用户与数据之间的一个接口。,DBMS在计算机系统中的地位,数据库系统的体系结构,数据库系统的体系结构(Database System Architecture,DSA)是数据库系统的一个总体框架。虽然存在数据模型、数据库语言或使用操作系统的不同,但体系结构一般具有三级模式结构的特征。这三级模式(Scheme)是:外模式、概念模式和内模式。,数据库系统的三级模式,1.2数据模型,数据模型(Data Model)是反映客观事物及客观事物联系的数据组织的结构和形式,数据库系统的分类是根据数据模型来划分的。它具有三个组成要素:数据结构、数据操作和数据的约束条件。(1)数据结构是所研究的记录类型的集合,是对系统静态特性的描述;(2)数据操作是指对数据库中各种对象(类型)的实例(值)允许进行的操作的集合;(3)数据的约束条件是一组完整性规则的集合。,数据模型的分类,可以分为三种类型:(1)层次模型;(2)网状模型;(3)关系模型。,1.2.1 层次模型,层次模型的特点包括:(1)有且仅有一个结点没有父结点,它就是根结点。(2)其它结点有且仅有一个父结点。(3)有些结点没有儿子结点,它们就是叶子结点;既有父结点,又有儿子结点的结点是树枝结点。,1.2.2 网状模型,网状模型的特点:(1)允许结点拥有多于一个的父结点。(2)可以有一个以上的结点没有父结点。,1.2.3 关系模型,关系模型用二维表格表示,但不是所有的表格都是符合关系型的,即只有满足一定条件的二维表才可以称为关系。这些条件是:(1)表格的每行表示一条记录,每列表示一个属性或特征;(2)每个属性是不可分的数据项,且具有相同的类型,不允许表中有表;(3)既不允许有完全相同的行,也不允许有相同的列。,1.3概念模型,计算机化的数据管理需要进行转变:现实世界信息世界机器世界,即“三个世界”的抽象,实体与实体集,实体(Entity):是客观存在的并且可以相互区分开来的事物。它既可以是具体的人、事或物,也可以是抽象的概念和概念之间的联系。实体属性(Entity Attribute):是实体所具有的某一特性。码(Key):可用于区分或惟一地标识实体中不同个体的一个属性或几个属性的组合。实体型(Entity Type):用于刻画或抽象同类实体的实体名及其属性名的集合。实体集(Entity Set):具有相同实体型的实体的集合。,术语的对应关系,实体间的联系,现实世界中的客观对象是相互联系的,在信息世界中反映这种联系是通过实体间的联系来体现的,而实体内部的联系是通过组成实体的各属性之间联系。根据实体集之间的联系方式不同,可以分为:一对一、一对多与多对一和多对多。,1:1,若实体集A中的每一个实体,在实体集B中至多有一个(可以没有)实体与之联系,反之亦然。,1:n或n:1,m:n,实体联系表示方法,在概念模型中,表示实体间的联系,最常用的方法是实体-联系方法(Entity-Relation,E-R),简称E-R方法。该方法直接从现实世界中抽象出实体与实体间的联系,然后用E-R图来表示数据模型。,E-R图画法,在E-R图中,实体用方框表示;实体属性用椭圆框表示,通过边将它们连接起来;实体联系用菱形框表示,也是通过边将实体和实体联系连接起来并在边上标注联系的类型,如果实体联系具有属性,它也是用椭圆表示,同样也是通过边将它们和实体联系连接起来。,【例1.1】某高校的选课系统中,学生可以选修多门不同的课程,每门课程可以被多个学生选修。试画出学生选课系统的E-R图。,1.4关系运算,数学定义:域(Domain):是一组具有相同数据类型的值的集合。笛卡尔乘积(Descartes Product):设定一组域D1,D2,Dn,这些域中可以存在相同的域。定义D1,D2,Dn的笛卡尔乘积为:D1D2Dn=(d1,d2,.,dn)|diDi,i=1,2,n 其中每一个元素(d1,d2,.,dn)叫做一个n元组或简称元组。元素中的每个值di(i=1,2,n)叫做一个分量。,关系(Relation),关系代数运算,关系代数定义了关系上的一组集合代数运算,每个运算都以一个或多个关系作为运算对象,运算的结果也是一个关系。关系代数运算包括传统的集合运算和专门的关系运算两类。,一、传统的集合运算,1.关系的并:是指关系R和关系S的所有元素合并,再删除掉重复的元组,得到一个新的关系称为R和S的并,记为RS。2.关系的交:是指由既属于R又属于S的所有元组组成的集合,即在两个关系中取相同的元组得到的一个新的关系称为R和S的交,记为RS。3.关系的差:是由属于R而不属于S的所有元组组成的集合,即在关系R中删除掉与关系S中相同的元组而得到的一个新的关系称为R和S的差,记为R-S。4.笛卡尔积:它的定义已经在1.4小节给出,这里再给出它的记法,设两个关系R和S,则它们的笛卡尔积,记为RS。,【例1.2】设有三个关系:R(X,Y)、S(X,Y)和T(Y,Z)。,根据运算的定义,可以得到传统集合运算的结果:,二、专门的关系运算,专门的关系运算有选择、投影和连接运算。,(1)选择(Select),选择运算是从关系中找出满足给定条件的所有元组,记为F(R),其中R表示关系,F表示条件表达式。在VFP中是通过命令中的For或While短语来实现选择符合条件的记录。,(2)投影(Project),投影运算是从关系中挑选若干属性组成新的关系称为投影。投影运算记为x(R),其中R为一个关系,x为一组属性名或属性序号组(是对应属性在关系中的顺序编号)。同选择运算相比,投影实质也是选择,只不过是从列方向进行的选择,对关系进行垂直分解。经过投影运算得到的新关系,其中包含的属性个数一般比原来关系的属性个数要少或者属性的排列顺序不同。在VFP中是通过命令中的Fields短语来实现字段(属性)的选择。,(3)连接(Join),连接运算是将两个关系的属性名拼接在一起,生成一个新关系,其中的属性来自两个原关系,元组需要满足连接条件的。连接可以分为如下三类:连接、F连接和自然连接。在VFP中实现连接可以使用物理连接命令Join,也可以使用逻辑连接命令Set Relation to,并结合动词短语fields。,三种连接的区别,连接:是从关系R和S的笛卡尔积中选取属性值满足某一操作的元组,记为R S,其中i和j分别代表关系R和S中第i和第j个属性的序号,代表操作,譬如:可以是、=或等,如果是“=”,则称为“等值连接”。F连接:是从关系R和S的笛卡尔积中选取属性值满足某一公式F的元组,记为R S,其中F是形式为F1F2Fn的公式,“”表示逻辑与运算,每个Fi(i=1,2,n)是形式为i j的式子,而i和j分别代表关系R和S中第i和第j个属性的序号。自然连接:是除去重复属性的等值连接,它是连接运算的一个特例,也是最常用的连接运算。记为R S,其中R和S是两个关系,并且具有一个或多个同名属性。,【例1.3】设有关系R(A,B,C)和关系S(B,C,D),依据定义可以得到专门关系运算的结果:,1.5关系数据库规范化理论*,在关系数据库系统中,设计一个数据库就是设计一些关系表、关系表中的属性(字段)和关系表之间的关系。为了解决关系模式存在的如下问题:数据冗余、不一致性、插入异常和删除异常等问题,需要研究关系模式的规范化设计问题。,1.5.1 范式(Normal Form,NF),要设计一个好的关系模式,必须使得关系满足一定的约束条件,此约束遵照的规范就称为范式(Normal Form,NF)。,1.5.2 范式的判定条件,范式可以分成五个等级,一级比一级要求严格,第一范式是最低要求,第五级范式要求最高。显然,满足较高范式条件者必须满足较低范式条件。一个较低范式的关系模式,可以通过关系模式的无损分解转换为若干较高范式关系模式的集合,这一过程称作关系模式规范化(Normalization)。,第一范式(1NF),设R是一个关系模式,R属于第一范式当且仅当R中每一个属性A的值域只包含原子项,即不可分割的数据项。,第二范式(2NF),设R是一个关系模式,R属于第二范式当且仅当R是1NF,且每个非主属性都完全函数依赖于主码。,【例1.4】设关系模式R(A,B,C,D),关键字为A,B的组合,若R满足函数依赖AD,则R不属于2NF。通过投影分解消除1NF关系中非主属性对主码的部分依赖成分,使之满足2NF。,通过对关系模式R进行投影分解成两个子关系模式R1和R2:R1(A,D)&AD R2(A,B,C)&A,BC 并且A是R2关于R1的外码。则R1、R2都属于了2NF,利用外码A连接R1和R2可重新得到R,即R1和R2是R的无损分解。,第三范式(3NF),设R是一个关系模式,R属于第三范式当且仅当R是2NF,且每个非主属性都非传递函数依赖于主码。3NF的关系已排除了非主属性对于主码的部分依赖和传递依赖,从而使关系表达的信息相当单一,能够满足关系数据库一般情况下的要求。,【例1.5】设关系模式R(A,B,C),主码为A,满足函数依赖BC,且B-A,则R不属于3NF,计算属于3NF的关系模式集合。,利用投影消除非主属性间的传递函数依赖,可以将R分解为如下的关系模式R1和R2:R1(B,C)&因为BC,且B-A,则R1属于3NF。R2(A,B)&因为主码为A,AB,且B-A,则R2属于3NF。并且R1和R2基于属性B连接可以重新得到关系模式R,BC范式(BCNF)4NF,设R是一个关系模式,若R中的所有非平凡的、完全的函数依赖的决定因素是码,则R属于BCNF。,1.5.3 关系模式的分解,通过投影可以分解关系模式,分解后的模式可以通过连接重新得到原来的关系模式。这样做的目的,是为了使得分解后的模式保持原模式所满足的特性,要求分解处理具有无损分解和保持函数依赖性。,本章小结,信息是有用的数据,方便人们决策;数据处理的目的是得到信息。数据管理经历了三个阶段。DBMS是在操作系统之上的系统软件,是用户与数据库间的接口。三级模式。数据模型分为三类。三个世界。实体间的联系有三种,E-R图是最直观的表示方法。传统的集合运算有四种,专门的关系运算有三种。范式及范式判定的条件。关系模式的无损分解。,作业,P18 1.9至1.23 1.24至1.26,