数据库第02章关系数据库理论基础.ppt
2023/9/11,数据库原理及开发,1,第2章 关系数据库理论基础,本章重点内容 关系的数学定义和性质关系模式的完整性约束条件关系代数关系的规范化原则,范式的基本概念和分解方法,2023/9/11,数据库原理及开发,2,关系模型:关系数据结构 关系操作集合 关系完整性约束关系操作:查询(选择select 投影project 连接join 除divide 并union 交intersection 差)、增加、删除、修改关系操作的特点是集合操作方式关系操作的表示:代数方式、逻辑方式,分别称为关系代数 和关系演算。表达查询要求的方式SQL(structurel query language):介于关系代数和关系演算之间的语言。是关系数据库的标准语言。,2023/9/11,数据库原理及开发,3,2.1 关系的基本概念,2.1.1 关系的数学定义1域(Domain)域:是一组具有相同数据类型的值集合。例如:自然数,男,女,0,1等都可以是域。基数:域中数据的个数称为域的基数。域被命名后用如下方法表示:D1=白亚春,陈韬,王雪莲,表示姓名的集合,基数是3;D2=计算机系,电子系,2023/9/11,数据库原理及开发,4,2笛卡尔积(Cartesian Product)给定一组域D1,D2,Di,Dn(可以有相同的域),则笛卡尔积定义为:D1D2DiDn=(d1,d2,di,dn)diDi,i=1,2,nD1XD2=(陈韬,计算机系),(陈韬,电子系),(王雪莲,计算机系),(王雪莲,电子系),(白亚春,计算机系),(白亚春,电子系)其中每个(d1,d2,di,dn)叫做元组,元组中的每一个值di叫做分量,di必须是Di中的一个值。显然,笛卡尔积的基数就是构成该积所有域的基数累乘积,若Di(i=1,2,n)为有限集合,其基数为mi(i=1,2,n),则D1D2DiDn笛卡尔积的基数M为:,2023/9/11,数据库原理及开发,5,该笛卡尔积的基数是M=m1m2=3*2=6,即该笛卡尔积共有6个元组,它可组成一张二维表,2023/9/11,数据库原理及开发,6,3关系(Relation)关系:笛卡尔积D1D2DiDn的子集R称作在域D1,D2,Dn上的关系,记作:R(D1,D2,Di,Dn)其中:R为关系名,n为关系的度或目(Degree),Di是域组中的第i个域名.当n=1 时,称该关系为单元关系;当n=2 时,称该关系为二元关系;以此类推,关系中有n个域,称该关系为n元关系。把列称为属性(Attribute)。一般来说,一个取自笛卡尔积的子集才有意义。,2023/9/11,数据库原理及开发,7,关系可以分为三种类型:基本关系(又称基本表):是实际存在的表,它是实际存储数据的逻辑表示;查询表:是对基本表进行查询后得到的结果表;视图表:是由基本表或其它视图导出的表,是一个虚表,不对应实际存储的数据。,2023/9/11,数据库原理及开发,8,2.1.2 关系的性质1列是同质的。2关系中行的顺序、列的顺序可以任意互换,不会改变关系的意义。,2023/9/11,数据库原理及开发,9,3关系中的任意两个元组不能相同。4、关系中的元组分量具有原子性,即每一个分量都必须是不可分的数据项。最基本的一条满足一定的规范化条件的关系模型简称范式。,2023/9/11,数据库原理及开发,10,2.2 关系的完整性,2.2.1 键1候选键(Candidate key)若关系中的某一属性组的值能惟一地标识一个元组,则称该属性组为候选键。2主键(Primary key)若一个关系中有多个候选键,则选定一个为主键。,2023/9/11,数据库原理及开发,11,3主属性(Primary Attribute)主键的属性称为主属性。4外键(Foreign key)设F是基本关系R的一个或一组属性,但不是R的键(主键或候选键),如果F与基本关系S的主键K相对应,则称F是R的外键,并称R为参照关系,S为被参照关系。,2.2 关系的完整性,2023/9/11,数据库原理及开发,12,2023/9/11,数据库原理及开发,13,2.2.2 实体完整性实体完整性规则:关系中的主键不能为空值(Null)。空值就是“不知道”或“无意义”2.2.3 参照完整性参照完整性规则:表的外键必须是另一个表主键的有效值,或者是空值。,2.2 关系的完整性,2023/9/11,数据库原理及开发,14,实体完整性和参照完整性实例,2023/9/11,数据库原理及开发,15,2.2.4 用户定义完整性用户按照实际的数据库运行环境要求,对关系中的数据所定义的约束条件,它反映的是某一具体应用所涉及的数据必须要满足的条件。,2.2 关系的完整性,2023/9/11,数据库原理及开发,16,2.3 关系代数,关系代数是一种抽象的查询语言,是关系数据操纵语言的一种传统的表达方式,他是用对关系的运算来表达查询的。运算的三大要素:运算对象、运算符、运算结果。关系代数的运算对象是关系,运算结果也是关系,运算符包括4类:集合运算符(交 并差)、专门的关系运算符(笛卡尔积 选择 投影 连接 除)、算术比较符(大于 小于 等于等)和逻辑运算符(与或非)关系代数的运算按运算符的不同可分为传统的集合运算和专门的关系运算。传统的集合运算是从关系的行来进行的,专门的关系运算涉及到行和列。,2023/9/11,数据库原理及开发,17,2.3.1 传统的集合运算,包括并、差、交和笛卡尔积当集合运算并、交、差用于关系时,要求参与运算的两个关系必须是相容的,即两个关系的度数一致,并且关系属性的性质必须一致。,2023/9/11,数据库原理及开发,18,1并并:是将两个关系中的所有元组构成新的关系,并运算的结果中必须消除重复值。关系R与S的并运算记作:RS。,2023/9/11,数据库原理及开发,19,RS,2023/9/11,数据库原理及开发,20,2交交:将两个关系中的公共元组构成新的关系。关系R与S的交运算记作:RS。,2023/9/11,数据库原理及开发,21,3差差:运算结果是由属于一个关系并且不属于另一个关系的元组构成的新关系,就是从一个关系中减去另一个关系。关系R与S的差运算记作:RS。,2023/9/11,数据库原理及开发,22,2.3.2 专门的关系运算专门的关系运算包括:选择、投影和连接,用于数据查询服务。1选择(Selection)选择:是按照给定条件从指定的关系中挑选出满足条件的元组构成新的关系。或者说,选择运算的结果是一个表的行的子集。记作,2023/9/11,数据库原理及开发,23,2投影(Projection)投影:是从指定的关系中挑选出某些属性构成新的关系。或者说,选择运算的结果是一个表的列的子集。记作,其中A为R的属性列。投影的结果将取消由于取消了某些列而产生的重复元组。,2023/9/11,数据库原理及开发,24,3连接(Join)连接:是将两个和多个关系连接在一起,形成一个新的关系。连接运算是按照给定条件,把满足条件的各关系的所有元组,按照一切可能组合成新的关系。或者说,连接运算的结果是在两关系的笛卡尔积上的选择。记作:自然连接:当连接的两关系有相同的属性名时,称这种连接为自然连接,它是连接的一个特例。记作:,2023/9/11,数据库原理及开发,25,学生基本情况表 学生选课表,2023/9/11,数据库原理及开发,26,2.4 关系规范化2.4.1 问题的提出关系数据库中的关系是要满足一定要求的,满足不同程度要求的为不同范式。插入异常:如果某个教师的所开课程某学期没有,或者学生没有选修他开的该课程,那么就无法将该教师及其所开课程的信息存入数据库。删除异常:如果某届学生全部毕业,在删除该系学生时会将课程及相关教师删除。数据冗余:比如,一门课程及其教师要与选修该课程的每一个学生出现的次数一样多 解决这些问题的办法就是重新设计数据库。,2023/9/11,数据库原理及开发,27,2023/9/11,数据库原理及开发,28,2.4.2 关系模式的规范化1范式(Normal form)范式:建立关系时需要满足的约束条件划分成若干标准,这些标准称为范式,简写为NF。范式的级别越高,发生操作异常的可能性越小,数据冗余越小,但由于关联多,读取数据时花费时间也会相应增加。2第一范式(1NF)对于给定的关系R,如果R中的所有行、列交点处的值都是不可再分的数据项,则称关系R属于第一范式,记作:R1NF。1NF是关系数据库中对关系的最低要求,它是从关系的基本性质而来的,任何关系必须遵守。,2023/9/11,数据库原理及开发,29,3第二范式(2NF)如果关系R1NF,并且R的每一个非主属性都决定于主键,则称R属于第二范式,记作:R2NF。思考:主键没有冗余,非主键存在冗余。3第三范式(3NF)第三范式:如果关系R2NF,并且R的每一个非主属性都不间接决定于主键,则称R属于第三范式,记作:R3NF。达到第三范式的关系仍有可能存在冗余等问题,所以关系数据库理论还有BCNF、4NF、5NF等范式。在实际应用中,一般达到了3NF的关系就可以认为是较为优化的关系。,2023/9/11,数据库原理及开发,30,2.4.3 关系分解的原则关系的规范化就是将关系按照一定的原则不断地分解为多个关系的过程,通过分解使关系逐步达到较高范式。任何一个非规范化的关系经过分解都可以达到3NF。在实际应用中,数据库设计人员应根据具体情况灵活掌握,千万不要盲目追求规范化的程度。关系分解的基本原则是:1关系分解后必须可以无损连接的。2分解后的关系要相互独立。,