关系数据库-数据库属性等.ppt
《关系数据库-数据库属性等.ppt》由会员分享,可在线阅读,更多相关《关系数据库-数据库属性等.ppt(36页珍藏版)》请在三一办公上搜索。
1、第2章 关系数据库,2.1 关系数据结构,2.2 关系操作,2.3 关系完整性,2.4 关系代数,2.1 关系数据结构,1二维表 在日常工作中,经常会碰到成绩册、职工表等二维表格,这些二维表的共同特点是由多个行和列组成。每个列有列名,表示了某个方面的属性,每行由多个值组成。例如,见表2.1,学生基本情况表就是一个二维表,体现了某个班级的学生基本情况,定义表名为XS。,2.1.1 关系,2.1.1 关系,二维表具有如下特点:每个表具有表名;表由表头和若干行数据两部分构成;表头有若干列,每列都有列名;同一列的值必须取自同一个域。例如,专业只能取自该学校有的专业;每一行的数据代表一个实体的信息。对二
2、维表可以进行如下操作:增加数据。例如,向“学生基本情况表”中增加一个同学的数据(07050103,王俊,男,1989-10-1,计算机应用)。修改数据。例如,改正“学生基本情况表”中的错误数据。删除数据。例如,从“学生基本情况表”中去掉一个学生的数据。查询数据。例如,在“学生基本情况表”中按某些条件查找满足条件的学生。2关系 关系模型的数据结构非常简单,只包含单一数据结构,即关系。从用户角度看,一个关系就是一个规范化的二维表。关系模型就是用关系这种二维表格结构来表示实体及实体之间联系的模型,即关系模型是各个关系框架的集合。一个关系由关系模式和关系实例组成。通常,它们分别对应于二维表的表名、表头
3、和数据。若将表2.1的“学生基本情况表”表示成关系,则如图 2.1 所示。,2.1.1 关系,图2.1 二维表的关系表示图,在人们日常理解中,学生是一个抽象的概念,而学生王林是一个具体的学生,是学生中的一员。在数据库领域中把学生称为实体“型”,学生王林则称为一个实体“值”或简称实体。在关系模型中,关系模式描述了一个实体型,而关系实例则是关系模型的“值”,关系实例通常由一组实体组成。以下介绍关系模型中一些常用的术语。关系:以非形式化的描述,一个关系(Relation)就是指一张二维表。例如,“学生基本情况表”就是一个关系。,2.1.1 关系,元组:一个元组(Tuple)指二维表中的一行。例如,(
4、07050101,王林,男,1989-3-2,计算机应用)就是一个元组。属性:一个属性(Attribute)指二维表中的一列,表中每列均有名称,即属性名。例如,“学 生基本情况表”有6列,对应6个属性:学号、姓名、性别、出生日期、专业、班级。码:码(Key)也称为键、关键字、关键码,指其值可唯一确定表中元组的属性或最小属性组合。例如,“学生基本情况表”中的“学号”属性即为码。域:域(Domain)指属性的取值范围。例如,按照学校对学生学号的编排方法,学号具有一定的范围限制,性别只能取(男,女)之一等。分量:分量指元组中的一个属性值。例如,元组(07050101,王林,男,1989-3-2,计算
5、机应用)中的“07050101”即为其分量。关系模式:关系模式是对关系“型”的描述,通常表示为:关系名(属性1,属性2,属性n)。例如,XS(学号,姓名,性别,出生日期,专业),关系名为XS,该关系包括5个属性,分别是:学号、姓名、性别、出生日期、专业。关系模型中,要求关系必须是规范化的,即关系要满足规范条件。规范条件最基本的一条就是要求关系的每个分量必须是原子项,是不可再分的数据项,即不允许出现表中表的情形。例如,表2.2的学生情况表中,出生日期是可再分的数据项,因此不符合关系数据库的要求。,2.1.1 关系,表2.2 学生情况表,表2.3将关系与现实世界中的二维表格各自使用的术语进行了对照
6、。,表2.3 术语对照表,2.1.2 关系的形式化描述,在关系模型中,数据是以二维表的形式存在的,这个二维表就叫做关系。1域(Domain)定义2.1 域是一组具有相同数据类型的值的集合,又称为值域(用D表示)。例如,整数、实数和字符串的集合都是域。域中所包含的值的个数称为域的基数(用 m 表示)。域表示了关系中属性的取值范围。例如:D1=07050101,07050102,07030201,07030202,07060101,07060102D2=王林,程小明,赵倪晓,朱庆,李运洪,张美红D3=男,女其中,D1,D2,D3 为域名,分别表示学生关系中的学号、姓名和性别的取值范围。这3个域的基
7、数分别是6,6,2。2笛卡儿积(Cartesian Product)定义2.2 给定一组域D1,D2,Dn(它们可以包含相同的元素),D1,D2,Dn 的笛卡儿积为 D1D2Dn=(d1,d2,dn)|diDi,i=1,2,n其中:每一个元素(d1,d2,d3,dn)称为一个 n 元组(n-tuple),简称元组(Tuple)。注意元组中的每个分量di是按序排列的,如(07050101,王林,男)(王林,07050101,男)(男,王林,07050101)。,2.1.2 关系的形式化描述,元组中的每一个值di 叫做一个分量(Component),分量来自相应的域(diDi)。笛卡儿积也是一个集
8、合。若Di(i=1,2,n)为有限集,其基数为mi(i=1,2,n),则笛卡儿积D1D2Dn 的基数 M(即元素(d1,d2,dn)的个数)为所有域的基数的累积,即,例如,上述学生关系中姓名、性别两个域的笛卡儿积为:D1D2=(王林,男),(王林,女),(程小明,男),(程小明,女),(赵倪晓,男),(赵倪晓,女),(朱庆,男),(朱庆,女),(李运洪,男),(李运洪,女),(张美红,男),(张美红,女)其中,王林、程小明、赵倪晓、朱庆、李运洪、张美红和男、女都是分量,(王林,男),(王林,女)等是元组。该笛卡儿积的基数M=m1m2=62=12,即D1D2的元组个数为12。,2.1.2 关系的
9、形式化描述,笛卡儿积也可用二维表的形式表示。例如,上述D1D2可表示为表2.4。表2.4 D1,D2的笛卡儿积D1D2王 林男王 林女程小明男程小明女赵倪晓男赵倪晓女朱 庆男朱 庆女李运洪男李运洪女张美红男张美红女可见,笛卡儿积实际是一个二维表,表的任意一行就是一个元组,表中的每一列来自同一个域,如表2.4中第一个分量来自D1,第二个分量来自D2。3关系(Relation)定义2.3 笛卡儿积D1D2Dn的任一子集称为域D1,D2,Dn上的关系。关系可用R(D1,D2,Dn)的形式表示,其中R为关系名,n是关系的度(Degree),也称目。通常,笛卡儿积D1D2Dn的许多子集是没有实际意义的,
10、只有其中的某些子集才有实际意义。,表2.4 D1,D2的笛卡儿积,例如,表2.4所示的D1D2笛卡儿积中的许多元组都是没有实际意义的,因为一个学生的性别只有一种。因此表2.4中的一个子集才是有意义的,见表2.5,表示了学生的性别,将其取名为R1。,2.1.2 关系的形式化描述,下面是对定义2.3的几点说明。关系中元组个数是关系的基数。如关系R1的基数为6。关系是一个二维表,表的任意一行对应一个元组,表的每一列来自同一域。由于域可以相同,为了加以区别,必须为每列起一个名字,称为属性。n元关系有n个属性,属性的名字唯一。在数学上,关系是笛卡儿积的任意子集,但在数据库系统中,关系是笛卡儿积中所取的有
11、意义的有限子集。,表2.5 R1关系,2.1.3 关系的性质,关系具有以下6条性质:列是同质的(Homogeneous),即每列中的分量必须是同一类型的数据;不同的列可以出自同一个域,但不同的属性必须赋予不同的属性名;列的顺序可以任意交换。交换时,应连同属性名一起交换;任意两个元组不能完全相同;关系中元组的顺序可任意,即可任意交换两行的次序;分量必须取原子值,即要求每个分量都是不可再分的数据项。,2.1.4 关系模式,在第1章已提到,在数据库中要区分“型”和“值”。关系数据库中,关系模式是“型”,关系是“值”。定义2.4 关系的描述称为关系模式(Relation Schema)。关系模式可形式
12、化地表示为R(U,D,dom,F)其中,R为关系名;U为组成关系的属性名集合;D为属性组U中属性所来自的域;dom为属性与域之间的映象集合;F为属性间依赖关系的集合。由定义2.4可看出,关系模式是关系的框架,是对关系结构的描述。它指出了关系由哪些属性构成,属性所来自的域以及属性之间的依赖关系等。关于属性间的依赖关系将在第5章讨论,本章中关系模式仅涉及关系名R、属性集合U、域D、属性到域的映像dom这4个部分,即R(U,D,dom)。关系模式通常可简记为:R(U)或R(A1,A2,An)。其中R为关系名,A1,A2,An为属性名(i=1,2,n)。而域名、属性到域的映像则常以属性的类型、数据长度
13、来说明。例如,在学生成绩数据库(XSCJ)中,有学生(XS)、课程(KC)、学生选课(XS_KC)三个关系,其关系模式分别为:XS(学号,姓名,性别,出生日期,专业,总学分,班干否,备注)KC(课程号,课程性质,课程名,开课学期,总学时,学分)XS_KC(学号,课程号,成绩)关系模式是静态的、稳定的,而关系是动态的、随时间不断变化的。关系是关系模式在某一时刻的状态或内容,关系的各种操作将不断地更新数据库中的数据。,2.1.5 关系数据库,关系模型中,实体、实体间的联系都是以关系来表示的。例如,学生成绩数据库中,学生(XS)和课程(KC)关系是用于表示实体的,而学生选课(XS_KC)关系则用于表
14、示“学生”实体与“课程”实体间的联系。定义2.5 在给定的应用领域,所有实体及实体之间联系的关系的集合构成一个关系数据库。例如,在研究学生选修课程的问题域中,学生(XS)、课程(KC)、学生选课(XS_KC)三个关系的集合就构成学生成绩数据库。关系数据库也区分“型”和“值”。关系数据库的型即关系数据库模式,是对关系数据库结构的描述。关系数据库模式包括若干域的定义,以及在这些域上定义的若干关系模式,通常以关系数据库中包含的所有关系模式的集合来表示关系数据库模式。例如,学生成绩数据库模式即为学生(XS)、课程(KC)、学生选课(XS_KC)三个关系模式构成的集合。关系数据库的值是指关系数据库模式中
15、的各关系模式在某一时刻对应的关系的集合。例如,若学生数据库模式中各关系模式在某一时刻对应的关系分别见表2.6、表2.7和表2.8,那么它们就是学生数据库的值。,2.1.5 关系数据库,表2.6 XS关系,表2.7 KC关系,2.1.5 关系数据库,表2.8 XS_KC关系,2.2 关系操作,关系模型给出了关系操作应达到的能力说明,但不对关系数据库管理系统如何实现操作能力做具体的语法要求。因此,不同的关系数据库管理系统可以定义和开发不同的语言来实现关系操作。基本的关系操作包括查询和更新两大类,更新操作又包括插入、删除和修改3种。关系操作的特点是集合方式操作,即操作的对象和结果都是关系。关系代数、
16、元组关系演算和域关系演算3种语言都是抽象的查询语言,它们在表达能力上是等价的。这3种语言常用做评估实际数据库管理系统中的查询语言表达能力的标准和依据。实际RDBMS的查询语言除了提供关系代数或关系演算的功能外,往往还提供更多附加功能,包括集函数、算术运算等,因此,实际RDBMS的查询语言功能更强大。,2.3 关系完整性,2.3.1 关系的码节中已给出了码(Key)的非形式化定义,本小节将更深入地讨论码的概念。1候选码由节给出的定义可知,能唯一标识关系中元组的一个属性或几个属性的最小组合,称为候选码(Candidate Key),也称候选关键字、候选键或码。如学生关系中的“学号”能唯一标识每一个
17、学生,则属性“学号”是学生关系的候选码。下面给出候选码的形式化定义。定义2.6 设关系R(A1,A2,An),其属性为:A1,A2,An,属性集K为R的子集,K=(Ai,Aj,Ak),1i,j,kn。当且仅当满足下列两个条件时,K被称为候选码:唯一性。对关系R的任两个元组,其在属性集K上的值是不同的。最小性。属性集K=(Ai,Aj,Ak)是最小集,即若删除K中的任一属性,K都不满足唯一性。例如,“学生选课”关系包含属性学号、课程号、成绩,其中属性集(学号,课程号)为候选码,删除“学号”或“课程号”任一属性,都无法唯一标识选课记录。,2.3.1 关系的码,2主码若一个关系有多个候选码,则从中选择
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 关系 数据库 属性
链接地址:https://www.31ppt.com/p-5928547.html