数据库基础与应用.ppt
《数据库基础与应用.ppt》由会员分享,可在线阅读,更多相关《数据库基础与应用.ppt(251页珍藏版)》请在三一办公上搜索。
1、数据库基础与应用,第一章数据库系统概述,学习目标了解数据处理技术的各个阶段的不同特点;了解和掌握实体、联系、属性、码等概念的含义,以及ER图的应用;了解数据库设计中的各种逻辑结构模型和特点,特别是关系数据模型的特点;了解数据库系统的构成,数据库用户的分类,数据库体系结构,存取数据库中数据的大致工程等内容。,1.1数据处理技术发展经历,基本概念:数据:是人们描述客观事务及其活动的抽象符号表示。是人们互相之间进行思想文化交流的工具。是数据库系统研究和处理的对象。通常指用符号记录下来的、可以识别的信息。数据可以是声音、文字、图形、绘画、图像等。,基本概念:数据处理:是对数据进行加工的过程,对数据进行
2、的查找、统计、分类、修改、变换等运算都属于加工。数据处理是指从某些已知的数据出发,推导加工出一些新的数据,这些新的数据又表示了新的信息。,数据处理手段的发展:人工管理文件管理数据库管理分布式数据库管理,人工管理阶段,人工管理阶段的数据管理有下列特点:数据不保存在计算机内。没有专用的软件对数据进行管理。只有程序(program)的概念,没有文件(file)的概念。数据的组织方式必须由程序员自行设计与安排。数据面向程序。即一组数据对应一个程序。,文件管理阶段,文件系统阶段的数据管理有以下特点:数据以“文件”形式可长期保存在外部存储器的磁盘上。数据的逻辑结构与物理结构有了区别,但比较简单。文件组织已
3、多样化。有索引文件、链接文件和直接存取文件等。数据不再属于某个特定的程序,可以重复使用,即数据面向应用。对数据的操作以记录为单位。随着数据管理规模的扩大,数据量急剧增加,文件系统显露出三个缺陷:数据冗余(redundancy)数据不一致(inconsistency)数据联系弱(poor data relationship),数据库管理阶段,数据库阶段的数据管理具有以下特点:采用数据模型表示复杂的数据结构。数据共享。有较高的数据独立性。增加了系统的灵活性,数据粒度缩小。数据库系统为用户提供了方便的用户接口。数据库管理系统提供以下四方面的数据控制功能:数据安全性,数据的一致性,数据库的并发控制和数
4、据库的恢复。,分布式数据库管理阶段,分布式数据库系统主要有以下特点数据库的数据物理上分布在各个场地,但逻辑上是一个整体。每个场地既可以执行局部应用(访问本地DB),也可以执行全局应用(访问异地DB)。各地的计算机由数据通信网络相联系。本地计算机单独不能胜任的处理任务,可以通过通信网络取得其它DB和计算机的支持。,1.2概念数据模型,概念数据模型:是人们对现实世界的认识和抽象,不考虑在计算机上的具体实现,也可以说与计算机的具体实现无关,而只考虑数据本身的结构和相互之间的自然联系。表示概念数据模型最常用的工具:实体联系(Entity Relationship)模型,简称ER模型。由于是以图形方式表
5、现,又称为实体联系图,简称ER图。,1.2.1 ER模型的有关概念,1、实体:是现实世界中存在的可以相互区别的事务或活动的抽象(数据描述)。通常,直接称事务或活动为实体。例如:一本书。实体集:是指同一个实体的集合。例如:一个班级的学生。实体型:是对同类实体的共有特征的抽象定义。例如:人的共有特征为姓名、年龄、籍贯、职业、学历等由此可以定义人这个实体型。实体值:就是符合实体型定义的每个具体实体。例如:由上面实体型定义张三、35、江苏、教师、研究生 实体、实体集、实体型、实体值在以后的叙述中均用实体一词代替。,2、联系:是实体之间的相互联系,它通常表示一种活动。例如:在一张订单中涉及商品、顾客和销
6、售员之间的关系,即某个客户从某个销售员手里订购某件商品。联系集:是同一类联系的集合。例如:一次展销会上的全部订单。联系型:是对同类联系的共有特征的抽象定义。联系、联系集、联系型在本课程中也将由联系一词代替。,3、属性:是描述实体或联系中的一种特征,一个实体或联系通常具有多个特征,需要多个相应属性来描述。例如:描述人需要使用姓名、年龄、籍贯、职业、学历、住址、电话等属性。码:或称键是实体间互相区别的一种唯一标识。例如:人的身份证号码。主属性与非主属性 域:是实体中相应属性的取值范围。例如:性别E男,女,4、联系分类:是讨论两实体型之间的联系情况。按照一个实体型中的实体个数与另一个实体型中的实体个
7、数的对应关系,可分类为:1对1联系、1对多联系、多对多联系。(1)1对1联系 若一个实体型中的一个实体至多与另一个实体型中的一个实体发生关系,同时另一个实体型中的一个实体至多与该实体型中的一个实体发生关系,则这两个实体型之间的联系被定义为1对1联系,简记为1:1。例如:一个学生与其学生证号码。,(2)1对多联系 若一个实体型中的一个实体与另一个实体型中的任意多个实体(含0个)发生关系,而另一个实体型中的一个实体至多与该实体型中的一个实体发生关系,则这两个实体型之间的联系被定义为1对多联系,简记为1:n。例如:一个班级对多个学生。(3)多对多联系 若一个实体型中的一个实体与另一个实体型中的任意多
8、个实体(含0个)发生关系,而另一个实体与该实体型中的任意多个实体(含0个)发生关系,则这两个实体型之间的联系被定义为多对多联系,简记为m:n。例如:一个学生选修多门课程;一门课程被多个学生选修。,1.2.2 ER模型,ER模型是人们描述数据及其联系的概念数据模型,是数据库应用系统设计人员和普通非计算机专业用户进行数据建模和沟通与交流的有力工具。特点:直观易懂、简单易行。进行数据库应用系统设计时,首先要根据用户需要建立合理的ER模型,然后再建立与计算机管理系统相匹配的逻辑数据模型和物理数据模型,最后才能在计算机系统上安装、调试和运行数据库。,1、ER模型中的基本构件 矩形实体,框内标注实体名 菱
9、形联系,框内标注联系名 椭圆型属性,框内标注属性名 连线表示实体、联系与属性之间的所属关系或实体与联系之间的相连关系。2、各种联系的ER图表示1对1 1 1,实体1,联系,实体2,1对n 1 nm对n m n3、使用ER模型举例 book page16,实体1,联系,实体2,实体1,联系,实体2,1.3逻辑数据模型,数据库的逻辑数据模型又称为结构数据模型,或直接简称为数据模型,相继出现:层次、网状、关系和对象四种数据模型。,层次数据模型,层次数据模型是最早出现和使用的数据模型,层次模型是一个树型结构模型,整个树有且只有一个根结点;其余结点都是它的孩子或子孙;每个结点只有1个双亲结点,但可以有0
10、n个孩子结点,没有孩子的结点被称为叶子结点。每个结点对应一个记录型,即概念模型中的一个实体型。层次模型有两个缺点:一是只能表示1:N联系,虽然系统有多种辅助手段实现M:N联系但较复杂,用户不易掌握;二是由于层次顺序的严格和复杂,引起数据的查询和更新操作很复杂,因此应用程序的编写也比较复杂。,网状数据模型,网状数据模型是一个图结构模型,是对层次模型的扩展。允许有多个结点无双亲,允许每个结点无双亲。层次模型是网状模型的一个特例。网状模型的特点是记录之间联系通过指针实现,M:N联系也容易实现(一个M:N联系可拆成两个1:N联系),查询效率较高。网状模型的缺点是数据结构复杂和编程复杂。,关系数据模型,
11、关系数据模型是数据库产品的主导数据模型。它是建立在集合论、数理逻辑、关系理论等数学理论基础之上。关系数据模型结构简单,符合人的思维逻辑。关系模型是一种简单的二维表格结构,概念模型中的每个实体和实体之间的联系都可以直接转化为二维表格形式。每个二维表称为一个关系。表头称为关系的型;表体称为关系的值;每一行数据称为一个元组;每一列数据称为属性,列标题称为属性名。,采用关系模型建立数据库具有的特点:1、数据结构单一 二维表,符合人的习惯,也便于计算机实现。2、采用集合运算 操作对象是关系,结果依然是关系,对关系的操作可以一次一集合。3、数据完全独立 用户对数据库的查询和更新,只要知道数据的逻辑表示以及
12、数据间的逻辑结构,就可以直接操作数据库中的数据。4、数学理论支持 关系模型具有严格的数学定义,具有成熟的数学理论依据。,对象数据模型,对象数据模型是数据库技术与面向对象程序设计的方法相结合的成果。主要适用于一些特殊领域,处理对象不仅是数值、文本还包括图形、图像、声音等多媒体数据信息。面向对象数据模型表达信息的基本单位为对象。面向对象模型中也有型和值的区别。对象型(类)是对具有共同特征的事务的抽象定义。对象值是对象型中的一个具体事务。面向对象模型区别于传统数据模型的本质特征在于对象具有封装性、继承性和多态性。,1.4数据库系统简介,数据库系统构成 数据库系统是安装了数据库和数据库管理系统的计算机
13、系统。数据库管理系统在计算机操作系统的支持下对保存在外部存储器上的数据库进行有效的管理、维护和使用。在数据库管理系统之上通常需要数据库应用系统开发工具软件,应用程序系统。数据库应用系统通常提供可视化操作界面共终端用户使用。,数据库系统用户,数据库系统用户通常包括四种:数据库管理员DBA:负责数据库系统的建立、管理、运行、维护、监控等系统工作,以及用户登记、存取数据权限分配等服务性工作。数据库设计员:根据用户的需求,负责建立相应的数据库。应用程序员:负责相关数据库的程序开发。终端用户:使用数据库的群体,是建立数据库为之服务的对象。,数据库体系结构,三级模式结构和两级存储结构概念模式是数据库中全部
14、数据的整体逻辑结构的描述。外模式是用户与数据库系统的接口,是用户用到的那部分数据的描述。内模式是数据库在物理存储方面的描述,定义所有内部记录类型、索引和文件的组织方式,以及数据控制方面的细节。模式内模式映象存在于概念级和内部级之间,用于定义概念模式和内模式之间的对应性。外模式模式映象存在于外部级和概念级之间,用于定义外模式和概念模式之间的对应性。,数据库系统的三级模式和两级映像确保了数据的逻辑独立性和物理独立性。数据的逻辑独立性是当数据库的整体逻辑结构发生变化时,通过调整外模式和模式之间的映像使得外模式中的局部数据及其结构(外模式定义)不变,从而使外模式上的应用程序也不用修改。数据的物理独立性
15、是当数据库的存储结构(内模式定义)发生变化时,通过调整模式和内模式之间的映像,仍然能够保持数据库的整体模式不变,当然其所有的外模式及应用程序都不变。,1.4.4 DBMS的主要功能,1、数据的定义和操纵 DBMS提供数据定义语言DDL和数据操纵语言DML及其相应的编译或解释程序,使用户能够进行数据库系统的各级模式定义,并能够对数据库进行查询、插入、删除、修改等操纵数据库的操作。2、数据库管理控制 DBMS提供一组数据库管理控制程序,用以控制数据库系统的正常运行。3、数据库辅助服务 DBMS提供一组数据库服务程序,完成诸如数据库初始创建、数据库转存、数据库恢复等辅助服务。4、提供使用数据库工具
16、DBMS提供一组高效、简单方便的使用数据库的工具,帮助用户按照提示内容操作完成各种相应的任务。5、建立和维护数据字典 数据库系统的三级模式定义都被DBMS保存到数据字典。DBMS的每一步操作都得到数据字典的检查和验证,以确保数据库操作的合法、安全、有效。,使用数据库系统存取数据过程 Book page29关系数据库系统简介 Book page30,第二章 关系运算,学习目标了解和掌握关系数据结构中涉及到的域、笛卡尔积、关系、关系模式等有关内容的含义。掌握关系的实体完整性和参照完整性的定义。掌握关系代数中的并、交、差、笛卡尔积运算,以及选择、投影和连接运算。,2.1关系数据结构,关系数据结构非常
17、单一,它就是一张具有行列结构的二维表。1、域:是具有相同特性的数据集合。例如:东、南、西、北2、笛卡尔积:是定义在一组域上的集合。例如:一组域D1、D2Dn,笛卡尔积表 示为D1xD2xDn 笛卡尔积的每个元素由下式求出:D1xD2xDn|(d1,d2dn)|di E Di,1=1,3、关系:是笛卡尔积的一个子集,若笛卡尔积具有n个域,则该笛卡尔积上的关系被称为n元关系。一个n元关系具有下面六个性质:(1)关系中每列的数据属于同一个域,每一列称为一个属性,列名称为属性名,每一列的值称为属性值,同一关系中的所有属性名必须是可区分的。(2)不同列允许对应同一个域,此时列名不宜直接采用域名,当一个列
18、对应一个域时,既可以直接采用域名,也可以重新命名。,(3)一个关系中属性的次序在理论上可以任意。(4)一个关系中的任意两个元组不允许完全相同。(5)一个关系中的元组的次序可以任意。(6)一个元组中的每个属性值都必须是单值,不可再分。,4、关系模式:是一个关系的型,即一个关系的具体结构,通常被形式化定义为:R(U,D,DOM,F,I)R为关系名;U为该关系中的所有属性名集合;D为该关系的所有定义域的集合;DOM为属性向域映射的集合,给出属性和域之间的对应关系;F为该关系中各属性之间的数据依赖的集合;属性间的数据依赖的分析主要是找出关系的主码属性。,I为该关系中所定义的完整性规则的集合。关系的完整
19、性规则的建立是为了保证数据库数据的正确性和一致性。一个关系模式可以简化为R(A1、A2、.An)R为关系名;A1、A2、.An为各属性名;主码属性下用下划线标记。一个关系可以只有模式而没有值(空关系),但不能没有模式只有值。,5、码:又称为键(1)超键:关系中能唯一标识每个元组属性或属性组。(2)候选码:关系中能唯一标识每个元组的最少属性或属性组。(3)主码:从候选码中选择一个作为该关系的主码,数据库系统将按主码标识和排序每个元组。(4)备用码:除了主码之外的所有候选码。(5)外码:在关系R1中的属性或属性组在关系R2中作为主码。(6)主属性和非主属性:包含在任何候选码中的属性称为主属性,其他
20、属性称为非主属性。,2.2关系完整性,关系完整性就是关系模型中的数据的正确性、一致性和有效性。1、实体完整性 在一个关系中,主码是对象的唯一标识,若主码为空,则表明该对象无法表示,主码绝对不能为空值。实体完整性规则:关系的主码不能取空值。,2、参照完整性 在一个关系模型中,关系R1的外码对应关系R2的主码,外码与主码不仅要定义在同一个域上,而且外码的取值不能超出主码的取值,否则将为非法数据。参照完整性规则:在两个参照和被参照关系中,参照关系中每个元组的外码或者为空,或者等于被参照关系中的某个元素的主码。,3、用户定义完整性 当用关系模型来描述对象时,关系中的每个属性除了用定义域或对应的数据类型
21、进行取值约束外,有时还需要定义一些附加条件。用户定义完整性规则包括对每个关系每个属性的取值限制的具体定义,它和其它两个完整性规则都被记录在DBMS的数据字典中。,2.3关系运算,关系是元组的集合,因此关系比一般的集合运算复杂,对关系运算不仅可以采用传统的集合运算,还可以采用专门的运算。,传统的集合运算,传统的集合运算包括并()、交()、差()和笛卡尔积()。设一个元组变量t t属于关系R:tR;t不属于关系R:tR;假定关系R中一个属性A,则t.A表示属性A在元组t中的值;六个比较运算符(运算符):大于()、小于(=)、小于等于()逻辑表达式由与、或、非连接比较运算符构成,1、并运算 设两个关
22、系R和S具有完全相同的结构,则R和S并仍是一个关系,结构与R和S相同,值是R和S的所有元组组成的集合。(R和S的共同元组,则结果只出现一个)RS=t|tRtS(满足交换率RS=SR)2、交运算 设两个关系R和S具有完全相同的结构,则R和S交仍是一个关系,结构与R和S相同,值是R和S共同具有的元组组成的集合。RS=t|tRtS(满足交换率RS=SR),3、差运算 设两个关系R和S具有完全相同的结构,则R和S差仍是一个关系,结构与R和S相同,值是从R中去掉S中同时出现的元组后,有R中剩余的元组组成的集合。RS=t|tRtS4、笛卡尔积 设一个具有n个属性的关系R和另一个具有m个属性的关系S,则R和
23、S的笛卡尔积仍是一个关系,结构是R和S的结构之连接,即前n个属性来自R,后m个属性来自S,属性个数为n+m,值是R中每个元素连接S中每个元素构成的元组集合。RS=tRtS|tRRtSS,专门的关系运算,专门的关系运算包括选择()、投影()、连接()和除()。1、选择运算(select)单目运算,它从一个关系R中选择满足条件的所有元组,同R具有相同的结构。选择运算提供横向划分关系的手段。设F(t)为元组逻辑表达式 F(R)t|tR F(t)=true 2、投影运算(project)单目运算,它从一个关系R中按所需顺序选择若干个属性构成新关系,新关系的元组数小于等于原关系的元组数。选择运算提供纵向
24、划分关系的手段。A(R)t.A|tR,3、连接运算(join)双目运算,把两个关系R和S按相应的属性值的比较条件连接起来,它是R和S的笛卡尔积的一个子集。比较条件就是比较运算表达式,相应的连接就称为该运算符连接。4、除法(division)设关系R和S的元数分别为r和s(设rs0),那么RS是一个(r-s)元的元组的集合。(RS)是满足下列条件的最大关系:其中每个元组t与S中每个元组u组成的新元组必在关系R中。,综合运算举例,Book Page 47,第三章 关系规范化基础,学习目的:会根据一个关系的定义,分析出属性间的各种函数依赖,并能够得出相应的最小函数依赖集。掌握关系的第一、第二、第三以
25、及BC范式的定义,会根据一个关系的最小函数依赖集确定它的规范化级别。会对一个具体关系进行规范化,使之达到所要求的规范化级别。,3.1数据依赖,每一种类型的数据和数据之间的联系,在关系数据库系统中都是利用相应的关系来描述的。这样事务之间以及事务内部的各特征之间的相互依赖和相互制约关系就自然反映到关系数据库中的各个关系之间和关系内部的各属性之间。因为关系是由属性构成的,所以数据依赖的基础是属性之间的数据依赖。数据依赖包括函数依赖和多值依赖,本课只讨论函数依赖。,定义1:设一个关系为R(U),X和Y为属性集U上的子集,若对于元组中X上的每个值都有Y上的一个唯一值与之对应,则称X和Y具有函数依赖关系,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 基础 应用
链接地址:https://www.31ppt.com/p-5058862.html