等级考-数据库系统.ppt
等级考基础数据库系统,东华大学计算机学院 孙 莉2016年2月,1数据库(DataBase,DB)长期存储在计算机内,有组织的、可共享的大量数据集合。数据库的特点:(1)数据按一定的数据模型组织、描述和储存,(2)可为各种用户共享。(3)冗余度小。(4)数据独立性高。(5)易扩展。,1.1 基本概念,2数据库管理系统(DataBaseManagementSystem,DBMS)管理数据库的系统软件。负责数据组织、操作、维护、控制与保护、服务。,数据库管理系统的主要功能:1)数据库定义功能定义数据库的外模式、模式和内模式,定义两级映射。2)数据库操纵功能实现对数据库中数据的基本操作,即查找(或检索)、插入、修改和删除操作。,3)数据的安全性、完整性定义与检查 4)数据库并发控制与故障恢复 5)数据的服务初始数据的载入、数据拷贝、转储;数据库的重组、性能检测与分析等功能。,数据库管理系统的组成为完成上述功能,数据库管理系统通常提供相应的数据语言:(1)数据定义子语言,(2)数据操纵子语言,(3)数据控制子语言。,3 数据库管理员(Data Base Administrator,简称为DBA)负责全面管理和控制数据库系统正常运行的人员,承担着规划、设计、创建、监控和维护整个数据库结构的责任。DBA是数据库系统中最重要的人员。,DBA的主要职责包括:(1)数据库设计:确定数据库中的内容和结构。设计概念模式、内模式以及各个用户的外模式。(2)数据库维护,对数据库的安全性、完整性、并发控制、系统恢复和数据转储,进行实施和维护。(3)改善系统性能,提高效率:监控数据库的使用和运行。分析数据库系统的性能,及时调整内部结构,提高系统效率。,4 数据库系统(Data Base System,DBS)具有管理和控制数据库功能的计算机系统。它通常由5部分组成:数据库、数据库管理系统、应用系统、数据库管理员和用户、系统平台-硬件与软件。相互之间的关系如图1.1所示。,硬件:计算机、网络图1.1 一个简化的数据库系统环境,1.2 数据库系统的发展,数据库技术是研究数据库的结构、存储、设计、管理和使用的一门软件学科。数据管理技术经历了三个发展阶段:人工管理、文件系统和数据库系统,人工管理阶段20世纪50年代中期以前。硬件:外部存储器只有纸带、卡片、磁带,没有能直接存取的存储设备(如磁盘等);软件:只有汇编语言,没有操作系统,没有专门的管理数据的软件。,人工管理阶段数据管理的特点:(1)数据管理者:应用程序,数据不保存。(2)数据面向对象:某一应用程序。(3)数据共享程度:无,数据冗余度极大(4)数据独立性:无独立性,以来于应用程序。(5)数据的结构化:无,文件系统阶段50年代后期到60年代中期。硬件有了磁盘、磁鼓等能直接存取的外设;软件有了高级语言和操作系统(有专门负责管理数据的文件系统)。,文件系统阶段管理数据的特点:(1)数据管理者:文件系统,数据可长期保存。(2)数据面向对象:某一应用程序。(3)数据共享程度:共享程度低,数据冗余度大。(4)数据独立性:独立性差,数据的逻辑结构改变必须修改应用程序。(5)数据的结构化:记录内有结构,整体无结构,数据库系统阶段60年代后期以来。数据库系统阶段管理数据的特点:(1)数据管理者:DBMS。(2)数据面向对象:系统。(3)数据共享程度:共享程度高,数据冗余度低。(4)数据独立性:独立性高,数据的逻辑结构改变不必修改应用程序。数据的物理结构改变也不必修改应用程序。(5)数据的结构化:整体结构化。数据结构化是数据库和文件系统的本质区别。(6)数据控制能力:DBMS统一管理和控制。,1.3 数据库系统内部结构体系,数据库系统采用三级模式结构:外模式、模式和内模式三级构成。,1 外模式(又称子模式或用户模式)用户看见和使用的局部数据的逻辑结构和特征的描述(用户的数据视图),是与某一个应用有关的数据的逻辑表示。用户对数据库的操作,只能与外模式发生联系,按照外模式的结构存储操纵数据。,2 模式(又称逻辑模式或概念模式)全局数据逻辑结构和特征的描述,3 内模式(又称存储模式、物理模式)数据物理结构和存储结构的描述,数据在数据库内部的表示方式。一个数据库中只有一个内模式和一个模式,但可有多个外模式。,图1.5 数据库系统的三级模式结构,4 外模式/模式映象 外模式/模式映象定义了各外模式和模式之间的对应关系(在各自外模式的描述中定义)。当模式改变时,由数据库管理员对各个外模式/模式映象作相应的改变,而外模式仍然保持不变,从而应用程序不必修改,保证了数据的逻辑独立性。,5 模式/内模式映象 模式/内模式现象定义了数据全局逻辑结构与存储结构之间的对应关系。当数据库的存储结构发生改变时,由数据库管理员对模式/内模式映象作相应的改变,而使模式保持不变,从而保证了数据的物理独立性。,第2章 数据模型,2.1 实体联系模型 2.2 关系模型,根据应用的不同目的,模型分为三个层次:1、概念数据模型(信息模型)-按用户的观点对数据和信息建模,主要用于数据库设计。2、逻辑数据模型-按数据结构表示数据建模,介于概念数据模型与物理数据模型之间。3、物理数据模型-按计算机系统的观点对数据建模,主要用于DBMS的实现,数据模型,数据模型包含三部分内容:数据结构:层次模型、网状模型、关系模型数据操作:检索(查)和更新(插、删、改)数据约束:保证数据正确、有效、相容,2.1 实体联系模型(ER模型),概念模型:能方便、准确地表示出信息世界中的常用概念。最常用的概念模型是实体-联系模型(ER图)现实世界由一组称作实体的基本对象及这些对象间的联系组成。,2.1.1 基本概念 ER数据模型的主要概念:实体集、联系集和属性。1 实体(entity):对现实世界中客观存在并可互相区别的“事件”或“物体”的抽象。实体:具体的人、事、物,或抽象的概念或联系,例如,学校中的每个人,一个系、一门课,学生的一次选课。,实体集:具有相同类型及相同性质(属性)的实体集合。例如,全体学生是一个实体集,全部课程也是一个实体集。,2 属性(attribute)实体具有的若干特征。实体通过一组属性来表示,例如学生具有姓名、学号等属性。,3 联系(relationship)联系是多个实体间的相互关联。例如学生实体与课程实体之间可有选课关系,学生与教师之间可能有讲课关系等。这种实体与实体间的关系抽象为联系。,图2.1 实体间的联系,实体集A和B之间的联系分三种:(1)一对一:A中的一个实体至多同B中的一个实体相联系,B中的一个实体也至多同A中的一个实体相联系,如图2.2(a)所示。(2)一对多:A中的一个实体可以同B中的任意数目的实体相联系,而B中的一个实体至多同A中的一个实体相联系,如图2.2(b)所示。,(3)多对多:A中的一个实体可以同B中任意数目的实体相联系,B中的一个实体也可以同A中任意数目的实体相联系,如图2.2(d)所示。,图2.2 二元联系集中映射的基数情况,联系的属性-联系具有的描述性属性。例如,学生和课程存在选课的联系,学生在课程上的成绩可作为选课联系的描述性属性。如图2.3所示。,图2.3 实体间联系的属性(a)二元联系的描述性属性;(b)实例,4码(键key)唯一区别给定实体集中的实体的属性集 例如,实体集课程的课程号属性可以将不同课程区分开来,因此,课程号是一个码。,2.2 关 系 模 型,关系模型是以集合论中的关系(relation)概念为基础发展起来的数据模型。在关系模型中,无论是实体还是实体之间的联系,均由关系(表)来表示。关系模型用二维表表示,它由表头、行和列组成。表头表框架,行-元组,列-属性,元组中的一个属性值为元组的一个分量,关系模型的优点,1、概念单一,结构简单实体和联系都用关系表示2、对数据的操作(查、插、删、改)结果也是关系3、存取路径对用户透明4、数据独立性高、保密性好5、简化数据库的开发工作,关系数据模型完整性约束 1 实体完整性约束实体完整性约束:每个关系应有一个主键,每个元组主键的值应惟一。主键的值不能为NULL。学生(学号,姓名,身份证号,性别,出生日期,年龄,籍贯,入学时间,系号,学籍类型号,专业号,班级号)学号为主键,则“学号”唯一且不能取空值。学生选课关系中选课(学号,课程号,成绩),“学号,课程号”为主键.,2 参照完整性约束 是不同关系之间(或同一关系的不同元组间)的约束。它不允许关系引用不存在的元组。,【例 1】学生和专业其主键用下划线标识:学生(学号,姓名,身份证号,性别,出生日期,年龄,籍贯,入学时间,系号,学籍类型号,专业号,班级号)专业(专业号,专业名)学生关系引用了专业关系的主键“专业号”。学生关系中的“专业号”值必须是确实存在的专业的专业号或空。,3 用户定义的完整性约束 针对某一具体关系数据库的约束条件。反映某一具体应用所涉及的数据必须满足的语义要求。例如大学生的年龄取值范围在1560之间等。,第3章 关系运算与SQL语言,3.1 关系代数 3.2 SQL语言,关系代数运算分为两类:(1)传统的集合运算:并、交、差和广义笛卡尔乘积。(2)专门的关系运算:选择、投影、连接。,3.1 关系代数运算对象是关系,运算结果也是关系。,3.1.1 传统的集合运算 设两个关系R和S均为n 元关系,且相应的属性取自同一个域(R和S为同类型关系:属性集相同、次序相同),1 并()-插入 关系R和S的并为:RS=t|tRtS 其结果仍为n元(目)关系。任取元组t,当且仅当t属于R或t属于S时,t属于RS。(一个元素在并集中只出现一次),2 差()-删除 关系R和S的差为:RS=t|tRt(S 其结果仍为n目关系。任取元组t,当且仅当t属于R且t不属于S时,t属于R-S。,3 交()关系R和S的交为:RS=t|tRtS=R-(R-S)其结果仍为n目关系。任取元组t,当且仅当t既属于R又属于S时,t属于RS。,4广义笛卡尔乘积()设R为m目关系,S为n目关系,则R和S的广义笛卡尔乘积为:RS=t|t=tr,tstrRtsS 其结果为m+n目关系。元组的前m列是关系R的一个元组,元组的后n列是关系S的一个元组。若R有k1个元组,S有k2个元组,则RS有k1k2个元组。,【例3.1】给定两个同类型关系R和S,计算 RS,RS,RS,RS的结果。,图3.2 传统集合运算举例,3.1.2 专门的关系运算 专门的关系运算包括选择、投影、连接和除。1 选择()设R是n目关系,F是条件,其结果为“真”或“假”,则R的选择操作定义为:F(R)=t|tRF(t)=true 即取出满足条件F的所有元组。,F 如:学号11018 或 性别=男成绩600 例如:学号11018(student),取出学号大于11018的元组,性别=男成绩600(student)。取出入学成绩大于等于600分的男性。选择操作从行的角度进行运算。,2 投影()设R是n目关系,R在其分量),即取出所有元组在特定分量,上的值。,例如,对图3.1可写出:A,C(S),,图3.3 投影说明举例,3.连接(),连接,从两个关系的笛卡尔积中选取属性间满足一定条件的元组 R S=AB(RS)A和B:分别为R和S上度数相等且可比的属性组:比较运算符从R和S的广义笛卡尔积RS中选取在A属性组(R关系)上的值与在B属性组(S关系)上值满足比较关系的元组。,自然连接R和S在相同的属性上值相等,R S,举例,R,S,R S,等值连接 R S,自然连接 R S,图3.4 选择、投影、连接举例,图3.4 选择、投影、连接举例,3.2 SQL语言,SQL语言(Structured Query Language):结构化查询语言集 数据定义语言DDL数据操纵语言DML数据控制语言DCL的功能于一体,设有如下关系表:则下列操作中正确的是A)TRSB)TRS C)TRS D)TR/S,RA B C2 2 33 1 3 SA B C1 1 2 T A B C1 1 22 2 33 1 3,B,第4章,数据库设计与管理,4.1 数据库设计概述,数据库设计:对于一个给定的应用环境,构造最优的数据库模式,建立数据库及应用系统,使之能有效地存储数据,满足各种用户的应用需求。,数据库设计方法,1、面向数据的方法:以信息需求为主,兼顾处理需求。2、面向过程的方法:以处理需求为主,兼顾信息需求。常用面向数据的生命周期法,分4个阶段:需求分析,概念设计,逻辑设计,物理设计。,数据库设计应具有的知识:数据库的基本知识和数据库设计技术程序设计方法软件工程原理领域知识,4.2 数据库设计的一般过程,1、需求分析阶段数据字典2、概念设计阶段E-R图3、逻辑设计阶段关系模型4、物理设计阶段存储安排、索引计划5、实施阶段创建数据库、数据导入、调试6、运行和维护,1、需求分析,需求收集和分析(1).信息要求(2).处理要求(3).安全性和完整性要求结果:数据字典(通常包括数据项、数据结构、数据流、数据存储和处理过程五个部分),2、概念设计,对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型。结果:E-R图概念设计常用方法:(1)视图集成法:首先根据需求分析的结果设计各个局部E-R图;然后集成并优化局部视图。(2)集中式设计:直接按总体概念结构设计。,3、逻辑设计,将概念设计转换为关系模型,E-R图转换为关系模式的原则:(1)一个实体集转换为一个关系模式。(2)一个m:n联系转换为一个关系模式。(3)一个1:n联系可以与n端对应的关系模式合并(1的关键字放入N的关系中)。(4)一个1:1联系可以与任意一端对应的关系模式合并。(5)三个或三个以上实体间的多元联系转换为一个关系模式(6)同一实体集间的联系(自联系),可按上述1:1、1:n和m:n三种情况分别处理。,4、物理设计,为逻辑数据模型选取一个最适合应用环境的物理结构。确定数据库物理结构的内容(1)确定数据的存储结构存放位置、系统配置(2)设计数据的存取方法 索引、聚簇、HASH,第5章 数据库管理,5.1 安全性保护5.2 完整性保护5.3 恢复,5.1 安全性保护,安全性保护:防止非法用户入侵数据库系统,造成数据的泄露、更改和破坏。,数据库安全性控制的常用方法,1、用户标识和鉴别-用户名/口令2、存取控制-数据库系统级、对象级3、视图(虚表)机制-敏感数据的保密4、审计机制-核查对数据库的操作5、数据加密-加密算法,审计,审计内容 审计用户名/口令的误用 监视指定数据库对象的变化 监视特权帐户执行的活动,5.2 完整性保护,保护数据库完整性的方法:定义功能,检查功能,保护功能,列、元组、关系,5.3 恢复,故障:计算机硬件故障系统软件和应用软件的错误操作员的失误恶意的破坏故障的影响轻:造成运行事务非正常中断,影响数据库中数据的正确性重:破坏数据库,使数据库中数据部分或全部丢失。,恢复(续),DBMS提供了恢复子系统,用来保证各种故障发生后,能把数据库中的数据从错误状态恢复到某种逻辑一致的状态。,