数据库系统概论王珊第五版学习笔记.docx
第一章1. 数据库的四个基本概念:数据、数据库、数据库管理系统、数据库系统。数据:是数据库中存储的基本对象。描述事物的符号称为数据。数据库:是长期存储在计算机内、有组织的、可共享的大量数据的集合。数据库数 据具有永久存储、有组织和可共享三个基本特点。数据库管理系统:是计算机的基础软件。数据库系统:是由数据库、数据库管理系统、应用程序和人组成的存储、管理、处 理和维护数据的系统。2. 数据处理和数据管理。数据处理:指对各种数据进行手机、存储、加工和传播的一系列活动的总和。数据管理:指对数据进行分类、组织、编码、存储、检索和维护。3. 数据独立性。物理独立性:指用户的应用程序与数据库中数据的物理存储是相互独立的。逻辑独立性:指用户的应用程序与数据库的逻辑结构是相互独立的。4. 数据模型-是对现实世界数据特征的抽象(现实世界的模拟)。数据模型是数据库系统的核心和基础。概念模型:信息模型,按照用户的观点来对数据和信息建模,主要用于数据库设计。逻辑模型:按照计算机系统的观点对数据建模。物理模型:描述数据在计算机内部的表示方式和存取方法。数据模型组成要素:数据结构、数据操作、数据的完整性约束条件。5. 信息世界中的基本概念。实体:客观存在并可相互区别的事物。属性:实体所具有的某一特征。码:唯一标识实体的属性集。联系:失误内部以及事物之间是有联系的。实体内部的联系通常是指组成实体的个 属性之间的联系,实体之间的联系通常是指不同实体集之间的联系。实体之间的联系有 一对一、一对多和多对多等各种类型。6. 数据完整性约束条件。实体完整性:检查主码值是否唯一,检查主码的各个属性是否为空。实体完整性在创建表时用primary key主键来定义参照完整性:检查增删改时检查外码约束。在创建表时用外码foreign key短语定 义。用户定义完整性:创建表中定义属性的同时,可以根据应用要求定义属性上的约束 条件,即属性值限制。列值非空(not null)、列值唯一(unique)、检查列值是否满足一个条件表达式(check 短语)7. 数据库系统的模式。型:是指对某一类数据的结构和属性的说明,对结构的描述和说明。值:是型的一个具体赋值。模式:是数据库中全体数据的逻辑结构和特征的描述,对结构进行描述,仅仅涉及 型。模式的一个具体值称为模式的一个实例。模式反应的事数据的结构及其联系,而实例反应的是数据库某一时刻的状态。8. 数据库的三级模式结构。模式(逻辑模式):是数据库中全体数据的逻辑结构和特征的描述,需要定义数据 想的名字,类型,取值范围和数据之间的联系,安全性完整性要求等。外模式(子模式):数据库中数据的局部逻辑结构。内模式(存储模式):是数据物理结构和存储方式的描述,是数据在数据库内部的 组织方式。第二章1. 关系模型-关系数据结构、关系操作集合、关系完整性约束三部分组成。2. 关系。域:一组具有相同数据类型的值的集合。关系:笛卡尔积的有限子集。候选码:关系中某一属性组的值能唯一地标识一个元组。候选码的诸属性称为主属性。不包含在任何候选码中的属性称为非主属性。3. 表。基本表(基本关系、基表):实际存在的表,是实际存储数据的逻辑表示。查询表:是查询结果对应的表。视图表:是由基本表或其他视图表导出的表,虚表,不对应实际存储的数据。4. 关系代数:用对关系的运算来表达查询。关系代数运算的三个要素:1.运算对象:关系;2.运算结果:关系;3:运算符:四类运算符含义运算符含义专门的美O选择逻辑运算系符运算符X连接选择运算是从行的角度进行的运算查询信息系(IS系)全体学生aSdept = 'IS' (Student)投影操作主要是从列的角度进行运算。投影之后不仅取消了原关系中的某些列,而 且还可能取消某些元组(避免重复行)查询学生的姓名和所在系,即求Student关系上学生姓名和所在系两个属性上的投影nSname,Sdept(Student)连接也称。连接:连接运算从R和S的广义笛卡尔积RXS中选取(R关系)在A 属性组上的值与(S关系)在B属性组上值满足比较关系的元组等值连接月 X $除在关系R中,A可以取四个值al, a2r a3r a4放的象集为(如&),(皈 乌),(板Cj)I我的象集为(bjf今),(房,乌)免的象集为(b,t临)匀的象集为(扁,临)涟。上的投影为(bl. c2), (bZ cl)f (b2, c3) 只有角的象集包含了维(以,。属性组上的投影所以 能S=角交:Jf -n-澎连接二 7?IX S = o AgB (RX S)除:R:S二九 JR)- IT 茂(II JR) 乂 IT y(S)-R)例10查询选修了全部课程的学生号码和姓名。c(SC)三 (Course)凶,g (Student)第四章什么是数据摩的安全性数据库的安全性是指保护数据库,防止因用户非法使用数据库造成数据泄露、更改或破坏。3数据库系统的安全保护措施是否有效是数据库系统主要的性能指标之一“十据库安全控制层次1.数据库安全性控制。用户身份鉴别:静态口令鉴别,动态口令鉴别、生物特征鉴别、智能卡鉴别。存取控制:定义用户权限。合法权限检查。自主存取控制:授予不同对象不同权限。强制存取控制:数据库中的内容带有密级标记,只有具有相应标记的用户才能够访问。强制存取控制规则当某一用户(或某一主体)以标记label注册入系统时,系统要求他对任何客 体的存取必须遵循下面两条规则=(1)但当主体的许可证级别大于或等于客体的密级时,该主体才能读取相应的 客体;(2)仅当主体的许可证级别等于客体的密级时,该主体才能写相应的客体。修正规则A主体的许可证级别二客体的密级 今主体能写客体规则的共同点禁止了拥有高许可证级别的主体更新低密级的数据对象2. 授权。授权:一对属性列授权必须指出相应的属性列名。grant select,insert,delete,update.on table Student,Scto用户1,用户2收回权限:revoke selecton table Student,Scfrom用户1,用户23. 角色。数据库角色是被命名的一组与数据库操作相关的权限,角色是权限的集合。创建角色、对角色进行授权、将角色授权给其他的角色或者用户、角色权限 的收回。创建角色:create role 角色1,角色2给角色授权:grant select,insert.on table Studentto角色1,角色2将角色授权给其他用户:grant 角色1to用户1,用户2收回角色权限:Revoke selectOn table StudentFrom角色14.视图。创建视图:Create view 视图 1AsSelect *From StudentWhere Sdept = CS第五章1. 数据库完整性。数据库的完整性是指数据的正确性和相容性。数据的正确性是指额数据是符合现实世 界语义、反应当前实际状况的。数据的相容性是指数据库同一对象在不同的关系表中的数据 是符合逻辑的。2. 保障数据库的完整性。提供定义完整性约束条件的机制。提供完整性检查的方法。进行违约处理。数据完整性约束条件前文中已经讲述,此处不再赘述。第六章1.函数依赖。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等, 而在Y上的属性值不等,则称“X函数确定Y”或 “Y函数依赖于X”,记作X-Y可以从不同角度分类=I平凡函数依赖与非平凡函数依赖1完全函数依赖与部分函数依赖I直接函数依赖与传逸函数依赖如果XT, fiYcX,则称XT是平凡的函数若果X-Y, BY妈 则称XT是非平凡的函数依赖如果X-Y,并且对于X的任何一个真子集X,,都有X*Y,I则称Y完全函数依赖于X,记作X Yo若X-Y但Y不完全函数依赖于X,则称Y部分函数依赖于X.记作X Yo如果X-Y, Yf Z,且YX, Y、X,则称Z传递函数依赖于X。如果X - Y-则名直接依赖于X一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式的 集合,这种过程叫做规范化。1NF(第一范式)如果一个关系模式R的所有属性都是不可分的基本数据项,则RE1NF第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数 据库。2NF:如果RC1NF,且每一个非主属性完全依赖于码,则RW2NF采用投影分解法将一个1NF的关系分解为多个2NF的关系3NF:如果R是2NF,且每个非主属性都不传递依赖于R的候选码,则R属于3NF。2NF消除非主属性的部分依赖,3NF消除非主属性的传递依赖NNF和3NF都是对非主属性的要求,2NF要求每一个非主属性完全函数依桢于码3NF要求每一个非主属性既不部分依赖F码也不传谗依赖于码#RINF,若XY>Y 时X必含有码,则,BCNF 的定义:REBCNF 一BCNF不仅对非主属性有要求,而且也对主属性有要求如果一个关系模式只有两个属性构成,则该关系模式一定属于BCNF例:关系模式SJP(览J,p)中,s是学生学号,丁是课程号,P 表示名次(没有并列名次,每一个学生透修每门课程的成绩 有一定的名次,由语义可得到函数依赖集F如下,F (S, J) P(P) 5思考:指出该关系模式的候选码 指出主属性、非主属性 核关系模式是否是3NF? 该关系模式是否是BCNF?有两个* (S,J)J,F) 士属性r S, J, P:没有非毛属性 SJP CNT SJP JECNF例:关系模式STJ(S,T,J)中,S是学生学号,T表不教帅一 建课程号,每个教师只教一门课,每门课有若干 教师讲授,某一学生选定某门课,就对应一个固定的教师 由语义可得到函数依赖集政1下:编号F=(S, J) T T f J思考.'指苗该关系模式的候选码 指出主属性、非主属性 该关系模式是否是3NF? 该关系模式是否是BGNE?有两个:(§,J) , G,T)主属性:S、J、P;没有非主属性SJP F3NJSJP 冥CNF1JMF2NF3NF消除非主属性对码的部分函数依赖消除非主属性对码的传递函数依赖消除主属性对码的部分和传递函数依赖BCNF,合并规则“由匕X-Z有曰JZ伪传递规则;由AH gZ有所乙分解规则:由有AF、X-Z.UA, B, C, D; F- A 一 B, BC 一 D I计算(AC)/(AC): =A,此 C, D1)判断一个函数依赖在R上是否成立R(A, B, C, D), F=A B, BC D;问:AC D是否在吐成立?第一种解决方法=计算看看ace是否在其中。该方法计 算量大,不可行.第二种解决方法:如果AC tD成立,则D一定属于(AC),,因此, 首先计算(ACV ,如果dw(ac)f ,则成立,否则,不成由于(AT)/ =A,B,C,D& 所以ACD在R上成立。己知关系模式Ru, F>,其中U=A, B, C, D, H;F二ABC* BD, CE, ECB,求关系的候选码并判断核关系模式是几范式?过程;首先,找出所有没有在任何一个函数依赖右侧出现的属性 把他们组成一个属性组K,候选码一定含有K;计算瑙-,如果Kf =U,则K为候选码,而且只有这一个; 否则,基于KT充属性,形成新的属性组(含有K但不含 候选码的所有可能的属性组合),计算新属性组的闭包, 判断其是否为候选码口候选码:A,B,A,C_1范式第七章1. 数据库设计,数据库设计分6个阶段。需求分析。概念结构设计。逻辑结构设计。物理结构设计。数据库实施。数据库运行和维护。2.数据项是不可再分的数据单位数据结构反映了数据之间的组合关系。数据流是数据结构在系统内传输的路径。数据存储是数据结构停留或保存的地方,也就是流的来源和去向之一。具体处理逻辑一般用判定表或判定树来描述。数据字典是关于数据库中数据的描述,是元数据,而不是数据本身。数据字典在需求分析阶段建立,在数据库设计过程中不断修改、充实、完善。概念结构是各种数据模型的共同基础,它比数据模型更独立于机器、更抽象,从而更加稳定。自顶向下的进行需求分析,自低向上的设计概念结构。定义数据库模式主要是从系统的时间效率、空间效率、易维护等角度出发。物理设计的第一任务就是要确定选择那些存取方法,即建立哪些存取路径。什么是数据库的物理设计数据库在物理设备上的存储结构与存取方法称 为数据库的物理结构,它依赖于给定的计算机 系统口为一个给定的逻辑数据模型选取一个最适合应 用环境的物理结构的过程,就是数据库的物理 设计口2. ER 图实体型:用矩形表示,矩形框内写明实体名属性:用椭圆形表示,并用无向边将其与相应的实体型连接起来联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时 在无向边旁标上联系的类型(1:1、1:n或m:n)联系的属性:联系本身也是一种实体型,也可以有属性。如果一个联系具有属性,则这些属性也要用无向边与该联系连接起来在关系总数尽量少的情况下,该E-R图转换后关系模式包括:学生(学号,姓名,性别,专业,出生日期,学院编号)课程(课程编号,课程名称,课程类别,学分)学院(学院编号,学院名称,办公室电话,院长教职工编号)教职工(教职工编号,姓名,参加工作时间,职称,学院编号)选课(学号,课程号,成绩)第八章1.游标。使用:声明游标、打开游标、从一个游标中提取信息、关闭释放游标。声明游标:Declare XXX cursorFor select *打开游标:openXXX关闭游标:close XXX释放游标:deallocate XXX声明一个名为curAllCourse的游标,完成统计有多少学生选修了全部课程,输出学生学号和 姓名declare curAllCourse cursor/声明游标for SELECT SNO, snamefrom studentwhere sno in (select snofrom scgroup by snohaving COUNT(*)>= (select COUNT(*)from course)for read only/声明变量open curAllCourse/打开游标 declare sno char(10),sname char(10)set sno=0fetch next from curAllCourse into sno, sname /从游标中取数据while FETCH_STATUS = 0beginif sname is nullset sno = sno + 1select sno 学号,sname 姓名fetch next from curAllCourse into sno,snameendCLOSE curAllCourse/关闭游标DEALLOCATE curAllCourse/释放游标2. 存储过程。视图、存储过程和自定义函数视图存储过程自定义函数语句只能是SELECT语句可以包含程序流、逻 辑以及SLLECT语句可以包含程序流、 逻辑以及SELECT 语句输入不能接受会数可以有输入输出参数有输入参数返回值只能返回结果集返回值只能是整数可以返回标量值、 表典型应 用多个表格的连接查 询完,成某个特定的较复 条的任务可以完成比较复杂 的任务七诃以出现 在select语有中类似与C语言中的函数。编写一个存储过程,在sc表统计每个学生的平均分.create proc avergrade/创建存储过程as beginselect sno, avg (grade) 平均分from scgroup by snoendexec avergrade/执行存储过程drop procedure avergrade/删除存储过程对练习1的存储过程进行改进,添加一个输入参数一一学号,使存储过程能根据输入的学号计算该学生的平均分create proc avergradesno char(10)asbeginselect sno, avg (grade) 平均分from scwhere sno = snogroup by snoendexec avergrade '04'drop procedure avergrade在练习2的基础上添加一个输出参数一一平均分,计算指定学号的平均分,然后将平均分输 出。create proc avergrade sno char(10), saving int outasbeginselect saving = avg(grade) from scwhere sno = snogroup by snoenddeclare avg int set avg = 0exec avergrade '02',avg out select avg 平均分drop procedure avergrade3.函数。函数必须返回指定类型,可以返回表,有输入参数。创建成绩转换函数,实现百分制成绩与优、良、中、及格、不及格五个等级的换算.CREATE FUNCTION grade_trans(grade FLOAT)RETURNS CHAR(16)ASBEGINDECLARE class CHAR(16)SELECT class = CASEWHEN grade IS NULL THEN '还没参加考试WHEN grade < 60 THEN '不及格WHEN grade >= 60 and grade < 70 THEN '及格'WHEN grade >= 70 and grade < 80 THEN '中等'WHEN grade >= 80 and grade < 90 THEN '良好'ELSE '优秀!ENDRETURN(class)ENDselect dbo.grade_trans(88)查询某个院系所有学生所选的每门课的平均成绩。create function aver (p char(10) returns table asreturn (select cno 课程号,avg (grade) 平均成绩from student, scwhere student.sno=sc.sno and sdept=pgroup by cno )select * from dbo.aver('cs')drop function aver求某个院系选修了某门课的学生人数。create function people (p0 char(10),p1 char (4) returns intasbegindeclare renshu intselect renshu =(select COUNT (*) 选课人数from student, scwhere student.sno = sc.sno and cno = p1 and sdept = p0 ) return renshuendselect dbo.people('cs' , '2')drop function people3. 触发器。Create trigger XXXOn tablefor /after /instead of Insert,delete,updateAs触发器实际需要触发内容For:用法同afterAfter:执行完sql语句之后进行检查,检查不符合条件的话回滚roll back。after 触发器只能在表上指定。Instead of :指定触发器时代替SQL语句执行的,其优先级高于触发语句的操作。例:为student表建立触发器T1,当插入或更新表中的数据时,保证所操作的记录的sage值大于0。 create trigger T1 on studentafter insert,updateasbegindeclare sage intselect sage = inserted.sage from insertedif (sage < 0)beginprint '年龄错误'rollback transactionendend update student set sage = 38 where sno = '01'insert into student(sno,sname,ssex,sage,sdept) values ('2007011','张三','男',55,'ma')为student表建立触发器T2,禁止删除编号为“ 0001 ”的学生。 insert into student(sno,sname,ssex,sage,sdept) values ( '0001','傻大个','男',19,'is')create trigger T2 on student after delete as begindeclare sno char(10)select sno = deleted.sno from deleted if (sno = '0001') beginprint '禁止删除学号0001信息' rollback transactionend enddelete student where sno = '0001' drop trigger T2第十章1. 事务。是一系列的数据库操作,是数据库应用程序的基本逻辑单元。是用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,是一个不可分割 的工作单元。2. 事务的四个特性。原子性:事务是数据库的逻辑工作单位,事务总包括的诸操作要么全做,要么全不做。一致性:数据库只包含成功事务提交的结果,就说数据库处于一致性状态。隔离性:一个事务的执行不能被其他事务干扰。即一个事务的内部操作及使用的数据对 其他并发事务是隔离的,并发执行的各个事务之间不能互相干扰。持续性:指一个事务一旦提交,他对数据库中数据的改变就应该是永久性的。事务是恢复和并发控制的基本单位。3. 数据库恢复。把数据库从错误状态恢复到某一已知的正确状态的功能。1. 运行事务非正常中断。2. 数据丢失。4. 故障种类。运行事务非正常中断恢复-事务撤销。系统故障、介质故障、计算机病毒。5. 恢复实现技术。数据恢复的基本原理:冗余。建立冗余数据最常用的技术是数据转储和登记日志文件。6. 数据转储。静态转储:是在系统中无运行事务时进行的转储操作。动态转储:是指转储期间允许对数据库进行存取或修改。即转储和用户事务可以并发执 行。海量转储:每次转储全部数据库。增量转储:指每次只转储上一次转储后更新过的数据。7旧志文件。是用来记录事务对数据库的更新操作的文件。在事务故障恢复和系统故障恢复必须用日志文件。在动态转储方式中必须建立日志文件,后备副本和日志文件结合起来才能有效地恢复数 据库。在静态转储中也建立日志文件8. 登记日志文件(对数据库的操作记录)。登记的次序严格按并发事务执行的时间次序。必须先写日志文件,后写数据库。9. 事务故障的恢复。恢复子系统应利用日志文件撤销此事务已对数据库进行的修改,系统自动进行。10. 系统故障恢复。导致故障原因可能有两个:1. 未完成事务对数据库的更新可能已写入数据库。2. 已提交事务对数据库的更新可能还留在缓冲区没来得及写入数据库。恢复策略是撤销故障发生时未完成的事物,重做已完成的事物。11. 介质故障的恢复。数据库副本。第十一章1. 并发操作带来的数据不一致性。并发操作破坏了事务的隔离性。丢失修改:两个事务同时读入同一数据并修改,T2提交的结构破坏了 T1提交的结果, 导致T1的修改被丢失。不可重复读:事务1读取数据后,事务2执行更新操作,使T1无法再现前一次读取结 果。读脏数据:事务1修改某一数据并将其写回磁盘,事务2读取同一数据后,T1由于某 种原因被撤销,这时被T1修改过的数据恢复原值,T2读到的数据就与数据库中的数据不一 致,则T2读到的数据就为脏数据,即不正确的数据。2. 并发控制的主要技术。封锁、时间戳、乐观控制法、多版本并发控制等。3. 封锁。封锁就是事务T对某个数据对象操作之前,先向系统发出请求,对该数据对象进行加锁。 加锁后事务T就对该数据对象有了一定的控制,在事务T释放它的锁之前,其他事务不能更 新此数据对象。4. 封锁类型。排他锁(写锁):若事务T对数据对象A加上X锁,则只允许T读取和修改A,其他任 何事务都不能再对A加任何类型的锁,直到T释放A上的锁为止。保证了其他事务在T释 放A上的锁之前不能再读取和修改A。共享锁(读锁):若事务T对数据对象A加上S锁,则事务T可以读A但不能修改A, 其他事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁为止。保证了其他事 务可以读A,但在T释放S锁之前不能对A做任何修改。5. 封锁协议。一级封锁协议:事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放。可防止丢失修改,保证事务T是可恢复的。二级封锁协议:在一级封锁协议基础上增加事务T在读取数据R之前必须先对其加S 锁,读完后即可释放S锁。二级封锁协议可以防止丢失修改和读“脏”数据三级封锁协议:在一级封锁协议的基础上增加事务T在读取数据R之前必须先对其加S 锁,直到事务结束才释放。三级封锁协议可防止丢失修改、读脏数据和不可重复读,容易造 成比较多的死锁。6. 活锁和死锁活锁:有一个事务一直等待无法执行。死锁:T1等待T2,T2等待T1。避免活锁:采用先来先服务的策略。预防死锁的方法:一次封锁法、顺序封锁法死锁的诊断:超时法、事务等待图法7. 可串行化调度。多个事务的并发执行是正确的,当且仅当其结果与按某一次序串行地执行这些事务时的 结果相同。可串行性是并发事务正确调度的准则。一个给定的并发调度,当且仅当它是可串行化的, 才认为是正确调度。8. 两段锁协议。实现并发调度的可串行性,从而保证调度的正确性。9. 所有事务必须分两个阶段对数据项加锁和解锁。在对任何数据进行读、写操作之前,首先要申请并获得对该数据的封锁。在释放一个封锁之后,事务不在申请和获得任何其他封锁。指事务分为两个阶段:一、获得封锁,事务可以申请获得任何数据项上的任何类型的锁,不 能释放任何锁。二:释放封锁,事务可以释放任何数据项上的任何类型的锁,但是不能再申 请任何锁。事务遵守两段锁协议是可串行化调度的充分条件,而不是必要条件。若调度是遵守两段锁协议的,因此一定是一个可串行化调度。反之不然。两段锁协议与防止死锁的次封钺法一次封锁法要求每个事务必须一次将所有要使 用的数据全部加锁,否则就不能继续执行,因 此一次封锁法遵守两段锁协议但是两段锁协议并不要求事务必须一次将所有 要使用的数据全部加锁,因此遵守两段锁协议 的事务可能发生死锁应用题1.授权例题把对Student表和Course表的全部权限授予用户U2和U3GRANT ALL PRIVILIGESON TABLE Student, CourseTO U2, U3;把对表SC的查询权限授予所有用户GRANT SELECTON TABLE SCTO PUBLIC把对表SC的INSERT权限授予U5用户,并允许他再将此权限授予其他用户GRANT INSERTON TABLE SCTO U5WITH GRANT OPTION;