数据库基础理论.ppt
Access数据库技术,第1章 数据库基础理论,1.1 数据库基本概念,1.1 数据库的基本概念,1.2 数据库结构的模型,1.1.1 信息与数据,信息(Information):通过各种方式传播的、可被感受的声音、文字、图像、符号等所表示的某一特定事物的知识、情况和消息。信息是指数据经过加工处理后所获取的有用数据。数据:数据(Data)是指存储在某种媒体上能够识别的物理符号。信息与数据的关系:信息依赖于数据而存在;数据是记载、表达、传递信息的工具。,数据处理:数据收集、转换、组织、输入、检索、合并、计算更新、输出、存储。目的:对原始数据综合加工给出有价值、有意义的数据,借以作为决策的依据或编辑后存储起来,供以后取用。数据管理:对数据的组织、存储、维护和使用等。,1.1.2 计算机数据管理技术的发展,1人工管理阶段2文件系统阶段3数据库系统阶段,数据库(DataBase,简称DB)就是存放数据的“仓库”。以一定的数据模型组织和存储的、能为多个用户共享的、独立于应用程序的、相互关联的数据集合,数据库特点:(1)数据的共享性(2)数据的独立性(3)数据的完整性(4)数据库中的冗余数据少,尽可能避免数据的重复,1.1.3 数据库,1.1.4 数据库内部结构体系,数据库内部结构体系结构是数据库系统的一个总的框架。数据库领域公认的标准结构是三级模式结构,它包括外模式、模式和内模式。,美国国家标准协会(ANSI:American National Standards Institute)将数据库结构分为3级:面向用户或应用程序员的用户级对应外模式面向建立和维护数据库人员的概念级对应模式 面向系统程序员的物理级对应内模式,外模式也称为用户模式,是三级模式的最外层,不同的用户可得到不同的外模式。模式也称为概念模式或逻辑模式,是对数据库的整体逻辑结构和特征的描述,一个数据库只有一个模式。内模式也称为存储模式或物理模式,是对数据库内部的描述。以物理模式为框架的数据库称为物理数据库,是真正存在的,是存放在外存上的数据文件。概念数据库和用户数据库是不存在的。,在数据库系统的三级模式结构,数据库管理系统(DBMS):对数据库的描述、建立、编辑、运行、维护和通信等进行集中管理的系统软件。,1.1.5 数据库管理系统,目前比较流行的有:Access,Visual FoxPro,MySQL,Sybase,Oracle,DB2,SQL Server,Informix等。,数据库管理系统具备的功能:,(1)数据库定义功能(2)数据库操作功能(3)数据库查询功能(4)数据库控制功能(5)数据库通信功能,数据库系统(DBS,Database System)是指引进数据库技术后的整个计算机系统。主要由以下四个部分组成:,DBS,计算机硬件系统计算机软件系统(OS、DBMS等应用软件)数据库应用系统各类人员,1.1.6 数据库系统,数据库系统层次示意图,数据库系统的特点,数据结构化数据共享数据独立性可控冗余度安全性保护数据完整性控制并发控制故障发现和恢复控制,1.2 数据模型,表示数据与数据之间联系的方法称为数据模型。,一、实体的描述,实体:客观存在并且可以相互区别的事物。实体的属性:实体所具有的特性。不同实体是由其属性的不同而被区分的。实体集和实体型 属性的集合表示一种实体的类型,称为实体型。同类型的实体的集合,称为实体集。,在学生实体集中,(2006111001,白雪,女,02/25/88,物理学)表征学生名册中的一个具体人。在图书实体集中,(3593,TP593,大学计算机基础,崔洪芳,23.00,华中科技大学出版社)则具体代表一本书。在 Access中,用“表”来表示同一类实体,即实体集,用“记录”来表示一个具体的实体,用“字段”来表示实体的属性。显然,字段的集合组成一个记录,记录的集合组成一个表。相应于实体型,则代表了表的结构。,关系模型,一对一联系(one-to-one relationship)主表中的每一条记录只与相关表中的一条记录相关联(如职工表与工资表)。一对多联系(one-to-many relationship)主表中的每一条记录与相关表中的多条记录相关联(如系与学生)。,二、实体间联系及联系的种类,多对多联系(many-to-many relationship)一个表中的多个记录在相关表中同样有多个记录与其匹配。如:图书与读者之间存在多对多的联系;学生和课程之间也是多对多联系。,三、数据模型,数据模型:用来抽象、表示和处理现实世界中的数据和信息。它决定了系统的特性管理能力和应用范围。三种经典的数据模型:层次模型、网状模型、关系模型面向对象模型,层次模型是用树型结构来表示数据之间的联系。数据间的联系像一棵倒放的树。实体 树的结点实体间的联系 树枝,特点:(1)有且仅有一个结点无父结点,这个结点即为树的根;(2)其它结点有且仅有父一个结点。适于描述现实世界中具有层次结构的事物,只能反映一对多的联系。,1.层次模型,层次模型示例,1系,2系,一处,二 处,一班,二班,三班,四班,科1,科2,科3,学 校,网络模型是用网络结构来表示数据之间的联系,可以表示多对多的联系。,特点:(1)可以有一个以上的结点无父结点;(2)至少有一个子结点有一个以上的父结点;(3)在两个结点之间有两个或两个以上的联系。,2.网络模型,网状模型示例,教师,讲 课,姓名 年龄 职称,教师 课程名 专业,学号 姓名 专业,课程号 课程名 学分,学号 课程号 成绩,学生,课程,选课,关系模型是把数据结构看成一个二维表,每个二维表就是一个关系,关系模型是由若干个二维表格组成的集合。实体 二维表 实体间的联系 二维表特点:(1)描述一致性;(2)可以直接表示多对多的联系;(3)关系规范化;(4)数据基础严密;(5)概念简单,操作方便.,3.关系模型,关系模型示例:,学生关系,学生课程关系,课程关系,表中表示例:(非规范化表),1.2 概念模型与E-R图,数据模型是数据库系统的核心和基础。概念模型也称信息模型,是按用户的观点对数据和信息建模,它不依赖于具体的数据库管理系统,主要用于数据库设计。实体间联系一对一、一对多和多对多三类基本联系是概念模型的基础。概念模型的表示方法最为常用的是实体联系方法(E-R方法)。,E-R图,E-R方法用来表示概念模型(E-R模型)。E-R图的基本图素:(1)实体:用矩形表示,矩形框内写出实体名。(2)联系:用菱形表示,菱形框内标出联系名,并用无向边分别与有关实体型连接起来,同时在无向边旁标上联系的类型(1:1,1:n或m:n)。(3)属性:用椭圆形框表示,并用无向边将其与相应的实体连接起来。,画E-R图的步骤如下:,确定实体。确定各实体的属性。确定实体间联系。确定各联系的属性。,用E-R图表示的学生实体及属性,用E-R图表示的课程实体、学生实体、参考书实体、书库实体之间的联系,1.3 关系数据库,1.3.1 关系数据库的基本概念,1.3.2 关系运算,退出,1.3.3 关系的完整性,1.3.1 关系数据库基本概念,一个关系就是一个二维表,每一个关系有一个关系名。在Access中一个关系称为“表”。,二维表中水平方向的行称为元组,每一行是一个元组,元组对应存储文件中的一个具体记录,1.关系,2.元组,3.属性,二维表中垂直方向的列称为属性,每一列有一个属性名,在Access中表示字段名。每个字段的数据类型,宽度等在建立表的结构时设定。,一个属性的取值范围称为域,即不同元组对同一属性的取值所限定限定的范围.,4.域,关系型数据库是由若干二维表组成的。关系 二维表表中一行(元组、记录)表中一列(属性、字段)字段名字段 字段值(域)关键字唯一标识一条记录的字段或字段的组合。(主关键字、候选关键字),例:学籍管理数据库,表1 学生表,记录(元组),属性(字段),表框架(数据表结构),表2 成绩表,5.候选关键字 关系中能够成为关键字的属性或属性组合可能不是惟一的。凡在关系中能够惟一区分、确定不同元组的属性或属性组合,称为候选关键字。6.主关键字 在候选关键字中选定一个作为关键字,称为该关系的主关键字。关系中主关键字是惟一的。,7外部关键字 关系中某个属性或属性组合并非关键字,但却是另一个关系的主关键字,称此属性或属性组合为本关系的外部关键字。关系之间的联系是通过外部关键字实现的。如果表中的一个属性不是本表的主关键字,而是另外一个表的主关键字,这个属性就称为外部关键字(也叫外键),8.关系数据库,采用关系模型的数据库叫做关系数据库(RDB:Relational Database)。关系数据库由至少一个或多个数据表组成,各数据表之间可建立相互性关系。,关系数据库中的表应满足:,表中不允许有重复的字段名,无重复的记录表中每一字段中的数据类型必须相同;表中记录的次序及字段的次序可任意排列;字段之间不应相互关联。如:“年龄”与“出生日期”;关键字一般应为唯一的。,1.4 关系代数,1.4.1 传统的集合运算1.并 两个具有相同结构的关系R和S的并是由属于这两个关系的元组组成的集合,表示为RS。RS=t|tRt S 例如,有两个结构相同的学生关系R1、R2,分别存放两个班的学生,把第二个班的学生记录追加到第一个班的学生记录后面,就是这两个班的并集。,2差 设有两个相同结构的关系R和S,R差S的结果是由属于R但不属于S的元组组成的集合,即差运算的结果是从R中去掉S中也有的元组,表示为RS。R-S=t|tR t S,3交 两个具有相同结构的关系R和S,它们的交是由既属于R又属于S的元组组成的集合。交运算的结果是R和S的共同元组,表示为RS。RS=t|tR t S 例如,有选修计算机网络的学生关系R,选修多媒体技术的学生关系S,求既选修计算机网络又选修多媒体技术的学生,就应当进行交运算。,4笛卡儿积,笛卡儿积是集合论中很重要的概念,已知一组集合D1、D2、.、Dn,他们的笛卡儿积S定义 为:D=(x1,x2,.,xn)|xi Di,i=1,2.n xi定义为他们的笛卡儿积D的一个子集。设关系R有m个元组,S有n个元组,则RS有mn个元组。,1.4.2 专门的关系运算,选择(Select):依据一定的条件选择若干个符合条件的记录(在二维表格中选择行)。例如,从成绩表中找出所有成绩在80分以上的记录,就是通过选择操作来完成的。,投影(Project):从一个数据库文件中选择若干个字段(在二维表格中选择列)。例如,在学生表中,若要显示所有学生的学号、姓名、性别、专业,那么可以使用投影运算来实现。,联接(Join):将两个数据库文件按某个条件提取部分(或全部)记录及部分(或全部)字段并组合成一个新的数据库文件。,(1)内连接(inner join)是按照公共属性值相等的条件连接,并且不消除重复属性。(2)自然连接(natural join)是在内连接的基础上,再消除重复的属性(属于投影操作)。,(3)左连接(1eft join)是在内连接的基础上,保留左关系中不能匹配条件的元组,并将右关系的属性值填空值Null。(4)右连接(right join)类似左外连接。在内连接的基础上,保留右关系中不能匹配条件的元组,并将左关系的属性值填空值Null。(5)全连接(full join)是左外连接和右外连接的组合。,小结,选择运算和投影运算的操作对象只是一个表,相当于对一个二维表的数据进行横向或纵向的提取;而连接运算则是对两个或两个以上的表进行的操作。如果需要连接两个以上的表,应当进行两两关系连接。在对关系数据库的操作中,利用关系的选择、投影和连接运算,可以方便地在一个或多个关系中提取所需的各种数据,建立或重组新的关系。对关系数据库的实际操作,往往是以上几种操作的综合应用。,1.5 关系的规范化,1.5.1 数据依赖,数据依赖是通过一个关系中属性间值的相等与否体现出来的数据间的相互关系,是现实世界属性间相互联系的抽象,是数据内在的性质,是语义的体现。数据依赖中最重要的是函数依赖和多值依赖。函数依赖普遍存在于生活中。描述一个学生的关系,可以有学号、姓名、性别、专业等多个属性。由于一个学号只对应一个学生,一个学生只有一个专业。因而当“学号”值确定之后,姓名、性别及其专业的值也就被唯一地确定了。,函数依赖可能存在4个问题:,(1)数据冗余太大。(2)更新异常。由于数据冗余,当更新数据库中的数据时,系统要付出很大的代价来维护数据库的完整性。否则会面临数据不一致的危险。(3)插入异常。(4)删除异常。,1.5.2 关系的规范化方法,关系的规范化是指在关系模型中,关系必须满足给定条件,最基本的要求是关系中的每一个属性都是不可再分的。关系的规范化是降低或消除数据库中冗余数据的过程。范式表示的是关系模式的规范化程度。通常只使用前三种范式。,1第一范式(1NF),如果一个关系R的每一分量都是不可分的数据项,则称R是第一范式的。第一范式要求删除表中的所有重复组,一个重复组是一个记录中的一组属性。1NF就是要删除重复组。如教师编号、姓名、电话组成一个关系,但电话可能有办公电话、家庭电话,电话可再分,不符合第一范式。应改为教师编号、姓名、办公电话、家庭电话组成一个关系。,2第二范式(2NF),若R1NF,且它的每一非主属性完全依赖于主键,则R2NF。第二范式指其中包含有组合主键,所有的非关键字字段必须完全依赖于整个主关键字。2NF要删除部分依赖。如学号、课程号、成绩、学分组成一个关系,学号课程号构成组合关键字,学分完全依赖课程号,不为完全依赖组合关键字。解决方法将原有关系变为两个关系模型,分别是R关系(学号、课程号、成绩)和S关系(课程号、课程名、学分)。,3第三范式(3NF),若R2NF,且每一非主属性不传递依赖于主键,则R3NF。第三范式指非主关键字属性之间不允许互相依赖。删除非关键字依赖。如学号、姓名、性别、专业、院系组成一个关系,学号是主关键字,没有部分依赖问题。但专业与院系相关,存在大量的冗余数据。解决方法将原有关系变为两个关系模型,分别是R关系(学号、姓名、性别、院系号)和S关系(院系号、院系名、专业),4第四范式(BCNF),又称为BoyceCodd范式(鲍依斯-柯德范式BCNF)。当实体已经是第三范式的,并且任何属性所依赖的都是某个候选关键字,则此实体就属于BCNF。规范化的基本思想是逐步消除数据依赖关系中不合适的部分,使依赖于同一个数据模型的数据达到有效的分离。,1.5.3 关系的完整性,关系的完整性,即关系中的数据及具有关联关系的数据间必须遵循的制约和依存关系,关系的完整性用于保证数据的正确性、有效性和相容性。关系的完整性主要包括实体完整性、域完整性和参照完整性三种,它们分别在记录级、字段级和数据表级提供了数据正确性的验证规则。,1.实体完整性,保证表中记录的唯一性,即在表中不允许出现重复记录。在Access中利用主键或候选键来保证记录的唯一性。由于主键的一个重要作用就是标示每条记录,所以关系的实体完整性要求关系(表)中的记录在组成的主键上,不允许出现两条记录的主键值相同,也就是说,既不能取空值Null,也不能有重复值。例如,在学生表中字段“学号”作为主键,其值不能为空值Null,也不能有两条记录的学号相同。,2域完整性,域完整性是针对某一具体字段的数据设置的约束条件,Access也提供了定义和检验域完整性的方法。例如,可以将“性别”字段定义为分别取两个值“男”或“女”,将“成绩”字段值定义为O100之间。,3参照完整性,参照完整性是相关联的两个表之间的约束,当输入、删除或更新表中记录时,保证各相关表之间数据的完整性。例如,如果在学生表和成绩表之间用学号建立关联,学生表是主表,成绩表是从表,那么,在向成绩表中输入一条新记录时,系统要检查新记录的学号是否在学生表中已存在。如果存在,则允许执行输入操作;否则拒绝输入,以保证输入记录的合法性。,3参照完整性,参照完整性还体现在对主表中记录进行删除和修改操作时对从表的影响。如果删除主表中的一条记录,则从表中凡是外键的值与主表的主键值相同的记录也会被同时删除,这就是级联删除;如果修改主表中主关键字的值,则从表中相应记录的外键值也随之被修改,这就是级联更新。,1.6 数据库设计基础,1数据库设计步骤(1)设计原则为了合理组织数据,应遵从以下基本设计原则:关系数据库的设计应遵从概念单一化“一事一地”的原则。避免在表之间出现重复字段。表中的字段必须是原始数据和基本数据元素 用外部关键字保证有关联的表之间的联系。,(2)设计的步骤,需求分析阶段 概念结构设计阶段 逻辑结构设计阶段 物理结构设计阶段 数据库实施阶段 数据库运行的维护阶段,2数据库设计过程,需求分析 确定数据库中需要的表。确定数据表所需字段。确定表间联系。设计求精。,1.7 数据库技术的发展,1分布式数据库系统2面向对象数据库系统3并行数据库系统4多媒体数据库系统5模糊数据库系统6数据仓库7工程数据库8空间数据库,1.8 Access数据管理系统概述,1.Access的发展过程2.Access的基本特点3.Access的启动与退出4.Access的操作窗口5.Access的基本对象6.设置工具栏,1.Access的发展过程,在1992年11月Microsoft公司推出了第一个供个人使用的关系数据库系统Access 1.0,受到了广泛关注,并且很快成为桌面数据库的领导者。此后Access不断地改进和优化,从1995年开始,Access作为MS-Office套装软件的一部分,先后推出了2.0、7.0、8.0、9.0、2000,到现在的Access2003。最新推出的Access 2003更是在界面和操作方式上与Office 2003中的其它成员保持了高度的一致性,并且它们彼此之间可以通过更快捷的方式进行协同工作和数据交换。本课以Access2003为基础来介绍Access的基本操作。,2.Access的基本特点,(1)存储文件单一(2)支持长文件名及名称自动更正(3)兼容多种数据库格式(4)具有Web网页发布功能(5)可应用于客户机/服务器方式(6)操作使用方便,3.Access的启动与退出,(1)启动方法一选择“开始”“程序”“Microsoft Office”“Microsoft Office Access 2003”命令可启动Access 2003。(2)启动方法二 如果在桌面上有Microsoft Access的快捷方式,可以直接双击该图标,或单击鼠标右键,在弹出的快捷菜单中选择打开命令,即可启动Access。(3)启动方法三 双击扩展名为mdb的数据库文件,或在扩展名为mdb的数据库文件上单击鼠标右键,在弹出的快捷菜单中选择打开命令,也可启动Access。此方法同时打开所选的数据库文件,Access系统的退出,退出Access通常可以采用以下方式:(1)单击窗口右上角的关闭按钮;(2)选择“文件”菜单中的“退出”命令;或按x键。(3)使用快捷键Alt+F4;(4)右击标题栏或单击控制菜单图标,在弹出的菜单中选择“关闭”命令;注意:在退出系统时,如果没有对文件进行保存,会弹出对话框提示用户是否对已编辑或修改的文件进行保存。,4.Access的操作窗口,(1)Access主窗口,(2)数据库窗口,(3)表设计视图窗口,(4)查询设计视图窗口,(5)窗体设计视图窗口,(6)报表设计视图窗口,(7)宏设计窗口,(8)代码窗口,5.Access的基本对象,(1)表,课程表,(2)查询,学生选课成绩查询结果,学生选课成绩查询结果,学生选课成绩查询结果,查询是通过设置某些条件,从表中获取所需要的数据。按照指定规则,查询可以从一个表、一组相关表和其他查询中抽取全部或部分数据,并将其集中起来,形成一个集合供用户查看。将查询保存为一个数据库对象后,可以在任何时候查询数据库的内容。,(3)窗体,窗体示例,窗体是Access数据库对象中最具灵活性的一个对象,是数据库和用户的一个联系界面,用于显示包含在表或查询中的数据和操作数据库中的数据。在窗体上摆放各种控件,如文本框、列表框、复选框、按钮等,分别用于显示和编辑某个字段的内容,也可以通过单击、双击等操作,调用与之联系的宏或模块(VBA程序),完成较为复杂的操作。,(4)报表,报表可以按照指定的样式将多个表或查询中的数据显示(打印)出来。报表中包含了指定数据的详细列表。报表也可以进行统计计算,如求和、求最大值、求平均值等。报表与窗体类似,也是通过各种控件来显示数据的,报表的设计方法也与窗体大致相同。,(5)页,数据访问页示例,页(或称为数据访问页)可以实现数据库与Internet(或Intranet)的相互访问。数据访问页就是Internet网页,将数据库中的数据编辑成网页形式,可以发布到Internet上,提供给Internet上的用户共享。也就是说,网上用户可以通过浏览器来查询和编辑数据库的内容。,(6)宏,宏是若干个操作的组合,用来简化一些经常性的操作。用户可以设计一个宏来控制系统的操作,当执行这个宏时,就会按这个宏的定义依次执行相应的操作。宏可以打开并执行查询、打开表、打开窗体、打印、显示报表、修改数据及统计信息、修改记录、修改表中的数据、插入记录、删除记录、关闭表等操作。,(7)模块,模块是用VBA语言编写的程序段,它以Visual Basic为内置的数据库程序语言。对于数据库的一些较为复杂或高级的应用功能,需要使用VBA代码编程实现。通过在数据库中添加VBA代码,可以创建出自定义菜单、工具栏和具有其他功能的数据库应用系统。,6设置工具栏,(1)显示或隐藏工县栏 工具栏随着Access视图状态的不同而有一些不同。打开Access时,系统打开数据库工具栏。Access提供了不同环境下的20多种常用工具栏,若想要显示或隐藏某些工具栏,可以单击“工具”菜单中“自定义”命令,也可以右击任何一个工具栏的空白处,打开工具栏的快捷菜单选择“自定义”命令,弹出自定义对话框,选定或清除相应的工具栏复选框,然后单击关闭按钮,便可显示或隐藏指定的工具栏。,(2)自定义工具栏,Access允许用户修改现有的工具栏,即自定义工具栏。在“工具”菜单选择“自定义”命令,弹出自定义对话框;选择“命令”选项卡,并在左边的类别列表中选定一种工具类别,在右边的命令列表中单击所需的工具按钮,例如导入,按住鼠标左键不放,并拖曳至工具栏上空白位置;同理,将所需的工具按钮全部加入工具栏中。若想删除不需要的工具按钮,只要将其从工具栏上直接拖曳至工具栏之外即可。,