数据库基础知识 .ppt
《数据库基础知识 .ppt》由会员分享,可在线阅读,更多相关《数据库基础知识 .ppt(135页珍藏版)》请在三一办公上搜索。
1、第1章 数据库基础知识,章节分布,1.1 数据库的基本概念,数据库技术产生于六十年代末,是数据管理的最新技术,是计算机科学的重要分支数据库技术是信息系统的核心和基础,它的出现极大地促进了计算机应用向各行各业的渗透数据库的建设规模、数据库信息量的大小和使用频度已成为衡量一个国家信息化程度的重要标志。,数据管理技术的发展,四个基本术语,数据库应用,1.1.1 数据管理技术的发展,什么是数据管理对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题 数据管理技术的发展过程人工管理阶段(40年代中-50年代中)文件系统阶段(50年代末-60年代中)数据库系统阶段(60年代末-现在),数据管
2、理技术的发展动力应用需求的推动计算机硬件的发展计算机软件的发展,人工管理时期40年代中-50年代中产生的背景应用需求科学计算硬件水平无直接存取存储设备软件水平没有操作系统处理方式批处理,特点数据的管理者:应用程序,数据不保存。数据面向的对象:某一应用程序 数据的共享程度:无共享、冗余度极大数据的独立性:不独立,完全依赖于程序数据的结构化:无结构数据控制能力:应用程序自己控制,文件系统阶段 时期50年代末-60年代中 产生的背景应用需求科学计算、管理硬件水平磁盘、磁鼓软件水平有文件系统处理方式联机实时处理、批处理,特点数据的管理者:文件系统,数据可长期保存数据面向的对象:某一应用程序 数据的共享
3、程度:共享性差、冗余度大数据的结构化:记录内有结构,整体无结构数据的独立性:独立性差,数据的逻辑结构改变必须修改应用程序数据控制能力:应用程序自己控制,数据库系统阶段 时期60年代末以来 产生的背景应用背景大规模管理硬件背景大容量磁盘软件背景有数据库管理系统处理方式联机实时处理,分布处理,批处理,特点数据的管理者:DBMS数据面向的对象:现实世界数据的共享程度:共享性高数据的独立性:高度的物理独立性和一定的 逻辑独立性数据的结构化:整体结构化数据控制能力:由DBMS统一管理和控制,独立性,物理独立性 指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。当数据的物理存储改变了,应用程序不用
4、改变。逻辑独立性 指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变了,用户程序也可以不变。,数据结构化,数据库中实现的是数据的真正结构化,数据的结构用数据模型描述,无需程序定义和解释,数据可以变长,数据的最小存取单位是数据项。,DBMS对数据的控制功能,数据的安全性(Security)保护使每个用户只能按指定方式使用和处理指定数据,保护数据以防止不合法的使用造成的数据的泄密和破坏。数据的完整性(Integrity)检查将数据控制在有效的范围内,或保证数据之间满足一定的关系。,并发(Concurrency)控制对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。数据
5、库恢复(Recovery)将数据库从错误状态恢复到某一已知的正确状态。,1.1.2 四个基本概念,数据(Data)数据(Data)是数据库中存储的基本对象 数据的定义描述事物的符号记录 数据的种类文字、图形、图象、声音 数据的特点数据与其语义是不可分的,数据举例学生档案中的学生记录(李明,男,1972,江苏,计算机系,1990)数据的形式不能完全表达其内容数据的解释语义:学生姓名、性别、出生年月、籍贯、所在系别、入学时间解释:李明是个大学生,1972年出生,江苏人,1990年考入计算机系,数据库(DataBase,DB)人们收集并抽取出一个应用所需要的大量数据之后,应将其保存起来以供进一步加工
6、处理,进一步抽取有用信息。数据库(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据集合。,数据库的特征数据按一定的数据模型组织、描述和储存可为各种用户共享冗余度较小数据独立性较高易扩展,数据库管理系统 数据库管理系统(Database Management System,简称DBMS)是位于用户与操作系统之间的一层数据管理软件。通过它人们可以科学地组织和存储数据、高效地获取和维护数据库中的数据。DBMS的主要功能 数据定义功能 提供数据定义语言(DDL)定义数据库中的数据对象,数据操纵功能:提供数据操纵语言(DML)操纵数据实现对数据库的基本操作(查询、插入、删除和
7、修改)数据库的运行管理 保证数据的安全性、完整性,多用户对数据的并发使用,发生故障后的系统恢复。数据库的建立和维护功能(实用程序)数据库数据批量装载,数据库转储,介质故障恢复,数据库的重组织,性能监视等,数据库系统(DataBase System,DBS)数据库系统(Database System,简称DBS)是指在计算机系统中引入数据库后的系统构成。在不引起混淆的情况下常常把数据库系统简称为数据库。它由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员(和用户)构成。,1.1.3 数据库的应用,数据库应用非常广泛,以下是一些具有代表性的应用:银行业:用于存储客户的信息、帐户、贷款
8、以及银行的交易记录。航空业:用于存储订票和航班的信息。大 学:用于存储学生的信息、课程和成绩等信息。信用卡交易:用于记录信用卡消费的情况和产生每月清单。电信业:用于存储通话记录,产生每月帐单,维护预付电话卡的余额和存储通信网络的信息。金融业:用于存储股票、债券等金融票据的持有、出售和买入的信息。销售业:用于存储客户信息,产品和购买的信息。制造业:用于管理供应链,跟踪工厂种产品的产量、仓库(或商店)中的产品的详细清单以及产品的订单。人力资源:用于存储员工、工资、所得税和津贴的信息,以及产生工资单。,1.2 数据描述,在使用计算机对数据库中的数据进行处理,首先要解决一个重要的问题,即如何将现实世界
9、中对事物的描述转换成能够被计算机识别并处理的信息世界中数据的表示,本节将从三个方面对数据转换过程中的几个基本概念进行解释。,1.2.1 现实世界的信息表示,实体(Entity)客观存在并可相互区别的事物称为实体。实体可以是具体的人、事、物,也可以是抽象的概念或联系,例如,一个职工、一个学生、一个部门、老师与系的工作关系等。属性(Attribute)实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画,例如学生实体可以由学号、姓名、性别、出生年份、系、入学时间等属性组成。Example:(94002268,张山,男,1976,计算机系,1994)表征了一个学生。,实体和属性的型与值 实体
10、和属性有型与值之分,型是结构,具有相同属性的实体,称它们具有相同的实体型,但是不同的个体有着不同的属性内容,由具体属性值组组成的实体,称实体值。类似地,属性也有型、值之分。,码(Key)唯一标识实体的属性集称为码。例如身份证号。域(Domain)属性的取值范围称为属性的域,例如性别的域为(男,女)。实体集(Entity Set)同型实体的集合称为实体集,例如全体学生就是一个实体集。联系(Relationship)在现实世界中,事物内部以及事物之间是有联系的,这些联系在信息世界中反映为实体(型)内部的联系和实体(型)之间的联系。,1.2.2 信息世界的数据描述,字段(Field)标记实体属性的命
11、名单位称为字段,或数据项,它是可以命名的最小信息单位。记录(Record)字段的有序集合称为记录,一般情况下,一个记录描述一个实体。文件(File)同类记录的集合称为文件,文件用来描述实体集。关键码(Key)能惟一标识文件中每个记录的字段或若干字段的集合称为关键码,又称主码。,1.2.3 数据联系的描述,实体间的联系一般存在两类联系:一类是实体之间的联系,另一类是实体内部的联系。1、实体之间的联系方式 两个实体之间的联系可以分为三类:a.一对一联系(1:1)如果对于实体集A中的每一个实体,实体集B中至多有一个(也可以没有)实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系,记为1:1
12、。,Eg,班级与班长之间的联系:一个班级只有一个正班长一个班长只在一个班中任职,b.一对多联系(1:n)如果对于实体集A中的每一个实体,实体集B中有n个实体(n0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系,记为1:n。c.多对多联系(m:n)如果对于实体集A中的每一个实体,实体集B中有n个实体(n0)与之联系,反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m0)与之联系,则称实体集A与实体B具有多对多联系,记为m:n。,Eg,班级与学生之间的联系:一个班级中有若干名学生,每个学生只在一个班级中学习,Eg,课程
13、与学生之间的联系:一门课程同时有若干个学生选修一个学生可以同时选修多门课程,2、同一实体集内实体间的联系 同一个实体集内的各实体之间也可以存在一对一、一对多、多对多的联系。例如职工实体集内部具有领导与被领导的联系,即某一职工(干部)“领导”若干名职工,而一个职工仅被另外一个职工直接领导,因此这是一对多的联系,如下图所示。,职工,领导,1,n,1.3 数据模型,在数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。通俗地讲数据模型就是现实世界的模拟。数据模型应满足三方面要求:能比较真实地模拟现实世界、容易为人所理解、便于在计算机上实现。数据模型分成两个不同的层次:(1)概念模型:
14、也称信息模型,它是按用户的观点来对数据和信息建模。(2)数据模型:主要包括网状模型、层次模型、关系模型等,它是按计算机系统的观点对数据建模。,1.3.1 数据库的三级结构,从现实世界的信息到数据库存储的数据以及用户使用的数据是一个逐步抽象的过程,在数据抽象的过程中,我们使用到四种数据模型:概念模型:用来表达用户需求观点的数据库全局逻辑结构的模型。逻辑模型:用来表达计算机实现观点的数据库全局逻辑结构的模型。外部模型:用来表达用户使用观点的数据库局部逻辑结构的模型。内部模型:用来表达数据库物理结构的模型。,后面三种模型我们有时又把它们称为外模式、模式和内模式。,概念模型,1.3.2 数据抽象过程,
15、客观对象的抽象过程-两步抽象:(1)现实世界中的客观对象抽象为概念模型;(2)把概念模型转换为某一DBMS支持的数据模型。概念模型是现实世界到机器世界的一个中间层次。,1.3.3 概念模型的特点及设计,概念模型的用途概念模型用于信息世界的建模是现实世界到机器世界的一个中间层次是数据库设计的有力工具数据库设计人员和用户之间进行交流的语言 对概念模型的基本要求较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识简单、清晰、易于用户理解。,概念模型的设计 概念模型的表示方法很多,其中最著名的是实体联系方法(E-R方法),即用E-R图来描述现实世界的概念模型,E-R方法也称为E-R模型。实体型
16、用矩形表示,矩形框内写明实体名。,学生,教师,属性用椭圆形表示,并用无向边将其与相应的实体连接起来,联系联系本身:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1、1:n或m:n)联系的属性:联系本身也是一种实体型,也可以有属性。如果一个联系具有属性,则这些属性也要用无向边与该联系连接起来。,Example:工厂物资管理的概念模型 物资管理涉及的实体有:仓库 属性有仓库号、面积、电话号码。零件 属性有零件号、名称、规格、单价、描述。供应商 属性有供应商号、姓名、地址、电话号码、帐号。项目 属性有项目号、预算、开工日期职工 属性有职工号、姓名
17、、年龄、职称。实体及其属性图如下所示:,1.3.4 模式,在选定DBMS软件后,就要把概念模型根据使用的DBMS的特点转换成逻辑模型,即数据库模式,目前较为常见的有以下几种模式:非关系模型层次模型(Hierarchical Model)网状模型(Network Model)数据结构:以基本层次联系为基本单位基本层次联系:两个记录以及它们之间的一对多(包括一对一)的联系,关系模型(Relational Model)数据结构:表面向对象模型(Object Oriented Model)数据结构:对象,层次模型 满足下面两个条件的基本层次联系的集合为层次模型。1.有且只有一个结点没有双亲结点,这个结
18、点称为根 结点2.根以外的其它结点有且只有一个双亲结点,网状模型 满足下面两个条件的基本层次联系的集合为网状模型。1.允许一个以上的结点无双亲;2.一个结点可以有多于一个的双亲。,关系模型 最重要的一种数据模型。也是目前主要采用的数据模型。1970年由美国IBM公司San Jose研究室的研究员提出。在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。,1.4 数据库系统,数据库系统的组成 数据库系统是由数据库、数据库管理系统、支持数据库运行的软、硬件环境、应用程序、数据库管理员和用户等组成的。DB是存放数据的仓库,只不过这个仓库是在计算机存储设备上的,而且数据是按一定格式存放
19、的。每个用户只享用其中一部分数据,不同用户所使用的数据可以重叠,并且同一片数据可以为多个用户共享;使用数据库中的数据是用户的事,要自编应用程序处理自己的业务。,DBMS向用户提供对数据的存储组织、数据操作的方便界面,它还提供有保护数据库的功能。使用DBMS的一个主要原因是可以对数据和访问这些数据的程序进行集中控制。对系统进行集中控制的人称为数据库管理员(DBA)。DBA的作用包括:模式定义存储结构及存取方式定义模式及物理组织的修改数据访问授权日常维护:备份、保护及监视,DBMS的工作模式,应用程序,DB,数据请求,数据(处理结果),底层指令,数据(查询结果),DBMS的主要功能 数据库定义功能
20、 DBMS一般提供数据定义(描述)语言(DDL)定义外模式、模式和内模式。各种模式翻译程序把用DDL书写的各种源模式翻译为相应的内部表示,分别称为目标外模式、目标模式和目标内模式。这些目标模式是对数据库的描述,而不是数据本身。它们是刻画数据库的框架,被保存在数据字典(亦称系统目录)中。,数据库操纵功能 数据操纵是指:对存储在数据库中的信息进行检索;向数据库中插入新的信息;从数据库中删除信息;修改数据库中存储的信息。DBMS提供数据操纵语言(Data Manipulation Language 简称DML)实现对数据库的基本操作:检索、插入、修改和删除等各种操作命令。DML有两类:一类是嵌入主语
21、言中的语言,称为宿主型语言;一类是交互式命令语言,称为自含语言。,数据库管理功能 数据库中的不同或相同的数据要供不同的用户使用,对特定用户而言,可以取数据库的某个子集,这是通过DBMS的数据管理功能实现的。数据库控制功能这是DBMS运行时的核心部分,包括并发控制、存取控制(即存取权限的检查)、完整性约束条件的检查和执行、数据库内部的维护(如索引、数据字典的自动维护)等等。,1.5 关系模型的基本概念,1.关系的概念,2.关系的性质,3.关系的约束,4.关系模型,1.5.1 关系的概念,现实世界的实体以及实体间的各种联系均用关系来表示,从用户角度,关系模型中数据的逻辑结构是一张二维表。域(Dom
22、ain)域是一组具有相同数据类型的值的集合。例:整数实数介于某个取值范围的整数长度指定长度的字符串集合,笛卡尔积 给定一组域D1,D2,Dn,这些域中可以有相同的。D1,D2,Dn的笛卡尔积为:D1D2Dn(d1,d2,dn)diDi,i1,2,n所有域的所有取值的一个组合不能重复,Example:给出三个域:D1=SUPERVISOR=张清玫,刘逸 D2=SPECIALITY=计算机专业,信息专业 D3=POSTGRADUATE=李勇,刘晨,王敏则D1,D2,D3的笛卡尔积为:D1D2D3(张清玫,计算机专业,李勇),(张清玫,计算机专业,刘晨),(张清玫,计算机专业,王敏),(张清玫,信息
23、专业,李勇),(张清玫,信息专业,刘晨),(张清玫,信息专业,王敏),(刘逸,计算机专业,李勇),(刘逸,计算机专业,刘晨),(刘逸,计算机专业,王敏),(刘逸,信息专业,李勇),(刘逸,信息专业,刘晨),(刘逸,信息专业,王敏),元组 笛卡尔积中每一个元素(d1,d2,dn)叫作一个n元组(n-tuple)或简称元组。分量 笛卡尔积元素(d1,d2,dn)中的每一个值di叫作一个分量。笛卡尔积的表示方法 笛卡尔积可表示为一个二维表。表中的每行对应一个元组,表中的每列对应一个域。,关系(Relation)D1D2Dn的子集叫作在域D1,D2,Dn上的关系,表示为:R(D1,D2,Dn)R:关系
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库基础知识 数据库 基础知识

链接地址:https://www.31ppt.com/p-6296415.html