《数据库概论》PPT课件.ppt
《《数据库概论》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《数据库概论》PPT课件.ppt(105页珍藏版)》请在三一办公上搜索。
1、,11 数据库系统概述12 数据库中的数据描述13 数据模型14 数据库系统的结构15 数据库系统的组成,第1章数据库系统概论,11 数据库系统概述,数据库技术的基本概念数据库技术的发展历程数据库系统的三个发展阶段,1数据和信息(Data and Information)2数据库(Database,DB)3数据库管理系统(Database Management System,DBMS)4数据库管理员(Database Administrator,DBA)5数据库系统(Database System,DBS)6数据库技术(Database Technology,DBT),111 数据库技术的基本
2、概念,1数据和信息(Data and Information)数据与信息有多种解释。一般而论,数据是对客观事物描述与记载的物理符号,而信息则是数据的集合、含义与解释,是事物变化、相互作用、特征的反映。数据按运算的特性可分为数值型数据和非数值型数据。数值型数据以数字表示,可以进行算术运算;非数值型数据以字符(含数字)等来表示,不能进行算术运算。例如,字符、文字、图表、图形、图像、声音、视频等均属于非数值型数据。,2数据库(Database,DB)数据库指长期存储在计算机内、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度,较高的数据独立性和易扩展性,并
3、可为各种用户共享。,3数据库管理系统(Database Management System,DBMS)指对数据库进行管理的系统软件,是用户访问数据的接口,提供用户对数据进行定义和操作的各种命令,并能保证数据的安全性、完整性、多用户对数据的并发使用以及发生故障后的系统恢复。,4数据库管理员(Database Administrator,DBA)指负责设计、建立、管理和维护数据库以及协调用户对数据库要求的个人或工作团队,5数据库系统(Database System,DBS)指引入了数据库后的计算机应用系统,一般由数据库、数据库管理系统及其开发工具、应用系统、数据库管理员及用户等组成。有时人们常将数
4、据库系统简称为数据库,它可用图1.1表示。,6数据库技术(Database Technology,DBT)指研究数据库结构、存储、设计和使用的一门软件学科,是在操作系统的文件系统的基础上发展起来的。,1人工管理阶段20世纪50年代中期以前,计算机主要用于科学计算,数据管理处于人工管理阶段,其特点是:(1)数据管理无相应的软件系统支持,要靠应用程序自己管理。(2)数据不共享。(3)数据不独立。(4)数据不保存。,112 数据库技术的发展历程,工作中的ENIAC,这部机器使用了18800个真空管,长50英尺,宽30英尺,占地1500平方英尺,重达30吨(大约是一间半的教室大,六只大象重)。它的计算
5、速度快,每秒可从事5000次的加法运算,运作了九年之久。由於吃电很凶,据传ENIAC每次一开机,整个费城西区的电灯都为之黯然失色。,2文件系统阶段20世纪50年代后期至60年代中期,计算机不仅用于科学计算,也大量用于企事业单位的管理,数据管理进入文件系统阶段。这时,已有磁盘、磁鼓等直接存取存储设备,有操作系统支持下的专门数据管理软件,通常称文件系统。用户通过操作系统对文件进行打开、读写、关闭等操作,既可批处理,也可联机实时处理。,112 数据库技术的发展历程,此阶段有如下特点:(1)文件系统利用“按文件名访问,按记录进行存取”的管理技术,可对文件进行修改、插入和删除操作。(2)数据可长期保存,
6、随时供用户使用。(3)数据共享性差。(4)数据独立性低。(5)数据无集中管理,易导致数据的完整性、安全性得不到可靠保证,并在数据的结构、编码、输出格式等方面难以做到规范化和标准化。(6)数据无结构。(7)使用方式不灵活。,文件系统仍然是无弹性的无结构的数据集合,即数据文件之间是孤立的,不能反映现实世界事物之间的内在联系。文件系统中,应用程序与数据的关系如图1.2所示。,112 数据库技术的发展历程,3数据库系统阶段 20世纪60年代后期,计算机磁盘存储技术取得重大进展,大容量和快速存取的磁盘相继投入市场,为新型数据管理技术的开发提供了良好的物质基础。此外,计算机用于管理的规模不断扩大,数据量急
7、剧增长,联机实时处理的要求日渐迫切。文件系统作为数据管理的手段已不能满足用户的需求。为了满足多用户、多应用共享数据的要求,使数据为尽可能多的应用服务,数据库技术应运而生。,112 数据库技术的发展历程,60年代末期出现的对数据库技术有着奠基作用的三件大事,标志着以数据库系统为基本手段的数据管理新阶段的开始。(1)1968年,IBM公司推出了商品化的基于层次模型的信息管理系统IMS。(2)1969年,美国数据系统语言协会(Conference On Data System Language,CODASYL)的数据库任务组(Database Task Group,DBTG)发布了一系列研究数据库方
8、法的DBTG报告,奠定了网状数据模型的基础。(3)1970年,IBM公司的研究人员连续发表文章,提出了关系模型,奠定了关系数据库管理系统的基础,一直沿用至今。,数据库管理系统克服了文件管理方式的缺陷,提高了数据的一致性、完整性,减少了数据冗余。数据库系统阶段,应用程序与数据间的关系如图1.3所示。,112 数据库技术的发展历程,数据库系统的主要特点是:(1)采用数据模型实现数据的结构化、数据的存取方式灵活。(2)数据共享性好,冗余度低。(3)数据独立性高。(4)提供了完整的数据管理与控制功能,包括并发性、完整性、可恢复性、安全性和审计性等。,112 数据库技术的发展历程,113 数据库系统的三
9、个发展阶段,自20世纪60年代末以来,数据库系统经历了三个发展阶段。1.第一代数据库系统 20世纪70年代,普遍流行的网状型和层次型数据库系统是第一代数据库系统。1970年,提出的关系数据模型受到了普遍关注,引起了广泛的研究。有代表性的成果是:1976年IBM公司推出的System R和加州大学伯克利分校的Ingres关系数据库系统。其后,IBM公司在System R的基础上先后推出了SQL/DS(1982)和DB2(1985)两个关系数据库系统。商品化的Ingres也由Ingres公司在1981年完成。Oracle公司1979年推出了关系数据库Oracle(V2.0),这被认为是第一次实现了
10、使用SQL语言的商品化关系数据库软件。由上可见,整个20世纪70年代,数据库理论和技术有了突破性的进展。,113 数据库系统的三个发展阶段,2.第二代数据库系统20世纪80年代出现了以关系数据库为代表的第二代数据库系统。20世纪80年代是数据库技术得到全面发展并逐步走向成熟的年代。其中值得一提的有如下几点。(1)关系数据库系统的发展促进了数据库系统的小型化。(2)随着数据库技术的发展和计算机网络的广泛使用,分布式处理系统,特别是分布式数据库系统在20世纪80年代得到了很大发展。,113 数据库系统的三个发展阶段,(3)随着信息化的推进,特别是一些新的应用领域提出了新的要求,如计算机集成制造系统
11、(CIMS)、地理信息系统(GIS)、全球定位系统(GPS)、人类基因库、卫星遥感信息处理等需要存储和管理超常规数据库容量的巨额数据,而已有的层次、网状、关系数据库均表现出不同程度的局限性。,113 数据库系统的三个发展阶段,3.新一代数据库系统20世纪80年代末,90年代初以来,开发新一代数据库技术成为数据库研究的热点课题。随着技术的进步,人们对数据库系统的功能提出了许多新的期望和要求,除处理常规数据外,还要对图形、图像、声音、视频等多媒体数据、时态数据、空间数据、知识信息以及各种复杂对象等非常规数据提供有效的数据处理功能。为了解决这些问题,人们提出了许多新概念、新思想和新方法,以及一些新的
12、数据模型和新的数据库管理系统的体系结构。本书将在第10章至第13章讲述这些问题。,信息的三个世界 概念设计中的数据描述 逻辑设计中的数据描述 1.2.4 物理数据描述,1.2数据库中的数据描述,信息三个世界的内容及其联系可用图1.4表示。,121 信息的三个世界,1现实世界 现实世界即客观存在的世界。事物及其联系就处在这个世界之中。事物都有一些特征或性质。人们总是选用感兴趣的最能表征该事物的若干特征来描述该事物。以物资为例,常选用物资名、型号规格、计量单位、价格等来描述一种物资的特征,有了这些特征,就能区分不同的物资。,121 信息的三个世界,2信息世界 信息世界是现实世界中的事物及其联系在人
13、们头脑中的反映,经过人们头脑的分析、归纳、抽象,形成信息。对这些信息进行记录、整理、归类和格式化后,它们就构成了信息世界。为了正确直观地反映客观事物及其联系,有必要对所研究的信息世界建立一个抽象的模型,称之为信息模型或概念模型,它是对现实世界的第一层抽象。,3机器世界 机器世界是信息世界中信息的数据化,即将信息用字符和数值表示,便于计算机识别和处理。在机器世界中,用数据模型或称逻辑模型来描述现实世界,它是对现实世界的第二层抽象,因此更为严格和抽象。这类模型有严格的形式化定义,以便于在计算机系统中实现。它通常有一组严格定义的无二义性的语法和语义的数据库语言,人们可以用这种语言来定义、操作数据库中
14、的数据。,数据库的概念设计是根据用户的需求设计数据库的概念结构。通常,数据库设计人员和用户都要参与这一活动。因此,对数据的描述应简单、清晰、易于用户理解。,122 概念设计中的数据描述,1实体(Entity)客观存在并可相互区别的事物称为实体,现实世界由各种各样的实体组成。实体可以是具体的人、事、物,也可以是抽象的概念或联系。例如,一个职工、一个部门、一种物资、仓库的一次订货、文化艺术、职工与部门的关系(即某个职工在某部门工作)等等都是实体。2属性(Attribute)实体所具有的某一特性称为属性。一个实体常具有多个属性,但在数据库设计中只选择数据管理所需要的属性,而不是全部属性。,3实体标识
15、符(Identifier)能惟一标识实体的属性或属性集,称为实体的标识符,也称为关键码(Key)、关键字,或简称为码、键等。例如,学号是学生实体的标识符。4域(Domain)属性的取值范围称为该属性的域。例如,属性性别的域为(男,女)。,5实体型(Entity Type)具有相同属性的实体,一定具有共同的特征和性质。用实体名及其属性集合描述的同类实体,称为实体型。例如,学生(学号,姓名,年龄,性别,专业)就是一个实体型。6实体集(Entity Set)同型实体的集合称为实体集(Entity Set)。例如,全班学生就是一个实体集。,7联系(Relationship)现实世界中,事物内部以及事物
16、之间是有联系的这些联系在信息世界中反映为实体内部的联系和实体之间的联系。一个实体内部的联系指组成实体的各属性之间的联系,而实体间的联系指实体之间的相互关联。如果参与联系的实体集数目为n,则称这种联系为n元联系。例如,有一元联系、二元联系、三元联系等。我们来讨论这几类联系。,122 概念设计中的数据描述,(1)二元联系。只有两个实体集参与的联系称二元联系,它是现实世界中大量存在的联系,可分为以下三类。一对一联系(1:1)如果对于实体集A中的每一个实体,实体集B中至多有一个实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系,记为1:1。例如,国家与国家主席或总统是一对一的关系。,一对多联
17、系(1:N)如果对于实体集A中的每一个实体,实体集B中有N(N0)个实体与之联系,而对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B具有一对多联系,记为1:N。例如,一个仓库有多种物资,而一种物资假定只存在一个仓库内,则仓库与物资具有一对多联系。,多对多联系(M:N)如果对于实体集A中的每一个实体,实体集B中有N(N0)个实体与之联系,而对于实体集B中的每一个实体,实体集A中也有M(M0)个实体与之联系,则称实体集A与实体集B具有多对多的联系,记为M:N。例如,一个仓库管理员可以管理多种物资,而一种物资可以被多个仓库管理员管理(假定三班倒),则仓库管理员与
18、物资具有多对多联系。,(2)多元联系。参与联系的实体集个数3时,称为多元联系。多元联系可区分为1:1、1:N和M:N。例如,顾客、商店和商品之间的“购物”联系就是三元联系,而且属于M:N联系。又如工厂物资管理系统中,领料单位、仓库和物资之间的“领用”关系也是三元联系,而且也属于M:N关系,当然这里要假定一个工厂有多个仓库,而一个仓库存有多种不同物资。这个联系可用图1.5表示。,122 概念设计中的数据描述,(3)一元联系。指同一实体集内两部分实体之间的联系,又称自反联系,也可分为1:1、1:N和M:N三种。例如,“人”这个实体集中,为了描述丈夫和妻子之间的关系,可用1:1表示。“职工”实体集中
19、,为了描述领导与被领导的关系,可用1:N联系表示。又如“零件”实体集中,零件的组合关系可用M:N表示。因为一个零件可以由若干个子零件组成,而一个零件又可以是其他零件的子零件。零件与子零件也是相对的,随需要而定。这个联系可用图1.6表示。,122 概念设计中的数据描述,数据库的逻辑设计是根据概念设计所得到概念结构或概念模型来设计数据库的逻辑结构,也即DBMS所支持的数据模型正如前面所指出的一样,实体联系模型是目前较流行的一种概念模型,而层次、网状、关系模型则是DBMS所支持的数据模型逻辑设计中的数据描述与前述信息的机器世界相对应,主要术语有字段、记录、文件等。,123 逻辑设计中的数据描述,1字
20、段(Field)标记实体属性的命名单位称为字段,或称域、数据项、数据元素、初等项、基本项等。字段名往往与属性同名。2记录(Record)字段的有序集合称为记录。通常用一个记录描述一个实体,故记录也可以定义为能完整地描述一个实体的字段集。,3文件(File)同一类记录的集合称为文件。文件是用来描述实体集的。,4关键字(Key)能惟一标识文件中每个记录的字段或字段集,称为记录的关键字,或简称键。例如,上述课程文件中,课程编号可以惟一标识每一个课程记录,故它即为课程记录的关键字。5记录型(Record Type)相应于概念设计中的实体型称为记录型。,1位(Bit)一个二进制位称为“位”,或比特。一位
21、只能取0或1两个状态之一。例如,字母A的ASCII码为七位:1000001。2字节(Byte)8个比特称为一个字节,可以存放一个字符所对应的ASCII码,而存储一个汉字常要两个字节。,124 物理数据描述,3字(Word)若干个字节组成一个字。一个字所含的二进制位的位数称为字长。各种计算机的字长不同,如有8位、16位、32位等。4块(Block)块又称物理块或物理记录,它是内存和外存交换信息的最小单位。每块常包含若干个逻辑记录,块的大小通常为210214字节。,5桶(Bucket)桶是外存的逻辑单位,一桶可以包含一个物理块或多个在空间上不一定连续的物理块。6卷(Volume)一个输入/输出设备
22、所能装载的全部有用信息,称为卷。例如,磁带机的一盘磁带就是一卷,磁盘的一个盘组也是一卷。,数据模型的组成及其分类概念模型逻辑模型,1.3数据模型,数据模型的组成及其分类,1数据模型的组成数据模型是现实世界中的事物间联系的一种模拟和抽象表示,是一种形式化描述数据、数据间联系以及有关语义约束规则的方法。数据库专家认为,一个基本数据模型是一组规则,这些规则规定数据结构如何组织以及允许进行何种操作。所以,一个数据库的数据模型常由数据结构、数据操作和数据的约束条件三部分组成。,(1)数据结构 数据结构或数据组织结构,是指数据对象的集合,它描述数据对象的类型、内容、属性,以及数据对象之间的联系,也即描述了
23、数据库的静态特性,是数据模型中最基础的部分。不同的数据模型采用不同的数据结构。举例:实体联系模型中,数据对象用实体、属性和联系来描述,以E-R图来组织;在关系模型中,用字段、记录、关系等来描述数据对象,以关系结构的形式进行数据组织,(2)数据操作数据操作是指对数据库的数据允许执行的操作的集合,包括操作及有关的操作规则,描述了数据库的动态特性。数据库主要由检索(即查询)和更新(含插入、删除和修改)两类操作。数据模型应对其详细定义,包括这些操作的确切含义、操作符号、操作规则及其实现语言。,(3)数据的完整性约束 数据的完整性约束是数据完整性规则的集合,它是对数据以及数据之间关系的制约和依存关系规则
24、,用以保证数据的完整性和一致性。数据模型应反映和规定其必须遵守的完整性约束条件。,2数据模型分类 数据模型按应用层次不同可分为两类:一类是概念数据模型,也称概念模型或信息模型,也有文献称为基于对象的逻辑模型(Object-Based Logical Models)另一类是逻辑数据模型,又称结构数据模型或逻辑模型,也有文献称为基于记录的逻辑模型(Record-Based Logical Models)。,数据模型的组成及其分类,概念模型是一种面向客观世界、面向用户的模型,是一种独立于计算机系统的数据模型,完全不涉及数据在计算机中的表示,只是用来描述某个特定组织所关心的信息结构,即按用户的观点对数
25、据和信息建模,用于数据库的逻辑设计。,132 概念模型,概念模型的表示方法较多,其中最常用的是于1976年提出的实体-联系方法(Entity-Relationship Approach)。该方法用E-R图来描述现实世界的概念模型,E-R方法也称为E-R模型。,1E-R图的基本成份及其表示 E-R图的基本成份实体、属性和联系已在上一节介绍,这里仅介绍其表示方法。(1)实体型:用矩形表示,矩形框内标明实体名。(2)属性:用椭圆形表示,并用无向边将其与相应的实体相连。(3)联系:用菱形表示,菱形框内标出联系名,并用无向边与有关实体相连,同时在无向边旁标上联系的类型,即1:1或1:N或M:N。,132
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库概论 数据库 概论 PPT 课件

链接地址:https://www.31ppt.com/p-5519526.html