第2章数据模型与概念模型.ppt
《第2章数据模型与概念模型.ppt》由会员分享,可在线阅读,更多相关《第2章数据模型与概念模型.ppt(40页珍藏版)》请在三一办公上搜索。
1、数据库系统原理及应用教程,主讲老师:蒋朝辉,第2章 数据模型与概念模型,2.1 信息的三种世界及其描述 2.2 数据库模型 2.2.1 概念模型的基本概念 2.2.2 概念模型的表示方法 2.3 常见的三种数据模型 2.3.1 数据模型概述 2.3.2 层次模型及特点 2.3.3 网状模型及特点 2.3.4 关系模型概述,2.1 信息的三种世界及其描述,从数据转化的顺序来看,数据从现实世界进入到数据库需要经历三个阶段,即现实世界阶段、信息世界阶段和机器世界阶段。,1.现实世界 现实世界是指我们要管理的客观存在的各种事物、事物之间的相互联系及事物的发生、变化过程。,在现实世界中客观存在着各种运动
2、着的事物,各种事物及事物之间存在着复杂的联系。不同的事物之间,存在着不同的特征,这些特征包括静态的和动态的特征。在这些特征中,可以抽取出一些有意义的特征来描述不同的事物个体。,例如:选择姓名、学号、班级、籍贯、所属院系等特征来描述一个学生,而描述一个老师的信息则常选择姓名、年龄、性别、籍贯、所属院系等特征。,利用这些特征,就可以在表征各类不同事物的同时,将不同的事物区别开来。,世界上的很多事物表面上看起来相互独立,但实际上它们之间是相互联系的。由于事物的多样性,导致事物之间的联系也是多方面的。在实际应用中,人们只选择一些有意义或感兴趣的联系,而没有必要选择所有的联系。,例如:在教学管理系统中,
3、教师和学生之间可以仅选择“教学”这种有意义的联系。,2.信息世界 现实世界中的事物及其联系由人门的感官所感知,经过大脑的分析、归纳、抽象形成信息。对这些信息进行记录、整理、归纳和格式化后就构成了信息世界。为正确直观地反映客观事物及其联系,有必要对所研究的信息世界建立一个抽象的模型,称为信息模型或者概念模型。在信息世界中,数据库技术涉及一下概念:,实体(Entity):现实世界中存在的可以相互区分的事物或概念称为实体。一个实体对应了现实世界中的一个事物。实体可以是具体的人、事、物,如一本书,一件衣服,一次借书、一次服装展览等,可以包含很多我们感兴趣的信息,也可以是抽象的概念或联系,如教师和学院的
4、工作关系(即某位教师在某学院工作)也可以抽象为一个实体。,实体集(Entity Set):性质相同的同类实体组成的集合,称为实体集。现实世界中的事物很多,有一些事物具有被关注的一些共同的特征和性质,他们可以有类似的描述,可以被放在一起进行研究和处理。例如:一个学校的所有学生,当利用学籍管理系统进行管理时,这些学生的姓名、学号、班级和成绩等就是要关注的特征或性质,把这些学生的上述性质一起研究和处理,则这些学生就构成一个实体集。,属性(Attribute):实体所具有的某一特性称为属性。客观存在的不同事物,具有不同的特性。从客观世界抽象出来的不同实体,也具有各自不同的特性。可以用若干个属性来刻画一
5、个实体。例如:对于大学生,有很多特性,如学校、学院、专业、班级、学号、姓名、身高、年龄、籍贯、成绩、入学时间等,这些属性组合起来共同表征了一个具体的学生。在信息世界里,人们对某个实体的认识和理解是通过属性来实现的。因此要要正确、全面的描述或者刻画某一个实体,就必须根据不同事物的特征,合理、全面地抽象出不同事物的属性,使人们通过这些属性,就能够对某个事物有一个全面的理解和把握。而且最重要的是,能够通过其中某一个或一些属性把握不同个体之间的本质的区别。,码(Key):能唯一标识每个实体的属性或属性集,称为码或关键字。例如:一个学校里可能存在几个学生重名的现象,所以在数据库系统中就不能用姓名这个属性
6、来唯一标识不同的学生,于是,只好给每个学生编一个不能重复的,能够将他们唯一区别开来的编号,即学号。学号就是实体学生的码。,3.机器世界 信息世界的信息经过抽象和概念化之后,计算机是无法识别的,因此必须对这些信息重新进行加工和转换,使他们能被计算机所识别和成为计算机能够处理和操作的符号。这些符号,即为数据。这些数据构成了机器世界或称为数据世界。用计算机管理信息,必须对信息进行数字化,即将信息用字符和数字来表示。数字化后的信息称为数据,数据是能够被计算机所识别和处理的。当前多媒体技术的发展使计算机能够识别和处理图形、图像、声音等数据。数字化是信息世界到机器世界转换的关键,为数据管理打下基础。信息世
7、界的信息在机器世界中以数据形式存储。机器世界对数据的描述常用到一下四个概念:,字段(Field):又称数据项,它是可以命名的最小信息单位。字段的定义包括字段名(字段的名称)、字段类型(描述该字段的数据类型)、字段长度(限定该字段值的长度)等。记录(Record):字段的有序集合称为记录,一般对应信息世界中的一个具体的实体。它是对一个具体对象的描述。例如:(2009178007,男,178),描述了一个学号为2009178007,性别为男,身高为178cm的学生。文件(File):同类的记录汇集成文件。文件是描述实体集的。例如:所有图书记录组成了一个图书文件。关键字(Key):能唯一标识文件中每
8、个记录的字段或字段集。例如学生的学号可以作为学生记录的关键字。如果一个字段不能唯一确定一条记录,则可以用多个字段作为关键字来唯一标识一条记录。例如学号和课程号可以作为学生选课记录的关键字。,机器世界和信息世界的术语是相互对应的,他们的关系如下表所示:,数据库中,每个概念都有类型(Type,简称型)和值(Value)的区别。,例如,“学生”是一个实体的型,而具体的(张三,男,信息院,19)是实体的值。“姓名”是属性的型,而“张三”是属性的值。记录也有记录的型和值。,2.2 数据库模型,数据库系统的主要功能是处理和表示对象与对象之间的联系。这种联系用模型表示就是数据库模型,它是人们对现实世界的认识
9、和理解,也是对客观现实的近似描述。在不同的数据库管理系统中,应使用不同的数据库模型,但不管采用什么样的模型,都要满足以下几个基本要求:能按照人们的要求真实地表示和模拟现实世界;容易被人理解;容易在计算机上实现;,数据库模型更多地强调数据库的框架和数据结构形式,而不关心具体数据。不同的数据库模型实际上就是提供模型化数据和信息的不同工具,根据模型应用的不同目的,可以将这些数据库模型划分为两类,他们分别属于不同的层次。,第一类模型是概念模型。它是按用户的观点来对数据和信息建模,主要用于数据库设计。第二类模型是数据模型。主要包括网状模型、层次模型、关系模型等。它是按计算机系统的观点对数据建模,主要用于
10、DBMS的实现。,2.2.1 概念模型,概念模型:在把现实世界抽象为信息世界的过程中,只抽取需要的元素及其关联,这时所形成的模型就是概念模型。在抽象出概念模型后,再把概念模型转换为计算机上某一DBMS支持的数据模型。概念模型不涉及数据组织,也不依赖于数据的组织结构,他只是现实世界到机器世界的一个中间描述形式。,目前,描述概念模型最常用的方法是实体联系方法(即E-R方法)。这种方法由于简单、实用,得到了非常普遍的应用。这种方法使用的工具称作E-R图,也把这种描述结果称为E-R模型。,实体(Entity)实体是现实存在的一个事物。具有相同特性的事物的集合构成实体集,集合中的元素(个体)是客观存在的
11、可区分的事物。在E-R图中,实体名写在矩形框内。,概念模型涉及以下几个概念:,实体可以是具体的人、事、物,比如一名学生、一本书等,也可以是一个抽象的概念,例如图书管理系统中,一次借书过程就是一个实体。,(2)属性(Attribute)属性为实体的某一方面特征的抽象表示,即事物所具有的状态特性.,实体的属性用椭圆框表示,框内是属性名,并用连线连到相应的实体。一个实体可以有若干个属性。例如,学生可以有姓名、学号、年龄、性别等属性,不同的属性值可以确定不同的学生。,与属性相关的概念有以下几个:,码(Key):能唯一标识实体的属性集称为码。例如:学生的学号就是一个码(当然也可以是其它的属性或属性集)。
12、对不同的学生码值一定是唯一的,不允许出现多个实体具有相同的码值情况。,比如,学号为2003002,年龄为21岁,男性的学生是李四。左图中学号就是学生实体的码。由于存在重名的现象,所以通常姓名不被选为码。,域(Domain):实体属性的取值一般受到某个条件的约束,如果取值不满足约束条件,则认为是一个非法的值,这个约束条件所确定得却值范围就称为该属性的域。例如:学生的性别的域是“男”,“女”,而成绩的取值范围通常会是0,1,2,.,100。,实体型(Entity Type):一类实体的实体名及其属性名集合就构成了实体型。在一个数据库中,同一类实体的实体型是相同的,即它们的实体名及实体的属性名都是一
13、样的。为了方便我们认为这些属性的排列顺序也是一致的。例如:学生(学号,姓名,性别,年龄)就是表示学生实体的实体型。,关系模式(Relation Schema):对关系的描述称为关系模式,一般表示为:关系名(属性1,属性2,属性n)例如:学生(学号,姓名,性别,年龄,系别,年级)就是描述学生的关系模型。,实体集(Entity Set):具有相同实体型的实体组成的集合称为实体集。例如:在一个学籍管理系统,一个学校的全体学生具有相同的实体型,这些学生实体的集合就是一个实体集。,(3)联系 在现实世界中,事物内部和事物之间是有联系的,这些联系在信息世界中包括实体内部的联系和实体之间的联系。实体内部的联
14、系通常指组成实体的各属性之间的联系,实体之间的联系通常指不同实体之间的联系。实体之间的联系可以分为以下3类:,一对一联系(1:1):如果对于实体集A中的每个实体,实体集B中至多有一个(也可以没有)实体与之联系,反之亦然,则称实体集A和实体集B之间具有一对一的联系,记为1:1 例如:在学校里一个班只有一个班长,而一个班长只能是一个班的班长,所以班级和班长之间就是一对一的联系。,一对多联系(1:n):如果对于实体集A中的每个实体,实体集B中有n个(n=0)实体与之联系,反之实体集B中的每个实体,实体集A中至多有一个实体与之联系,则称实体集A和实体集B之间具有一对多的联系,记为1:n 例如:班级和学
15、生之间的联系。一个班级有若干名学生,而每个学生只在一个班级中学习,则班级和学生之间就是一对多的联系。,多对多联系(m:n):如果对于实体集A中的每个实体,实体集B中有n个(n=0)实体与之联系,反之,如果实体集B中的每个实体,实体集A中有m个(m=0)实体与之联系,则称实体集A和实体集B之间具有多对多的联系,记为m:n 例如:课程和学生之间的联系就是多对多的联系。一门课程同时有若干名学生选修,一个学生可以同时选修多门课程。,一般在E-R图中,用菱形表示联系,内部写上联系的名称,两端分别用连线连接发生联系的实体,并分别表上联系的类型。,一般来说,两个以上的实体之间也可以存在一对一,一对多和多对多
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据模型 概念 模型
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5641210.html