信息系统的技术基础26数字存储与分析技术.ppt
《信息系统的技术基础26数字存储与分析技术.ppt》由会员分享,可在线阅读,更多相关《信息系统的技术基础26数字存储与分析技术.ppt(113页珍藏版)》请在三一办公上搜索。
1、第二章:2.6 数据存储与分析技术,本节主要内容,引言2.6.2 数据管理技术的发展2.6.3 数据库环境下的数据管理数据库设计 数据库设计的步骤 实体联系模型(ER模型)数据模型关系数据库的规范化数据库操作常见关系型数据库系统介绍2.6.5 数据库技术的发展数据仓库数据集市数据挖掘,了解传统的文件组织和管理技术了解传统文件管理环境下存在的问题了解数据库管理系统中数据的组织方法理解三种不同的数据库组织模型掌握E-R模型和E-R图的画法掌握三范式理论掌握基本的数据库操作方法了解数据库技术的发展,本章学习目的,国际著名调查机构Gartner Group在高级技术调查报告中,将数据分析和人工智能列为
2、“未来三到五年内将对工业产生深远影响的五大关键技术”之首,还将并行处理体系和数据分析列为未来五年内投资焦点的十大新兴技术前两位。Gartner的调查报告预计:到2010年,数据分析在相关市场的应用将从目前少于5%增加到超过80%。在国外,数据分析已在金融、证券、电信、制造、统计、零售业等数据密集型行业实施,并取得巨大的效益。,引言,数据管理技术数据分析技术数据加密技术数据压缩技术数据恢复技术,一、数据处理技术,引言,数据存储技术,数据检索技术,数据挖掘技术,二、数据管理技术,数据仓库技术,引言,内容管理产生于20世纪80年代中后期,其需求主要来自于非结构化数据管理的需要。目前,在大多数情况下,
3、内容管理特指用于非结构化数据管理的技术。内容管理是借助信息技术,通过收集、创建、管理和发布内容,实现内容在企业内部以及企业之间的传播和共享的过程。,数据管理技术的重要方向内容管理,引言,位字符数据元(字段)记录文件数据库,引言,三、数据的组织层次,数据库,文件,记录,字段,字符,引言,计算机系统是按层次组织数据的,首先由位组成字节,字节组成字段(数据元),向上依次组成记录、文件和数据库。位(Bit)是计算机中最小的数据单位,其值为0或1。计算机只能检测到电脉冲信号的有无。电脉冲信号出现高电平表示1,电脉冲信号为低电平表示0。一个位表示二进制数据0或1,多个位组成字节(Byte),一个字节代表一
4、个字符,字符可以是字母、数字或其他符号;多个字符组成一个词或一个完整的数字,称为字段、数据项或域(Field);若干个相关的字段组成一个记录(Record);若干同类型的记录组成一个文件(File);若干相关文件的集合组成一个数据库(Database)。如下图所示,比特、字符、字段、记录、文件和数据库构成了数据层次,数据库中不仅包括了所有这些数据层次,还包括了它们之间的关系。,引言,数据实体、属性和键,数据管理技术的发展经过了三个阶段:人工管理:50年代中期以前文件管理:50年代后期到60年代中期数据库管理:60年代后期开始、DBMS广泛应用,数据管理技术的发展,数据访问应用模型,数据访问的发
5、展史,数据管理技术的发展,数据管理技术的发展,数据库 数据库(DB-Database)是以一定的组织方式存储在一起的互相关联的数据的集合(逻辑相关的记录和文件的集合)。数据库管理系统 数据库管理系统(DBMS-Database Management System)是对数据库进行管理的特定软件。通常所说的数据库管理系统是指DBMS,而不是指具体的数据库Database。,一、数据库、数据库管理系统和数据库系统,数据库环境下的数据管理,数据库系统 口语中常说的“数据库系统”在大多数时候都是指DBMS。但是严格来说,数据库系统(DBS-Database System是指在计算机系统中引入数据库之后的
6、系统,一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员(DBA-Database Administrator)和用户构成。即:DBS=DB+DBMS+APPLICATION+DBA+USER,数据库环境下的数据管理,数据库管理系统的目的:就是为了解决前面提到的在文件处理系统中存在的一些问题:数据冗余和不一致数据访问困难数据孤立灵活性差并发访问异常安全性问题 由于这些问题,数据库管理系统提出了很多新的概念和算法,加速了DBMS的发展。,二、数据库管理系统(DBMS),数据库环境下的数据管理,数据库管理系统的功能就是:,数据库环境下的数据管理,创建和修改数据库。存储和检索数据。
7、操纵数据和生成报表。保证所存储数据的安全性。数据被多用户共享时,要 避免可能产生的异常结果(并发控制)。,数据共享减少数据冗余提高了数据的一致性数据与应用程序之间的独立性提高了数据的安全性,三、数据库管理的优点,数据库环境下的数据管理,数据库设计是建立数据库及其应用系统的技术,是信息系统开发和建设中的核心技术。具体说,数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息要求和处理要求)。数据库合理的结构和组织是信息系统分析、设计时需要考虑的一个重要方面。,数据库设计,一、什么是数据库设计,数据库设计,1,现实世
8、界,认识抽象,二、人们对客观事物的认识和描述过程,现实世界的自行车,数据库设计,观念世界的自行车,信息模型(概念模型),数据库设计,数据世界的自行车,中国铁路网络图,信息模型(概念模型),数据库设计,按规范的设计方法,一个完整的数据库设计一般分为以下六个阶段:,数据库设计,三、数据库设计的步骤,需求收集和分析,设计概念结构,设计逻辑结构,数据模型优化,设计物理结构,评价设计,性能预测,物理实现,试验性运行,使用、维护数据库,四、数据库设计的流程,数据库设计,需求信息收集初步调查详细调查(目的、内容、方法)需求信息的分析整理业务流程数据流程、数据字典,1.需求分析,数据库设计,五、数据库设计各阶
9、段的任务:需求分析,目标 是把现实世界中的客观对象抽象为某种信息结构,设计出反映某个组织部门信息需求的数据库系统概念模式,它独立于数据库系统的逻辑结构、独立于数据库管理系统(DBMS)、独立于计算机系统。设计方法 是在需求分析的基础上,用概念数据模型(例如E-R模型)表示数据及数据之间的相互联系,设计出反映用户信息需求和处理需求的数据库系统概念模式。,2.概念结构设计,数据库设计,五、数据库设计各阶段的任务:概念结构设计,(1)实体联系模型(E-R模型:EntityRelationship)E-R模型是这样认识现实世界的:现实世界是由一组称作实体的基本对象以及这些对象间的联系构成的。实体(En
10、tity):“实体”是观念世界中描述客观事物的概念。实体可以是人,也可以是物或事件;可以指事物本身,也可指事物之间的联系,例如一个人、一件物品、一个部门、一个银行帐户等都是一个实体。实体可以通过属性集合来描述。属性:“属性”是指实体具有的某种特性。如人有身高、体重、年龄、性别等属性。联系:“联系”是事物间的相互关联。在信息世界中,事物之间的联系可分为两类:一是实体内部的联系,一是实体之间的联系.,数据库设计,(2)实体之间的联系,一对一联系(1:1)对于实体集A中的每一实体,实体集B中至多有一个实体与之联系。反之亦然。一对多联系(1:N)对于实体集A中的每一实体,实体集B中有N个实体与之联系。
11、反之,对于实体集B中每一实体,实体集A中至多只有一个实体与之联系。多对多联系(M:N)对于实体集A中的每一实体,实体集B中有N个实体与之联系,对于实体集B中每一个实体,实体集A中有M个实体与之联系。,数据库设计,(3)实体联系方法(EntityRelation Approach),概念模型最常用的表示方法是实体联系方法(EntityRelation Approach,简称ER方法)。ER方法通过ER图来描述某一组织的信息模型。E-R图由以下元素构成:矩形:代表实体集(具有相同属性或特征的实体集合);椭圆:代表实体属性;菱形:代表实体间的联系集(同一类型的所有联系的集合);线段:将属性与实体集相
12、连或将实体集与联系集相连。,数据库设计,E-R图示例,客户,帐户,数据库设计,(4)实体之间联系类型的E-R表示,数据库设计,管理,厂长,工厂,1,1,数据库设计,存放,1,n,数据库设计,如对于学生、课程和教师这三个实体,若规定每个学生可以选择多门课程,每门课程可以被多个学生选修,每门课程惟一对应一个任课教师,一个教师可以讲授多门课程。则学生、课程和教师这三个实体之间的E-R图可表示为:,m,n,p,1,(5)三个或更多实体相互联系的情况,数据库设计,(6)设计E-R图的过程,E-R图设计过程实际是对数据进行归纳、分析、抽象的过程,首先把企业的有关数据综合组织,然后根据不同用户对数据的使用需
13、求进行分组,再从局部入手,建立局部E-R模型,再综合成总体E-R模型。确定实体集确定联系和联系类型(1:1或1:n)设计局部及整体的E-R图确定属性将E-R图优化,数据库设计,数据库设计,在数据分析的基础上,就可以着手设计概念结构。设计初步E-R图的步骤先设计局部E-R图,也称用户视图 综合各局部E-R图,形成总的E-R图,即用户视图的集成。也称基本E-R图(全局E-R图)在设计初步E-R图时,要尽量能充分地把组织中各部门对信息的要求集中起来,而不需要考虑数据的冗余问题。,局部概念模型设计是从用户的观点出发,设计符合用户需求的概念结构。局部概念模型设计的就是组织、分类收集到的数据项,确定哪些数
14、据项作为实体,哪些数据项作为属性,哪些数据项是同一实体的属性等。确定实体与属性的原则:能作为属性的尽量作为属性而不要划为实体;作为属性的数据项不能再用其他属性加以描述,也不能与其他实体或属性发生联系。,设计局部E-R图,数据库设计,仓库,存放,物资,1,n,物资,a.仓库作为属性,b.仓库作为实体,数据库设计,学 生,选 课,课程,学 生,选 课,课程,教务处学生管理的E-R模型图,研究生院学生管理的局部E-R模型图,数据库设计,设计全局E-R图 局部E-R图的设计从局部的需求出发,比一开始就设计全局E-R图要简单得多、单纯得多。有了各个局部E-R图,就可通过局部E-R图的集成设计全局E-R图
15、。在进行局部E-R图集成时,需按照下面三个步骤来进行:确认局部E-R模型图中的对应关系和冲突 对应关系是指局部E-R图中语义都相同的概念,也就是它们的共同部分;冲突指相互之间有矛盾的概念。常见的冲突有下列4种:,数据库设计,命名冲突 命名冲突有同名异义和同义异名两种。例如,在例1给出的图中,“学生”和“课程”这两个实体集在教务处的局部E-R图和研究生院的局部E-R图中含义是不同的:在教务处的局部E-R图中学生是指大学生、大学生的课程,在研究生院的局部E-R图中是指研究生和研究生课程,这属于同名异义;在教务处的局部E-R图中学生实体集有“何时入学”这一个属性,在研究生院的局部E-R图中有“入学日
16、期”这一属性,两者是同义异名。,数据库设计,概念冲突 同一个概念在一个局部E-R图中可能作为实体集,在另一局部E-R图中可能作为属性或联系。例如,在上面给出的图中,如果用户要求,选课也可以作为实体集,而不作为联系。域冲突 相同的属性在不同的局部E-R图中有不同的域,例如,学号在一个局部E-R图中可能当作字符串,在另一个局部E-R图中可能当作整数。相同的属性采用不同的度量单位,称为域冲突。,数据库设计,约束冲突 不同局部E-R图可能有不同的约束;例如,对于“选课”这个联系,大学生和研究生对选课的最少门数和最多门数的限定可能不一样。,数据库设计,对局部E-R图进行某些修改,解决部门冲突 解决部门的
17、冲突是对各个部门中存在的命名冲突、概念冲突、域冲突、约束冲突按照统一的规范定义。如在例1的图中,“入学日期”和“何时人学”两个属性名可以统一成“入学日期”,学号统一用字符串表示,学生分为大学生和研究生两类,课程也分为本科生课程和研究生课程两类等。合并局部E-R图,形成全局模式,数据库设计,学 生,选 课,课程,学号,姓名,性别,系别,出生日期,入学时间,学生类别,成绩,课程号,学分,教师,课程名,课程类别,数据库设计,产品,零件,组成,产品号,产品名,性能参数,零件数,零件号,材料名,耗用量,产品,使用,材料,存放,仓库,技术部门E-R图,供应部门E-R图,数据库设计,消耗,产品,零件,材料,
18、仓库,消耗,产品号,产品名,性能参数,零件号,材料名,价格,耗用量2,存放量,材料号,材料名,价格,仓库号,仓库名,地点,耗用量1,数量,合并后的E-R模型图,存放,组成,数据库设计,综合后的E-R模型图,数据库设计,n,1,物料需求计划,报价,采购订单,供应商,请购单,采购订单明细,物料代码,检验单,入库单,供应商评估表,收货单,生成,送货,合并,参照2,入库,参照1,收货,检验,评估,组成,采购系统E-R图,数据库设计,设计某工厂物资管理的概念模型(画出E-R图)。物资管理涉及的实体有:仓库(仓库号,仓库面积,仓库地点)材料(材料编号,名称,规格,单价)供应商(供应商编号,联系人,地址,电
19、话,帐号)采购员(编号,姓名,电话,邮箱)实体间的联系:一个仓库可以存放多种材料,一种材料可以存放在多个仓库中。一种材料只能一个采购员采购,一个采购员可以采购多种材料。一个供应商只能供应一种材料,一种材料可由多个供应商供应。,作业题,实体及其属性图,供应商,材料,采购员,供应,供应量,采购量,采购,1,1,n,m,存放,仓库,p,m,实体联系图,(1)数据模型 数据模型是描述计算机世界中数据及数据之间的关系及存储、处理特征的模型,它依赖于具体的计算机。在数据库系统,对现实世界中数据的抽象、描述以及处理等都是通过数据模型来实现的,数据模型是数据库系统实现的基础。目前,在实际数据库系统中支持的数据
20、模型主要有三种:关系模型、网状模型和层次模型。,数据库设计,五、数据库设计各阶段的任务,:逻辑结构设计,4.逻辑结构设计,关系模型:关系模型是用表的集合来表示数据和数据间的联系。每个表有多个列,每列有唯一的列名。在关系模型下,数据的逻辑结构是一张二维表。关系模型中的有关术语:,关系:一个关系对应一张二维表元组:表中一行称为一个元组;属性:表中一列称为一个属性,列名即为属性名;主码:表中的某个属性组,它的值惟一地标识一个元组。域:属性的取值范围;分量:元组中的一个属性值。关系模式:对关系的描述,用关系名(属性1,属性2,属性n)来表示。,数据库设计,Primary Key,EmployeeID,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息系统 技术 基础 26 数字 存储 分析
链接地址:https://www.31ppt.com/p-5230494.html