数据模型基本概念及建模方法论 logicppt课件.ppt
《数据模型基本概念及建模方法论 logicppt课件.ppt》由会员分享,可在线阅读,更多相关《数据模型基本概念及建模方法论 logicppt课件.ppt(50页珍藏版)》请在三一办公上搜索。
1、数据模型的基本概念及建模方法论,2,内容安排,数据模型相关术语,什么是数据模型,建模注意事项,数据模型方法论,什么是数据模型?,以数学的方式对现实事物的一种抽象表达, 特征:内容:描述了数据、及其之间的关系形式:反映了数据的组织与管理形式用途:(数据仓库)系统建设中的数据信息的蓝图(数据仓库)系统建设的核心业务人员与IT人员沟通的语言和工具,3,数据模型的分类,数据仓库项目中数据模型可以分为以下几种:Conceptual Data Model (CDM) 概念数据模型Logical Data Model (LDM) 逻辑数据模型Physical Data Model(PDM)物理数据模型App
2、lication Data Model(ADM)应用数据模型,4,概念数据模型,Conceptual Data Model(CDM)概念数据模型从全局上、宏观上介绍模型设计思路、范围和内容。主要组成元素主题主题间关系主题中的重要实体实体间的相互关系目标与用途圈定建模的范围划分建设主题理清主要业务关系构造逻辑数据模型的框架,5,逻辑数据模型,定义:使用逻辑建模语言定义数据与数据之间的逻辑关系以图形化的形式反映客户的业务规则达到数据组织的设计目标,6,逻辑数据模型,Logical Data Model (LDM) 逻辑数据模型设计人员:业务人员、IT人员设计目标设计蓝图,指导整个数据仓库系统的建设
3、业务语言,业务人员与技术人员沟通的手段和方法业务视图,独立于数据库技术实现设计内容:实体、关系和属性建模方法:3NF的设计方法后续工作:物理数据模型的输入,7,物理数据模型,Physical Data Model(PDM)物理数据模型设计目标:面向物理实施的具体细节输入条件继承于逻辑数据模型依赖于所选择的数据库决定于业务需求和性能之间的平衡设计内容数据库、表和字段、索引需要作非正则化处理后续工作:ETL、元数据管理和前端应用输入,8,应用数据模型,Application Data Model(ADM)应用数据模型设计目标满足最终用户对数据的访问(内容、形式要求)满足应用系统对数据的存取(性能、
4、存储要求)主要特征面向Power User和业务人员与具体的应用相关多维分析时一般采用星型结构或者雪花状结构 的设计方法是事实表和维度表的组合,9,逻辑数据模型与物理数据模型比较,10,逻辑数据模型在数据仓库中的定位,11,存储和管理,采集,回答业务问题,析取,清洗,条件,剔除,家庭关系,加载,业务系统,业务系统,业务数据,外部数据,关系数据库管理系统,聚集,统计,人工智能,神经网络,多维,可视化,EIS/DSS,电子表,对象语言,开发,企业 数据仓库,从属数据集市,业务人员,IT 用户,数据导入,知识发现 数据挖掘,信息存取 工具,源数据,逻辑数据模型,应用数据模型,12,内容安排,数据模型
5、相关术语,什么是数据模型,建模注意事项,数据模型方法论,13,逻辑数据模型基本术语 (一),模型结构 第三范式(3NF)结构 星型结构(多星型结构)雪花型结构,模型分类概念数据模型逻辑数据模型物理数据模型应用数据模型,3NF基础数据模型,Star Schema,汇总数据/已知应用模型,Snowflake,星型结构的演变,14,实体 独立型实体 依赖型实体 子类实体,主题域层面,核心实体 关系实体 特征实体分类实体,逻辑数据模型基本术语 (二),15,属性: (描述真实或抽象事物相关联的特征或性质) 主键(识别实体实例唯一性的属性、属性组) 可选键 (能识别实体实例唯一性的其他属性、属性组)外键
6、(通过父实体到子实体关系转移到子实体的属性)非键属性(不是实体主键属性的其他属性 ) 基础名(外键的原来名称 )角色名 (外键的新名称,表明取值是父实体属性的子集 )鉴别器 (取值决定父实体实例属于哪个子类的属性 ),逻辑数据模型基本术语 (三),16,关系二元关系父实体的一个实例严格关系子实体的0,1或多个实例的这种关系是二元关系 基数父、子实体实例的比例,如1:1,1:M识别(型)关系子实体实例唯一性的识别与父实体相关联,父实体的主键属性成为子实体的主键属性 非识别(型)关系子实体不需要与父实体的关系就可以确定实例唯一性,父实体的主键属性成为子实体的非键属性,逻辑数据模型基本术语 (四),
7、17,关系确定关系父实体的一个实例对应子实体的0、1或多个实例,并且子实体的一个实例对应0或1个父实体的实例 非确定关系多对多关系 子类关系子类实体和所属父实体的关系 完全子类群所属父实体的每个实例都能够与子类群的一个实体实例相关联 不完全子类群所属父实体的每个实例不一定都有子类相关联,逻辑数据模型基本术语 (五),Logical Data Model (LDM) Example,18,Entity,Key Attribute,Nonkey Attribute,Relationship,CardinalityOne-to-many1 : M,Business Rule : one custom
8、er invoice at least contains one invoice item,逻辑数据模型基本术语 (示例),范式理论 Normal Form,关系数据库:原子性第一范式: 每个属性的值唯一第二范式:键值依赖 非键属性依赖所有的主键属性。(不存在部分键属性就决定的非键属性)第三范式:完全键值依赖 非键属性完全依赖且只依赖与键属性。(不存在非主键属性依赖其他非主键属性的情况)BCNF第四范式第五范式,19,关系数据库理论中对于实体划分、实例(记录)设计的规则,The KEY - 1st Normal Form (1NF)The WHOLE Key - Second Normal F
9、orm (2NF)And NOTHING BUT the Key - Third Normal Form (3NF) - E. F. Codd,违反第一范式,20,如果数Quantity属性被定义为“不是与Order相关,就是与Part相关”,例如:在OLTP系统中常见的字段复用现象,属此类问题,110,152,违反第二范式,21,依赖了复合主键的一部分,客户经理/地域客户经理编号,违反第三范式,22,依赖了非主键属性(不参与主键的外键属性),正则化LDM对数据库物理实现的优势,保留了更多的业务关系 更多的主索引选择 最佳的数据分布 更少的全表扫描 更多的连接选择 增强优化器使用更有利于提高性
10、能的合并、聚合连接方法 最佳的数据分离(耦合度) 最佳的底层模型与用户分离 最佳的数据控制 每行更少的字段 最佳的与应用分离 更小的行 最佳的数据块大小 减少临时与永久日志空间 减少物理 I/O,23,要考虑正则化对数据库性能的要求,24,内容安排,数据模型相关术语,什么是数据模型,建模注意事项,数据模型方法论,NCR数据仓库实施方法论,25,逻辑数据模型设计步骤,26,Step 1: 定义业务需求与范围Step 2: 定义实体Step 3: 定义关系Step 4: 定义非键属性Step 5: 确认模型,Step 1: 定义业务需求与范围,27,确认已经理解全部业务需求什么困难或问题需要解决?
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据模型基本概念及建模方法论 logicppt课件 数据模型 基本概念 建模 方法论 logicppt 课件
链接地址:https://www.31ppt.com/p-1921821.html