欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    数据仓库系统的设计与开发.ppt

    • 资源ID:5985382       资源大小:294.50KB        全文页数:32页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    数据仓库系统的设计与开发.ppt

    2023/9/11,数据仓库与数据挖掘,1,第3章 数据仓库系统的设计与开发,通过对数据仓库的概念、体系结构与存储结构、ETL过程等内容了解以后,如何建立数据仓库系统呢?,2023/9/11,数据仓库与数据挖掘,2,3.1 数据仓库系统的设计与开发概述,建立一个数据仓库系统的参考步骤 数据仓库系统的生命周期 创建数据仓库系统的两种思维模式 数据仓库数据库的设计步骤,2023/9/11,数据仓库与数据挖掘,3,建立一个数据仓库系统的参考步骤,数据仓库系统的建立是一个复杂而漫长的过程。涉及到:源数据库系统数据仓库对应的数据库系统数据分析与报表工具,2023/9/11,数据仓库与数据挖掘,4,建立一个数据仓库系统的参考步骤,收集和分析业务需求步骤 建立数据模型和数据仓库的物理设计 定义数据源 选择数据仓库技术和平台 从操作型数据库中抽取、清洗及转换数据到数据仓库 选择访问和报表工具,选择数据库连接软件,选择数据分析和数据展示软件 更新数据仓库,2023/9/11,数据仓库与数据挖掘,5,数据仓库系统的生命开发周期,数据仓库系统的开发与设计是一个动态的反馈和循环过程。一个数据仓库系统包括:数据仓库数据库数据分析应用系统,2023/9/11,数据仓库与数据挖掘,6,数据仓库系统的生命开发周期,2023/9/11,数据仓库与数据挖掘,7,建立数据仓库系统的两种思维模式,自顶向下(Top-down)将数据通过ETL汇集到数据仓库中,然后再把数据通过复制的方式存入各个数据集市中。自底向上(Bottom-Up)通过ETL将数据汇集到数据集市中,再将数据汇集到数据仓库中。,2023/9/11,数据仓库与数据挖掘,8,数据仓库数据库的设计步骤,2023/9/11,数据仓库与数据挖掘,9,3.2 基于SQL Server的数据仓库数据库设计过程详解,SQL Server 2005介绍集成了三个服务。SQL Server 2005的数据仓库架构,2023/9/11,数据仓库与数据挖掘,10,MS SQL Server 2005的数据仓库架构,2023/9/11,数据仓库与数据挖掘,11,3.2 基于SQL Server的数据仓库数据库设计过程详解,包括以下步骤:分析组织的业务状况及数据源结构 组织需求调研,收集业务需求 采用信息包图法进行数据仓库的概念模型设计 利用星形图进行数据仓库的逻辑模型设计 数据仓库的物理模型设计,2023/9/11,数据仓库与数据挖掘,12,分析组织的业务状况及数据源结构,以SQL Server 2005实例数据库Adventure Works DW中所描述Adventure Works Cycles公司的用户需求为例。公司概况业务系统流程介绍 对数据源结构的分析与理解,2023/9/11,数据仓库与数据挖掘,13,组织需求调研,收集业务需求,坚持数据驱动+用户(需求)驱动的设计理体念,因此需要充分了解用户的需求,进而对需求进行分析。关于用户需求的调研(确定主题域)对用户需求调研结果的分析(确定度量指标和维度),2023/9/11,数据仓库与数据挖掘,14,采用信息包图法进行概念模型设计,2023/9/11,数据仓库与数据挖掘,15,信息包图:是数据仓库的数据模型的第一层或最高层。由于大多数商务数据是多维的,但传统的数据模型表示三维以上的数据有一定困难。而信息包图简化了这一过程并且允许用户设计多维信息包并与开发者和其他用户建立联系。这种模型集中在用户对信息包的需要,信息包提供了分析人员思维模式的可视化表示。,信息包图法简介,2023/9/11,数据仓库与数据挖掘,16,工作:确定系统边界:决策类型、需要的信息、原始信息确定主题域及其内容:主题域的公共键码、联系、属性组确定维度:如时间维、销售位置维、产品维、组别维等确定类别:相应维的详细类别确定指标和事实:用于进行分析的数值化信息,2023/9/11,数据仓库与数据挖掘,17,信息包图的建立,信息包:维度类别空白信息包图样式,2023/9/11,数据仓库与数据挖掘,18,例试画出销售分析的信息包图。解:首先根据销售分析的实际需求,确定信息包的维度、类别和指标与事实:(1)维度:包括日期维、区域维、产品维、客户维、广告维(待用)等。(2)类别:确定各维的详细类别,如:日期维包括年(5)、季度(20)、月(60)、日(1800),括号中的数字分别指出各类别的数量;区域维包括国家(10)、省州(100)、城市(500)、销售点(8000),括号中的数字同样分别指出各类别的数量;类似地,可以确定产品维、客户维、广告维等的详细类别。(3)指标和事实:确定用于进行分析的数值化信息,包括实际销售额、计划销售额和计划完成率。,2023/9/11,数据仓库与数据挖掘,19,销售分析的信息包图,信息包:销售分析维度,类别,2023/9/11,数据仓库与数据挖掘,20,设计基于主题域的概念模型,2023/9/11,数据仓库与数据挖掘,21,利用星形图进行数据仓库的逻辑模型设计,根据分析需求与信息包图制作星形图,2023/9/11,数据仓库与数据挖掘,22,根据分析需求与信息包图制作雪花图,雪花模型对星型模型的维度表进一步标准化,对星型模型中的维度表进行了规范化处理。,2023/9/11,数据仓库与数据挖掘,23,确定主题的属性组,2023/9/11,数据仓库与数据挖掘,24,事实表及其特征度量是客户发生事件或动作的事实记录,如客户打电话,可能选择的度量有通话时长、通话次数和通话费用等。客户购买商品,可能选择的度量有购买的次数、购买商品的金额和购买商品的数量等。事实表则是在星型模型或雪花模型中用来记录业务事实,并作相应指标统计的表。事实表的特征有:记录数量情况维度表情况,2023/9/11,数据仓库与数据挖掘,25,事实表的类型与设计 事实是一种度量,所以事实表中的这种指标往往需要具有数值化和可加性的特征。即:要考虑决策分析的需要(必要的数据)要考虑系统运行的需要(派生的数据),2023/9/11,数据仓库与数据挖掘,26,粒度的选择与设计步骤 根据需求和系统运行情况确定粒度:粒度的不同选择导致逻辑模型的差异粒度的不同选择导致数据存储容量的差异粒度的设计步骤:粗略估计数据量确定粒度的级别粒度设计实例:,2023/9/11,数据仓库与数据挖掘,27,关于数据仓库的聚合模型数据的分割处理 星形图中的维度表简介 常用维度的设计模式,2023/9/11,数据仓库与数据挖掘,28,事实表及其特征事实表的类型与设计 粒度的选择与设计步骤 关于数据仓库的聚合模型与数据的分割处理 星形图中的维度表简介 常用维度的设计模式,2023/9/11,数据仓库与数据挖掘,29,数据仓库的物理模型设计,物理模型设计的主要工作物理存储结构设计的原则 数据仓库索引设计的特殊性 存储优化与存储策略,2023/9/11,数据仓库与数据挖掘,30,3.3 使用SQL Server 2005建立多维数据模型,SQL Server 2005示例数据仓库环境的配置与使用 基于SQL Server 2005示例数据库的多维数据模型的建立与应用。,2023/9/11,数据仓库与数据挖掘,31,3.3 使用SQL Server 2005建立多维数据模型,在SQL Server 2005数据库环境中安装数据仓库组件、示例和工具 利用示例数据仓库(AdventureWorks DW)环境及帮助系统学习,2023/9/11,数据仓库与数据挖掘,32,3.3 使用SQL Server 2005建立多维数据模型,创建一个新的数据仓库分析项目 定义数据源 定义数据源视图 定义多维数据集 部署“销售分析示例”项目 浏览已部署的多维数据集 提高多维数据集的可用性和易用性,

    注意事项

    本文(数据仓库系统的设计与开发.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开