SQL-Server-中数据仓库的创建课件.pptx
《SQL-Server-中数据仓库的创建课件.pptx》由会员分享,可在线阅读,更多相关《SQL-Server-中数据仓库的创建课件.pptx(43页珍藏版)》请在三一办公上搜索。
1、理论与技术基础实验目的实验要求实验设备及软件实验内容实验步骤实验思考题,SQL Server 中数据仓库的创建,理论与技术基础,(1)数据仓库的概念著名的数据库专家Bill Inmon 认为数据仓库就是面向主题的(subject-oriented)、集成的(integrated)、非易失的(non-volatile)和时变的(time-variant)的数据集合,用以支持管理决策。对于这个概念我们可以从两个层次予以理解:首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的事务型数据库;其次,数据仓库是对多个异构数据源的有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在
2、数据仓库中的数据一般不再修改。,理论与技术基础,(2)数据集市数据集市是为了特定应用目的或应用范围而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据。在数据仓库的实施过程中往往可以从一个部门的数据集市入手,以后再用几个数据集市组成一个完整的数据仓库。需要注意的就是在实施不同的数据集市时,同一含义的字段定义一定要相容。,理论与技术基础,(3)元数据元数据与电话黄页的作用相似,是数据仓库内容的一个字典。它是描述数据仓库内数据的结构和建立方法的数据。数据仓库中的元数据主要分为事务型元数据、抽取盒转换元数据和最终用户数据。,理论与技术基础,(4)ETL数据仓库并非只是数据的简单累积,而是要
3、经过一系列的抽取、转换和装载的过程,即ETL。ETL是构建数据仓库的重要环节,也是企业数据管理的核心,对数据仓库的后续环节影响比较大。目前市场上主流的ETL工具主要有Informatica的PowerCenter、IBM的Data Stage、Oracle的Warehouse Builder以及Microsoft的SQL Server IS等。ETL的主要功能包括数据抽取、数据转换、数据清洗和数据装载。,理论与技术基础,(5)数据仓库模型模型是对现实事物的反映和抽象,它可以帮助我们更加清晰地了解客观世界。数据仓库建模在业务分析之后开始,是数据仓库构造工作正式开始的第一步。正确而完备的数据模型是
4、用户业务需求的体现,是数据仓库项目成功与否的最重要的技术因素。数据建模有三层:概念、逻辑和物理。在数据仓库的设计中,数据建模的每一层都有自己的目的。,理论与技术基础,(6)数据仓库的实现步骤数据仓库不是直接买来就能使用的产品,它是一种方案或过程,是建立在用户提供的大量数据、硬件环境和数据库管理系统上的,需要分析工具的辅助支持。数据仓库的构建通常包括以下步骤:,理论与技术基础,建立企业模型要实现体系结构的变迁,首先要了解企业需要什么数据、已经具备了哪些数据、哪些数据是和需求相关的,最大程度地利用现有系统中的数据。建立企业模型一般采用ER模型或面向对象的分析方法。,理论与技术基础,选取主题企业模型
5、建立后,可以根据企业模型和用户需求确定系统中存在的主题。一个复杂的大型数据仓库系统通常包含有多个主题。在主题选定后,需要针对这些主题拟定一个尽可能详尽的需求说明,然后逐个主题进行实施,它是知识螺旋式开发思想在具体实现中的体现。根据选定的主题,在企业模型中划分出各个主题的边界,从而确定各个主题涉及的操作系统中的表。,理论与技术基础,逻辑模型设计确定了主题域,接下来进行系统逻辑模型的设计,包括确定数据的粒度层次、数据分割策略、定义关系模式记录系统等任务,在数据库数据表的基础上设计数据仓库的表结构。物理设计在数据仓库的物理模型设计中主要解决数据的存储结构、索引策略、存储策略、存储分配优化等问题。,理
6、论与技术基础,数据装载接口的设计在完成数据仓库概念、逻辑、物理设计后,接下来一个需要设计的是数据装载接口的设计。数据装载程序实际包括数据装载功能(数据清洗、转换和集成)、数据综合功能(将集成的细节数据转化成不同综合层次的数据)。,理论与技术基础,装载检验数据在进行了上述步骤的设计后,一个初步的数据仓库已经设计完成。接下来装载一个主题的数据进行数据校验以进行数据质量评估,确保数据的可靠性。OLAP模型设计和应用通常,需要对阶段任务中涉及的维度进行一个总体的分析,然后针对每一个需要进行OLAP展现的主题确定其维度和度量事实,最终为每一个主题建立一个OLAP模型。并在此模型上进行必要的OLAP操作,
7、做数据分析。,理论与技术基础,数据挖掘在数据挖掘层面上,首先要为数据挖掘准备足够的数据,根据需求选择算法建立挖掘模型。数据挖掘需要的数据可以来自数据仓库,也可以由于需求的需要而来自其他地方。前端数据展示系统设计 重复前面过程在完成初级阶段的工作后,需要和客户进行更深入的交流。根据最终用户的需求,将现有业务系统的缺陷和不足进行调整和修改,从而为上层数据仓库系统的发展做更好的数据准备。,实验目的,1理解数据库与数据仓库之间的区别与联系;2掌握典型的关系型数据库及其数据仓库系统的工作原理以及应用方法;3掌握数据仓库建立的基本方法及其相关工具的使用。,实验要求,利用实验室和指导教师提供的实验软件,认真
8、完成规定的实验项目,真实地记录实验中遇到的各种问题和解决的方法与过程,并绘出模拟实验案例的数据仓库模型。实验完成后,应根据实验情况写出实验报告。,实验设备及软件,基于NT的局域网络,服务器与客户端安装MS SQL Server 服务系统以及Analysis Services系统。,实验内容,以SQL Server为系统平台,设计、建立数据库,并以此为基础创建数据仓库。,实验步骤,1.启动SQL Server 服务启动SQL Server实例时即启动了SQL Server服务。启动SQL Server服务之后,用户便可与服务器建立新连接。SQL Server服务可在本地或远程作为 Microso
9、ft Windows NT 4.0 或 Windows 2000 服务启动和停止。SQL Server服务若是默认实例,则被称为MSSQLServer;若是命名实例,则被称为 MSSQL$instancename。,实验步骤,2.注册服务器 右击一个服务器或服务器组,然后单击新建 SQL Server 注册命令。在服务器框中,键入服务器名。若要指定 SQL Server 企业管理器(作为客户端)与运行正在注册的 Microsoft SQL Server 实例的服务器之间的连接,请执行下列操作之一:单击“使用 Windows 身份验证”-或-单击“使用 SQL Server 身份验证”。,实验步
10、骤,在服务器组列表中,单击一个服务器组。执行下列一个或多个操作:选择在控制台中显示 SQL Server 服务器的状态复选框。选择显示系统数据库和系统对象复选框。选择在连接时自动启动 SQL Server复选框。重复步骤 1 到 5,在SQL Server 企业管理器中注册每个服务器。,实验步骤,3.设计表设计数据库时,应先确定需要什么样的表,各表中都有哪些数据以及各个表的存取权限等等。在创建和操作表的过程中,将对表进行更为细致的设计。设计时应注意:表所包含的数据的类型;表的各列及每一列的数据类型(如果必要,还应注意列宽);哪些列允许空值;是否要使用以及何时使用约束、默认设置或规则;所需索引的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SQL Server 数据仓库 创建 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-3726645.html