MDX语言在OLAP中的应用 数据挖掘 毕业设计.doc
《MDX语言在OLAP中的应用 数据挖掘 毕业设计.doc》由会员分享,可在线阅读,更多相关《MDX语言在OLAP中的应用 数据挖掘 毕业设计.doc(38页珍藏版)》请在三一办公上搜索。
1、MDX语言在OLAP中的应用本科毕业设计摘 要OLAP是一项分析处理技术,它从企业的数据集合中收集信息,并运用数学运算和数据处理技术,灵活、交互式地提供统计、趋势分析和预测报告。也可以说OLAP是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。 通过多种OLAP工具对数据仓库中的数据进行多维分析、汇总,形成图表或报表的形式,使企业的决策者可以清晰、直观地看到分析结果,这正是数据仓库系统所要达到的目的。 然而,OLAP中存放的只是数据基本信息,不存放商务规则,商务规则放在MDX建模中。客户端写一条MDX语句,传给服务器端,传过
2、去时实际上是一个XML/A(XML for analysis),返回来的也是一个XML/A文件。 MDX语句生成的对象不外乎MEMBER、TUPLE、SET三者:MEMBER,(TUPLE),SET。 本文重点介绍MDX语言在OLAP中的应用和实现。由于现在无论是书籍还是网上都没有系统的介绍MDX语言的实现和应用,本文就是本着可以在数据挖掘的过程中可以轻松使用MDX语言的目标进而整理和规范了MDX的一些介绍和使用。 并且本文还给出了若干个实例演示,其中从创建多维数据集,进行设计存储,到建立挖掘模型都给出了介绍,特别是如何用MDX语言进行分析和查询最终得到希望的结果作为本文的重中之重做了详细的介
3、绍。具体的说就是自己给自己一个问题,然后自己再分析,找出答案,分析答案。真诚地希望通过本文可以对数据挖掘方面的工作有所帮助。 关键词:OALP;MDX;数据;数据挖掘AbstractOLAP is an analytical processing technology, which the data set from the enterprise to collect information and use of mathematical calculations and data processing technologies, flexible and interactive to pro
4、vide statistics, trend analysis and forecasts. It can be said is to enable the analysis of OLAP, managers or executives from multi-angle information for fast, consistent, interactive access to obtain the data to gain a better understanding of a class of software technology. Through a variety of OLAP
5、 tools for data storage in multi-dimensional data analysis, aggregation, formation of the form of a chart or report, business decision-makers can be clear and intuitive to see the results of the analysis, this is the data warehouse system to achieve the purpose of . However, OLAP data is stored in t
6、he basic information, do not store business rules, business rules modeling on the MDX. MDX client to write a statement to the server-side, when in fact the past Chuan is a XML / A (XML for analysis), is also a return to the XML / A file. MDX statement generated no more than objects MEMBER, TUPLE, SE
7、T: MEMBER, (TUPLE), (SET). This article focuses on the MDX language of OLAP applications and to achieve. As both the book or the Internet do not have a systematic introduction of the MDX language and application of the realization of this paper is based on data mining in the process can easily use t
8、he target language MDX to organize and regulate the introduction of the MDX and use. And this article also gives examples of a number of demonstrations, which from the creation of multi-dimensional data sets, the design of storage, to establish a mining model are given to introduce, in particular ho
9、w to use MDX query language for analysis and final results have been promising, as this article done the most important detail. That is specific to their own question, and then their re-analysis, to find the answers, analyze the answers. Sincerely hope that through this paper, data mining can be hel
10、pful to work.Key words :OLAP;MDX;Data;Data Mining目录1 前言41.1 数据挖掘的应用41.2 OLAP简介12. FoodMart2000的介绍22.1. FoodMart2000的安装22.2 多维数据集42.3 FoodMart2000中的多维数据集83. MDX语言的介绍83.1 MDX语言的概念93.2 MDX语言的表示113.3 基本MDX查询123.4 执行MDX语言的环境124. MDX实例154.1 切片154.2 切块194.3 旋转244.4 钻取275. 结论316参考文献32致谢331 前言1.1 数据挖掘的应用提到数据
11、挖掘就得提到数据仓库,提到数据仓库就得提到仅有一字之差的数据库,那么数据仓库究竟如何从数据库技术进化而来?市场需求是技术发展的源动力。在数据库应用的早期,计算机系统所处理的是从无到有的问题,是传统手工业务自动化的问题,例如银行的储蓄系统和电信的计费系统都属于典型的联机事务处理系统,进而有了OLTP(联机事务处理)的诞生。然而,当联机事务处理系统应用到一定的阶段时,企业家们便发现仅依赖拥有联机事务处理系统已经不足以获得市场竞争的优势。他们需要对其自身业务的运行以及整个市场相关的态势进行分析,从而做出有利的决策。这些决策需要对大量的业务数据,包括历史业务数据进行分析。而这种基于业务数据的决策分析,
12、我们把它称之为“联机分析处理”(OLAP)。传统的数据库一直被用于OLTP,也就是将日常事务处理中的数据以表的形式存放在数据库中,按用户要求对数据库里的数据进行查询和处理。数据仓库主要应用于决策支持系统,其主要目的是“提取”信息并加以扩展,用来处理DSS(决策支持系统)的应用。数据仓库弥补了原有的操作型数据库的缺点,将原有的以单一数据库为中心的数据库环境发展为一种新环境,即体系化环境。那数据挖掘能做什么?它将怎么样影响企业的管理模式?这两个问题从数据挖掘一诞生起就是人们不断思考的课题。数据挖掘可以做的工作主要有: 1) 概念/类描述:特征化和区分。即用汇总的、简洁的、精确的方式描述每个类和概念
13、。例如可以研究销售增加20%的产品的特征。 2) 关联分析:发现关联规则,这些规则展示了属性-值频繁的在给定数据集中一起出现的条件。例如:我们可以通过对数据的分析得出啤酒茶杯的关联规则。即买啤酒的人往往会买茶杯。 3) 分类和预测:通过分类可以找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类。当被预测的值是数值数据时,通常称为预测(prediction)。预测包含值预测和基于可用数据的分布趋势识别。例如在销售活动中根据商品的描述特性,如price,brand ,place_made, type和 category,对这三类的每一种导出模型。结果分类应最大限度地
14、区别每一个类,提供有组织的数据集图象。假定结果分类用判定树的形式表示,判定树可能把price看作最能区分三个类的因素。该树可能结实,在price之后,帮助进一步区分每类对象的其他特性包括brand和 place_made。这样的判定树可以帮助你理解给定销售活动的影响,并帮助你设计未来更有效的销售活动。 4) 聚类分析:对象根据最大化类里的相似性、最小化类间的相似性的原则进行聚类或分组,所形成的每个簇(聚类)可以看作一个对象类,由它可以导出规则。聚类也便于分类编制(taxonomy formation),将观察到的内容组织成类分层结构,把类似的事件组织在一起。 5) 演变分析:数据演变分析描述行
15、为随时间变化的对象的规律或趋势,并对其建模。如对股票交易数据的演变分析可以识别整个股票时常和特定公司的股票演变规律。这种规律可以帮助预测股票市场价格的未来走向,帮助对股票投资作出决策1 王珊等. 数据仓库技术与联机分析处理. 北京科学出版社. 19981。1.2 OLAP简介 联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。OLAP的提出引起了很大的反响,OLAP作为一类产品同联机事务处理 (OLTP) 明显区分开来。当今的数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction
16、processing)、联机分析处理OLAP(On-Line Analytical Processing)。OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。联机分析处理(OLAP)指的是对存储在数据库或数据仓库中的数据提供分析的一类软件技术。OLAP 工具能快速提供复杂数据库查询的答案,并帮助用户分析多维数据中的各维情况。通常 OLAP 应用于数据仓库中的数据处理过程,即所谓的“数据挖掘”(Data Mining)。OLAP 具有三种类型:l 多维 OLAP(MO
17、LAP) MOLAP 是 OLAP 中较为“流行”的一种。它使用摘要型数据库,具有一个专用数据库引擎,并且按照需求创建包含基本数据和数据集合的多纬度模式。MOLAP 在小型数据设置方面占有一定优势,集合计算和返回答案的速度都比较快,但同时也能快速创建海量数据。 l 关系 OLAP(ROLAP) ROLAP 与关系数据库直接相关,基本数据和纬度表代表关系表,此外创建一个包含数据集合信息的新表。ROLAP 是较 MOLAP 更为高级的一种类型,优点是占有空间小,但其预处理和查询性能也是最低的。 l 混合 OLAP(HOLAP) 混合 OLAP 使用关系表表示基本数据和纬度表。在所有领域中 HOLA
18、P 介于 MOLAP 和 ROLAP 之间,但它能提供快速预处理和良好的衡量。 l 还有其他的一些实现OLAP的方法,如提供一个专用的SQL Server,对某些存储模式(如星型、雪片型)提供对SQL查询的特殊支持。实现 OLAP 的主要难点是查询构成、基本数据选择和模式开发。这使得大多数现代 OLAP 产品与大型预置查询库结合使用。OLAP的基本分析操作有切片(Slice and Dise),切块(Dice),上钻(Roll up)和下钻(Drill down),旋转(Pivoting)等,使得OLAP系统可以提供给用户强大的统计,分析(包括时间序列分析,成本分配,货币兑换,非过程化建模和多
19、维结构的随机变化等)及报表处理功能。此外,OLAP系统还具有回答“假设-分析”(what-if)问题的功能及进行趋势预测的能力。OLAP提供给数据库系统一种高灵活性,高性能地存取、浏览、和分析数据的手段1 王珊等. 数据仓库技术与联机分析处理. 北京科学出版社. 19982。2. FoodMart2000的介绍2.1. FoodMart2000的安装SQL Server 2000为用户学习数据仓库提供了一个样例数据仓库,这就是FoodMart数据仓库。在SQL Server 2000书库仓库中,称为FoodMart示例数据库。FoodMart示例数据库是一个Access数据库,可以通过ODBC
20、进行连接和读取其数据。Microsoft英语查询让用户可以在不懂SQL的情况下查找一个Microsoft SQL Server数据库。英语查询界面接受一个自然语言问题,再将其转换为MDX语句,最后从数据库返回一个答案。 这个新的示例数据库使用了一家假想国际食品连锁店-FoodMart(食品市场),说明Microsoft英语查询怎样工作。这个演示程序,可以看看当提出关于FoodMart销售业务、促销活动、产品分类和品牌、消费者和他们的收入、商店地点和商店经理等方面的自然语言问题,它会怎样作出反应,也可以使用程序提供的示例问句。下面介绍一下如何安装和打开MDX查询界面:FoodMart示例数据库文
21、件的目录默认路径为:C:Program FilesMicrosoft Analysis ServicesSamplesFoodMart2000在安装的过程中,可能有些朋友会出现一些问题,现在我总结了几个可能遇到的问题,要进行以下的操作:1.安装SQL Server2000 SP42.重新启动MSSQLServerOLAPService3.打开Analysis Manager发现可以连上了,但是数据库列表中出现FoodMart 2000,这是因为Analysis Server没有加载这个数据库4.手工加载FoodMart 2000,右键单击本机服务器,弹出菜单中选择“还原数据库”,然后选择“Pr
22、ogram FilesMicrosoft Analysis ServicesSamples”目录下的foodmart 2000.cab文件。5.再次运行Analysis Manager,可能还是不能连接,刷新服务器再连接应该行了!FoodMart数据库中的24个用户数据表可以划分为两类:一类是事实数据表,用户存储数据仓库中的实际数据,在FoodMart数据库中,Salary和其名称中的第二段为“fact”做标记的,共有7个事实表;另一类是维度数据表(简称为“维度表”),用户存储数据仓库中的维度数据,FoodMart数据库中除了事实数据表以外的所有表都是维度表,共有17个维度表1 王珊等. 数据
23、仓库技术与联机分析处理. 北京科学出版社. 19983。如图2.1所示:图2.1注意:以后的第四节MDX实例就是在FoodMart2000的数据库上做的实例,因为本文主要是要讲清楚MDX语言的分析和应用,所以包括多维数据集的建立等过程会在以后的章节里先做出简单的介绍。至于FoodMart2000中的24个表中具体数据这里不做介绍,但是并不是说没有必要理解这24个表,因为我们要了解了维度表的数据所代表的是什么我们才能将相关的自然语言转换成MDX语言才能完成相关的查询。2.2 多维数据集 多维数据集通过其度量值和维度定义。多维数据集中的度量值和维度派生自数据源视图中的表和视图,此数据源视图是多维数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MDX语言在OLAP中的应用 数据挖掘 毕业设计 MDX 语言 OLAP 中的 应用 数据 挖掘
链接地址:https://www.31ppt.com/p-2396057.html