第5章:基于数据仓库的决策支持系统ppt课件.ppt
《第5章:基于数据仓库的决策支持系统ppt课件.ppt》由会员分享,可在线阅读,更多相关《第5章:基于数据仓库的决策支持系统ppt课件.ppt(39页珍藏版)》请在三一办公上搜索。
1、1,第5章,基于数据仓库的决策支持系统(1),20世纪90年代中期,国外兴起了三项决策支持新技术:数据仓库(DW)、联机分析处理(OLAP)、数据挖掘(DM)。数据仓库、联机分析处理、数据挖掘的结合形成了基于数据仓库的决策支持系统。,第(1)部分,5.1 数据仓库的基本原理,5.1 数据仓库的基本原理,5.1.1 数据仓库产生和数据仓库的概念5.1.2 数据仓库结构5.1.3 数据集市5.1.4 元数据5.1.5 数据仓库存储5.1.6 数据仓库系统,5.1.1数据仓库产生和数据仓库的概念,数据仓库的产生蜘蛛网问题 随着数据库技术的广泛运用,企业的运营环境逐渐转化为以数据库为中心的运营环境。企
2、业对数据的需求是多方面的,除了在企业中建立企业级的数据库外,常常还要建立部门数据库。比如,市场人员通常只关心企业的销售、市场策划方面的信息,而不注重企业研发、生产等其他环节。因此,将销售、市场策划方面的信息抽取出来单独建立部门级的数据库很有必要,这样可以提高数据的访问效率。随着数据的逐层抽取,很可能形成“蜘蛛网”现象,使数据的抽取和访问显得错综复杂。一个大型公司每天进行上万次的数据抽取很普通。这种演变不是人为制造的,而是自然演变的结果,如果不再体系结构上进行调整,“蜘蛛网”问题将越来越严重。,数据分析的结果缺乏可靠性如:不同部门根据各自抽取的不同数据对同一个问题得到不同的结果数据处理效率很低由
3、于数据分散在各个数据库中,因此需要编写的程序很多。由于企业中使用的数据库类型很多,因此需要很多技术来实现。程序的重用性很差,完成的报表不仅时效性很差,数据处理效率也很低,难以将数据转化为信息如,某电信公司想分析某个大客户今年的情况和过去三年有什么不同?情况可能包括客户的呼叫行为、话费情况、咨询问题等。因此要想比较完整的回答这个问题,实际上需要将客户多方面的数据综合成信息。实际数据库系统中,记录客户呼叫行为的数据库通常只保留客户最近3个月的呼叫帐单,帐务数据库只保留客户今年的缴费情况,客户咨询数据库只保留客户两年内的咨询信息,用户根本不可能从这些数据中提取比较完整的信息。,1.数据仓库的概念,W
4、.H.Inmon对数据仓库的定义为:数据仓库是面向主题的、集成的、稳定的,不同时间的数据集合,用于支持经营管理中决策制定过程。SAS软件研究所定义:数据仓库是一种管理技术,旨在通过通畅、合理、全面的信息管理,达到有效的决策支持。,操作型数据(DB数据)与分析型数据(DW数据)之间的差别为:,2、数据仓库特点,(1)数据仓库是面向主题的 主题是数据归类的标准,每一个主题基本对应一个宏观的分析领域。例如,银行的数据仓库的主题:客户 DW的客户数据来源:从银行储蓄DB、信用卡DB、贷款DB等三个DB中抽取同一客户的数据整理而成。在DW中分析客户数据,可决定是否继续给予贷款。,(2)数据仓库是集成的
5、数据进入数据仓库之前,必须经过加工与集成。对不同的数据来源进行统一数据结构和编码。统一原始数据中的所有矛盾之处,如字段的同名异义,异名同义,单位不统一,字长不一致等。将原始数据结构做一个从面向应用到面向主题的大转变。,(3)数据仓库是稳定的 数据仓库中包括了大量的历史数据。数据经集成进入数据仓库后是极少或根本不更新的。(4)数据仓库是随时间变化的 数据仓库内的数据时限在510年,故数据的键码包含时间项,标明数据的历史时期,这适合DSS进行时间趋势分析。而数据库只包含当前数据,即存取某一时间的正确的有效的数据。,(5)数据仓库的数据量很大 大型DW是一个TB(1000GB)级数据库问题(一般为1
6、0GB级相当于一般数据库100MB的100倍)(6)数据仓库软硬件要求较高 需要一个巨大的硬件平台 需要一个并行的数据库系统 最好的数据仓库是大的和昂贵的。,近期基本数据:是最近时期的业务数据,是数据仓库用户最感兴趣的部分,数据量大。历史基本数据:近期基本数据随时间的推移,由数据仓库的时间控制机制转为历史基本数据。轻度综合数据:是从近期基本数据中提取出的,这层数据是按时间段选取,或者按数据属性(attributes)和内容(contents)进行综合。高度综合数据层:这一层的数据是在轻度综合数据基础上的再一次综合,是一种准决策数据。,5.1.2 数据仓库结构,数据仓库工作范围和成本常常是巨大的
7、。开发数据仓库是代价很高、时间较长的大项目。提供更紧密集成的数据集市就应运产生。目前,全世界对数据仓库总投资的一半以上均集中在数据集市上。,5.1.3 数据集市(Data Marts),数据集市是一种更小、更集中的数据仓库,为公司提供分析商业数据的一条廉价途径。数据集市是指具有特定应用的数据仓库,主要针对某个应用或者具体部门级的应用,支持用户获得竞争优势或者找到进入新市场的具体解决方案。,数据集市概念,数据集市的种类,独立数据集市,从属数据集市,1、规模是小的,面向部门2、由业务部门设计、开发、管理和维护3、购买较便宜,快速实现,投资快速回收4、数据仓库的子集5、可升级到完整的数据仓库,数据集
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 数据仓库 决策 支持系统 ppt 课件
链接地址:https://www.31ppt.com/p-2105032.html