数据仓库和决策支持系统.ppt
《数据仓库和决策支持系统.ppt》由会员分享,可在线阅读,更多相关《数据仓库和决策支持系统.ppt(98页珍藏版)》请在三一办公上搜索。
1、数据仓库和决策支持系统,大连海事大学计算机科学与技术学院研究方向:智能数据分析与数据挖掘,课程主要内容,决策支持系统的相关概念知识表示与决策推理数据仓库的基础知识数据仓库的建造技术OLAP技术数据仓库的应用数据仓库的发展趋势数据挖掘方法简介,教材及参考书,教材:1 徐洁磐,数据仓库与决策支持系统,科学出版社,2005年4月第1版。2(美)著,王志海等译,数据仓库(第3版),机械工业出版社,2003.参考书:1 高洪深,决策支持系统(DSS)理论方法案例(第二版),清华大学出版社,2004.2(美)Efrem G.Mallach著,李昭智等译,决策支持与数据仓库系统,电子工业出版社,2001.3
2、 陈京民等.数据仓库与数据挖掘技术,电子工业出版社,2002.4 黄梯云,智能决策支持系统,电子工业出版社,2001.,第一章 决策支持系统概述,本章内容,决策支持系统的定义决策支持系统产生的背景决策支持系统的发展阶段决策支持系统主要部件功能决策支持系统与企业决策决策支持系统的理论基础与DSS相关的若干概念决策支持系统的发展方向,1.决策支持系统的定义,计算机发展初期,主要用于科学计算问题,随后转向事务处理问题。EDP(Electronic data processing)解决了一些办公自动化中的数据处理问题,但缺乏数据的系统处理能力。企事业单位的业务数据处理需求,促使MIS系统得到迅速发展和
3、普及,解决了信息存储、组织和利用问题,促进了企事业单位信息化的进程,但不能分析、挖掘和利用数据库中潜藏的深层知识。,1.决策支持系统的定义,20世纪70年代,学术界对于应用系统分析、传统运筹学、MIS等学科的发展和作用进行了反思,认为它们都遇到了一些障碍,主要是由于不重视或者无法正确体现决策者的作用。社会与技术的发展,需要一种既能支持管理者决策、又能体现决策者意图和作用的新技术。,1.决策支持系统的定义,1971年,美国麻省理工学院的Keen和Scott Morton在管理决策系统一书中首次指出计算机对于决策的支持作用,提出了DSS(Decision Support Systems)概念。顾名
4、思义,DSS是为管理决策提供技术支持的计算机系统,主要提供决策所需的必要信息和知识。IBM公司将DSS与BI(Business Intelligence)等同。,1.决策支持系统的定义,一般认为,DSS是以数据、模型、方法以及知识和工具为主体,结合并利用了计算机强大的信息处理能力和人的灵活判断能力,以交互方式辅助决策者解决半结构化和非结构化系统问题,通过定量分析,为各级管理者提供辅助决策。70年代末期,DSS一词已经非常流行,由此开始了信息系统新的发展阶段,并形成了决策支持系统新学科。,2.决策支持系统产生的背景,2.1 从数据库到数据仓库20世纪60年代后期=数据库时代 三种典型数据库:层次
5、数据库网状数据库关系数据库处理功能以信息检索为主 事务处理(TP-Transaction Processing)分析处理(AP-Analytical Processing),2.决策支持系统产生的背景,早期的DSS(20世纪80年代初期):直接在数据库之上建立分析模型,构成一种用于数据分析、预测和决策的系统,称为决策支持系统(图1.1),一般为双库结构。分析模型:以演绎性推理的数学模型为主 统计分析,线性规划,最小二乘法,回归分析等,DSS两库结构(三角式),图1.1 DSS双库结构,对话部件 人机接口界面,协调通信数据部件(根本)组织形式:层次模型;网状模型;关系模型 模型部件(*核心)与对
6、话部件交互和数据部件交互,DSS两库结构(三角式),DSS两库结构(三角式),模型是以某种形式对一个系统的本质 属性的描述,揭示系统的功能、行为及其变化规律。模型库系统以库的形式对模型进行组 织和管理,包括模型库及模型库管理系统。,基于双库的决策系统,图1.2 基于双库结构的决策系统,2.决策支持系统产生的背景,基于模型库和方法库的DSS 随着数学模型的结构日益复杂,并且涉及多种数学方法,数学模型中的数学方法部分被分离出去,形成了数学模型和数学方法两个部分,分别称为(数学)模型库和(数学)方法库,构成了三库结构的DSS(20世纪80年代中期,图1.3)。更为复杂的DSS结构(四库,五库,群库)
7、,DSS三库结构,方法库管理系统,图1.3 DSS三库结构,DSS四库结构(经典结构),图1.4 DSS四库结构,DSS五库结构,图1.5 DSS五库结构,DSS群库结构,近年来,有学者提出增加DSS的组成部件,从而形成5库、6库、7库、8库等群库结构。即:DSS=群库系统+对话系统(人机界面)群库系统:模型库,方法库,知识库,工具库 数据库,文本库,图形库,语音库 地理信息库,DSS功能,两库结构,三库结构,四库结构,五库结构,DSS的演变,结构化问题,半/非结构化问题,DSS空间范围,桌面DSS,网络DSS,DSS库结构,2.2 TP环境不适应 DSS 应用的原因,1.事务处理(TP)和D
8、SS所需数据的粒度不同 在事务处理环境中,操作的是数据库中的数据,一般为原始数据。数据格式和描述方式并不适合非计算机专业人员进行业务上的分析和统计;而在分析处理环境中,需要的是对原始数据进行统计加工的统计性、总结性数据。DSS在利用原始数据进行分析前,往往需要对这些数据进行不同程度的综合,而事务处理系统一般不具备这种能力。,2.2 TP环境不适应 DSS 应用的原因,在事务处理环境中,系统处理特点是:数据的存取操作频率高,而每次操作处理的时间短;数据随时可能修改,从而发生变化;一般为当前数据。在分析处理环境中,系统处理特点与此完全不同,某个 DSS 应用程序可能需要连续几个小时。另外,可能需要
9、用到大量历史数据,并且一般为相对稳定的,保存周期长;可按事先规定好的方式进行更新,但不允许人工修改。,2.事务处理(TP)和分析处理(AP)的处理特性不同,2.2 TP环境不适应 DSS 应用的原因,3.数据集成问题 在事务处理环境中,数据库中的数据一般为面向某个应用的局部数据。=一般不需集成 而在分析处理环境中,DSS系统需要的是大量、广泛、普遍的集成性数据。=事先需要集成 全面而正确的数据是进行有效的分析和决策的首要前提。相关数据收集得越完整,得到的结果就越可靠。而当前绝大多数企业内数据的真正状况是分散而非集成的。,2.2 TP环境不适应 DSS 应用的原因,3.数据集成问题 造成当前绝大
10、多数企业内数据分散而非集成的原因有多种,主要有:事务处理应用分散“蜘蛛网”问题 数据不一致问题 外部数据和非结构化数据,图1.7 蜘蛛网问题,2.2 TP环境不适应 DSS 应用的原因,图1.6 事务处理应用分散的实例,2.决策支持系统产生的背景,通过对比事务处理(TP)与DSS可知,传统的数据库系统不能适应决策支持系统的需要,必须进行改造,通过数据集成和综合,构建数据仓库数据仓库(Data Warehouse)是在数据库基础上产生的一种数据集合体,是数据库概念的延伸与推广,目的是适应决策支持的需要构建数据仓库的过程称为数据仓储(data Warehousing),其成果为数据仓库(data
11、Warehouse)。,2.决策支持系统产生的背景,2.3 从数据仓库(DW)到业务智能(BI)数据仓库可以较好地满足数据集成、复杂数据查询和OLAP的需要但是对于一些复杂的、深层次的数据分析需求,数据仓库有一定局限性,必须与数据挖掘、可视化方法等相结合分析模型的扩展:从演绎推理型扩展至归纳推理(学习)型=OLAP(验证型)+DM(探索型)结果展示方法的扩展:引入最新的可视化方法 多媒体界面,Web发布,扩充的分析方法,2.决策支持系统产生的背景,结果展示,联机分析处理OLAP,数据挖掘DM,数据仓库DW,图1.7 新的决策支持系统结构,2.决策支持系统产生的背景,新的DSS结构的组成:数据仓
12、库:是支持DSS的数据集合体,也是其决策基础,可为后面的分析决策提供数据支持OLAP:是一种验证型的模型化分析工具,以数据仓库中的数据为基础,按一定的模型进行分析,以人机交互为主要操作手段,最终可获得一定的规律性知识,是一种扩充的验证型分析方法。,2.决策支持系统产生的背景,数据挖掘:是一种以归纳分析为主的分析工具集合,能够对数据库和数据仓库中的数据进行归纳性总结与分析,并最终形成深层次的规律性知识结果展示:是DSS中的结果输出与表示工具,具有本地/远程/互联网、单媒体/多媒体等多种展示方式,2.决策支持系统产生的背景,新的DSS结构的优点能较好地反映DSS对数据的真实要求能够构建较深刻的分析
13、模型能充分利用DSS的有效展示能力具有更为广泛的应用性与适用性具有多学科的集成优势 数据库,人工智能,数学,多媒体,网络技术,,图1.8 数据仓库体系结构的一个实例,3.决策支持系统的发展阶段,数据库阶段DSS发展的初级阶段,主要以数据库为基础,构建分析程序,20世纪80年代初形成,并在80年代中、后期得到发展。这个阶段涉及几种专门程序:特定查询程序用户(特别是市场和金融部门的用户)向IT部门提出特定查询需求,IT部门针对一种需求,分别编制专门的程序来提供特定查询报表。,3.决策支持系统的发展阶段,特殊抽取程序IT部门预先估计用户的各种查询需求,编制从不同业务系统中抽取目标数据的程序,定期运行
14、,以满足用户的需求。有时为了满足特殊需要,也需单独编制专用程序。小的应用程序IT部门对数据抽取处理进行规范化,并基于所产生的抽取文件,开发一些简单的应用程序。用户只要给定所需要的特定报告的参数,报表打印程序就可以输出满足需要的报表。其中一些高级程序允许用户联机查看结果信息(所见即所得)。,3.决策支持系统的发展阶段,数据仓库阶段20世纪90年代初形成,并在90年代得到发展与普及,是DSS发展的中级阶段(过渡阶段),主要以数据仓库为基础,构建DSS。在这个阶段,国内外出现了许多所谓的信息中心或数据中心。下级单位需要根据上级机构的要求,逐层向上级机构传送业务数据。用户可以向信息中心提出特定查询请求
15、,可以在自己的终端上查看信息。IT专业人员会在信息中心帮助用户获得所需要的合法内容。在这种情况下,报表和屏幕上的信息都是预先定制好的,基本上可以满足用户各种查询请求。,3.决策支持系统的发展阶段,现代DSS阶段(BI阶段)20世纪90年代末期形成,至今已构成一个成熟的体系与学科。它集成了现代计算机技术多个相关领域的最新成果,可以为企业决策提供有力的支持。在这个阶段,DSS系统一般由抽取文件支持,采用菜单方式,提供在线信息,能打印特定的报表。许多这样的DSS系统是为市场营销等部门服务的,主要提供战略决策信息。,3.决策支持系统的发展阶段,必须认识到:DSS系统的构建过程必须有用户和领域专家的参与
16、需要用到大量领域知识和启发式知识DSS或BI对于企业决策仅仅能够起到辅助与支持的作用,而最终的主要决策者仍是企业的管理人员,4.决策支持系统主要部件功能,(1)人机交互接口:系统交互设备和软件功能提供多种交互方式,满足不同决策者的需求具有方便快捷的输入和明确直观的输出功能协调各部件通信和运行提供系统保密机制,4.决策支持系统主要部件功能,(1)人机交互接口,主要研究内容集中在:可视化图形界面技术基于多媒体的界面技术基于Web的信息展示自然语言界面技术多通道用户界面虚拟现实技术,4.决策支持系统主要部件功能,(2)数据库子系统,数据库子系统包括数据库及其管理系统,其基本技术与一般数据库及其管理系
17、统基本相同。但也有自己的特点。,4.决策支持系统主要部件功能,与传统数据库系统的共同点:数据独立性 最小冗余度 共享性强 统一管理与控制 适当的响应时间 整体性(完整性)可修改性和可扩充性比较好 安全和保密 简明性,4.决策支持系统主要部件功能,DSS结构中数据库子系统的特点:面向决策支持过程,来组织和管理数据面向模型、面向模型生成,来使用数据面向不同的决策者,来描述数据,4.决策支持系统各部件功能,(3)模型库子系统:包括模型库和模型库管理系统。与数据库子系统的交互:获得模型所需的数据,实现模型输入、输出和中间结果存取的自动化;与方法库子系统的交互:可实行目标搜索、灵敏度分析和仿真运行自动化
18、等;与人机对话子系统的交互:模型的使用与维护实质上是用户通过人机对话子系统进行控制和操作的。,4.决策支持系统主要部件功能,模型库:提供模型的存储和表示模式。数学模型(方程形式,算法形式,程序形式)数据处理模型(程序形式)图形/图像模型 报表模型 智能模型模型库管理系统:提供模型的提取、访问、更新和合成等操作。,4.决策支持系统各部件功能,与模型和模型库相关的研究课题:模型的自动生成技术模型管理的人工智能方法模型管理与数据管理的结合,4.决策支持系统各部件功能,(4)方法库子系统:存储、管理、调用及维护DSS各部件要用到的通用算法、标准函数等方法的部件,供模型使用。与模型库的区别:一个模型对应
19、若干个方法 模型接近于实际决策问题,而方法接近求解算法,图1.10 DSS双库结构,4.决策支持系统各部件功能,(5)知识库子系统存储、管理、调用及维护DSS系统推理过程中用到的各类知识。知识的属性 真实性 相对性 不完全性 模糊性 可表示性,4.决策支持系统各部件功能,知识的表示方法一阶谓词逻辑产生式规则框架法语义网络Petri网脚本表示过程表示面向对象表示,5.DSS与企业决策,5.1 企业决策 一般包括收集信息、形成决策意见和决策意见传达贯彻等3个阶段。DSS可全面支持上述各阶段工作,设计方案,评价方案,确定目标,实施方案,环 境,5.2 决策问题的类型,决策问题的结构化程度:对某一过程
20、的环境和规律,能否用明确的语言(数学的或逻辑学的,形式的或非形式的)给予清晰的描述(定量的或推理的)的程度或状态。,5.2 决策问题的类型,结构化问题:能够描述清楚的问题。决策的各个阶段都能使用确定的算法或决策规则。非结构化问题:不能够描述清楚,而只能凭直觉或经验作出判断的问题。决策的各个阶段都不能使用确定的算法或决策规则。半结构化问题:介于两者之间的问题。决策的一个或二个阶段能使用确定的算法或决策规则。,5.2 决策问题的类型,5.3 决策类型,决策风格按获取数据的方式分:直觉型(N)感知型(S)按处理数据的方式分:感觉型(F)思考型(T),组合的决策风格:系统型(ST)思辩型(NT)司法型
21、(SF)直观推断型(NF),6.DSS的理论基础,DSS涉及计算机技术、信息论、人工智能、信息经济学、管理科学、行为科学等,构成了DSS的理论基础。DSS是一种开放技术,总是在不停地吸收其他学科的新营养,不断丰富自己的内容,同时也促进了相关学科的发展。,6.1 信息论,信息论的奠基人为R.E.Shannon。他于20世纪40年代确立了香农理论,提出了信息熵的概念,首次将信息定义为可量化的名词。信息论是运用信息的观点,把系统看作是借助于信息的获取、传播、加工、处理而实现其有目的性行动的研究方法。,6.1 信息论,信息和信息系统是现代科学技术中普遍采用的重要概念,在工程、通讯、控制等领域的理论中得
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 决策 支持系统

链接地址:https://www.31ppt.com/p-5985373.html