数据分析科学的过去现在未来.ppt
《数据分析科学的过去现在未来.ppt》由会员分享,可在线阅读,更多相关《数据分析科学的过去现在未来.ppt(81页珍藏版)》请在三一办公上搜索。
1、数据分析科学的过去、现在、未来-统计是数据科学,谢邦昌 教授1 朱建平教授21.辅仁大学统计资 讯学系暨应用统计所教授 首都经贸大学统计学院&中央财经大学统计学院博导 厦门大学计划统计系&西南财经大学统计学院客座教授 中华数据挖掘协会理事长2.厦门大学计划统计系,统计学的发展,是根据数据的型态和问题的本质来改变的,不是因为我们会做他背后的数学而发展的。不要因为(统计的)问题困难而去做它;也不要因为它难而不做。(贺吉士J.L.Hodges,Jr.,1922-2000)统计学的味道,来自她的数据,因为这是她的本质。,统计是数据科学数学是数理统计的基础,统计科学还是统计工业,工业意味着不断改进的、有
2、市场的产品和日益增加的就业人口。如果统计只是在大学里或者研究单位里面存在的话,那么这个行业的萧条,也是可以预期的。工业的另一个意涵是不再有单兵作战。工业化的结果,除了世俗化之外,还暗示着有更高的附加价值。化工厂里满墙的屏幕:每一个都在监测某一重要生产环节的状况和反应;企业里开始有数据价值发展部的编制。将某些统计工作专业化,不断地加上新的价值,什么是数据挖掘?,数据挖掘是计算机应用领域的新名词。然而当人类还在茹毛饮血的上古时代早已进行着数据挖掘的行为为了快速并准确捕获猎物,人类的祖先必须细心观察猎物的习性,并预测猎物的行为,才能战胜猎物、存活下去同样的,在讲究实时、竞争激烈的网络时代,如果能事先
3、破解消费者的行为模式,将会是赢得电子商务的关键因素之一,It is New,资源与信息共享Information DeliveryData mining(DM)是一个当红的专题,也是蛮新的一个专题多半的人,并不知道它能做甚么。但是不能太晚上车。(中研院 赵民德),瞎子摸象?找Pattern?Trend?Relationship?,林共进 教授 提供,什么是数据挖掘?,定义William Frawley&Gregory Piatetsky Shapiro,1991从现有的大量数据中,撷取不明显的、之前未知的、可能有用的信息目标建立起决策模型哪一类的用户对我的产品有兴趣?根据过去的行动来预测未来的
4、行为,10,什么是数据挖掘?,从数据库中萃取出有效益,且隐藏在数据当中的信息数据挖掘是属于KDD的其中最重要的一环Fayyad(1996):The nontrivial process of identifying valid、novel、potentially useful,and ultimately understandable pattern in data.,什么是数据挖掘?,大量的资料,型态或规则,里面要有矿!,信用卡消费资料:假设每人平均有1.5张信用卡,每月平均消费10笔,该行约有150万的客户。就资料量而言,每月约有2,250万笔消费记录,每年约有2亿7千万笔消费记录,客户的
5、消费型态或规则,你不能不知的十大创新技术,根据TECHNOLOGY REVIEW杂志(麻省理工学院2002年1月出刊)提出改变未来的十大创新技术机器与人脑的界面塑料晶体管资料採礦(Data mining)数字权利管理生物测定學(Biometrics)语言识别处理微光学技術(Microphotonics)解开程式碼(Untangling code)机器人设计微应用流体學(Microfluidics),PC ArchitectureDOS,SpreadsheetsWord Processors,PCMid 80s,InternetMid 90s,ApplicationsLate 80s-Mid 9
6、0s,Web AppsMid 00s-.,Today,Speech/Writing,XML/SOAPHTTP/HTMLSMTP,Email ClientsWeb Browsers,Wi-Fi/Broadband,Devices,Web Services,Rights Management,Trusted Computing Hardware,MouseGUILANs,智能提炼,让数据为您开启智识大门,15,Intelligence Refining Process,数据挖掘方法概述,1.Classification2.Prediction3.Segmentation4.Association5
7、.Sequence,Data Mining兴起的原因,数据大量产生资料仓储形成计算机软件配合发展,The Evolution of Data Mining,Data Mining进行步骤,理解数据与进行的工作获取相关知识与技术(Acquisition)融合与查核资料(Integration and checking)去除错误或不一致的数据(Data cleaning)发展模式与假设(Model and hypothesis development)实际数据挖掘工作测试与检核所挖掘的数据(Testing and verification)解释与使用数据(Interpretation and us
8、e),数据挖掘,贝叶斯网络,RBF网络,统计分析 数据挖掘 数据分析流程,报表展现,数据导入,数据处理,统计分析数据挖掘,建模结果,数据分析流程,数据挖掘 统计分析平台,数据挖掘平台,部分挖掘平台分析结果作案方式分析,如果:选择部位 属于 宿舍那么:进入方式 撬门,决策预警,DataMining进行步骤之产业标准,CRISP-DM(Cross-Industry Standard Process For Data Mining)SAS-SEMMA,数据挖掘功能,分类(Classification)预测(Forecasting)推估(Estimation)关联分组(Affinity Groupin
9、g)集群化(Clustering),数据挖掘方法论,Association RuleClusteringDecision TreeLinear RegressionLogistic RegressionNave BayesianNeural NetworkSequence ClusteringTime Series,DATA MINING 运行时间,定义企业问题,资料检视,资料准备,模型的建立,模型的评估,布属与应用,资料源,DATA MINING处理流程,数据挖掘产业标准CRISP-DM,Data Mining的商业价值,商 业 价 值,数据源:Microsoft Taiwan,数据挖掘应用
10、Data Mining在各产业的应用,金融服务业客户贡献度分析、信用评分、风险评估、客户区隔、交叉营销等。保险业顾客贡献度分析、信用评分、风险评估、客户区隔、交叉营销、客 户流失分析和诈欺侦测等。电信业 顾客贡献度分析、信用评分、客户区隔、交叉营销、客户流失分析、销售预测和诈欺侦测等。,Data Mining在各产业的应用,制造业客户贡献度分析、质量管理、营销绩效分析、生产分析和存货分析等。零售业客户忠诚度、客户区隔、购物篮分析、定价分析、交叉营销和销售预测等。生物科技、医疗保健、航天空业、环境、法律等,数据挖掘无处不在,商业智慧的核心,如何收集资料营运数据,市场调查资料,固定Panel追踪如
11、何管理数据ETL,Data warehousing如何从数据中获取智能Data Mining,OLAP,Statistics如何应用智能营销策略,主管决策,互动化CRM机制,商业智慧之整合运用,不论是营销或服务部门,如何将分析所得到的信息,进一步转换成经营管理可资利用的材料,并且在实际联机操作环境中,将整个响应机制完全自动化,充分运用这些信息。将数据分析所得的结果回馈入企业资源规划系统(ERP),客户关系管理(CRM)以及电子商务(EC)等系统中,藉此快速地提升在这些系统上所花费大量支出的投资报酬率(return on investment,ROI),透过提供企业所有成员商业洞察力,以提升企业
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 科学 过去 现在 未来
链接地址:https://www.31ppt.com/p-5356542.html