大数据解决方案.pptx
《大数据解决方案.pptx》由会员分享,可在线阅读,更多相关《大数据解决方案.pptx(32页珍藏版)》请在三一办公上搜索。
1、,大数据解决方案,1.项目背景理解,IBM 大数据平台解决方案,当前业务面临的挑战,数据问题,慢,缺,重,散,繁,差,企业内数据定义缺失;数据项缺失;数据属性不完整;企业外部数据无暇顾及;,数据在多个系统中重复采集、重复存储;,系统数据无法关联、共享,数据整合困难;系统林立,数出多门;,数据时效性差,使用者无法及时获得所需信息;,数据使用不方便,方法繁琐;手工报表多;,数据质量差,数据不完整,数据不一致;,没有准确数据支撑难以进行深度分析决策缺乏可靠依据,IT如何推动公司运营变革,2、服务管控模式逐步完善夯实基础管理管控思路由简单支撑向精细服务转型全面优化信息化服务流程实现分级服务,保险行业经
2、过多年的发展,整个行业的变革越来越快,市场竞争环境也日益激烈。保险公司想要在残酷的竞争中占得先机,就必须考虑产业的融合,并在价值链中占得有利的位置。,1、由被动的IT支撑向主动的以数据为核心的IT服务转型以大数据为核心组织IT服务能力持续完善基础支撑能力拥抱互联网架构体系全面云化,大数据思考,根据Gartner的定义,大数据的特征具体涵盖了3V的内容:数据量庞大(Volume):从PB扩展到ZB;IT系统、互联网、物联网等每天都在产生大量新生数据,过去的两年间产生的数据占到了所有数据的90%数据变化快(Velocity):数据变化与处理的频度由天加速到秒/毫秒;订单、支付、欺诈、微博、监控视频
3、、传感器、信令每时每刻都在不停的产生数据数据多样(Variety):数据种类繁多:数据库表,格式文本,自然语言文本,电子表格,声音,图片,视频,大数据应用价值可以从公司侧和客户侧体现,客户:精准服务及时响应智能应用,透明管控,围绕大数据应用,促使公司实现科学运营、价值创造以及透明管控,一方面能使得公司侧感知到大数据带来的管理、决策、运营效率和质量的提升;另一方面,能够使客户感知到大数据带来业务开发的智能、服务及时以及与需求匹配的精准。,科学运营,价值创造,企业:开发便捷分析及时决策支持数据准确,客户,2.大数据平台需求理解,IBM 大数据平台解决方案,大数据平台的关键需求,角色,流程,数据应用
4、,数据分类,结构化了企业架构中四大架构的关键要素,以及要素间的承接关系,形成了一套规范、清晰的定义,从而为大数据平台的方案设计建立了更明确的指导依据和验证方法。,柔性架构的大数据平台企业架构方法论和云计算技术让建立柔性架构成为可能,基于企业架构元模型,建立柔性的架构需要实现业务、应用、数据、技术四个架构层面的解耦。业务应用/数据:业务活动在业务架构和应用架构(大数据平台)间具有承上启下的作用,可从业务类型和业务活动类型两个维度划分,前者体现业务差异,后者更多体现数据平台能力要求,且可以稳定地分为决策类、管理类、执行类和分析类四种,因此业务与IT的解耦可从四类业务活动支撑实现。应用数据:应用和数
5、据共同承接了业务,数据实体也承接了应用交互,因此二者解耦的核心是数据实体。这可以通过建立稳定的、弹性的企业企业级大数据模型、数据整合与存储区域,保证未来应用对数据操作的可扩展,以及屏蔽了应用对底层数据直接访问的数据服务加以实现。应用/数据技术:系统组件承接了应用和数据,因此要实现该层面的解耦,需要解决系统组件对应用的依赖,可通过建立应用开发平台、数据交换平台和数据管控平台来实现。同时基于云计算的弹性扩展和虚拟化技术实现系统组件与基础设施的解耦。,大数据平台能力需求分析决策类业务活动,决策就是为达到某一目标而在若干个可行方案经过分析、比较、判断,从中选择并赋予实施的过程据诺宾斯泰(Robenst
6、ein)将决策过程定义为五个步骤大数据平台的核心是数据,从数据生命周期看,大数据的生成、获取、整合、服务、应用、归档各个步骤分别有着不同的目标,并面临不同的问题从决策类活动过程和数据生命周期两个维度,对大数据平台的决策类活动的支撑能力需求进行分析,通过优化技术选择满足约束条件的最优方案,4V,产生,应用,获取,整合,服务,归档,应用,通过仿真技术进行各种方案的预演与细化,整合,案例类、规则类知识支撑规则制度信息查询,实时/准实时数据捕获客户行为捕获企业/用户互联网数据捕获,应用,服务,获取,整合,大数据的存储和管理海量数据的快速分析,海量数据的快速获取,归档,整合,服务,应用,归档,获取,整合
7、,服务,应用,归档,获取,服务,归档,实时/准实时数据捕获互联网数据捕获,冷数据的近线访问,快速的数据服务执行简便的数据服务使用,非结构化数据的挖掘和分析,快速的数据转储和归档,高可用的数据支撑,建立柔性的架构支撑个性化应用开发支撑,最终用户自定制的数据服务,与生产系统在功能和数据分工上清晰合理,与生产系统的及时交互决策执行业务活动中的数据支撑,大数据平台能力需求分析分析类业务活动,分析类活动是通过对数据的深入分析,力求取得更深刻业务洞察的过程,参考DM-CRISP数据挖掘方法论,包括业务理解、数据理解、数据准备、数据建模、模型评估和模型部署六个步骤,4V,产生,应用,获取,整合,服务,归档,
8、应用,整合,应用,服务,获取,整合,归档,整合,服务,应用,归档,获取,整合,服务,应用,归档,获取,服务,归档,模型评估,应用,整合,获取,服务,归档,历史数据探查和分析,海量数据的快速获取方便准确的数据抽样能力,探索数据可方便归档和恢复,非结构化数据、实时数据的获取海量数据的获取,非结构化数据与结构化数据的整合流数据概要数据与结构化数据的整合海量数据的处理能力,非结构化数据分析能力海量数据分析能力,支撑不同分析的数据宽表,宽表数据归档,丰富的数据挖掘算法建模过程中的模拟仿真仿真结果的优化计算调用API进行模型训练能力,丰富的数据计算和可视化,分析模型能够导出为可直接使用的评分条件,如SQL
9、,评估数据能够嵌入到模型评估中,通过外部调用发现已经退化的模型,模型分析结果的快速回写,模型评估数据集的提取,模型分析结果嵌入到生产系统中,模型分析源数据的预处理与获取,大数据平台关键能力需求应用开发与运行,当前总部BI系统的数据应用需求包括业务部门的计划性业务支撑需求和大量的临时性支撑需求,以及IT部门自身规划中的计划性支撑需求;省公司经分系统也需要支撑来自业务部门和IT部门的大量支撑需求,同时要完成集团下发的IT规范要求未来省公司数据集中后,大数据平台将必须承担省分公司和总部的全部数据应用服务需求,数据应用需求急速增长,总公司IT增长缓慢,省公司IT投入有限,平台开发方面:如何支撑急速增长
10、的数据应用需求平台执行方面:如何保障海量大并发的数据访问需求和海量数据处理的性能要求,大数据平台将面临两大挑战,IT人力紧张IT系统扩容难IT投入效益难保障,大数据平台关键能力需求更直接的决策支持,未来大数据平台,当前BI系统,结构化决策:库存控制半结构化决策:套餐设计非结构化决策:产品外观设计,知识库(事实知识、规则知识、案例知识),模型的建立基于预先假设模型所需数据事先确定已知模型是静态的模型的数学形式很完善,但往往不能符合实际业务情况,DWD,DWA,ODS,DM,DM,DM,非结构化数据,3.大数据平台定位分析,IBM 大数据平台解决方案,前期初步确立的大数据平台目标技术架构,目标架构
11、:拥抱互联网、运用云计算技术,建立开放的基于SOA架构的中国企业集中化云数据服务支撑平台,面向全国各级经营主体和总部集中平台提供大数据、分布式、实时智能数据服务支撑与客户响应,并注重公共数据、公共能力的一点沉淀与全网共享,实现基于特定对象、特定需求的个性化自主定制、灵活组件组装,高效实现一级系统多维应用多级支撑,围绕三个维度:透明管控、科学运营、价值创造强调开放灵活:基于开放业务组件、应用开发平台、公共应用模型等构建,灵活支撑个性化应用开发、部署和推广实施五项管控:数据模型与标准、数据质量、数据安全、元数据、数据生命周期推行五个一点:一点源头采集、一点加工转换、一点存储、一点分析挖掘、一点服务
12、提供,数据模型标准管控,基于技术架构目标,加入大数据平台建设的驱动力,分析类系统应该建立多少数据库,多少种数据库,保证数据从省分及时向集团提供准确唯一数据,现存问题,在一个框架下有效支持5级体系的个性化开发和共性开发,提供多种形式数据服务提供方式,并有效执行,数据应用,数据服务,数据交换采集,数据整合,数据存储,数据管控,新兴技术,流数据处理架构和体系,桌面云管理技术,IaaS、PaaS,SaaS,DaaS等云管理技术,内容数据处理架构和体系,提供多厂商、多系统的统一开发平台,大数据平台应具备的技术支撑能力,10,9,6,2,数据捕获,数据服务,大数据产生,知识沉淀,数据消亡,清晰的整合层次和
13、加工时效海量数据、非结构化数据、实时流数据等多样化的存储与管理Gartner于2012年7月提出大数据管理中:“列式存储数据库、云计算和内存数据库在未来5年内将是3个最重要的技术”,数据价值,1,0,4,数据整合,3,数据处理,14,业务信息,8,系统支撑,5,数据分析,11,数据冷却,13,数据归档,示意,12,近线存储,7,数据展示,大数据生命周期,时间,大数据平台将借助云计算的快速可扩展性、标准化服务、自助服务等特征,强化大数据的获取、处理、整合、分析、服务等技术支撑能力,促进敏捷化、个性化的数据应用开发,最终助力IT对业务转型的推动。,海量数据的识别和快速装入数据分布流转互联网数据和客
14、户行为捕获实时/准实时数据捕获,大量数据服务需求的快速开发支撑快速数据服务执行简便的数据服务使用清晰的数据服务目录数据服务使用记录,针对海量数据的高性能数据分析实时数据的即时分析非结构化数据的智能分析(如网页的标引、结构化解析,视频、图片的模式识别等)高级分析算法,海量冷数据(包括实时、非结构化、结构化)的存储和管理策略冷数据的透明访问冷数据与热数据的统一支撑操作型和分析型数据的统一归档快速的数据转储和归档,数据的展现策略个性化应用开发支撑共享应用快速部署对外部系统的支撑信息提炼以及对业务的支撑知识的组织、沉淀、管理和应用,3V,大数据平台与周边系统的关系,大数据平台与省分系统和总部系统的关系
15、主要体现在功能分工协作和数据交换两大方面,此处将大数据平台作为一个黑盒子,重点关注数据平台与外部系统的关系。,大数据平台,总部系统,省分系统,功能分工与协作生产系统只保留与生产直接相关的、数据稽核(比对)相关的统计报表,其它全部整合到分析平台上。直接相关可以从流程和数据两方面考察,一系列连续业务活动,使用相同数据的应用功能直接相关(耦合度高),如结算中的话单数、成本查询,需要放在结算系统。不直接相关的统计、分析类应用,由大数据平台通过数据服务,并在D域中统一建立应用进行支撑。数据交换一般情况下,D域中的分析类应用系统中不单独存储数据,系统所需的和系统产生的数据都存放在数据平台的数据集市中。其中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 解决方案
链接地址:https://www.31ppt.com/p-4588644.html