大数据解决方案V1044课件.ppt
《大数据解决方案V1044课件.ppt》由会员分享,可在线阅读,更多相关《大数据解决方案V1044课件.ppt(44页珍藏版)》请在三一办公上搜索。
1、北京荣之联大数据解决方案,北京荣之联大数据解决方案,目录,大数据综述荣之联企业大数据平台方案大数据平台建设方法汽车制造业应用大数据畅想案例,目录大数据综述,大数据时代到来,IDC预测全球的数据使用量到2020年会增长44倍,达到35.2ZB (1ZB = 10亿TB),宽带、移动网络普及和提速,移动网络和各种智能终端,视频(医疗影像、地理信息、监控录像等),统计、分析、预测、实时处理,传感器、RFID阅读器、导航终端等非传统IT设备,社交网络(Facebook, Twitter, 微博等),大数据时代到来IDC预测全球的数据使用量到2020年会增长4,数据处理思维转变,少量的样本数据,数据关系
2、力求明确清晰,探求难以捉摸的因果关系,要求数据精确无误,全量数据,乐于接受数据的纷繁复杂,转而关注事物的关联关系,数据的精确不是那么重要了, 谷歌翻译系统为了训练其系统,收集其能找到的所有翻译; 谷歌收集了上万亿页的语料库,包括质量参差不齐的文档; 上万亿的语料库,相当于950亿句英语; 相对而言,谷歌的翻译质量还是最好的; 谷歌翻译之所以更好,不是因为它拥有一个更好的算法机制,而是增加了各种各样的数据,包括有错误的数据; 在谷歌的翻译团队中,大多数工程师并不懂其翻译出来的语言;,数据处理思维转变,传统数据分析思维,大数据分析思维,案例一, 聘请了20多名书评家和编辑组成的团队,在网页上创立“
3、亚马逊的声音”向客户推荐新书,写书评; 通过客户的购买历史,寻找客户的相似性,对客户分群进行产品推荐,推荐的总是与以往购买的相似或略有区别; 通过大量的数据分析,找出书籍之间的关联关系,即“item-to-item”,时亚马逊发生了天翻地覆的变化。 AMAZON销售额的三分之一来自于“item-to-item”的推荐系统。 AMAZON最终放弃了在线书评,书评团队被解散。,案例二,数据处理思维转变少量的样本数据数据关系力求明确清晰探求难以捉,数据处理思维转变,数据处理思维转变关联关系,预测的关键。很多时候,知道“是什么”就够了,没必要知道“为什么”。一旦我们完成了“关联关系”分析,我们就可以继
4、续向更深层次研究因果关系,找出背后的“为什么”, 沃尔玛:请把蛋挞和飓风用品摆在一起,请把啤酒和尿片摆在一起; 某信用评分公司,利用Facebook的社交圈来预测个人偿还债务的可能性; 对冲基金通过分析Twitter微博的数据文本,作为股市投资的信号; 某信用评分公司,利用Facebook的社交圈来预测个人偿还债务的可能性; 对冲基金通过分析Twitter微博的数据文本,作为股市投资的信号;,其它案例,数据处理思维转变 沃尔玛:请把蛋挞和飓风用品摆在一起,请把,大数据与BI融合*,大数据与BI融合*,大数据的商业价值,大数据的商业价值,大数据主要厂商,大型企业和机构在寻求解决棘手的大数据问题时
5、,往往会使用开源软件基础架构Hadoop的服务。由于Hadoop深受欢迎,许多公司都推出了各自版本的Hadoop,也有一些公司则围绕Hadoop提供解决方案。 Hadoop的发行版除了社区的Apache hadoop外,cloudera,IBM,ORACLE等都提供了自己的商业版本。商业版主要是提供Hadoop专业的技术支持,这对一些大型企业尤其重要。,Cloudera,EMC,。,IBM,Oracle,大数据主要厂商大型企业和机构在寻求解决棘手的大数据问题时,,大数据生态,非结构化资料汇入,SQL资料汇入,分散式档案系统,类SQL资料库系统(非即时性),分散式资料库(即时性),并行计算框架,
6、资料处理语言,数据挖掘程序库,大数据生态HIVEBig Data Applications,目录,大数据综述荣之联企业大数据平台方案大数据平台建设方法汽车制造业应用大数据畅想案例,目录大数据综述,企业大数据平台架构原则*,技术-按需频度的数据获取批量和实时数据采用不同的技术手段和工具,遵循统一的文件接口标准技术-多样化数据共存跨同构/异构数据库(物理系统),基于文本、数据库的数据抽取和加载数据-数据即服务业务人员通过逻辑数据对象组件访问数据,而不用关心数据的物理存储方式。通过数据组织与前端应用功能,使业务人员可以较容易、较快地定位和了解数据的内容。数据-数据质量控制通过一系列的技术和业务手段实
7、现数据集成平台数据质量控制,主要体现在数据正确性(技术)、完整性、一致性(业务)、有效性。,企业大数据平台架构原则*技术-按需频度的数据获取,大数据平台整体架构,大数据平台整体架构,大数据处理流程,建立对非结构化数据进行SQL语法查询的支持,实现与结构化数据的集成关联(key),非结构化数据,数据获取,结构化数据,数据集市,数据集市,EDW,结构化元数据,Hadoop,建立非结构化信息的标签、摘要、索引、日志、内容等,提取结构化的元数据信息,如类别、标引、摘要等;实现与结构化数据的整合,ODS,SQL,声誉度分析,品牌分析,服务质量分析,竞争产品分析,产品评价,市场动态跟踪,ETL,网络爬虫,
8、大数据处理流程主分类关键词标签地名人名全国统一分类分词,倒排,大数据关键技术,大数据关键技术,大数据关键技术-Hadoop,大数据关键技术-Hadoop,Hadoop系统工作原理,Hadoop系统工作原理,大数据关键技术-网络数据获取,分布式网络爬虫,分布式文件系统,分布式存储横向扩容(Scale-out) 架构,分布式软件架构并行计算框架,大数据关键技术-网络数据获取分布式网络爬虫分布式文件系统分布,大数据关键技术-两种平台相互集成,大数据关键技术-两种平台相互集成,大数据关键技术-数据应用功能,数据查询,数据统计,信息检索,数据分析,语义分析,数据挖掘,经营管理,市场活动,市场口碑,分销管
9、理,决策支持,用户服务,大数据关键技术-数据应用功能数据查询数据统计信息检索数据分析,大数据关键技术-数据管控,大数据关键技术-数据管控,目录,大数据综述荣之联企业大数据平台方案大数据平台建设方法汽车制造业应用大数据畅想案例,目录大数据综述,传统数据平台与大数据分布式平台特性差异,传统数据平台与大数据分布式平台特性差异,大数据分析与传统BI分析差异,结构化数据数据规模一般为TB规模集中式,为了分析进行大量数据移动,数据向计算靠近批处理为主,结构化/非结构化混合分析的能力数据规模从数十TB到PB级别分布式,计算向数据靠近支持流式分析,事务,关系型数据库,批处理,数据仓库,分析,集群化,非结构化,
10、流式,多种数据源,分析,(MapReduce),组织,传统BI分析,大数据分析,大数据分析与传统BI分析差异结构化数据结构化/非结构化混合分,大数据处理和管理体系-多结构化,大数据处理和管理体系-多结构化,大数据实施建议,第一阶段:,应用场景驱动的大数据开发,第二阶段:各业务系统、,各渠道系统等配合大数据改造优化,第三阶段:,管理信息体系,下的大数据平台建设,第四阶段(目标):以大数据驱动的,实时的、整体联动的IT解决,方案,Think big, start small.,大处着眼,小处着手。,大数据实施建议第一阶段:应用场景驱动第二阶段:各渠道系统等第,大数据实施方法论,大数据业务战略,大数
11、据建设目标,大数据架构设计,大数据实施,大数据运维,企业战略目标,业务目标,业务模式,大数据治理目标,应用场景,服务模式,服务对象,大数据服务定义,大数据信息模型,大数据管理定义,技术选择,验证测试,容量规划,安装,配置,验收测试,系统上线,大数据服务管理,服务性能管理,生命周期管理,资源调度,系统监控,大数据持续改进,业务调整,服务改进,技术升级,架构优化,大数据实施方法论大数据业务战略大数据建设目标大数据架构设计大,大数据的角色和技能,大数据的角色和技能,目录,大数据综述荣之联企业大数据平台方案大数据平台建设方法汽车制造业应用大数据畅想案例,目录大数据综述,汽车企业IT的过去,汽车企业IT
12、的过去,汽车企业IT的将来,业务挑战产品研发周期响应长市场扩张不够且竞争激烈客户忠诚度不高成本增长且利润率低,业务趋势提升客户服务,增加用户粘度提高生产率扩大市场份额加强集团管控降低成本绿色经济,新兴技术,云(Cloud),移动(Mobility),社交(Social),大数据(Big Data),一体化平台,客户体验(CX),汽车企业IT的将来业务挑战业务趋势新兴技术云(Cloud)移,汽车制造业大数据能力创新的方向,汽车制造业大数据能力创新的方向部分数据开放实时/近实时封闭延,大数据在汽车制造企业的应用,企业级数据,行业数据,跨行业数据,企业传统数据,供应商数据,订单数据,维修记录,分销商
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 解决方案 V1044 课件
链接地址:https://www.31ppt.com/p-1748809.html