互联网金融的结构化设计.pptx
《互联网金融的结构化设计.pptx》由会员分享,可在线阅读,更多相关《互联网金融的结构化设计.pptx(66页珍藏版)》请在三一办公上搜索。
1、大数据基础概念,用5W1H了解大数据,为什么要研究大数据(WHY)什么是大数据(WHAT)哪里有大数据(WHERE)大数据现在什么阶段(WHEN)谁在做大数据(WHO)大数据是一种方法(HOW)大数据有哪些潜在价值(Value)大数据有哪些关键的技术(Tachnology),目录,“数据现在就像新型石油。数据就像原油一样,非常宝贵,但是如果未进行优化则毫无用处。”专家,“我们的经济是基于一种不仅可再生并且会自我生成的资源。用完不是问题,被淹没才是问题。”John Naisbitt,能力向消费者转移,数据竞争的压力,大数据的激增,商业模式驱动,社会在发生变革,Google,Facebook,腾讯
2、百度阿里彻底的改变了人们生活 你在读书,书在读你数据是一种资产,成为商品构成成分、是一种资源,4,全球每秒钟发送 2.9 百万封电子邮件,一分钟读一篇的话,足够一个人昼夜不息的读5.5 年每天会有 2.88 万个小时的视频上传到Youtube,足够一个人昼夜不息的观看3.3 年推特上每天发布 5 千万条消息,假设10 秒钟浏览一条信息,这些消息足够一个人昼夜不息的浏览16 年每天亚马逊上将产生 6.3 百万笔订单每个月网民在Facebook 上要花费7 千亿分钟,被移动互联网使用者发送和接收的数据高达1.3EBGoogle 上每天需要处理24PB 的数据,在web 2.0的时代,人们从信息的被
3、动接受者变成了主动创造者,UGC时代到来,*Truthfulness,accuracy or precision,correctness,Volume多,Velocity快,Veracity垃圾*,Variety杂,Data at rest,Terabytes to exabytes of existing data to process,Data in motion,Streaming data,milliseconds to seconds to respond,Data in many forms,Structured,unstructured,text,multimedia,Data
4、in doubt,Uncertainty due to data inconsistency&incompleteness,ambiguities,latency,deception,model approximations,全新的计算时代,业务发展-DAAS模式精髓IT比业务反应更快!,BI,分析&多变量测试 太多噪音数据 事后诸葛 依靠猜测,重-设计重-发布新-平台每年每季每月,调整、商品化&it优化,业务改进 手动&高成本 仅提供前5%最热门内容 专家偏见,开发&QA 太多项目 茅盾的优先级 昂贵,批准&部署研究 优先级问题 错过截止日期 与市场脱节,系统自动升级,使用群体智慧,少量IT
5、参与,实时自动调节,用5W1H了解大数据,为什么要研究大数据(WHY)什么是大数据(WHAT)哪里有大数据(WHERE)大数据现在什么阶段(WHEN)谁在做大数据(WHO)大数据是一种方法(HOW)大数据有哪些潜在价值(Value)大数据有哪些关键的技术(Tachnology),目录,何为大?数据度量,1Byte=8 Bit1KB=1,024 Bytes1MB=1,024 KB=1,048,576 Bytes1GB=1,024 MB=1,048,576 KB=1,073,741,824 Bytes1TB=1,024 GB=1,048,576 MB=1,099,511,627,776 Bytes
6、1PB=1,024 TB=1,048,576 GB=1,125,899,906,842,624 Bytes1EB=1,024 PB=1,048,576 TB=1,152,921,504,606,846,976 Bytes1ZB=1,024 EB=1,180,591,620,717,411,303,424 Bytes1YB=1,024 ZB=1,208,925,819,614,629,174,706,176 Bytes,大数据的“大“,红楼梦含标点87万字(不含标点853509字)每个汉字占两个字节:1汉字=16bit=2*8位=2bytes1GB 约等于671部红楼梦1TB 约等于631,90
7、3 部1PB 约等于647,068,911部美国国会图书馆藏书(151,785,778册)(2011年4月:收录数据235TB)中国国家图书馆:2631万册1EB=4000倍美国国会图书馆存储的信息量600美元的硬盘就可以存储全世界所有的歌曲MGI估计,全球企业2010 年在硬盘上存储了超过7EB(1EB 等于10 亿GB)的新数据,同时,消费者在PC 和笔记本等设备上存储了超过6EB 新数据,专注于企业级大数据,集群容量 约3200台服务器 物理CPU 30000核 内存 100TB 磁盘 36000块 存储容量 60PB,阿里巴巴云梯一 数据规模(2012),集群负载 每天Job数 150
8、,000+道 每天hive query数 6,000+每天扫描数据量 7.5PB 每天扫描文件数 4亿 存储利用率 80%CPU利用率65%峰值80%,阿里巴巴是数据信息流制造业,用5W1H了解大数据,为什么要研究大数据(WHY)什么是大数据(WHAT)哪里有大数据(WHERE)大数据现在什么阶段(WHEN)谁在做大数据(WHO)大数据能做什么方法(HOW)大数据有哪些潜在价值大数据有哪些关键的技术,目录,大数据约90%是机器数据,13,关系型数据、高度结构化、基于僵化模式财务记录、多维数据、数据计算月报,非实时事件,时间序列非结构化数据,无预定义模式由所有 IT 系统生成,大量不同类型的格式
9、巨量;快速导航和相关性最重要,由人与人之间的互动而产生包括电子邮件、即时通信、语音、视频和文本 储存在集中式公司服务器、文件共享和桌面中,机器产生的数据90%,商业应用程序数据2%,人为产生的数据8%,互联网络,Google机房硬件(几十万台服务器),几百万平米米几百个数据中心,用5W1H了解大数据,为什么要研究大数据(WHY)什么是大数据(WHAT)哪里有大数据(WHERE)大数据现在什么阶段(WHEN)谁在做大数据(WHO)大数据是一种方法(HOW)大数据有哪些潜在价值(Value)大数据有哪些关键的技术(Tachnology),目录,不断量化的宇宙,18,引爆大数据的原因,2023/5/
10、1,1946,1961,1970,1990,2000,2003,2008,2013,1960年代,数据与应用分离,数据库技术蓬勃发展,但重视事务处理,2000年后,互联网公司开启数据分析挖掘新时代,1946年,电脑诞生,数据与应用紧密捆绑在文件中,彼此不分,1990年代,提出数据分析挖掘,数据耦合时代,数据分析时代,数据库时代,大数据时代,从流程电子化到数据资产化1)数据更加丰富,有分析价值,从TB到PB2)分析工具更加强大,成本够低,MapReduce3)互联网商业上的成功,引起重视,麦肯锡报告,数据驱动,初始期-发展期-成长成熟期,过去,现在,随机样本 全体数据精确性 混杂性因果关系 相关
11、关系,21,数据成为资产,缺少数据资产不足以谈产业;缺少数据思维不足以语未来,数据资产评估模型,公司的价值与其数据规模、活性及其解释、运用的能力成正比价值=f(颗粒度,维度,规模,活性,关联度)x f(应用),数据成为资产,不同行业数据资产特征对比,话说电子商务公司“银行”,银行搞电子商务;搜索巨头做电信业务,电信运营商搞应用商店。,Integration&Analytics(DW,MDM,),The unseen information(Big Data),Governance,Operational systems,信息社会的发展&企业内部管理的变革,C端用户应用的网络发展:目录式(yah
12、oo)-搜索式(google)-分享式(FaceBook)-推荐式(个性化信息服务平台)B端企业内部管理变革小农生产-小规模生产-大规模生产-大规模按需定制-大规模个性化生产-大规模协同生产 营销管理变革 大众-分众-微众-个性化 粗放-精细化社会变革:(1)强调消费者已逐渐取得交易主权;(2)消费者需求差异日趋扩大;(3)数据增加、竞争加剧、互联网改变传统行业加快,用5W1H了解大数据,为什么要研究大数据(WHY)什么是大数据(WHAT)哪里有大数据(WHERE)大数据现在什么阶段(WHEN)谁在做大数据(WHO)大数据是一种方法(HOW)大数据有哪些潜在价值(Value)大数据有哪些关键的
13、技术(Tachnology),目录,各IT厂家纷纷快速跟进大数据技术,“大数据”对信息处理设施和技术提出了更高的要求 全球主流IT厂家纷纷加大在大数据领域的投入,行业价值快速增长,大数据产业相关企业一览图,用5W1H了解大数据,为什么要研究大数据(WHY)什么是大数据(WHAT)哪里有大数据(WHERE)大数据现在什么阶段(WHEN)谁在做大数据(WHO)大数据是一种方法(HOW)大数据有哪些潜在价值(Value)大数据有哪些关键的技术(Tachnology),目录,大数据涉及的关键技术,需求,技术描述,关键技术,海量数据分布式处理,Hadoop 生态系统,针对大量数据进行分布式处理的系统框架
14、,实时数据处理,Streaming Data,流计算引擎,非结构化数据处理,文本处理技术;自然语言理解;多媒体处理技术,文本内容分词与分析;图像、音视频分析,可视化交互界面,通过交互式可视化界面辅助用户进行分析,交互式可视化探索分析技术,智能数据分析,大规模机器学习技术,计算机模拟人类学习行为,包括特征提取、图形生成等,保护隐私数据与信息个体的对应关系等安全技术,高效存储和管理大规模数据,数据存储备份技术、数据放置和调度技术、数据溯源,存储、放置、调度大规模的数据,数据隐私保护,数据隐私防范保护措施与数据安全技术,大数据采集处理,大数据分析,存储、组织、管理,增强的全方位客户视图,安全/智能扩
15、展,数据仓库扩充,运营分析和优化,大数据探究,IBM大数据的五大关键用例,查找、可视化和理解所有大数据,从而改进决策制定,整合额外的内部和外部信息源,从而扩展现有客户视图(MDM、CRM 等),分析各种机器数据以改进业务成果,实时降低风险、检测欺诈、监控电子安全,集成大数据和数据仓库功能以提高运营效率,大数据分析的广泛应用,Insurance,360 View of Domain or SubjectCatastrophe ModelingFraud&AbuseProducer Performance AnalyticsAnalytics Sandbox,Banking,Optimizing
16、Offers and Cross-sellCustomer Service and Call Center EfficiencyFraud Detection&InvestigationCredit&Counterparty Risk,Telco,Pro-active Call CenterNetwork AnalyticsLocation Based Services,Energy&Utilities,Smart Meter AnalyticsDistribution Load Forecasting/SchedulingCondition Based MaintenanceCreate&T
17、arget Customer Offerings,Media&Entertainment,Business process transformationAudience&Marketing OptimizationMulti-Channel EnablementDigital commerce optimization,Retail,Actionable Customer InsightMerchandise OptimizationDynamic Pricing,Travel&Transport,Customer Analytics&Loyalty MarketingPredictive M
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 互联网 金融 结构 设计
链接地址:https://www.31ppt.com/p-4617077.html