Google_云计算核心技术及应用场景分析.ppt
《Google_云计算核心技术及应用场景分析.ppt》由会员分享,可在线阅读,更多相关《Google_云计算核心技术及应用场景分析.ppt(41页珍藏版)》请在三一办公上搜索。
1、Google云计算,核心技术介绍及应用场景分析,Cloud Computing,2023年2月23日,1,网络信息内容安全讲义/张华平/2010-10,http:/,小组成员,2023年2月23日,2,内容目录,2023年2月23日,3,云计算的基本概念,云计算的概念,云计算的服务形式,云计算的发展现状,2023年2月23日,4,是由分布式计算,并行处理,网格计算发展来的新兴商业计算模型.将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力,存储空间和各种软件服务.类似电厂集中供电模式,最终目标是将计算,服务和应用作为公共设施提供给公众,使人们能够像使用水,电,煤气那
2、样使用计算机资源.,云计算的概念,2023年2月23日,5,云计算的发展现状,2023年2月23日,6,IaaS(Infrastructure as a service)Amazon Web服务(AWS)IBM的Blue Cloud等PaaS(Platform as a service)Google的App EngineSalesforce的开放平台八百客的800APPSaaS(Software as a service)Google DocsGoogle MailSalesforce的CRM,ERP,云计算的服务形式,2023年2月23日,7,Google云计算核心技术,并行计算模型MapR
3、educe,分布式文件系统GFS,分布式数据库BigTable,2023年2月23日,8,Google拥有海量数据,并且需要快速处理,为什么需要MapReduce?,Google MapReduce架构设计师Jeffrey Dean,2023年2月23日,9,处理和生成海量数据的并行编程模型;用于大规模数据集(通常大于1TB)的并行运算;MapReduce的核心是Map和Reduce两个函数Map,映射,对列表中的所有元素进行指定的操作,返回基于这个处理的中间结果集;Reduce,化简,对中间结果集进行分类和归纳得到最终的计算结果;两个函数可能会并行运行普通的PC机集群上;,MapReduce
4、的概念,2023年2月23日,10,MapReduce执行流程,1,2,3,4,5,6,7,2023年2月23日,11,Worker故障Master 周期性的ping每个worker,检查状态重新执行失效节点上已经执行或尚未执行的Map任务重新执行失效节点上未完成的Reduce任务Master故障定期写入检查点数据备恢复之用Master的数据多重备份机制重新发起MapReduce计算请求,MapReduce架构的思考,MapReduce计算架构有什么问题?,?,?,2023年2月23日,12,任务分割的粒度:时间复杂度任务备份机制:解决长尾效应本地文件读写:节省带宽跳过异常记录:避免崩溃,Ma
5、pReduce的优化,2023年2月23日,13,MapReduce的性能,实践证明,MapReduce是出色的分布式计算模型对分布于1000台计算机上1TB数据进行排序仅需要68s对4000台计算机上的1PB数据进行排序处理仅需要6小时2分钟(每次测试至少会损坏1块硬盘)Google MapReduce平均每天的数据处理量是20PB,相当于美国国会图书馆当年5月份存档网络数据的240倍,Google云计算平台上运行的MapReduce实例,2023年2月23日,14,网站访问量统计Map:Reduce:反向连接分析Map:Reduce:倒排索引Map:Reduce:,MapReduce的应用
6、场合,2023年2月23日,15,MapReduce示例:单词计数,案例:单词记数问题(Word Count)给定巨大的文本文件(大于1TB),如何计算文件中所有单词出现的数目?,2023年2月23日,16,MapReduce示例:单词计数,使用MapReduce求解该问题定义Map和Reduce函数(Pseudo Code),2023年2月23日,17,MapReduce示例:单词计数,使用MapReduce求解该问题Step 1:自动对文本进行分割,2023年2月23日,18,MapReduce示例:单词计数,使用MapReduce求解该问题Step 2:在分割之后的每一对进行用户定义的M
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Google_ 计算 核心技术 应用 场景 分析

链接地址:https://www.31ppt.com/p-2719187.html