大数据与云计算黄哲学.pptx
《大数据与云计算黄哲学.pptx》由会员分享,可在线阅读,更多相关《大数据与云计算黄哲学.pptx(64页珍藏版)》请在三一办公上搜索。
1、大数据与云计算:-信息技术发展的新纪元,大纲,大数据与云计算云计算大数据平台与技术创新大数据平台产业化与应用案例,什么是大数据,对数据的使用者来讲,如果数据集超出了使用者所拥有的信息处理和分析的能力,就给使用者带来了大数据问题,大数据V特征,Volume数据规模大,Velocity数据变化数据快,Variety数据属性复杂,Value 价值,大数据的特点并不只是数据规模大,数据的量呈现指数增长2009年至2020年将增加44倍数据的体量从0.8 zettabytes增加到35ZB,生成和采集的数据将按指数增长,根据麦肯锡预计美国超过1000雇员的公司,平均每个公司存有200TB的数据,很多行业
2、的公司,如银行、电讯、互联网、政府部门等,平均存储的数据超过1个PB。,大数据的多样性Variety,不同的数据格式,数据类型和数据结构文本、数字、图像、音频、视频、时间序列、社会媒体数据、高维矩阵数据等静态数据 vs.流数据同一个应用可以生成和采集不同类型的数据,为了提取知识 尽可能多地综合不同类型的相关数据,大数据的速度Velocity,数据的采集速度的加快导致处理时间都需要有相应的提高在线数据分析(Online Data Analytics)决策的延误 商机的消失实例网上营销(E-Promotions):基于用户当前的位置和过往的交易数据预测用户的喜好 在合适的时间和地点发送用户感兴趣的
3、产品和店铺健康监控(Healthcare monitoring):利用穿戴式的传感器监控用户的生理和活动数据 及时提供需要的医疗服务,大数据的价值(Value),未来大数据的产业规模将会至少以万亿美元来进行衡量,大数据将会给信息技术领域带来一个新的增长点。,美国医疗保健每年产值达3000亿美金每年生产率增长约0.7%,制造业最多可节省50%的产品研发、组装成本最多可节约7%的营运资金,美国零售业净利率增长可能高达60%+每年生产率增长0.5-1.0%,欧洲公共部门管理每年2500亿欧元每年生产率增长约0.7%,全球个人定位数据1000亿+的服务供应商收入为终端用户带来高达7000亿美的价值,大
4、数据的产生,数据的发展和创新将不再是如何生成和采集数据具备对采集的数据进行管理、分析、总结、可视化展示和知识发现的能力已经成为新的挑战,社会媒体网络(每个人都在产生数据),科学仪器(采集不同类型的数据),移动终端(个人地理信息数据),传感器网络(测量不同类型的数据),大数据的技术挑战,存储 分布式、低成本传输 能力、成本处理 集成、融合、处理分析 能力、效率 挖掘 方法、能力、技术、平台应用能耗,互联网与电讯行业需求,某互联网公司100多在线游戏,4亿在线游戏用户在线系统记录每个游戏用户在线玩游戏的详细数据,包括游戏、时间、动作、结果等,TB级数据 分析需求:用户行分类与预测,用户行为客户群划
5、分用户挽留、用户奖励和级别提升某电信公司深度包检测(DPI)大数据分析,研究客户互联网行为模型,流量分析,数据套餐设计百万人口城市,每天数据量TB级,云计算,云计算是一种新的大规模分布式计算模式通过网络和资源 虚拟技术,实现计算及存储资源集中管理,面向用户提供服务云计算可以解决目前计算机使用的诸多问题,是计算技术发展的一个新的里程碑,2023/4/28,12,云计算的五个基本特征,按需自助服务(On-demand self-service)广泛的网络接入(Broad network access)资源池(Resource pooling)快速弹性化(Rapid elasticity)可度量的服
6、务(Measured Service),2023/4/28,13,云环境(A Cloud),云指的是一个遥远的计算环境,这个环境是用来为计算环境外的用户提供可扩展和可度量的计算资源。用户可能不知道具体的云环境在哪里。如用户在深圳,云环境可能在内蒙古。,2023/4/28,14,云环境的计算资源,物理服务器CPU,内存,外存(磁盘、磁带)虚拟服务器CPU,内存,外存软件服务(应用),2023/4/28,15,物理服务器,虚拟服务器,软件,服务,虚拟化是云计算的核心技术,虚拟化技术可以将一个物理服务器当作多个虚拟服务器使用,多个用户共享物理服务器的资源,但用户对虚拟服务器的体验是独立的计算机。用户
7、不需要了解物理服务器虚拟服务器的运行由物理服务器统一管理和维护,虚拟机用户不需要维护。当某虚拟机用户需求变化时,物理服务器的资源可以自动扩展。,2023/4/28,16,弹性化和可扩展性,弹性化是云计算的重要特征,计算资源弹性化可以使云环境的计算能力随着用户需求变化而增加或减少。水平扩展向外扩展 Scale out增加资源向内收缩 Scale in减少资源垂直扩展向上扩展 Scale up提升CPU和内存向下收缩 Scale down 降低CPU和内存,2023/4/28,17,云服务器,面向服务 Service Orientation,云计算的独特特征是服务导向或面向服务,就是将计算和存储资
8、源作为服务供用户使用服务的收费方式是谁使用谁付钱,例如:付使用存储服务的费用付使用CPU的费用付使用数据库软件的费用用户不拥有这些资源,因此不需维护它们,2023/4/28,18,云计算的三种基本服务模式,云设施服务 Cloud Infrastructure as a Service(IaaS)云平台服务 Cloud Platform as a Service(PaaS)软件作为服务 Cloud Software as a Service(SaaS),2023/4/28,19,云计算架构 Cloud Architecture,2023/4/28,20,虚拟化,计算服务Computing Ser
9、vice,存储服务Storage Service,DBMS,MapReduce,Google App Engine,CRM,ERP,CAD/CAM,POS,Windows Azure,Infrastructure as aService(IaaS),Platform as aService(PaaS),Software as aService(SaaS),物理资源,云服务应用的部署模型,公有云 Public cloud私有云 Private cloud社区云 Community cloud混合云 Hybrid cloud,2023/4/28,21,大纲,大数据与云计算云计算大数据平台与技术创新
10、大数据平台产业化与应用案例,挑战性的技术问题,数据融合(fusion)数据集成(integration)挑战,病人健康医疗数据,没有有效的数据集成就不能进行有效的综合数据分析,挑战性的科学问题,成千上万个属性超高维问题,百万以上甚至超亿个记录,混合数据类型缺省值/噪声相关性问题UnbalanceSubspace property Uninformativeness,1,2,n,n-1,n-2,n-3,n-4,f1,f2,f3,f4,f5,大数据集的挑战(Big Data Matrix),超高维数据聚类算法研究,对属性变量做分组归并,产生组变量对组变量和属性变量分层加权重扩展软子空间聚类算法EW
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 计算 哲学
链接地址:https://www.31ppt.com/p-4565612.html