大数据与物流医学课件.ppt
《大数据与物流医学课件.ppt》由会员分享,可在线阅读,更多相关《大数据与物流医学课件.ppt(38页珍藏版)》请在三一办公上搜索。
1、,大数据与物流,1,.,大数据与物流1.,2,.,2.,你脑海中的大数据是什么?,3,.,你脑海中的大数据是什么?3.,一、大数据的内涵二、大数据的应用三、大数据给物流带来什么,4,.,一、大数据的内涵4.,最早关于大数据的故事发生在美国第二大超市塔吉特百货。孕妇对零售商来说是个含金量很高的顾客群体,但是她们一般会去专门的孕妇商店。人们一提起塔吉特,往往想到的都是日常生活用品,却忽视了塔吉特有孕妇需要的一切。在美国,出生记录是公开的,等孩子出生了,新生儿母亲就会被铺天盖地的产品优惠广告包围,那时候再行动就晚了,因此必须赶在孕妇怀孕前期就行动起来。塔吉特的顾客数据分析部门发现,怀孕的妇女一般在怀
2、孕第三个月的时候会购买很多无香乳液。几个月后,她们会购买镁、钙、锌等营养补充剂。根据数据分析部门提供的模型,塔吉特制订了全新的广告营销方案,在孕期的每个阶段给客户寄送相应的优惠券。结果,孕期用品销售呈现了爆炸性的增长。2002年到2010年间,塔吉特的销售额从440亿美元增长到了670亿美元。大数据的巨大威力轰动了全美。我们可以想象的是,许多孕妇在浑然不觉的情况下成了塔吉特的忠实拥趸,许多孕妇产品专卖店也在浑然不知中破产。商家们早晚要面对的一个问题就是:究竟是在浑然不觉中崛起,还是在浑然不觉中灭亡?,导入案例美国零售商和怀孕预测,5,.,最早关于大数据的故事发生在美国第二大超市塔吉特百货。孕妇
3、,1、定义: “大数据”是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。 麦肯锡报告:大数据是指其大小超出了典型数据库软件的采集、储存、管理和分析等能力的数据集合。 奥巴马政府:未来的新石油,一、大数据的内涵,6,.,1、定义:一、大数据的内涵6.,2、数据来源 物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器。请问:(1.)写在磁带、纸上的数据是大数据么?有用吗?(2)滴滴打车要用到一个交通路况数据,需要用到什么样的数据?(3)为什么今天的淘宝数据值钱了?,一、大数据的内涵,7,.,2、
4、数据来源一、大数据的内涵7.,今天的数据不是大,真正有意思和值钱的是数据变得在线了,这个恰恰是互联网的特点。所以 在线 的这个问题,远远比“大”更反映本质。大数据的本质,一、大数据的内涵,8,.,今天的数据不是大,真正有意思和值钱的是数据变得在线了,这个恰,3、大数据的技术支持(1)Hadoop平台 互联网企业的海量数据采集工具,有Facebook开源的Scribe、LinkedIn开源的Kafka、淘宝开源的 Timetunnel、Hadoop的Chukwa等,将这些数据上载到Hadoop中央系统进行处理分析。(2) MapReduce分析 大多数互联网企业采用Hadoop的HDFS分布式文
5、件系统来存储数据,并使用MapReduce进行分析 MapReduce目前最擅长的计算领域有流量统计、推荐引擎、趋势分析、用户行为分析、数据挖掘分类器、分布式索引等。,一、大数据的内涵,9,.,3、大数据的技术支持一、大数据的内涵9.,例如在淘宝,每天有1000多台服务器生成日志文件,日志总量大概有10TB,每天成千上万的报表基于这些数据进行计算。有的报表每半小时计算 一次,有的报表每天计算一次,还有些非报表应用需要实时进行数据分析。如何保证这些报表和应用按时收到自己需要的数据?每天10TB的数据该如何管理?淘宝实时数据传输平台-Timetunnel就是因这些需求而诞生的,目前在淘宝Timet
6、unnel使用三台服务器服务所有的应用,每秒钟实测流 入流量峰值为50MB/S(压缩后),流出流量为130MB/S(压缩后)。Timetunnel保证为所有的报表按时准备好所需数据,延迟不超过1分 钟;保证为所有的实时应用提供实时数据,延迟不超过1秒。,10,例如淘宝开源的 Timetunnel,.,例如在淘宝,每天有1000多台服务器生成日志文件,日志总,11,.,11.,12,.,12.,一分钟内,微博推特上新发的数据量超过10万;社交网络“脸谱”的浏览量超过600万. 这些庞大数字,意味着什么?,MapReduce在用户行为上体现的价值,13,.,一分钟内,微博推特上新发的数据量超过10
7、万;社交网络“脸谱”,它意味着,一种全新的致富手段也许就摆在面前,它的价值堪比石油和黄金。具体有六大价值:华尔街根据民众情绪抛售股票;对冲基金依据购物网站的顾客评论,分析企业产品销售状况;银行根据求职网站的岗位数量,推断就业率;投资机构搜集并分析上市企业声明,从中寻找破产的蛛丝马迹;美国疾病控制和预防中心依据网民搜索,分析全球范围内流感等病疫的传播状况;美国总统奥巴马的竞选团队依据选民的微博,实时分析选民对总统竞选人的喜好。,MapReduce用户行为体现的价值,14,.,它意味着,一种全新的致富手段也许就摆在面前,它的价值堪比石油,美国华尔街德温特资本市场公司首席执行官保罗霍廷每天的工作之一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 物流 医学 课件
链接地址:https://www.31ppt.com/p-1748072.html