大数据物流可视化解决方案ppt课件.ppt
《大数据物流可视化解决方案ppt课件.ppt》由会员分享,可在线阅读,更多相关《大数据物流可视化解决方案ppt课件.ppt(84页珍藏版)》请在三一办公上搜索。
1、物 流 大 数 据 处 理,物流,大数据,处理,采集,导入/预处理,统计/分析,挖掘,1,2,3,4,5,6,7,潘 果,淘宝数据分析挖掘实践及变革,百度大数据分析系统架构,京东大数据实时处理技术,物流大数据处理简介,1,2,3,4,目 录,【推荐】,用大数据能力找到商品之间的关系,【推荐】,用大数据能力找到商品之间的关系,你知晓大数据在哪些方面有应用?,3,1,3,2,架构化1950-1970,数字化,1970-1990,网络化1990-2010+,物联网大数据Something Big is HappeningNOW,移动互联网云计算,4,信息技术革命的小周期智慧化,5,1:1 Marke
2、ting,Nanotargeting和Retargeting,6,2,IBM IBM 2013,多渠道交通控制交易分析,智慧的医疗国土安全制造,金融电信欺诈和风险,日志分析搜索质量零售:流失、促销 Copyright 2011 Corporation,大数据在各行各业都可以获得应用,2,4, Copyright 2011 Corporation,IBM IBM 2013,获得突破性回报了解关于客户的一切,作快速大量地创新产品,和风险,利用工具化的资产,利用大数据能力可以帮助企业获得突破性回报,利用大数据独有的技术能力可视化和发现,Hadoop执行零延迟的操,数据仓库流计算,文本分析,整合和治理
3、,多媒体内容,通过分析仸意大数据类型交易 / 应用数据,机器数据,社交媒体数据实时侦测欺诈,4,11,快,杂,大,大数据的新思维,13,多数据源的集成,浮动车GPS:20M/day,手机位置信息:18M/day,居民调查:80000户,视频/图像数据和元数据:100s of TB/dayGIS数据,供水系统,智能电网,睡眠质量,出租车运营数据:1M/day交通卡:19M/day高速路收费数据:0.5M/day社交网络情感分析,部分数据来源:BeijingTOCC,12,大数据的新方法学数据极大丰富前提下的新分析思维和技术,采样数据 全集数据多数据源的整合基于主观因果假设 相关关系,大数据+小算
4、法+上下文+知识积累描述性分析 预测性和处方性分析实时性 绝对的精确性,数据,数据中介服务,生态系统,数据拥有者大数据的,数据中介,数据技术公司 数据产品和服务16,大数据系统的设计权衡,大体量,基于采样的查询实时性流计算,批量计算精确性,惰性数据的即席查询,Little data(个人计算)19,城市计算,增量计算内存计算,案例一:大数据分析系统架构的搭建,百度的数据规模, 1001000PB 10100PB/天 千亿万亿 百亿千亿 十亿百亿/天 十亿百亿/天 100TB1PB/天,数据总量数据处理量网页索引更新量请求日志,离线,在线,离线分析与在线实验相结合,快速迭代是互联网产品的主要创新
5、手段算法A算法B算法B通过反馈来验证算法优劣,搜索引擎的迭代,5%,5%,Online LearningA/B test策略,机器学习平台FeatureTraining,数据网页网页库倒排表Data Mining,想法,原型,系统,快速开发,测试,产品,部署运维,开发框架,互联网产品的迭代A/B测试,持续优化数据智能,验证,数据分析,应用引擎云测试,应用引擎,数据,架构技术,互联网服务enable数据智能,IT产业生产力的变化,60,70,80,90,00,10,硬件Mainframe,软件PC,Internet,Inf+人+数据Cloud,迭代的本质是让人参与系统进化,而Big Data为迭
6、代指导方向,Infrastructure则加速迭代。软件+人,互联网服务的典型技术特点,超大规模,快速迭代,数据智能,软件基础架构,大数据,数据中心、网络、服务器,数据中心计算,云计算技术体系,Disk,Flash,Pipe,K/V,File,Table,统一存储体系 平衡大容量、高并发、低延迟 不同访问模式通过组合满足统一访问与传输,数据访问层,P2P,CDN,分布式存储,描述能力,数据流优化,控制流管理资源分配,优先级、并发控制隔离、安全,执行层,模型层,Map,Reduce,表示层,SQL-like翻译,Join,Select,Top,分布式计算,BC,D,A,实时存储与计算,kNN查询
7、平台,向量计算引擎,流式数据处理引擎,PubSub引擎,机器学习算法平台,OLAP引擎,复杂事件处理引擎分布式数据结构超大规模数据仓库,图查询平台,实时检索平台,向量计算引擎,Vector,Layout,Map-,Shuffle,Operators/ Checkpoint,SIMDProgram,复杂事件处理,average(price)trigger(?,b,c)filter(b),pattern(a-b-c),condition(func(a,b,c),流式计算模型window,step,bound,time,M=Stream,目标, 1000PB 10亿维特征训练 100维条件查询 流式
8、 触发式,海量高维、多维实时,更大、更复杂、更快!,数据智能,分布式存储与计算,大规模人工辅劣标注系统,人计算,向量引擎,MachineLearning算法,Web Contents,流式处理,Logs,PubSub,推荐系统智能交通,Apps自劢评估,商业智能,决策辅劣,关于京东,营销管理,供应商管理,仓储管理,财务系统,客户数据,网站前台,关于京东 京东拥有覆盖企业全部价值链的稳定系统,通过持续优化打造开放平台,全面提升用户体验。,配送管理,大规模数据处理更加容易,ETL/企业数据仓库(Hive/Pig/MR),数据挖掘/建模,(R、Mahout),搜索和推荐,日志存储,“Next Cli
9、ck”运营智能风险控制互动分析,一些场景需要进一步的考量,MapReduce批量处理=延迟较长无法满足用户的实时需求调度开销较大,大数据包括三部分,服务,模型 性能,大数据实时处理的思考, 模型, 海量数据, 数据量大 并发数高, 多个数据源整合, 预定义好的数据模型, 去规格化, 数据任务依赖关系简单 推和拉的问题, 拉比推好,大数据实时处理的思考, 性能, 高并发需求 大容量需求, GBTB 级后台数据处理吞吐, 高速度需求, 从数据产生到处理完成结果延迟要求到秒级 计算需要在短时间内完成, 批处理预算 硬件支持, 内存、CPU、网络, 容错, 水平扩展,大数据实时处理的思考,关联获取价值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 物流 可视化 解决方案 ppt 课件
链接地址:https://www.31ppt.com/p-1972541.html