数据与大数据分析ppt课件.pptx
《数据与大数据分析ppt课件.pptx》由会员分享,可在线阅读,更多相关《数据与大数据分析ppt课件.pptx(65页珍藏版)》请在三一办公上搜索。
1、Contents,我们可以做些什么,实操分享,大数据,你从哪来,你是谁,中国网民数量:7.51亿半年增长率:2.7%,中国注册网站数量:344.3万个,手机网民:7.236亿 占网民总数:96.3%,月均网络交易: 16亿笔,每日新发微博数量: 1亿+条,注册微博用户数: 2.9071亿,发布的网页数量:866亿页年增速:40%,网络直播用户:3.43亿 占网民总数:47.1%,很多人还没搞清楚什么是PC互联网,移动互联来了;我们还没搞清楚移动互联的时候,大数据时代又来了!马云,数据爆炸式的增长,数据资产管理的挑战,需要更高性价比的数据计算与储存方式,需要不同的数据管理策略,01,你从哪里来?
2、,数据爆炸式的增长,数据资产管理的挑战,数据资产,数据资产管理,传统数据管理方式面临挑战,需要更高性价比的数据计算与储存方式,计算更快 存储更省,10万 GB,10万 TB,1Byte = 8 Bit1KB = 1,024 Bytes1MB = 1,024 KB = 1,048,576 Bytes1GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Bytes1TB = 1,024 GB = 1,048,576 MB = 1,099,511,627,776 Bytes1PB = 1,024 TB = 1,048,576 GB =1,125,899,906,
3、842,624 Bytes1EB = 1,024 PB = 1,048,576 TB = 1,152,921,504,606,846,976 Bytes1ZB = 1,024 EB = 1,180,591,620,717,411,303,424 Bytes1YB = 1,024 ZB = 1,208,925,819,614,629,174,706,176 Bytes,1Bity,1KB,1MB,1GB,1TB,1PB,1EB,1ZB,1YB,需要不同的数据管理策略,15% 结构化的 DB/DW,残缺,当我们想要扩充时,才发觉:架构只能 scale-up, scale-out 不易处理时间过长,
4、 time-to-value 受限成本过高, cost-efficiency 受限,概念(Concept)特征(Features)变革(Change)技术(Technology),数据库(database),大数据(bigdata),你是什么?,02,大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据就是“未来的新石油”。,全球信息咨询机构国际数据公司(IDC)对大数据的技术定义是:通过高速捕捉、发现或分析,从大容量数据中获取价值的一种新的技术架构。,所谓“大数据”(big data) 指的是这样一种现象:一个公司日常运营所生成和积累
5、用户行为数据“增长如此之快,以至于难以使用现有的数据库管理工具来驾驭,困难存在于数据的获取、存储、搜索、共享、分析和可视化等方面。”这些数据量是如此之大,已经不是以我们所熟知的多少G和多少T为单位来衡量,而是以P(1000个T), E(一百万个T)或Z(10亿个T)为计量单位,所以称之为大数据。,概念,数据类型多越来越多非结构化数据;音频、 食品,地理位置信息等多类型数 据对数据处理能力提出更高要求。,数据价值高海量数据带来了巨大的商业价值。数据之间关联性支持深层的数据挖掘。,大数据的特点-4V理论,数据处理速度快 对数据实时处理有着极高的要求, 通过传统数据库查询方式得到的 “当前结果”很可
6、能已经没有价值。,数据规模大从TB跃升到PB甚至EB。 一组公式:1024GB=1TB; 1024TB=1PB;1024PB=1EB。,。,大数据改变生活,IBM C&P Industry,需求海量数据存储技术实时数据处理技术数据高速传输技术搜索技术,描述分布式文件系统流计算引擎服务器/存储间高速通信文本检索、智能搜索、实时搜索,技术Hadoop,x86/MPPMap ReduceStreaming DataInfini BandEnterpriseSearch,数据分析技术,大数据涉及的关键技术,Text Analytics Engine 自然语言处理、文本情感分析、Visual Data
7、Modeling 机器学习、聚类关联、数据模型,顾客一次购买商品 1面包、黄油、尿布、牛奶 2咖啡、糖、小甜饼、鲑鱼 3面包、黄油、咖啡、尿布、牛奶、鸡蛋 4面包、黄油、鲑鱼、鸡 5鸡蛋、面包、黄油 6鲑鱼、尿布、牛奶 7面包、茶叶、糖、鸡蛋 8咖啡、糖、鸡、鸡蛋 9面包、尿布、牛奶、盐10茶叶、鸡蛋、小甜饼、尿布、牛奶,顾客一次购买商品 1面包、黄油、尿布、牛奶 2咖啡、糖、小甜饼、鲑鱼 3面包、黄油、咖啡、尿布、牛奶、鸡蛋 4面包、黄油、鲑鱼、鸡 5鸡蛋、面包、黄油 6鲑鱼、尿布、牛奶 7面包、茶叶、糖、鸡蛋 8咖啡、糖、鸡、鸡蛋 9面包、尿布、牛奶、盐10茶叶、鸡蛋、小甜饼、尿布、牛奶,
8、概念(Concept)分类(Features)流程(Technological process),03,我们可以做些什么?,大数据时代的核心价值数据分析,什么是数据分析,数据分析有哪些类型,数据分析,对比分析法,平均分析法,交叉分析法,初级数据分析,高级数据分析,相关分析,因子分析,回归分析,数据分析的一般环节,04,关于数据分析的分享与交流,理论模型统计方法可视化,数据分析方法论,4P(product price place promotion),5W2H,KANO模型,对顾客的不同需求进行分区处理,帮助团队识别对产品来说较为关键的客户需求层次,尽快完成规划。,兴奋型需求,期望型需求,基本型
9、需求,数据分析统计方法,聚类分析,01,回归分析,02,时间序列分析,03,因子分析和主成分分析,04,数据分析软件MATLABSASSpssStataEviewsExcel,可视化方法,ECHARTS,EASELY,PPT,附:1、ECHARTS http:/ https:/www.easel.ly/home,THE END,用户行为理论,用户行为理论的用途较单一,就是用于用户行为研究分析用户使用行为:认知-熟悉-试用-使用-忠诚利用用户行为理论,梳理网站分析的各关键指标之间的逻辑关系,构建符合公司实际业务的网站分析指标体系:,ADD YOUR TITLE HERE,TEXT HERE,TE
10、XT HERE,TEXT HERE,TEXT HERE,TEXT HERE,ADD YOUR TITLE HEREThis is an example text. Go ahead and replace it.,ADD YOUR TITLE HEREThis is an example text. Go ahead and replace it.,ADD YOUR TITLE HEREThis is an example text. Go ahead and replace it.,数据分析统计方法,01,02,04,03,聚类分析,ADD YOUR TITLE HEREThis is an
11、 example text. Go ahead and replace it.,ADD YOUR TITLE HEREThis is an example text. Go ahead and replace it.,ADD YOUR TITLE HEREThis is an example text. Go ahead and replace it.,数据分析统计方法聚类分析回归分析因子分析和主成分分析时间序列分析,数据分析软件MATLABSASSpssStataEviewsExcel,1.绩效指标必须是具体的(Specific)2. 绩效指标必须是可以衡量的(Measurable)3. 绩
12、效指标必须是可以达到的(Attainable)4. 绩效指标是要与其他目标具有一定的相关性(Relevant)5.绩效指标必须具有明确的截止期限(Time-bound)无论是制定团队的工作目标还是员工的绩效目标都必须符合上述原则,五个原则缺一不可,ADD YOUR TITLE HERE,MAIN IDEAThis is an example text. Go ahead and replace it.,ADD YOUR TITLE HEREThis is an example text. Go ahead and replace it.,ADD YOUR TITLE HEREThis is a
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 ppt 课件
链接地址:https://www.31ppt.com/p-1349801.html