大数据与审计.pptx
《大数据与审计.pptx》由会员分享,可在线阅读,更多相关《大数据与审计.pptx(27页珍藏版)》请在三一办公上搜索。
1、大数据与审计概述,目录,1.信息技术的相关背景知识2.大数据的由来及技术体系3.大数据在审计中的应用4.关于大数据审计的几点建议,信息化技术发展的三次变革,数据的度,计算机中数据大小的表示1Byte=8 Bit(=bps)1KB=1,024 Bytes1MB=1,024 KB=1,048,576 Bytes1GB=1,024 MB=1,048,576 KB=1,073,741,824 Bytes1TB=1,024 GB=1,048,576 MB=1,099,511,627,776 Bytes1PB=1,024 TB=1,048,576 GB=1,125,899,906,842,624 Byte
2、s1EB=1,024 PB=1,048,576 TB=1,152,921,504,606,846,976 Bytes1ZB=1,024 EB=1,180,591,620,717,411,303,424 Bytes1YB=1,024 ZB=1,208,925,819,614,629,174,706,176 Bytes,数据的量,在2006年个人PC迈入TB,全球产生数据总量为180EB(0.18ZB)在2010年时,全球数据总量增加到了1.8ZB据预计到2020年,全球将总共拥有44ZB的数据量我国将达到8ZB,占全球总量的18%,大数据起源(Big Data),2008年9月科学(Scienc
3、e)杂志发表了一篇文章“BigData:Science in the Petabyte Era”,从此“大数据”这个词开始广泛传播所谓大数据,泛指规模达到级,包含结构化、非结构化以及半结构化数据集合,如文本、图像、声音、视频等。,大数据4V特征,结构化数据、半结构化数据和非结构化数据如今的数据类型早已不是单一的文本形式,网络日志、音频、视频、图片、地理位置信息等,对数据的处理 能力提出了更高要求,数据更新速度快据统计,淘宝每日的数据量约在10万G左右,百度搜索每日的搜索量达70亿次,新浪微博每日更新数达5千万次,人人网的每日访问量达4亿次。,数据量巨大全球在2010 年正式进入ZB 时代,预计
4、到 2020 年,全球将总共拥有44ZB 的数据量,沙里淘金,价值密度低虽然数据量很大,但是价值密度较低。通过强大的机器算法更迅速地完成数据价值“提纯”,是目前 大数据亟待解决的难题,1.海量(Volume),3.速度(Velocity),4.价值(value),2.多样(Variety),8,大数据的定义,定义 大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。维基百科 大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。百度百科,googl
5、e的三大论文(三驾马车),Google公开的三篇论文(2003,2004,2006)The Google File System分布式文件存储系统MapReduce:Simplified Data Processing on Large Clusters分布式并行计算Bigtable:A Distributed Storage System for Structured Data分布式数据库,Hadoop的诞生,Hadoop之父Doug CuttingDoug Cutting 根据Google公开的三篇论文思想,以JAVA语言,实现了论文中关于分布式存储、分布式并行计算的机制,由此开启了大数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 审计
链接地址:https://www.31ppt.com/p-4565624.html