数据科学概论ppt课件.ppt
《数据科学概论ppt课件.ppt》由会员分享,可在线阅读,更多相关《数据科学概论ppt课件.ppt(28页珍藏版)》请在三一办公上搜索。
1、数据科学概论,肖波中央民族大学,数据科学和数据科学家,数据科学定义数据科学家定义数据科学团队学术数据科学家企业数据科学家,近年对数据科学的炒作,-除了上帝谁都要用数据说话! -只管把数据拿来,数据自己会说话! 近年我们在各种场合听到各种关于大数据和数据科学家的议论。听起来仿佛谁不搞大数据和数据科学就要落后,企业就要走向末路。这就迫使我们一定要看个究竟。如果是这样那么怎么认识大数据,又如何成为大数据的行家里手呢?先来看看我们面临的问题。,数据科学直面的问题,缺乏最基本术语定义。什么是大数据?什么是数据科学?大数据和数据科学的关系是什么?数据科学是关于大数据的科学吗?数据科学仅适用于Google和
2、Facebook这样的大技术公司吗?为什么有人认为大数据只是个交叉学科(空间,财务,技术等)而数据科学只是个技术问题?到底数据多大才算大?抑或它只是个相对的术语?,1.当代社会数据无处不在,我们掌握大量生活方方面面的数据,但是缺乏计算处理的经验。购物,交流,读报,听音乐,搜信息,表达意见。如人所知,所有这些都被在线跟踪。 人们也许不知道“数据化”已经通过技术采集并利用在线数据来观察我们的离线行为。二者结合起来可以像研究新物种一样研究我们。不仅仅是因特网数据,还有金融,医药工业,药品,生物信息,社会福利,政府信息,教育,退休及其他可以想到的数据。对大部分部门和工业数据影响力不断增长。在某种情况下
3、,这种数据足可以称之为“大”,2.“数据化”,他们定义数据化为“将所有对生活有影响的因素转化为数据”。他们提到的例子有:谷歌增强现实眼镜数据化凝视,推特数据化变化的思想。数据化是一个有趣的概念,我们来想象一下它对于人们共享数据所产生的影响。我们正在被数据化,抑或说我们的行为被数据化。当我们在线“喜欢”什么人或事的时候,我们就被数据化了,至少有可能被数据化了。如果我们甚少上网也可能被通过cookies在不知情的情况下被动地数据化了。当我们走过一个商店甚至走在街上都可能被传感器,摄像头,谷歌眼镜等无意识地数据化。 这些拍摄的图像从我们兴高采烈地参加社会媒体活动到各种户外调查和谈话,都是在数据化。我
4、们的倾向可能被大肆渲染,而结果并非如此。,3.数据化使谁获益?,一旦我们数据化了事物,我们就可以转换它们的用途并把信息变为新的数值形式。 这里有一个问题要关注:谁是上面论述中的“我们”?他们使用什么类型的数据?大部分情况下的“我们”是模型作者和驱使人们去花钱买东西的企业。而“数据”通过自动化被转换成增加的效益。,4.为什么会出现数据科学,不仅仅因为这些数据大而有趣(或更具挑战),而是数据本身往往是实时的,成为一个数据产品的原材料。在因特网它意味着亚马孙推送系统,Facebook的朋友推荐,电影和音乐推送等等。在财务方面意味着信用评级,交易算法和模型等。在教育方面意味着动态个性化学习和像 Kne
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 科学 概论 ppt 课件

链接地址:https://www.31ppt.com/p-1924647.html