大数据算法综述.ppt
《大数据算法综述.ppt》由会员分享,可在线阅读,更多相关《大数据算法综述.ppt(22页珍藏版)》请在三一办公上搜索。
1、,数据挖掘算法综述,张娴,大数据概述,数据挖掘算法分类,经典算法简介,1,2,3,大数据概述,大数据概述,大数据是指无法在一定时间范围内用常规的软件工具进行捕捉、管理和处理的数据集合。是由于目前存储和计算模式与能力不能满足存储与处理现有数据集规模的需求而产生的相对概念。,大数据平台的设计,数据挖掘算法分类,数据挖掘,大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持过程。大数据的挖掘常用的方法有分类、回归分析、聚类、关联规则、神经网络方法、Web 数据挖掘等。这些方法从不同的角度对数据进行挖掘。,数据挖掘算法
2、分类,数据挖掘算法分类,经典算法简介,ID3算法,决策树是一种依托决策而建立起来的一种树。在机器学习中,决策树是一种预测模型,代表的是一种对象属性与对象值之间的一种映射关系,每一个节点代表某个对象,树中的每一个分叉路径代表某个可能的属性值,而每一个叶子节点则对应从根节点到该叶子节点所经历的路径所表示的对象的值。决策树仅有单一输出,如果有多个输出,可以分别建立独立的决策树以处理不同的输出。,ID3算法,ID3算法是决策树的一种,它是基于奥卡姆剃刀原理的,即用尽量用较少的东西做更多的事。在信息论中,期望信息越小,那么信息增益就越大,从而纯度就越高。ID3算法的核心思想就是以信息增益来度量属性的选择
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 算法 综述
链接地址:https://www.31ppt.com/p-6457830.html