数据挖掘原理与SPSS Clementine应用宝典第7章 贝叶斯分析.ppt
-
资源ID:2433498
资源大小:457.01KB
全文页数:11页
- 资源格式: PPT
下载积分:8金币
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
数据挖掘原理与SPSS Clementine应用宝典第7章 贝叶斯分析.ppt
,数据挖掘原理与SPSS Clementine应用宝典 元昌安 主编 邓松李文敬刘海涛编著 电子工业出版社,第七章 贝叶斯分析,本章内容,贝叶斯定理,贝叶斯分类,EM算法,贝叶斯定理,贝叶斯分类,贝叶斯分类的基本过程朴素贝叶斯分类贝叶斯信念网络,贝叶斯分类-基本过程,贝叶斯分类方法基于贝叶斯定理进行分类,一般分为以下两个步骤:(1)建立分类模型,描述预定的数据类集或概念集。通过分析有属性描述的数据集中的属性来构造贝叶斯分类模型(2)使用建立的分类模型对新的数据集进行划分,主要考虑分类规则的准确性、矛盾划分的取舍等。一个好的分类规则集合应该是对新的数据集而言具有很高的准确性、尽可能少的矛盾划分和较少的规则集。,朴素贝叶斯分类-贝叶斯假设,朴素贝叶斯分类-朴素贝叶斯计算,根据类属性的不同有不同的计算方法:离散属性的条件概率计算:连续属性的条件概率计算 朴素贝叶斯分类提供了两种办法用来估计连续属性的条件概率:(1)将连续属性离散化,使用离散区间来代理连续属性(2)利用概率分布函数进行计算,朴素贝叶斯分类-贝叶斯信念网络,贝叶斯网络具有如下的特点:贝叶斯网络通过网络结构图的方法来描述数据间的关系,语意清晰,可理解性强,有助于利用数据间的因果关系进行预测分析。贝叶斯网络适合处理不完整的数据。贝叶斯信念网络本身没有输入和输出的概念,各个结点的计算是独立的。,EM算法-基本概念,EM(expectation-maximization)算法是最常用的从不完整数据条件下统计概率分布的方法。它是“求期望-取最大”的迭代循环过程,“求期望”步骤计算不完整数据样本中每个事件在当前概率分布条件下发生的期望充分统计量;“取最大”步骤按照期望分布统计量把不完整数据转换成完整数据,找到使似然性最大的概率分布。,EM算法-基本步骤,