朴素贝叶斯方法处理缺失值ppt课件.ppt
《朴素贝叶斯方法处理缺失值ppt课件.ppt》由会员分享,可在线阅读,更多相关《朴素贝叶斯方法处理缺失值ppt课件.ppt(20页珍藏版)》请在三一办公上搜索。
1、朴素贝叶斯,结 构,贝叶斯理论贝叶斯分类器,=A1A2.Am,是由所有未知类别的可能样本组成的集合;c=A1A2.AmC是由所有已知类别的样本组成的集合。D c是训练样例集合。中的元素x表示为x=。c中的元素x表示为x=。其中ai表示第i个属性的某个取值。,描述用到的符号,我们用Ai表示第i个属性,C表示决策属性;aik表示第i个属性的第k个取值,cj表示第j类;加上绝对值则表示相应的个数,如|Ai|表示第i个属性的取值个数,|cj|表示第j类样例个数。,贝叶斯定理,设x是一个类别未知的数据样本,cj为某个类别,若数据样本x属于一个特定的类别cj,那么分类问题就是决定P(cj|x),即在获得数
2、据样本x时,确定x的最佳分类。所谓最佳分类,一种办法是把它定义为在给定数据集D中不同类别cj先验概率的条件下最可能(most probable)分类。贝叶斯理论提供了计算这种可能性的一种直接方法,更精确地讲,贝叶斯法则基于假设的先验概率、给定假设下观察到不同数据的概率,提供了一种计算假设概率的方法,贝叶斯公式,先验概率P(cj),联合概率P(x|cj),后验概率P(cj|x),如果没有这一先验知识,那么可以简单地将每一候选类别赋予相同的先验概率。不过通常我们可以用样例中属于cj的样例数|cj|比上总样例数|D|来近似,即,先验概率P(cj),P(cj)代表还没有训练数据前,cj拥有的初始概率。
3、P(cj)常被称为cj的先验概率(prior probability),它反映了我们所拥有的关于cj是正确分类机会的背景知识,它应该是独立于样本的。,联合概率是指当已知类别为cj的条件下,看到样本x出现的概率。,联合概率P(x|cj),若设x=则P(x|cj)=P(a1,a2am|cj),后验概率P(cj|x),即给定数据样本x时cj成立的概率,而这正是我们所感兴趣的,P(cj|x)被称为C的后验概率(posterior probability),因为它反映了在看到数据样本x后cj成立的置信度,贝叶斯分类,我们现在计算P(cMAP|x)=max P(cj|x)j(1,|C|),则P(cMAP|
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 朴素 贝叶斯 方法 处理 缺失 ppt 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5713880.html