周志华-机器学习-西瓜书-全书16章-ppt-Chap07贝叶斯分类器课件.pptx
《周志华-机器学习-西瓜书-全书16章-ppt-Chap07贝叶斯分类器课件.pptx》由会员分享,可在线阅读,更多相关《周志华-机器学习-西瓜书-全书16章-ppt-Chap07贝叶斯分类器课件.pptx(72页珍藏版)》请在三一办公上搜索。
1、霍轩,第七章:贝叶斯分类器,章节目录,贝叶斯决策论极大似然估计朴素贝叶斯分类器半朴素贝叶斯分类器贝叶斯网EM算法,章节目录,贝叶斯决策论极大似然估计朴素贝叶斯分类器半朴素贝叶斯分类器贝叶斯网EM算法,贝叶斯决策论,贝叶斯决策论(Bayesian decision theory)是在概率框架下实施决策的基本方法。在分类问题情况下,在所有相关概率都已知的理想情形下,贝叶斯决策考虑如何基于这些概率和误判损失来选择最优的类别标记。,贝叶斯决策论,贝叶斯决策论(Bayesian decision theory)是在概率框架下实施决策的基本方法。在分类问题情况下,在所有相关概率都已知的理想情形下,贝叶斯决
2、策考虑如何基于这些概率和误判损失来选择最优的类别标记。假设有 种可能的类别标记,即,是将一个真实标记为 的样本误分类为 所产生的损失。基于后验概率 可获得将样本 分类为 所产生的期望损失(expected loss)或者称条件风险(conditional risk)我们的任务是寻找一个判定准则 以最小化总体风险,贝叶斯决策论,显然,对每个样本,若 能最小化条件风险,则总体风险 也将被最小化。,贝叶斯决策论,显然,对每个样本,若 能最小化条件风险,则总体风险 也将被最小化。这就产生了贝叶斯判定准则(Bayes decision rule):为最小化总体风险,只需在每个样本上选择那个能使条件风险
3、最小的类别标记,即此时,被称为贝叶斯最优分类器(Bayes optimal classifier),与之对应的总体风险 称为贝叶斯风险(Bayes risk)反映了分类起所能达到的最好性能,即通过机器学习所能产生的模型精度的理论上限。,贝叶斯决策论,具体来说,若目标是最小化分类错误率,则误判损失 可写为,贝叶斯决策论,具体来说,若目标是最小化分类错误率,则误判损失 可写为此时条件风险,贝叶斯决策论,具体来说,若目标是最小化分类错误率,则误判损失 可写为此时条件风险于是,最小化分类错误率的贝叶斯最优分类器为即对每个样本,选择能使后验概率 最大的类别标记。,贝叶斯决策论,不难看出,使用贝叶斯判定准
4、则来最小化决策风险,首先要获得后验概率。然而,在现实中通常难以直接获得。机器学习所要实现的是基于有限的训练样本尽可能准确地估计出后验概率。主要有两种策略:判别式模型(discriminative models)给定,通过直接建模,来预测决策树,BP神经网络,支持向量机生成式模型(generative models)先对联合概率分布 建模,再由此获得生成式模型考虑,贝叶斯决策论,生成式模型,贝叶斯决策论,生成式模型基于贝叶斯定理,可写成,贝叶斯决策论,生成式模型基于贝叶斯定理,可写成,先验概率样本空间中各类样本所占的比例,可通过各类样本出现的频率估计(大数定理),贝叶斯决策论,生成式模型基于贝叶
5、斯定理,可写成,先验概率样本空间中各类样本所占的比例,可通过各类样本出现的频率估计(大数定理),“证据”(evidence)因子,与类标记无关,贝叶斯决策论,生成式模型基于贝叶斯定理,可写成,先验概率样本空间中各类样本所占的比例,可通过各类样本出现的频率估计(大数定理),“证据”(evidence)因子,与类标记无关,类标记 相对于样本 的“类条件概率”(class-conditional probability),或称“似然”。,章节目录,贝叶斯决策论极大似然估计朴素贝叶斯分类器半朴素贝叶斯分类器贝叶斯网EM算法,极大似然估计,估计类条件概率的常用策略:先假定其具有某种确定的概率分布形式,再
6、基于训练样本对概率分布参数估计。记关于类别 的类条件概率为,假设 具有确定的形式被参数 唯一确定,我们的任务就是利用训练集 估计参数,极大似然估计,估计类条件概率的常用策略:先假定其具有某种确定的概率分布形式,再基于训练样本对概率分布参数估计。记关于类别 的类条件概率为,假设 具有确定的形式被参数 唯一确定,我们的任务就是利用训练集 估计参数 概率模型的训练过程就是参数估计过程,统计学界的两个学派提供了不同的方案:频率学派(frequentist)认为参数虽然未知,但却存在客观值,因此可通过优化似然函数等准则来确定参数值贝叶斯学派(Bayesian)认为参数是未观察到的随机变量、其本身也可由分
7、布,因此可假定参数服从一个先验分布,然后基于观测到的数据计算参数的后验分布。,极大似然估计,令 表示训练集中第 类样本的组合的集合,假设这些样本是独立的,则参数 对于数据集 的似然是对 进行极大似然估计,寻找能最大化似然 的参数值。直观上看,极大似然估计是试图在 所有可能的取值中,找到一个使数据出现的“可能性”最大值。,极大似然估计,令 表示训练集中第 类样本的组合的集合,假设这些样本是独立的,则参数 对于数据集 的似然是对 进行极大似然估计,寻找能最大化似然 的参数值。直观上看,极大似然估计是试图在 所有可能的取值中,找到一个使数据出现的“可能性”最大值。式(7.9)的连乘操作易造成下溢,通
8、常使用对数似然(log-likelihood)此时参数 的极大似然估计 为,极大似然估计,例如,在连续属性情形下,假设概率密度函数,则参数 和 的极大似然估计为也就是说,通过极大似然法得到的正态分布均值就是样本均值,方差就是 的均值,这显然是一个符合直觉的结果。需注意的是,这种参数化的方法虽能使类条件概率估计变得相对简单,但估计结果的准确性严重依赖于所假设的概率分布形式是否符合潜在的真实数据分布。,章节目录,贝叶斯决策论极大似然估计朴素贝叶斯分类器半朴素贝叶斯分类器贝叶斯网EM算法,朴素贝叶斯分类器,估计后验概率 主要困难:类条件概率 是所有属性上的联合概率难以从有限的训练样本估计获得。,朴素
9、贝叶斯分类器,估计后验概率 主要困难:类条件概率 是所有属性上的联合概率难以从有限的训练样本估计获得。朴素贝叶斯分类器(Nave Bayes Classifier)采用了“属性条件独立性假设”(attribute conditional independence assumption):每个属性独立地对分类结果发生影响。,朴素贝叶斯分类器,估计后验概率 主要困难:类条件概率 是所有属性上的联合概率难以从有限的训练样本估计获得。朴素贝叶斯分类器(Nave Bayes Classifier)采用了“属性条件独立性假设”(attribute conditional independence assu
10、mption):每个属性独立地对分类结果发生影响。基于属性条件独立性假设,(7.8)可重写为其中 为属性数目,为 在第 个属性上的取值。,朴素贝叶斯分类器,朴素贝叶斯分类器,由于对所有类别来说 相同,因此基于式(7.6)的贝叶斯判定准则有这就是朴素贝叶斯分类器的表达式,朴素贝叶斯分类器,朴素贝叶斯分类器的训练器的训练过程就是基于训练集 估计类先验概率 并为每个属性估计条件概率。令 表示训练集 中第 类样本组合的集合,若有充足的独立同分布样本,则可容易地估计出类先验概率对离散属性而言,令 表示 中在第 个属性上取值为 的样本组成的集合,则条件概率 可估计为对连续属性而言可考虑概率密度函数,假定,
11、其中 和 分别是第 类样本在第 个属性上取值的均值和方差,则有,朴素贝叶斯分类器,例子:用西瓜数据集3.0训练一个朴素贝叶斯分类器,对测试例“测1”进行分类(p151,西瓜数据集 p84 表4.3),拉普拉斯修正,若某个属性值在训练集中没有与某个类同时出现过,则直接计算会出现问题,.比如“敲声=清脆”测试例,训练集中没有该样例,因此连乘式计算的概率值为0,无论其他属性上明显像好瓜,分类结果都是“好瓜=否”,这显然不合理。,拉普拉斯修正,若某个属性值在训练集中没有与某个类同时出现过,则直接计算会出现问题,.比如“敲声=清脆”测试例,训练集中没有该样例,因此连乘式计算的概率值为0,无论其他属性上明
12、显像好瓜,分类结果都是“好瓜=否”,这显然不合理。为了避免其他属性携带的信息被训练集中未出现的属性值“抹去”,在估计概率值时通常要进行“拉普拉斯修正”(Laplacian correction)令 表示训练集 中可能的类别数,表示第 个属性可能的取值数,则式(7.16)和(7.17)分别修正为现实任务中,朴素贝叶斯分类器的使用情形:速度要求高,“查表”;任务数据更替频繁,“懒惰学习”(lazy learning);数据不断增加,增量学习等等。,章节目录,贝叶斯决策论极大似然估计朴素贝叶斯分类器半朴素贝叶斯分类器贝叶斯网EM算法,半朴素贝叶斯分类器,为了降低贝叶斯公式中估计后验概率的困难,朴素贝
13、叶斯分类器采用的属性条件独立性假设;对属性条件独立假设进行一定程度的放松,由此产生了一类称为“半朴素贝叶斯分类器”(semi-nave Bayes classifiers),半朴素贝叶斯分类器,为了降低贝叶斯公式中估计后验概率的困难,朴素贝叶斯分类器采用的属性条件独立性假设;对属性条件独立假设记性一定程度的放松,由此产生了一类称为“半朴素贝叶斯分类器”(semi-nave Bayes classifiers)半朴素贝叶斯分类器最常用的一种策略:“独依赖估计”(One-Dependent Estimator,简称ODE),假设每个属性在类别之外最多仅依赖一个其他属性,即其中 为属性 所依赖的属性
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 周志华 机器 学习 西瓜 全书 16 ppt Chap07 贝叶斯 分类 课件

链接地址:https://www.31ppt.com/p-2349436.html