基于朴素贝叶斯算法的垃圾邮件分类(Python实现)ppt课件.pptx
《基于朴素贝叶斯算法的垃圾邮件分类(Python实现)ppt课件.pptx》由会员分享,可在线阅读,更多相关《基于朴素贝叶斯算法的垃圾邮件分类(Python实现)ppt课件.pptx(20页珍藏版)》请在三一办公上搜索。
1、,Presentation,基于朴素贝叶斯算法的垃圾邮件分类(Python实现),East China Normal University,2022年11月9日,CONTENTS,目录,0,简介,1,回顾:基本方法,2,算法,3,拉普拉斯平滑,4,实例:邮件分类,5,流行学习,2022年11月9日,East China Normal University,简介,朴素贝叶斯法:是基于贝叶斯定理和特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型对于给定的输入x,利用贝叶斯定理求出后验概率最大的输出y.朴素贝叶斯法实现简单,学习和
2、预测的效率都很高,是业界常用的一种方法。,2022年11月9日,East China Normal University,Review1:分类问题综述,1,2022年11月9日,East China Normal University,各种化验检测数据来推断病情,这时医生就好比一个分类器,而这个医生诊断的准确率,与他当初受到的教育方式(构造方法)、病人的症状是否突出(待分类数据的特性)以及医生的经验多少(训练样本数量)都有密切关系。,回顾,算法,拉普拉斯平滑,邮件分类,流行学习,小结,Review2:贝叶斯定理,2022年11月9日,East China Normal University,回
3、顾,算法,拉普拉斯平滑,邮件分类,流行学习,小结,算法:,2022年11月9日,East China Normal University,Train_dataset,(表格来源:数据挖掘:概念与技术 第3版),回顾,算法,拉普拉斯平滑,邮件分类,流行学习,小结,2022年11月9日,East China Normal University,test:X=(age=youth,income=mediu,student=yes,credit_rating=fair)(1)计算先验概率P(buy_pc=yes)=9/14=0.643P(buy_pc=no )=5/14=0.357条件概率:P(age
4、=youth|buy_pc=yes)=2/9=0.22P(age=youth|buy_pc=no)=2/5=0.600P(income=medium|buy_pc=yes)=4/9=0.444P(income=medium|buy_pc=no)=2/5=0.400P(student=yes|buy_pc)=1/5=0.200P(credit_rating=fair|buy_pc=yes)=6/9=0.667P(credit_rating=fair|buy_pc=no)=2/5=0.400,回顾,算法,拉普拉斯平滑,邮件分类,流行学习,小结,2022年11月9日,East China Norma
5、l University,回顾,算法,拉普拉斯平滑,邮件分类,流行学习,小结,如果遇到零概率值怎么办?拉普拉斯平滑。,East China Normal University,2022年11月9日,回顾,算法,拉普拉斯平滑,邮件分类,流行学习,小结,流程图:,East China Normal University,准备阶段,分类器训练阶段,应用阶段,2022年11月9日,回顾,算法,拉普拉斯平滑,邮件分类,流行学习,小结,准备数据从文本中构建词向量(贝努利模型),East China Normal University,从文本中构建邮件向量(words2vec):通常有两种实现方式:一种是基
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 朴素 贝叶斯 算法 垃圾邮件 分类 Python 实现 ppt 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1325265.html