统计机器学习(陈明)基础-probability.ppt
《统计机器学习(陈明)基础-probability.ppt》由会员分享,可在线阅读,更多相关《统计机器学习(陈明)基础-probability.ppt(117页珍藏版)》请在三一办公上搜索。
1、Classification,Input:x=x1,x2T,Output:C 0,1Prediction:,1,Lecture Notes for E Alpaydn 2010 Introduction to Machine Learning 2e The MIT Press(V1.0),Bayes Rule,2,posterior,likelihood,prior,evidence,Lecture Notes for E Alpaydn 2010 Introduction to Machine Learning 2e The MIT Press(V1.0),K=2 Classes,Dicho
2、tomizer(K=2)vs Polychotomizer(K2)g(x)=g1(x)g2(x)Log odds:,3,Lecture Notes for E Alpaydn 2010 Introduction to Machine Learning 2e The MIT Press(V1.0),Bayes Rule:K2 Classes,4,Lecture Notes for E Alpaydn 2010 Introduction to Machine Learning 2e The MIT Press(V1.0),Parametric Classification,5,Lecture No
3、tes for E Alpaydn 2010 Introduction to Machine Learning 2e The MIT Press(V1.0),数学基础的重要性,研究数据分析必须打好概率和统计基础Using fancy tools like neural nets,boosting and support vector machines without understanding basic statistics like doing brain surgery before knowing how to use a band-aid.,预修课程:概率统计,主要内容:概率、随机变
4、量及其分布、常用分布、多元随机向量随机变量的变换及其分布独立、条件独立、贝叶斯公式期望、方差,第一章:概率,概率:定量描述不确定性的数学语言例:P(牙痛是由虫牙引起)=0.8 20%所有其他可能实际数值可能来源于统计数据、模型、启发规则或猜测更精确的概率定义:代数、可测量、测度(参考CB Chp1),概率、样本空间和事件,考虑一个事先不知道输入的试验:试验的样本空间 是所有可能输出的集合事件A是样本空间的子集对每个事件A,我们定义一个数字P(A),称为A 的概率。概率根据下述公理定义:,概率公理,事件A 的概率是一个非负实数P(A)0合法命题的概率为1P()=1两两不相交(互斥)事件A1,A2
5、,从上述三个公理,可推导出概率的所有的其他性质。,公理的推论,不可满足命题的概率为0P()=0P(A Ac)=0对任意两个事件A、BP(A B)=P(A)+P(B)P(A B)对事件A的补事件AcP(Ac)=1 P(A)对任意事件A0 P(A)1,概率的解释,概率的“真正意义”仍是一个非常有争议的论题没有一种解释被一致接受概率两种主要的解释:频率解释概率=一个事件的相对频率(大量试验情况下)对应频率推断(点估计、置信区间)可信度解释概率=观测者对可能性的判断“贝叶斯概率”对应贝叶斯推断,概率的频率解释,在相似试验条件下,进行多次重复试验,得到某个特定输入的相对频率(如掷骰子或抛硬币)满足概率公
6、理只有试验才能确定概率但是试验次数多少次才足够多?相似条件?(条件完全相同?)P(正面朝上)?P(你本门课程得90分以上)?P(明天会下雨)?,概率的可信度解释,亦称“贝叶斯概率”概率表示观测者对可能性的判断定量表示某人的信念强度是基于个人的信念和信息“主观概率”而不是“真正的概率”并没有对世界客观的表述主观判断完全一致没有矛盾?不同人之间没有统一的客观基准满足概率公理(在保持一致性的情况下),独立事件,当P(AB)=P(A)P(B)时,称两个事件A与B独立,记为可推广到有限个事件系列可通过两种方式确定事件之间的独立性显式假设:如抛硬币试验中,假设每次抛掷都是独立的数值推导:满足P(AB)=P
7、(A)P(B)如在一个公正的掷骰子的试验中,则,不相交 独立,独立总结,独立总结若P(AB)=P(A)P(B),则A和B独立。独立某些时候是假设的,某些时候推导得到的。有正概率的不相交事件不一定独立。,条件概率,当P(B)0 时,给定B时A的条件概率为给定任意B,若P(B)0,则 也是一个概率,即满足概率的三个概率公理 当 不相交时,,条件概率,下列等式不一定成立,条件概率,例1.13:对疾病D的医学测试结果输出为+和-,其概率分别为:假设某个测试的结果为+,则得病的概率为多少?,检验相当正确,不要相信直觉!,得病概率很小,条件概率,例1.13(续):假设某个测试的结果为-,则得病的概率为多少
8、?,得病概率几乎为0,独立与条件概率,若A与B独立事件,则知道B不会改变A的概率当A与B不独立时Vs.A与B独立时:,例:条件独立,赌徒的谬误:戴伦伯特系统参与者赌红色或黑色,每赌失败一次就加大赌数,每赌赢一次就减少赌数。如果小小的象牙球让他赢了,那么就会有某种原因“记住”它,不太可能让他在下一次再赢;如果小球使他输了,它将感到抱歉,很可能帮助他在下一次赢。事实上:每一次旋转,轮盘都与以前旋转的结果无关。,摘自数学悖论奇景,条件概率总结1.如果 P(B)0,则2.对给定的B,P(.|B)满足概率公理。通常,对给定的A,P(A|.)不满足概率公理。3.通常,P(A|B)P(B|A)。4.当且仅当
9、P(A|B)=P(A)时,A 与B 独立。,贝叶斯公式,全概率公式:令A1,Ak 为 的一个划分,则对任意事件B,有。贝叶斯公式:令A1,Ak 为 的一个划分且对每个i,i=1,2,k。若,则对每个 有,后验概率,先验概率,例:邮件分类,例1.19:email可分为三类:A1=“垃圾,”A2=“低优先级”和A3=“高优先级”。根据先前的经验,我们发现则:0.7+0.2+0.1=1。令B表示email中包含单词“free”。根据先前的经验,,思考,如果收到一封带有单词“free”的邮件,该邮件为垃圾邮件的概率是多少?如果仅以单词“free”为先验来进行邮件邮件分类,如何判别一封邮件是否为垃圾邮件
10、?,第二章:随机变量,上节课内容概率理论概率公理及推论随机变量之间的关系:条件概率、独立/条件独立、贝叶斯公式本节课内容随机变量及其分布随机变量变换常见分布族多元随机向量的分布联合分布、边缘分布、条件分布、独立,随机变量,统计推断是与数据相关的。随机变量就是将样本空间/随机事件与数据之间联系起来的纽带随机变量是一个映射,将一个实数值 赋给一个试验的每一个输出例2.2:抛10次硬币,令X()表示序列中正面向上的次数,如当=HHTHHTHHTT,则 X()=6。,随机变量的概率描述,事件的概率 随机变量的概率描述给定一随机变量X及实数子集A,定义 例2.4:抛2次硬币,令X表示正面向上的次数,则,
11、其中X表示随机变量,x表示X可能的取值,随机变量的分布函数,随机变量X的累积分布函数(cumulative distribution function,CDF)定义为CDF是一个非常有用的函数:包含了随机变量的所有信息。CDF的性质:略(见书),有时记为F,例:随机变量的CDF,例2.6:公正地抛硬币2次,令X表示正面向上的次数,则CDF右连续、非减函数对所有实数x都有定义虽然随机变量只取0、1、2,离散型随机变量的概率函数,离散型随机变量的概率函数(probability function or probability mass function,pmf)定义为对所有的 CDF与pmf之间的
12、关系为:,有时记为 f,例:离散型随机变量的pmf,例2.10:公正地抛硬币2次,令X表示正面向上的次数,则概率函数为:,连续型随机变量的概率(密度)函数,对连续型随机变量X,如果存在一个函数,使得对所有的x,且对任意 有则函数 被称为概率密度函数(probability density function,pdf)。CDF与pdf之间的关系:在所有 可微的点x,则,注意:是可能的,例:连续型随机变量的CDF和pmf,例2.12:设X有PDF:显然有有该密度的随机变量为(0,1)上的均匀分布:Uniform(0,1),即在0和1之间随机选择一个点。其CDF为:,分位函数(quantile fun
13、ction),令随机变量X的CDF为F,CDF的反函数或分位函数(quantile function)定义为其中。若F严格递增并且连续,则 为一个唯一确定的实数x,使得。为增函数中值(median):一个很有用的统计量,对噪声比较鲁棒,随机变量的变换,X:老的随机变量,Y:新的随机变量,离散:,离散型随机变量的变换,例2.45:假设Y的取值比X少,因为该变换不是一一映射。,连续型随机变量的变换,方法1:CDF方法变换的三个步骤对每个y,计算集合计算CDFPDF为,连续型随机变量的变换,方法2:Jacobian方法当r为单调增函数/减函数,定义r的反函数,则当X、Y存在一一映射时,上述结论仍可用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 机器 学习 陈明 基础 probability
链接地址:https://www.31ppt.com/p-6056662.html