基于统计的自然语言处理的数学基础.ppt
《基于统计的自然语言处理的数学基础.ppt》由会员分享,可在线阅读,更多相关《基于统计的自然语言处理的数学基础.ppt(43页珍藏版)》请在三一办公上搜索。
1、2023/10/11,By Barbara Rosario,1,基于统计的自然语言处理的数学基础,初等概率理论,2023/10/11,2,动机,统计计算语言处理的目的在于以自然语言为处理对象进行统计推导统计推导包括两方面内容:收集自然语言词汇(或者其他语言单位)的分布情况根据这些分布情况进行统计推导,2023/10/11,3,动机,这类统计推理的例子之一就是语言的模型化(也就是说如何根据前面出现的词预测下一个词的出现)为此我们需要构造语言的模型概率理论能够帮助我们找到这样的模型,2023/10/11,4,概率理论,某事件发生的可能性有多少?样本空间 是一个随机试验所有可能的结果的集合事件 A
2、是的子集概率函数(或者概率分布),2023/10/11,5,先验概率与后验概率,先验概率(prior probability):在没有任何附加条件下的概率值后验概率(posterior probability):在某种先决条件下的概率值P(A|B),2023/10/11,6,条件概率,我们对于随机试验的结果有部分知识(或者约束条件)条件概率(或者后验概率)假设我们已知B为真那么在我们已知B为真的条件下A 为真的概率可以表示为:,2023/10/11,7,联合概率,A与B的联合概率argmaxBP(A|B)P(B)/P(A)=argmaxBP(A|B)P(B),2023/10/11,8,链规则,
3、P(A,B)=P(A|B)P(B)=P(B|A)P(A)P(A,B,C,D)=P(A)P(B|A)P(C|A,B)P(D|A,B,C.),2023/10/11,9,(条件)独立,两个事件 A 与 B 相互独立如果 P(A)=P(A|B)P(A,B)=P(A)*P(B)两个事件 A 与 B 是在条件C下相互条件独立如果:P(A|C)=P(A|B,C),2023/10/11,10,贝叶斯定理,Bayes Theorem是我们能够交换事件之间的条件依赖的顺序 由于 贝叶斯定理(Bayes Theorem):,2023/10/11,11,举例,S:脖子僵硬,M:脑膜炎P(S|M)=0.5,P(M)=1
4、/50,000 P(S)=1/20我的脖子僵硬,得了脑膜炎的概率有多大?,2023/10/11,12,随机变量,对于不同的问题,样本空间的内容各不相同随机变量(Random variables)(RV)是我们能够讨论与样本空间相关的数值的概率值离散型随机变量连续型随机变量,2023/10/11,13,数学期望(Expectation),数学期望是一个随机变量的均值,2023/10/11,14,方差(Variance),一个随机变量的方差是该随机变量取值是否比较一致或者有很大差异的一个量度 是标准差(standard deviation),简称SD,2023/10/11,15,语言模型,对于语言
5、这一事件来说P未知我们需要估算P,(换句话说,构造语言的概率模型 M)为估算P,我们必须看看在大规模真实文本中词的分布状况,2023/10/11,16,对P的估算,基于频度的统计贝叶斯统计,2023/10/11,17,基于频度的方法,相关频度(频率):事件 u 发生的次数与所有事件总次数的比率C(u)在N次实验中u 发生的次数当 相关频度逐渐稳定在某一个值上:即该事件的概率估计,2023/10/11,18,基于频度的方法,两种不同的方法有参数的方法(Parametric)无参数的方法(Non-parametric)(与分布无关),2023/10/11,19,有参数的方法,假设某种语言现象服从我
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 统计 自然语言 处理 数学 基础
链接地址:https://www.31ppt.com/p-6262642.html