【教学课件】第五章不确定性推理.ppt
《【教学课件】第五章不确定性推理.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第五章不确定性推理.ppt(140页珍藏版)》请在三一办公上搜索。
1、第五章 不确定性推理,概述概率论基础Bayes网络主观Bayes方法确定性方法证据理论,第五章 不确定性推理,概述概率论基础Bayes网络主观Bayes方法确定性方法证据理论,概述,不精确思维并非专家的习惯或爱好所至,而是客观现实的要求。很多原因导致同一结果推理所需的信息不完备背景知识不足信息描述模糊信息中含有噪声规划是模糊的推理能力不足解题方案不唯一,概述-表示的3方面问题,不确定问题的数学模型表示的3方面问题表示问题:表达要清楚。表示方法规则不仅仅是数,还要有语义描述。计算问题:不确定性的传播和更新。也是获取新信息的过程。,不确定性推理例子,例如,对于如下的推理过程:R1:A1A2B1R2
2、:A2A3B2R3:B1BR4:B2B在描述这些规则时采用的都是不确定性知识表示方式,推理树结果图,概述-表示的3方面问题,语义问题:将各个公式解释清楚。语义问题:如何解释表示和计算的含义,目前多用概率方法。如:f(B,A)可理解为当前提A为真时结论B为真的一种影响程度,C(A)可理解为A为真的程度。特别关心的是f(B,A)的值:1)A(T)B(T),f(B,A)=?2)A(T)B(F),f(B,A)=?3)B 独立于A,f(B,A)=?对C(A)关心的是:1)A为TRUE,C(A)?2)A为FALSE,C(A)?T:True,F:False,概述-分类(1),不确定性推理方法可分为形式化方法
3、和非形式化方法。形式化方法有逻辑法、新计算法和新概率法。逻辑法是非数值方法,采用多值逻辑和非单调逻辑来处理不确定性。传统的有基于概率理论的贝叶斯网络等。新计算法认为概率法不足以描述不确定性,从而出现了证据理论(也叫DempsterShafter,D-S方法),确定性方法(CF法)以及模糊逻辑方法。新概率法试图在传统的概率论框架内,采用新的计算方法以适应不确定性描述。非形式化方法是指启发性方法,对不确定性没有给出明确的概念。,概述-分类(2),不确定推理方法:工程方法、控制方法和并行确定性法。工程法是将问题简化为忽略哪些不确定性因素。控制法是利用控制策略来消除不确定性的影响,如启发式的搜索方法。
4、并行确定性法是把不确定性的推理分解为两个相对独立的过程:一个过程不计不确定性采用标准逻辑进行推理;另一过程是对第一个过程的结论加以不确定性的度量。前一过程决定信任什么,后一过程决定对它的信任程度。,第五章 不确定性推理,概述概率论基础Bayes网络主观Bayes方法确定性方法证据理论,第五章 不确定性推理,概述概率论基础Bayes网络主观Bayes方法确定性方法证据理论,概率论基础,概率论是研究随机现象中数量规律的科学。所谓随机现象是指在相同的条件下重复进行某种实验时,所得实验结果不一定完全相同且不可预知的现象。众所周知的是掷硬币的实验。人工智能所讨论的不确定性现象,虽然不完全是随机的过程,但
5、是实践证明,采用概率论的思想方法考虑能够得到较好的结果。在这节中我们简单给出概率论的基本概念和贝叶斯定理。,概率论基础(随机事件),随机实验:随机实验是一个可观察结果的人工或自然的过程,其产生的结果可能不止一个,且不能事先确定会产生什么结果。样本空间:样本空间是一个随机实验的全部可能出现的结果的集合,通常记作,中的点(即一个可能出现的实验结果)成为样本点,通常记作。随机事件:随机事件是一个随机实验的一些可能结果的集合,是样本空间的一个子集。常用大写字母A,B,C,表示。,概率论基础(事件间的关系与运算),两个事件A与B可能有以下几种特殊关系:包含:若事件B发生则事件A也发生,称“A包含B”,或
6、“B含于A”,记作AB或BA。等价:若AB且BA,即A与B同时发生或同时不发生,则称A与B等价,记作A=B。互斥:若A与B不能同时发生,则称A与B互斥,记作AB=对立:若A与B互斥,且必有一个发生,则称A与B对立,记作或,又称A为B的余事件,或B为A的余事件。任意两个事件不一定会是上述几种关系中的一种。,概率论基础(事件间的关系与运算),设A,B,A1,A2,An为一些事件,它们有下述的运算:交:记C=“A与B同时发生”,称为事件A与B的交,C=|A且B,记作或。类似地用表示事件“n个事件A1,A2,An同时发生”。并:记C=“A与B中至少有一个发生”,称为事件A与B的并,C=|A或B,记作。
7、类似地用表示事件“n个事件A1,A2,An中至少有一个发生”。差:记C=“A发生而B不发生”,称为事件A与B的差,C=|A但B,记作或。求余:,概率论基础(运算的性质),事件的运算有以下几种性质:交换率:结合律:分配律:摩根率:事件计算的优先顺序为:求余,交,差和并。,概率论基础(概率定义),定义:设为一个随机实验的样本空间,对上的任意事件A,规定一个实数与之对应,记为P(A),满足以下三条基本性质,称为事件A发生的概率:若二事件AB互斥,即,则以上三条基本规定是符合常识的。,,,概率论基础(概率性质),定义:设An,n=1,2,为一组有限或可列无穷多个事件,两两不相交,且,则称事件族An,n
8、=1,2,为样本空间的一个完备事件族,又若对任意事件B有BAn=An或,n=1,2,,则称An,n=1,2,为基本事件族。完备事件族与基本事件族有如下的性质:定理:若An,n=1,2,为一完备事件族,则,且对于一事件B有有若An,n=1,2,为一基本事件族,则,,,概率论基础(统计概率性质),对任意事件A,有必然事件的概率P()=1,不可能事件的概率P()=0对任意事件A,有设事件A1,A2,An(kn)是两两互不相容的事件,即有,则设A,B是两事件,则,,,概率论基础(条件概率),定义:设A,B为事件且P(A)0,称为事件A已发生的条件下,事件B的条件概率,P(A)在概率推理中称为边缘概率。
9、简称P(B|A)为给定A时B发生的概率。P(AB)称为A与B的联合概率。有联合概率公式:,,,概率论基础(条件概率性质),,若,则乘法公式:全概率公式:设A1,A2,An互不相交,且,则对于任意事件A有,,,概率论基础(贝叶斯定理),,,设A,B1,B2,Bn为一些事件,P(A)0,B1,B2,Bn互不相交,P(Bi)0,i=1,2,n,且,则对于k=1,2,n,贝叶斯公式容易由条件概率的定义,乘法公式和全概率公式得到。在贝叶斯公式中,P(Bi),i=1,2,n称为先验概率,而P(Bi|A)i=1,2,n称为后验概率也是条件概率。,各种情况的概率是多少?,第五章 不确定性推理,概述概率论基础B
10、ayes网络主观Bayes方法确定性方法证据理论,第五章 不确定性推理,概述概率论基础Bayes网络主观Bayes方法确定性方法证据理论,贝叶斯网络,二十世纪八十年代贝叶斯网络(Bayes Network)成功地应用于专家系统,成为表示不确定性专家知识和推理的一种流行的方法。基于贝叶斯方法的贝叶斯网络是一种适应性很广的手段和工具,具有坚实的数学理论基础。在综合先验信息(领域知识)和数据样本信息的前提下,还可避免只使用先验信息可能带来的主观偏见。虽然很多贝叶斯网络涉及的学习问题是NP难解的。但是,由于已经有了一些成熟的近似解法,加上一些限制后计算可大为简化,很多问题可以利用近似解法求解。贝叶斯网
11、络方法的不确定性表示基本上是保持了概率的表示方式,可信度计算也是概率计算方法,只是在实现时,各具体系统根据应用背景的需要采用各种各样的近似计算方法。推理过程称为概率推理。因此,贝叶斯网络没有其它确定性推理方法拥有的确定性表示、计算、语义解释等问题。由于篇幅关系,本节只介绍贝叶斯网络的基本概念和简单的推理方法。,贝叶斯网络(事件的独立性),独立:如果X与Y相互独立,则 P(X,Y)=P(X)P(Y)P(X|Y)=P(X)条件独立:如果在给定Z的条件下,X与Y相互独立,则 P(X|Y,Z)=P(X|Z)实际中,条件独立比完全独立更重要,贝叶斯网络(联合概率),联合概率:P(X1,X2,XN)二值,
12、则有2N可能的值,其中2N-1个独立。不是二值哪?如果相互独立:P(X1,X2,XN)=P(X1)P(X2)P(XN)条件概率:P(X1,X2,XN)=P(X1|X2,XN)P(X2,XN)迭代表示:P(X1,X2,XN)=P(X1)P(X2|X1)P(X3|X2X1)P(XN|XN-1,X1)=P(XN)P(XN-1|XN)P(XN-2|XN-1XN)P(X1|X2,XN)实际应用中就是利用条件独立性的性质简化网络复杂性的。,贝叶斯网络(基本概念),贝叶斯网络:一系列变量的联合概率分布的图形表示。一个表示变量之间的相互依赖关系的数据结构;图论与概率论的结合。,贝叶斯网络(因果关系网络),假设
13、:命题S(smoker):该患者是一个吸烟者命题C(coal Miner):该患者是一个煤矿矿井工人命题L(lung Cancer):他患了肺癌命题E(emphysema):他患了肺气肿由专家给定的假设可知,命题S对命题L和命题E有因果影响,而C对E也有因果影响。命题之间的关系可以描绘成因果关系网。每一个节点代表一个证据,每一条弧代表一条规则(假设),连接结点的弧表达了有规则给出的,节点间的直接因果关系。其中,节点S,C是节点L和E的父节点或称双亲节点,同时,L,E也称为是S和C的子节点或称后代节点。,贝叶斯网络(因果关系图例),其中,节点S,C是节点L和E的父节点或称双亲节点,同时,L,E也
14、称为是S和C的子节点或称后代节点。,因果关系图例,贝叶斯网络(贝叶斯网络),贝叶斯网就是一个在弧的连接关系上加入连接强度的因果关系网络。,贝叶斯网络(图例),贝叶斯网络图例无环图和指定概率值P(A),P(B),P(B|AC),P(E|C),P(D|C),P(F|E),P(G|DEF),贝叶斯网络(图例),非贝叶斯网络图例,贝叶斯网络(定义),两个部分贝叶斯网络结构图,这是一个有向无环图(DAG:Directed Acyclic Graph),其中图中的每个节点代表相应的变量。当有向弧由节点A指向节点B时,则称:A是B的父节点;B是A的子节点。节点和节点之间的条件概率表(Conditional
15、Probability Table,CPT),也就是一系列的概率值,表示了局部条件概率分布。P(node|parents)。目的:由证据得出原因发生的概率。即观察到P(Y),求P(X|Y),贝叶斯网络(如何构造),选择变量,生成节点 从左至右(从上到下),排列节点填充网络连接弧,表示节点之间的关系得到条件概率关系表条件概率表示的概率网络有时叫“Belief Nets”,贝叶斯网络(计算),有向非循环图是各个节点变量关系传递的合理表达形式。条件概率的引入使得计算较之全连接网络有了大大的简化。CPT表相对比较容易得到。有时可以用某种概率分布表示,需要做的指示计算表示的参数。,贝叶斯网络(计算续),
16、简单的联合概率可以直接从网络关系上得到如:P(X,Y)=P(X)P(Y|X)又如:P(X,Y,Z)=P(X)P(Y)P(Z|X,Y),贝叶斯网络(例),CPT表为:P(S)=.04P(C)=0.3(E|S,C)=0.9P(E|S,C)=0.3P(E|S,C)=0.5 贝叶斯网络实例图P(E|S,C)=0.1。,贝叶斯网络(例续),上图例中的联合概率密度为由图可知:E与L在S条件下独立,所以P(E|S,C,L)P(E|S,C),L与C在S,E条件下独立,所以P(L|S,C)=P(L|S)C与S在E条件下独立,所以P(C|S)=P(C)以上三条等式的正确性,可以从贝叶斯网的条件独立属性:每个变量与
17、它在图中的非继承节点在概率上是独立的推出。同样,从后面给出的D分离的定义的特性中也可以得到相同的结论。简化后的联合概率密度为,显然,简化后的公式比原始的数学公式更加简单明了,计算复杂度低很多。如果原贝叶斯网中的条件独立语义数量较多,这种减少更加明显。,贝叶斯网络(独立),独立P(X,Y)=P(X)P(Y)P(X|Y)=P(X)P(Y|X)=P(Y)独立时求解 可以直接在网络图上求,贝叶斯网络(条件独立),对于X,Y,E:X与Y在给定E的条件下独立P(X|Y,E)=P(X|E)P(Y|X,E)=P(Y|E)多个变量组:d分离(d-separate)P(X1,X2,Xn|Y1,Y2,Ym,E1,E
18、2,Ep)=P(X1,X2,Xn|E1,E2,Ep)如果一组节点X在给定E的条件下,从Xi到Yj的每一条通路都被即Ekd分离,则称X独立于另一组节点Y(节点组E d分离X与Y),贝叶斯网络(D分离),图中有三个节点S,L,EL(结果)影响S(起因),S影响E(另一个结果)。如果给定原因S后,L并不能告诉我们有关E的更多事情。即对于S,L和E是相对独立的,那么在计算S和L的关系时就不用过多地考虑E,将会大大减少计算复杂度。称S能D分离L和E。D分离是一种寻找条件独立的有效方法。,贝叶斯网络(D分离-串行),Linear 串行连接中,事件X通过事件Z影响事件Y,反之事件Y也是通过事件Z影响事件X。
19、但是,如果原因证据Z是给定的,X并不能给Y更多的东西,或者说,从X那里得到更多的信息。此时称,如果Z是已知的,那么通道就被阻塞,X和Y就是独立的了。则称X和Y是被Z节点D分离的。,贝叶斯网络(D分离(分叉连接)),Diverging如果,父节点Z是已知的,没有更多的信息能够通过Z影响到所有子节点。同理,父节点Z是已知时,子节点X,N是相互独立的。称子节点X,N是被Z节点D分离的。,贝叶斯网络(D分离(汇集连接)),汇集(Converging)略有不同如果不从父节点得到推断,子节点Z就一无所知,那么,父节点是相互独立的,它们之间没有相互影响。如果,某事件影响了Z,那么,各个父节点就不是相互独立的
20、了。该事件可以直接影响Z,也可以通过它的后代节点影响Z。这种现象称作条件依存。总之,如果子节点有了变化,或子节点的后代节点发生变化,信息是可以通过汇集连接传播的。,贝叶斯网络(D分离(条件依存)),事件e直接影响节点Z 事件e影响节点Z的后代节点,贝叶斯网络(D分离(定义)),对于给定的结点集,如果对贝叶斯网中的结点Vi和Vj之间的每个无向路径(即不考虑DAG图中弧的方向性的路径),在路径上都有某个结点Vb,如果有属性:Vb在中,且路径上的两条弧都以Vb为尾(即弧在Vb处开始(出发),分叉连接)Vb在中,路径上的一条弧以Vb为头,一条以Vb为尾(串行连接)Vb和它的任何后继都不在中,路径上的两
21、条弧都以Vb为头(即弧在Vb处结束,汇集连接,但没有后代节点)则称Vi和Vj 被Vb结点阻塞。如果Vi和Vj被证据集合中的任意结点阻塞,则称Vi和Vj是被集合D分离,结点Vi和Vj条件独立于给定的证据集合,可形式化表示为:,或,贝叶斯网络(D分离(图示)),贝叶斯网络(定义),条件独立:如具有以上三个属性之一,就说结点Vi和Vj条件独立于给定的结点集。阻塞:给定证据集合,当上述条件中的任何一个满足时,就说Vb阻塞相应的那条路径。D分离:如果Vi和Vj之间所有的路径被阻塞,就叫证据集合可以D分离Vi和Vj,贝叶斯网络(D分离(例1)),贝叶斯网络(D分离(例2)),贝叶斯网络(D分离(例3)),
22、贝叶斯网络(D分离(例4),Radio and Ignition,given Battery?YesRadio and Start,given Ignition?YesGas and Radio,given Battery?YesGas and Radio,given Start?NoGas and Battery,given Moves?No,贝叶斯网络(推理),建立贝叶斯网络的目的有了网络。可以提出问题:P(问题|证据),如:P(吸烟|肺癌)进行概率推理与谓词逻辑有相似之处。如:患病(吸烟,肺癌)在某些场合下有有效的推理方法。有一些工具包。一般情况下是很困难的,原因不是所有的CPT表都能够
23、得到网络结构大且复杂NP-hard推理我们要做的是,将问题正确的表示为合理的网络形式,选用适合的算法。,贝叶斯网络(推理续),贝叶斯网络通常使用因果或诊断规则与推理因果规则:X Cause Y with some probability诊断规则:Y is evidence of X with some probability因果推理:Given cause C,determine P(Query|C)诊断推理:Given evidence E,determine P(Query|E),贝叶斯网络(推理续),推理需求:P(X|Y)诊断推理是从效果到起因 证据是一些征兆:X是起因,Y是征兆因果推理
24、是从起因到效果 证据是一些起因:X是征兆,Y是起因解释历史 X和Y是起因,Z是两个起因的征兆。这时可以用一个起因Y解释另一个起因X。,贝叶斯网络(推理例),下雨、草湿、洒水,贝叶斯网络(推理例续),条件:下雨草湿出现虫子 求:P(Raining|Worm Sighting),P(Y|X),下雨,草湿,Query:P(X|Z),P(X),出现虫子,P(Z|Y),贝叶斯网络(因果推理例),给定患者是一个吸烟者(S),计算他患肺气肿(E)的概率P(E|S)。S称作推理的证据,E叫询问结点。首先,E的另一个父结点(C),P(E|S)=P(E,C|S)+P(E,C|S);右边的第一项,P(E,C|S)P
25、(E,C,S)/P(S)P(E|C,S)*P(C,S)/P(S)P(E|C,S)*P(C|S)同理可得公式的右边的第二项为:P(E,C|S)=P(E|C,S)*P(C)。由此可得:P(E|S)=P(E|C,S)*P(C)+P(E|C,S)*P(C)如果采用概述中的例题数据,有P(C)=1-P(C),则有,P(E|S)0.9*0.3+0.3*(1-0.3)=0.48主要操作:按照给定证据的V和它的所有双亲的联合概率,重新表达给定证据的询问结点的所求条件概率。直到所有的概率值可从CPT表中得到,推理完成。,贝叶斯网络(推理自学),Artificial Intelligence:A New Synt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 第五 不确定性 推理

链接地址:https://www.31ppt.com/p-5662591.html