逻辑推理-人工智能.ppt
《逻辑推理-人工智能.ppt》由会员分享,可在线阅读,更多相关《逻辑推理-人工智能.ppt(93页珍藏版)》请在三一办公上搜索。
1、人工智能,不确定性推理(1),不确定性,不确定环境下的行动概率公理使用全概率分布进行推理独立性贝叶斯法则及其应用,不确定性(Uncertainty),定义行动 At=航班起飞前 t 分钟启程前往机场;问:At 能不能及时使agent赶上飞机?A180 是一个可靠的行动,如果所选路线上没有交通事故、没有交通管制、汽车没有出故障、没有沙尘暴,等等,等等。(A1440 或许是个一定不会耽误飞机的计划,不过要在机场过夜)逻辑方法使得Agent在得到关于环境的足够多事实时,使得行动计划得到保证。但是,没有任何agent能够获得关于其环境的全部事实。,FOL与不确定性,FOL能够处理不确定性吗?医学专家系
2、统:p Symptom(p,Toothache)Disease(p,Cavity)?引起牙痛的原因:牙洞?穷举牙洞与牙痛有必然联系吗?失败的原因:懒惰(laziness):failure to enumerate exceptions,qualifications,etc.无知(ignorance):lack of relevant facts,initial conditions,etc.,不确定环境下的决策,基本思想:精确度和有效性的折中理性决策的含义既依赖于各种目标的相对重要性,也依赖于这些目标将被实现的可能性(程度)。假设A180理性决策,这意味着在给定所处的环境信息下,它是所有可执行
3、的规划中智能体的性能度量期望达到最大的那个。性能度量:及时赶上飞机、等待时间不长,,不确定环境下的决策,例如:给出行动及其成功的概率如下:P(A25 gets me there on time|)=0.04 P(A90 gets me there on time|)=0.70 P(A120 gets me there on time|)=0.95 P(A1440 gets me there on time|)=0.9999 该选哪一个行动?例如,取决于成功的几率以及等待时间的折中。必须考虑效用理论(Utility theory)决策论概率论效用论Decision theory=probabil
4、ity theory+utility theory,不确定性,不确定环境下的行动概率公理使用全概率分布进行推理独立性贝叶斯法则及其应用,概率理论(Probability theory),Agent的知识提供的最多是关于语句的信度(degree of belief)。概率论可以处理我们的惰性和无知。概率是宇宙的真实方面:它是物体的行为表现为特定方式的倾向,而不仅仅是对观察者信心的描述。概率与证据:在评估语句的概率时,必须指出有关证据。Agent获得新的信息后,其概率评估应该更新。先验概率、后验概率,先验概率,与命题a相关的无条件概率,在没有任何其它信息存在的情况下,关于命题的信度,记为:P(a)
5、。例如,用P(weather)表示天气的概率:P(weather sunny)0.7P(weather rain)0.2P(weather cloudy)0.08P(weather snow)0.02先验概率分布:P(weather)联合概率分布,全联合概率分布概率密度函数,后验(条件)概率,得到与命题a相关的变量的证据,先验概率失效,需要以后验概率替代,记为:P(a|b)例如:P(cavity|toothache)0.7乘法规则:P(a b)P(b|a)P(a),概率公理(Axioms of probability),对任意命题 A,B:0 P(A)1P(true)=1,P(false)=0
6、P(A B)=P(A)+P(B)-P(A B),Kolmogorov公理,不确定性,不确定环境下的行动概率公理使用全概率分布进行推理独立性贝叶斯法则及其应用,联合概率分布,联合概率分布(joint probability distribution):表中catch是指由于牙医的钢探针不洁而导致的牙龈感染对任何命题,其概率是所有原子证据事件概率的和:P()=:P(),联合概率分布(枚举),Start with the joint probability distribution:For any proposition,sum the atomic events where it is true:
7、P()=:P()P(toothache)=0.108+0.012+0.016+0.064=0.2,Start with the joint probability distribution,Can also compute conditional probabilities:P(cavity|toothache)=P(cavity toothache)P(toothache)=0.016+0.064 0.108+0.012+0.016+0.064=0.4,联合概率分布(枚举),归一化(Normalization),(Denominator)-1 normalization constant P
8、(Cavity|toothache)=P(Cavity,toothache)=P(Cavity,toothache,catch)+P(Cavity,toothache,catch)=+=General idea:compute distribution on query variable by fixing evidence variables and summing over hidden variables.,不确定性,不确定环境下的行动概率公理使用全概率分布进行推理独立性贝叶斯法则及其应用,独立性(Independence),A 与 B 独立,当且仅当P(A|B)=P(A)or P(B|
9、A)=P(B)or P(A,B)=P(A)P(B)例如:P(Toothache,Catch,Cavity,Weather)=P(Toothache,Catch,Cavity)P(Weather)32 entries reduced to 12(weather has 4 possible values);for n independent biased coins,O(2n)O(n)绝对独立很好但很少见,例如牙科中可能涉及几百相互关联的变量,这时候如何处理?,条件独立(Conditional independence),已知有一个牙洞,钻具感染与牙疼的概率相互独立:钻具感染与牙痛在给定牙洞的情
10、况下是条件独立的conditionally independent P(Toothache,Catch|Cavity)=P(Toothache|Cavity)P(Catch|Cavity),条件独立,推导联合分布,将全联合分布分解成很多更小的分布:P(Toothache,Catch,Cavity)=P(Toothache,Catch|Cavity)P(Cavity)乘法法则=P(Toothache|Cavity)P(Catch|Cavity)P(Cavity)条件独立I.e.,2+2+1=5 independent numbers条件分布将联合分布的表示空间由指数级降到线性。条件概率是处理不确
11、定信息的基础和最鲁棒的形式。,不确定性,不确定环境下的行动概率公理使用全概率分布进行推理独立性贝叶斯法则及其应用,贝叶斯法则(Bayes Rule),由乘法法则 P(ab)=P(a|b)P(b)=P(b|a)P(a)Bayes rule:P(a|b)=P(b|a)P(a)/P(b)一般形式:P(Y|X)=P(X|Y)P(Y)/P(X)=P(X|Y)P(Y)例子:用于从病因(causal)中找到诊断(diagnostic)结论:P(Cause|Effect)=P(Effect|Cause)P(Cause)/P(Effect)E.g.,let M be meningitis,S be stiff
12、neck:P(m|s)=P(s|m)P(m)/P(s)=0.8 0.0001/0.1=0.0008,贝叶斯法则与条件独立,P(Cavity|toothache catch)=P(toothache catch|Cavity)P(Cavity)=P(toothache|Cavity)P(catch|Cavity)P(Cavity)This is an example of a nave Bayes(朴素贝叶斯)model:P(Cause,Effect1,Effectn)=P(Cause)iP(Effecti|Cause)Total number of parameters is linear i
13、n n,贝叶斯网络,1 贝叶斯网络概述2 贝叶斯网络的语义3 贝叶斯网络中的精确推理4 贝叶斯网络的近似推理,概率公式,条件概率公式,乘法公式,全概率公式,边缘化与条件化,联合概率分布边缘化(求和消元)P(toothache)=0.108+0.012+0.016+0.064=0.2条件化:,贝叶斯法则,由乘法法则 P(ab)=P(a|b)P(b)=P(b|a)P(a)Bayes rule:P(a|b)=P(b|a)P(a)/P(b)一般形式:更通用版本(条件化):,贝叶斯网络的由来,随机方法?每个状态值取决于前面有限个状态,如Markov链。在现实生活中,很多事物相互的关系并不能用一条链来串起
14、来;它们之间的关系可能是交叉的、错综复杂的。如疾病的起因,故障的原因等。,贝叶斯网络的由来,全联合概率计算复杂性十分巨大;变量之间的独立性和条件独立性能大大减少为了定义全联合概率分布所需的概率数目。需要一种自然、有效的方式来根据不确定性知识推理贝叶斯网络;,贝叶斯网络的定义,贝叶斯网络(Bayesian network)是一个有向图,其中每个节点都标注了定量概率信息:一个随机变量集合组成网络节点,变量可以是离散的或者连续的;一个连接节点对的有向边或者箭头的集合,如果存在从节点X指向节点Y的有向边,则称X是Y的一个父节点;每个节点都存在一个条件概率分布P(Xi|Parent(Xi),量化父节点对
15、该节点的影响;图中不存在有向环(是有向无环图DAG)。,简单例子,表示前例中条件独立的拓扑网络:Weather is independent of the other variablesToothache and Catch are conditionally independent given Cavity,贝叶斯网络的表示 防盗网,条件概率表,每个节点旁的条件概率表(简称CPT)中的值对应一个条件事件的概率如P(A)=0.94=P(A|BurglaryEarthquake);条件事件是父节点取值的一个可能组合;每行的概率之和应为1(表中只给出了为真的情况,为假的概率应为1-p);一个具有k
16、个布尔父节点的布尔变量的条件概率表中有2k个独立的可指定的概率(注意概率值是独立的);没有父节点的节点的概率只有1行,为先验概率。,0.700.01,t f,P(M),A,贝叶斯网络的概率解释,任何完整的概率模型必须具有表示(直接或间接)该领域变量联合分布的能力,完全的枚举需要指数级的规模(相对于领域变量个数);贝叶斯网络提供了这种联合概率分布的紧凑表示:分解联合分布为几个局部分布的乘积:,贝叶斯网络的概率解释,从公式可以看出,需要的参数个数随网络中节点个数呈线性增长,而联合分布的计算呈指数增长。网络中变量间独立性的指定是实现紧凑表示的关键。独立性在通过人类专家构造贝叶斯网中特别有效。,贝叶斯
17、网络,1 贝叶斯网络概述2 贝叶斯网络的语义3 贝叶斯网络中的精确推理4 贝叶斯网络的近似推理,贝叶斯网络的语义,贝叶斯网络给出了关于相关事件的完整描述,通过计算全联合概率分布求取联合分布中的某项是对每个变量赋予一个特定值情况下的合取概率就是条件概率表中适当元素的乘积例子 P(jmabe)=P(j|a)P(m|a)P(a|be)P(b)P(e)=0.90*0.70*0.001*0.999*0.998=0.00062,一种贝叶斯网络构建方法,乘法规则:P(x1,x2,xn)=P(xn|xn-1,x1,)P(xn-1,x1,)链式法则(chain rule):P(Xi|Xi-1,X1)=P(Xi|
18、Parent(Xi)Parent(Xi)Xi-1,X1初始的合取概率化为更小的条件概率和更小的合取式 这些条件概率的合取式实际上就是父节点到子节点的概率乘积。父子节点的关系使得贝叶斯网络具有局部结构化的特性,即每个节点只和数量有限的其它部分产生直接的相互作用,贝叶斯网络的构造 防盗网,Burglary,Earthquake,MaryCalls,JohnCalls,Alarm,P(m|j,a,b,e)=P(m|a),紧致性与节点顺序,贝叶斯网络的局部结构化(locally structed)每个随机变量可以至多受到k个其它随机变量的影响(k=常数);设网络中有n个节点(随机变量),指定每个条件概
19、率表所需信息量至多为2k个数据,则整个网络可以用n2k个数据完全描述/而全联合概率分布需要2n个数据.比较:n=30,k=5.构造贝叶斯网络的次序:添加节点首先从“根本原因”开始,然后加入受其直接影响的变量,直到叶节点(不影响任何其它节点)。,Suppose we choose the ordering M,J,A,B,EP(J|M)=P(J)?,Example,Suppose we choose the ordering M,J,A,B,EP(J|M)=P(J)?NoP(A|J,M)=P(A|J)?P(A|J,M)=P(A)?,Example,Suppose we choose the or
20、dering M,J,A,B,EP(J|M)=P(J)?NoP(A|J,M)=P(A|J)?P(A|J,M)=P(A)?NoP(B|A,J,M)=P(B|A)?P(B|A,J,M)=P(B)?,Example,Suppose we choose the ordering M,J,A,B,EP(B|A,J,M)=P(B|A)?Yes(JohnCalls and MaryCalls increase the chance of alarm.)P(B|A,J,M)=P(B)?NoP(E|B,A,J,M)=P(E|B)?P(E|B,A,J,M)=P(E|A,B)?,Example,Suppose we
21、 choose the ordering M,J,A,B,EP(J|M)=P(J)?No P(A|J,M)=P(A|J)?P(A|J,M)=P(A)?NoP(B|A,J,M)=P(B|A)?YesP(B|A,J,M)=P(B)?NoP(E|B,A,J,M)=P(E|B)?NoP(E|B,A,J,M)=P(E|B,A)?Yes(P(E|B,A)P(E|A)P(E|B,A,J,M)=P(E|A)?No,Example,Example contd.,Network is less compact:1+2+4+2+4=13 numbers neededDeciding conditional inde
22、pendence is hard in noncausal directions(Causal models and conditional independence seem hardwired for humans!),条件独立关系,贝叶斯网络中节点相互独立(下面两个定义等价):(1)给定父节点,一个节点与它的非后代节点是条件独立的;(2)给定一个节点的父节点、子节点以及子节点的父节点(Markov blanket),这个节点对于其它节点都是条件独立的。图示,例子,条件独立关系图示,给定父节点,一个节点与它的非后代节点是条件独立的JohnCall,给定一个节点的父节点、子节点以及子节点的父
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 逻辑推理 人工智能

链接地址:https://www.31ppt.com/p-6434845.html