第三章5不确定推理课件.ppt
1,3.8.2 关于结论的不确定性,关于结论的不确定性也叫做规则的不确定性,它表示当规则的条件被完全满足时,产生某种结论的不确定程度。,3.8.3 多个规则支持同一事实时的不确定性,基于模糊集理论的方法基于概率论的方法,3.8 不确定性推理,2,基本概念,1.什么是不确定性推理?2.为什么要研究不确定性推理?3.不确定性的表示和度量4.不确定性的计算5.不确定性推理方法的分类,3,基本概念(1/5),什么是不确定性推理?不确定性推理是建立在非经典逻辑上的一种推理,是对不确定性知识的运用与处理是从不确定性的初始证据出发,通过运用不确定性的知识,最终推出既保持一定程度的不确定性,又是合理和基本合理的结论的推理过程。例如:A发生的概率是0.7,A发生后B发生的概率是0.8。则A发生引起B发生的概率是0.7*0.8=0.56,4,基本概念(2/5),为什么要研究不确定性推理?日常生活中含有大量的不确定的信息ES系统中大量的领域知识和专家经验,不可避免的包含各种不确定性。,5,不确定性推理方法研究产生的原因,很多原因导致同一结果推理所需的信息不完备背景知识不足信息描述模糊信息中含有噪声规划是模糊的推理能力不足解题方案不唯一,例如,多种原因引起同一种疾病。发烧可能因为感冒,也可能因为得了肺炎,需要进一步的知识才能作出具体判断。,6,不确定性推理方法研究产生的原因,很多原因导致同一结果推理所需的信息不完备背景知识不足信息描述模糊信息中含有噪声规划是模糊的推理能力不足解题方案不唯一,勘探得到的地质分析资料不完备,7,不确定性推理方法研究产生的原因,很多原因导致同一结果推理所需的信息不完备背景知识不足信息描述模糊信息中含有噪声规划是模糊的推理能力不足解题方案不唯一,疾病的发病原因不十分明确。,8,不确定性推理方法研究产生的原因,很多原因导致同一结果推理所需的信息不完备背景知识不足信息描述模糊信息中含有噪声规划是模糊的推理能力不足解题方案不唯一,如他不高不矮,今天不冷不热等等。在这类描述中,通常无法以一个量化的标准来描述,所描述的事物通常处在一个大致的范围。比如,认为身高在165cm174cm之间的男士符合不高不矮的描述。,9,不确定性推理方法研究产生的原因,很多原因导致同一结果推理所需的信息不完备背景知识不足信息描述模糊信息中含有噪声规划是模糊的推理能力不足解题方案不唯一,噪声的存在干扰了人们对本源信息的认知,从而加大了认知上的难度。如语音信号、雷达信号中的噪音干扰带来的信息模糊。,10,不确定性推理方法研究产生的原因,很多原因导致同一结果推理所需的信息不完备背景知识不足信息描述模糊信息中含有噪声规划是模糊的推理能力不足解题方案不唯一,当需要对某个问题域进行划分时,可能无法找到一个清晰的标准。如根据市场需求情况调节公司产品的内容和数量。,11,不确定性推理方法研究产生的原因,很多原因导致同一结果推理所需的信息不完备背景知识不足信息描述模糊信息中含有噪声规划是模糊的推理能力不足解题方案不唯一,必须考虑到实现的可能性,计算复杂度,系统性能。如计算机的实现能力,推理算法的规模扩大能力有限等,12,不确定性推理方法研究产生的原因,很多原因导致同一结果推理所需的信息不完备背景知识不足信息描述模糊信息中含有噪声规划是模糊的推理能力不足解题方案不唯一,没有最优方案,只有相对较优方案。不实施,不能做出最后判断。,13,一个人工智能系统,由于知识本身的不精确和不完全,采用标准逻辑意义下的推理方法难以达到解决问题的目的。对于一个智能系统来说,知识库是其核心。在这个知识库中,往往大量包含模糊性、随机性、不可靠性或不知道等不确定性因素的知识。为了解决这种条件下的推理计算问题,不确定性推理方法应运而生。由于人类认识水平的客观限制,客观世界的很多知识仍不为人们所认知。不精确思维并非专家的习惯或爱好所至,而是客观现实的要求。在人类的知识和思维行为中,精确性只是相对的,不精确性才是绝对的。知识工程需要各种适应不同类的不精确性特点的不精确性知识描述方法和推理方法。,14,师氏食狮史,石室诗士施氏,嗜狮,誓食十狮。氏时时适市视狮。十时,适十狮适市。是时,适施氏适市。氏视是十狮,恃矢势,使是十狮逝世。氏拾是十狮尸,适石室。石室湿,氏使恃拭石室。石室拭,氏始试食是十狮尸。食时,始识是十狮尸,实十石狮尸。试释是事。,15,知识的不确定性,难于用精确的概念来描述事物 eg 高与不高 比秃子多一根头发的人仍是秃子专家系统中的不确定性表现在证据或事实的不确定性,第二是规则的不确定性,第三是推理的不确定性。,秃子悖论,16,关于证据的不确定性,证据的歧义性证据的不完全性证据的不精确性证据的模糊性证据的可信性证据的随机性,同意总理开会I saw a man with a telescope,身高大约1.70米,年轻,如果乌云密布且电闪雷鸣,则很可能要下暴雨。,17,关于规则的不确定性,构成规则前件的模式的不确定性观察证据的不确定性规则前件的证据组合的不确定性规则本身的不确定性规则结论的不确定性,Eg 如果患者发高烧且常流清鼻涕,则患者感冒,牛顿定律宏观正确微观不适合,18,推理的不确定性,推理的不确定性是指:由于证据和规则的不确定性在推理过程中的动态积累和传播而导致推理结论的不确定性。需要采用某种不确定性的测度,并能在推理过程中来传递和计算这种不确定性的测度,最终得到结论的不确定性测度。根据不确定性测度计算方法的不同,不确定推理可以有基于概率理论的不确定推理,基于可信度理论的不确定推理和基于模糊理论的不确定推理.,19,研究和发展,Shortliffe等人1975年结合MYCIN系统的建立提出了确定性理论。DURA等人1976在PROSPECTOR的基础上给出了概率法。Dempster Shafter同年提出证据理论,Zadeh两年后提出了可能性理论,1983年提出了模糊逻辑。,20,基本概念(3/5),表示问题:即采用什么方法描述不确定性.一般有数值表示和非数值的语义表示方法.计算问题:主要指不确定性的传播和更新,也即获得新信息的过程.主要包括:已知C(A),AB f(B,A),如何计算C(B)已知C1(A),又得到C2(A),如何确定C(A)如何由C(A1),C(A2)计算C(A1A2),C(A1A2)语义问题:指的是上述表示和计算的含义是什么,如何进行解释.,21,不确定性的度量是指不确定的程度。根据不同的需要,往往采用不同的数据和方法来度量知识、证据和结论不确定性的程度,同时还需要事先规定它的取值范围。在确定一种量度方法及其范围时,应注意以下几点:(1)量度要能充分表达相应知识及证据不确定性的程度。(2)量度范围的指定应便于领域专家及用户对不确定性的估计。(3)量度要便于对不确定性的传递进行计算,而且对结论算出的不确定性量度不能超出量度规定的范围。(4)量度的确定应当是直观的,同时应有相应的理论依据。,22,不确定性的计算主要指不确定性的传递和更新,也即获得新信息的过程。主要包括如下三个方面:1)不确定性匹配算法及阈值的选择 目前常用的解决方法是,设计一个算法用来计算匹配双方相似的程度,另外再指定一个相似的“限度”,用来衡量匹配双方相似的程度是否落在指定的限度内。如果落在指定的限度内,就称它们是可匹配的,相应知识可被应用,否则就称它们是不可匹配的,相应知识不可应用。上述中,用来计算匹配双方相似程度的算法称为不确定性匹配算法,用来指出相似的“限度”称来阈值。,基本概念(4/5),23,2)组合证据的不确定性算法 知识的前提条件既可以是简单条件,也可以是用合取或析取把多个简单条件连接起来构成的复合条件。进行匹配时,一个简单条件对应于一个单一的证据,一个复合条件对应于一组证据,称这一组证据为组合证据。目前,用的较多的有如下3种:(1)最大最小法 C(E1 AND E2)=minC(E1),C(E2)C(E1 OR E2)=maxC(E1),C(E2)(2)概率方法 C(E1 AND E2)=C(E1)C(E2)C(E1 OR E2)=C(E1)+C(E2)-C(E1)C(E2)(3)有界方法 C(E1 AND E2)=max0,C(E1)+C(E2)-1 C(E1 OR E2)=min1,C(E1)+C(E2)上述的每一组公式都有相应的适用范围和适用条件。,24,3)不确定性的传递算法 求解问题时,一般都需要通过多步推理才能得出结论,并求出结论的不确定性。在这一过程中,不确定性是逐步传递的。因此,为了得到最终结论的不确定性,必须设计不确定性的传递算法。在不同的系统中,由于面向的领域问题有不同特性,所采用不确定性的表示方法不同,因而所用的算法也不一样。不确性的传递一般包括两个子问题:一是在每一步推理中,如何把证据及知识的不确定性传递给结论;二是在多步推理中,如何把初始证据的不确定性传递给最终结论。,对于第一个子问题,在不同的不确定推理方法中所采用的处理方法各不相同,这将在下面的几节中分别进行讨论。对于第二个子问题,各种方法所采用的处理方法基本相同,即把当前推出的结论及其不确定性量度作为证据放入数据库中,供以后推理使用。,25,4)结论不确定性合成 推理中有时会出现这样一种情况:用不同知识进行推理到得到了相同结论,但不确定性程度却不相同。此时,需要用合适的算法对它们进行合成。若有n条独立的证据i(i=1,2,n),分别求得结论H的不确定性为Ci(H)。则所有证据i的组合导致结论H的不确定性C(H),即定义算法g,使得 C(H)=gC1(H),C2(H),Cn(H)在不同的不确定性推理方法中所采用的合成算法g各不相同,这将在以下的各节中分别予以讨论。,26,基本概念(5/5),不确定推理方法的分类形式化方法:在推理一级扩展确定性方法.逻辑方法:是非数值方法,采用多值逻辑、非单调逻辑来处理不确定性新计算方法:认为概率方法不足以描述不确定性,出现了确定性理论,主观贝叶斯方法,证据理论和模糊逻辑等新概率方法:在传统的概率框架内,采用新的计算工具以确定不确定性描述非形式化方法:在控制一级上处理不确定性如制导回溯、启发式搜索等等,27,不确定性推理方法可分为形式化方法和非形式化方法。形式化方法是对确定性推理方法的扩展,它包括逻辑法、新计算法和新概率法。逻辑法是非数值方法,它采用多值逻辑和非单调逻辑来处理不确定性。新计算法认为一般的概率方法不足以描述不确定性,从而出现了确定性理论、主观贝叶斯方法和证据理论等方法。新概率法则试图在传统的概率论框架内,采用新的概率计算方法以适应不确定性描述。非形式化方法则是指启发性方法,通过在控制上处理不确定性,但对不确定性没有给出明确的概念。,28,常见不确定性推理方法的基本思想,信念网络()信息网络也称贝叶斯网络,是由 年给出的,属于证据推理中的贝叶斯家族,使用概率论方法。信念网络是无圈有向图(),其中结点都是变元,弧表示相关变元间的依赖关系。变元有一些取值对应于互不相同的假设或观察。依赖性强度由条件概率确定。由于通常的概率推理计算量很大,信念网络理论试图利用问题中的独立性信息减少计算量。信念网络提供了一种有效机制利用和检测独立性,从而为古老的概率推理注入了新的活力。该方法现已广泛应用,成为最有影响的不确定性推理方法。沿着这一思路,提出了概率相似性网络理论,相似性网络可以利用更多的独立性信息。,29,确定因子方法()在专家系统出现之前,概率论、证据理论和模糊集合论已经得到很大发展。当专家系统研究开始时,研究人员试图发展适合于基于规则的知识密集型系统不确定性管理方案。年代早期,提出了著名的确定因子方法,并用于处理系统中的不确定性信息。在系统中,知识库是一组形如:证据()假设的规则组成,其中,表示在给定观察下假设的可信度。可信度可以通过两个函数计算:()(,)。其中,(,)表示:证据成立时,假设相信程度的增加;(,)表示:证据成立时,假设被怀疑程度的增加。的值,表示的否定被确认,表示被确认。值得指出的是,证明了确定因子的原始定义与其综合函数是不协调的,并且提出了确定因子的一种概率解释。指出的修正确定因子理论是理论的一个特殊情形。,30,主观贝叶斯方法主观贝叶斯方法最早用于探矿专家系统的设计。主观贝叶斯方法除了使用通常的贝叶斯公式外,还使用一种变形的贝叶斯公式来计算在给定观察下某一假设成立的概率。新的公式基于更多的条件独立性假设。,31,证据理论证据理论又称理论,最早由 在年代提出,年代经 发展成现在的形式。证据理论的提出旨在解决概率论推理的两上困难:概率论不能很好地表示无知,一个信念与其否定的主观概率之和为。事实上,概率论推理的两个困难是有密切联系的:无知使得我们对某一命题及其否定的相信程度之和可能不为;而和不为说明信念中有无知。证据理论用两个数值信任度和似然度来表示不确定性,信任度相当于概率的下界,似然度相当于概率的上界。,32,可能性理论可能性理论是基于模糊集合论提出的一种不确定性推理方法,后经和等人发展,成为一种重要的推理方法。可能性理论能处理模糊不确定性和不完全信息,其表示不确定性信息的手段是使用可能性度量和必然性度量。尽管从度量上看,可能性理论的度量是证据理论度量的特例,但是这不等于说可能性理论是证据理论的一个特例。事实上,可能性理论具有自己的传播、修正手段,它所处理的对象是带有模糊性的信息。,33,粗略集理论粗略集理论是 年提出的一种处理不确定性的方法。该理论特别适合于处理知识获取过程中的不致性。在粗略集理论中,计算一个划分的上、下似是基本的研究问题。基于上、下近似,两组不同的规则集就可以算出来,这就是确定性规则和可能性规则。确定性规则可以使用经典逻辑进行演算。可能性规则由一些数据(其中可能有冲突)支持。可能性可以使用经典逻辑或者任何一种不确定处理方法进行处理。该方法的一个优点是确定性规则和可能性规则可以分开来处理,另一个优点是不需关于数据的定量化信息。,34,非单调推理经典的非单调推理方案主要研究在信息或知识不完全情况下如何推出一些合理的可错的结论问题。因此,非单调推理属于定性不确定性推理的范畴。由于大多数非单调推理方案缺乏信念强度的评价手段,因此非单调推理与其它不确定性推理的结合研究逐渐活跃起来。,35,不确定性推理方法,确定性理论主观贝叶斯方法证据理论,36,一.确定性理论,1975年,肖特里菲(E.H.Shortliffe)提出一种不确定性推理方法,并应用于专家系统MYCIN。它以产生式作为知识表示方法,以确定性因子或称可信度作为不确定性的度量。,37,1.知识的不确定性表示,规则以AB表示,其中前提A可以是一些命题的合取或析取。可信度CF(B,A)作为规则不确定性度量,它的作用域为-1,1。定义4.11 规则AB,结论B的可信度被定义为,CF(B,A)的定义借用了概率,但它本身并不是概率。因为CF(B,A)可取负值,CF(B,A)+CF(B,A)不必为1甚至可能为0。,38,定义4.12 CF(B,A)=MB(B,A)-MD(B,A)其中MB为信任增长程度,当MB(B,A)0时,有P(B|A)P(B),表示证据A的出现增加了对B的信任程度。MD为不信任增长程度,当MD(B,A)0时,有P(B|A)P(B),表示证据A的出现增加了对B的不信任程度。定义4.13,39,对于同一个证据A,若存在n个互不相容的假设Bi(i=1,2,n),则,因此,若发现专家给出的可信度CF(B1,A)=0.6,CF(B2,A)=0.7,即出现B1和B2互不相容,则说明规则的信度是不合理的,应当进行适当调整。,40,在确定性的逻辑推理过程中,前提(规则A B的左部A,也就是证据)要么为真,要么为假,不允许不真不假的情况出现。但是在很多不确定性推理问题中,前提或证据本身是不确定的,介于完全的真和完全的假之间。为了描述这种不确定性的程度,引入了证据的可信度。,2.证据的不确定性表示,41,在推理过程中,不可避免要计算原始证据的与、或、非,还要计算多条规则的使用对计算结果的综合影响。于是,在已知规则和原始证据的可信度度量的情况下,如何计算新的组合证据或规则的不确定性,就成了很关键的问题。在不确定性的传播与更新中,必须解决证据的与、或、非的不确定性计算问题。(1)组合证据的不确定性算法 CF(A1A2An)=minCF(A1),CF(A2),CF(An)CF(A1A2An)=maxCF(A1),CF(A2),CF(An)(2)证据“非”的计算 CF(A)-CF(A)(3)不确定性的传递算法:根据证据和规则的可信度求其结论的可信度。若已知CF(B,A)和证据的可信度CF(A),则结论的可信度CF(B)为 CF(B)=CF(B,A)max0,CF(A),3.推理算法,42,(4)多个独立证据推出同一假设的合成算法 如由规则A1B求得CF1(B),又使用规则A2B时,如何更新CF2(B)。或说已知CF(A1),CF(A2)以及CF(B,A1),CF(B,A2)来寻求合成的CF(B)。依(1)先计算出 CF1(B)CF(B,A1)max0,CF(A1)CF2(B)CF(B,A2)max0,CF(A2)进而规定,43,在MYCIN系统基础上形成的专家系统工具EMYCIN,对上式中的其他情况做了如下修改。在其他情况下,CF(B)的更新计算,也可这样来理解。已知CF(A),CF(B,A),B原来的可信度为CF(B),来求B的可信度更新值CF(B|A)。这时的计算可写成当CF(A)=1时,有,44,EMYCIN系统中,其他情况下时,当CF(A)0,可以CF(A)CF(B,A)作为对规则AB的可信度,而CF(B|A)的计算仍可使用CF(A)=1时的公式。但CF(A)0时,规则AB可不使用,像MYCIN系统规定CF(A)0.2就认为是不可使用的前提。,45,4.对CF定义的改进 可信度直观上应满足下述性质:(1)CF(B,A,e)=CF(B,A)独立性(2)CF(B,A1,A2)=CF(B,A2,A1)组合交换性(3)若CF(A,A)=1则CF(B,A)=CF(B,A)有序组合性 其中,e是在已知证据A之前出现的证据。,46,二.主观贝叶斯方法,1.知识的不确定性表示 定理4.9 设事件A1,A2,A3,An中任意两个事件都不相容,则对任何事件B有下式成立:,该定理就叫Bayes定理,上式称为Bayes公式。其中P(A)和P(B)分别是A和B的先验概率,P(B|A)是A为真时B真的条件概率,P(A|B)是B为真时A真的条件概率。如果直接使用Bayes公式做度量,计算P(A|B)则需要已知P(B|A)。为避开这个困难,由此主观Bayes方法被提出来。,47,对规则AB的不确定性用(LS,LN)来描述。其中 称为充分性度量,表示事件A的出现对其结果B的支持。称为必要性度量,表示事件A的不出现对B的影响。,48,下面分析一下LS和LN的意义。先建立几率函数,表示的是证据X的出现概率与不出现概率之比,显然随P(X)的增大O(X)也增大,而且 P(X)=0 时 O(X)=0 P(X)=1 时 O(X)=这样,取值0,1的P(X)就放大为取值0,的O(X)。不难验证 O(B|A)=LSO(B)(4-8)O(B|A)=LNO(B)(4-9),49,由于,与,相比就得到,这就是O(B|A)=LSO(B)相仿地也可得O(B|A)=LNO(B)由这两个公式可看出,LS表示A真时,对B为真的影响程度,表示规则AB成立充分性。LN表示A假时,对B为真的影响程度,表示规则AB成立的必要性。,50,2.证据的不确定性表示 就以O(A)或P(A)表示证据A的不确定性,转换公式是,虽然几率函数与概率函数有着不同的形式,但变化趋势是相同的。当A为真的程度越大(P(A)越大)时,几率函数的值也越大。由于几率函数是用概率函数定义的,所以在推理过程中经常需要通过几率函数值计算概率函数值时,可用如下等式:,(4-10),51,3.推理算法(1)当A必然出现即P(A)=1,可直接使用 O(B|A)LSO(B)O(B|A)=LNO(B)以求得使用规则AB后,O(B)的更新值O(B|A)和O(B|A)。若需要以概率表示,再由(4-10)式,计算出P(B|A)和P(B|A)。,52,(2)当A是不确定的,即P(A)1时,需作如下考虑。设A代表与A有关的所有观察,对规则AB来说,P(B|A)=P(B|A)P(A|A)+P(B|A)P(A|A)(4-11)问题是当P(B|A),AB(LS,LN)以及P(B)已知时,如何更新P(B)或说寻求P(B|A)。当P(A|A)=1时,证据A必然出现,则有,当P(A|A)=0时,证据A必然不出现。,53,当P(A|A)=P(A)时,也即观察A对A无影响。有 P(B|A)=P(B|A)P(A)+P(B|A)P(A)=P(BA)+P(BA)=P(B)这样可确定P(A|A)分别为0,P(A)和1时相应的P(B|A)的值,线性插值图如图4-10所示。,图4-10 线性插值图,54,(3)当存在两个证据时,P(A1A2|A)=minP(A1|A),P(A2|A)P(A1A2|A)=maxP(A1|A),P(A2|A)(4)若A1B,A2B,而A1与A2相互独立,对A1,A2的有关观察分别为A1,A2便有,(4-15),55,三.证据理论,该理论采用信任函数而不是概率作为不确定性度量,通过对一些事件的概率加以约束来建立信任函数而不必说明精确的难于获得的概率,当这种约束限制为严格的概率时,证据理论就退化为概率论了。,56,1.证据理论的形式化描述 证据理论是用集合表示命题。设U是变量x所有取值的集合,且U中各元素是互斥的。在任一时刻x都取且仅能取U中的某一个元素为值,则称U为x的样本空间。在证据理论中,U的任何一个子集A都对应一个关于x的命题,称该命 题为“x的值在A中”。在证据理论中,可分别用概率分配函数、信任函数和似然函数等概念来描述和处理知识的不确定性。,57,1)概率分配函数 定义4.14 设U为样本空间,领域内的命题都由U的子集表示,则概率分配函数定义如下:设M:0,1,而且满足M()=0,则称M是 上概率分配函数,M(A)为A的基本概率函数。M(A)表示证据对U的子集成立的一种信任的度量,取值于0,1,而且 中各元素信任的总和为1。,58,2)信任函数 定义4.15 信任函数Bel:0,1为,Bel(A)=,即A的信任函数的值,是A的所有子集的基本概率分配函数值的和,用来表示对A为真的信任程度。可以证明,信任函数有如下性质:(1)Bel()=0,Bel(U)=1,且对于 中的任意元素A,0Bel(A)1。(2)信任函数为递增函数。即若A1A2U,则Bel(A1)Bel(A2)。(3)Bel(A)+Bel(A)1(A为A的补集),59,3)似然函数 定义4.16 似然函数 Pl:0,1 Pl(A)=1-Bel(A)其中,A=U-A。Pl(A)表示不否定A的信任度,是所有与A相交的子集的基本概率分配函数值的和。,似然函数有如下性质:(1)Pl(A)=,(2)Pl(A)Bel(A)(3)Pl(A)+Pl(A)1,60,4)Dempster组合规则 定义4.17 设M1和M2是两个概率分配函数,则其正交和M=M1M2为 M()=0;,其中,定义4.18 设M1,M2,Mn是n个概率分配函数,则其正交和M=M1M2Mn为M()=0;,其中,61,5)一种特殊的概率分配函数 如果对4-14定义的概率分配函数加上不同的限制,就可得到不同的较为特殊的概率分配函数。下面介绍一种特殊的概率分配函数。设D=s1,s2,sn,在D上按如下定义概率分配函数:(1)M(si)0 对任何siD(2),(3)M(D)=1-,(4)当AD且|A|1或|A|=0时,M(A)=0,62,由上述定义可知,只有单个元素组成的子集的情况下,其概率分配函数值才有可能大于0,有一个以上元素组成的子集的概率分配函数值均为0。对任何命题AD,其信任函数和似然函数分别为,Pl(A)=1-Bel(A)=M(D)+Bel(A),Pl(D)=1-Bel(D)=1-Bel()=1从上面定义可知,对于任何AD及BD均有Pl(A)-Bel(A)=Pl(B)-Bel(B)=M(D)它表示对A或B不知道的程度,=1,63,利用Pl和Bel可以定义A的类概率函数f。定义4.19 A的类概率函数定义为 其中,|A|与|D|分别表示A 和U中元素的个数。由定义4.19,可以证明f(A)具有如下性质:(1)f()=0(2)f(U)=1(3)对于AU,有0f(A)1。,64,2.知识的不确定性表示 在证据理论中知识用如下的规则表示 IF A THEN B=b1,bn CF=c1,cn 其中,A为条件,即可以是简单条件,也可以是多个子条件的逻辑组合;B为结论,b1,bn为该子集的元素;CF为规则强度,也用集合形式表示,bi与ci一一对应(i=1,2,n)。3.证据的不确定性表示 不确定性证据A的确定性用CER(A)表示。对于初始证据,其确定性由用户给出;对于用前面推理所得结论作为当前推理的证据,其确定性由推理得到。CER(A)的取值范围为0,1,即0CER(A)1。当条件A为多个子条件的合取或析取得组合时,A=A1A2An,则A的确定性 CER(A)=minCER(A1),CER(A2),CER(An)A=A1A2An,则A的确定性 CER(A)=maxCER(A1),CER(A2),CER(An),65,3.推理算法 结论B的确定性可以通过以下步骤求出:(1)求出B的概率分配函数 对于规则IF A THEN B=b1,b2,bn CF=c1,c2,cn则概率分配函数为:M(b1,b2,bn)=CER(A)c1,CER(A)c2,CER(A)cn 如果有两条规则支持同一结论B即 A1B=b1,b2,bn CF=c1,ck A2B=b1,b2,bn CF=c1,ck 则首先分别对每一条规则求出的概率分配函数:M1(h1,h2,hn)M2(h1,h2,hn)然后再用公式M=M1M2,求出B的概率分配函数。如果有n个规则支持同一结论B,则用公式M=M1M2Mn,求出B的概率分配函数。,66,(2)求出Bel(B),Pl(B)和f(B)(3)按如下公式求B的确定性CER(B)CER(B)=MD(B/A)f(B)其中MD(B/A)是条件部分与证据匹配度,定义为,67,21世纪人工智能研究的一个新方向:不确定性人工智能不确定性人工智能的基础科学问题不确定性的计算机模拟,68,不确定性:,随机性模糊性不完全性不稳定性不一致性,不确定性的魅力!,随机性和模糊性的关联性,69,确定性和不确定性,精确数学是描述确定性规律的;概率论是揭示随机现象的统计规律性,是对精确数学的突破,但不排斥概率统计模型可能转化为精确数学模型去处理;模糊集和粗糙集是揭示模糊现象的亦此亦彼的规律性,是对精确数学的突破,但不排斥模糊学模型可能转化为概率统计模型甚至精确数学模型去处理;随机性和模糊性是不确定性的两个方面,确定值可以被看作是不确定性的特例。,70,自然界中的不确定现象,随机模糊混沌分形复杂网络,2023/4/3,71,对不确定性现象的研究,并不一定非要分别从随机性和模糊性入手去认识,也不一定非要去区分随机体现在那里,模糊在哪里。,72,混沌,混沌是一种确定性系统中出现的类似随机的过程。因为很难对初值确定得非常精确,近似相同的初值产生很不相同的貌似随机的结果。初值敏感性导致过程的不确定性和不可预测性。,73,自动控制理论起始于20世纪20年代,经历了经典控制理论、现代控制理论和智能控制理论三个发展阶段。经典控制理论主要研究线性定常系统,解决单输入单输出问题,采用传递函数、频域法等方法,最终实现对系统的指定目标控制。到了60年代,由于航天技术的需要,诞生了现代控制理论,主要研究多输入多输出系统,及非线性系统等,主要采用系统辨识理论、状态空间法等。经典控制理论和现代控制理论统称为传统控制理论,其共同特点是必须对被控对象或被控对象的系统行为建立数学模型。,74,随着科学技术的不断进步和工业生产的不断发展,人们发现,许多现代军事和工业领域所涉及的被控过程和对象都难于建立精确的数学模型,甚至根本无法建立数学模型。如指挥自动化的效能评估、社会经济系统等。特别是对过程任务的控制时,传统控制理论遇到的最大困难就是不确定性问题。一种是系统模型的不确定性,是指系统本身,包括过程和环境,具有许多未知因素和不确定因素,无法建立数学模型,如炼钢炉内温度的控制。(送料、受潮、气压等);另一种不确定性是环境本身的不确定性,主要是指环境与被控对象(过程)间存在着因果关系的强相互作用的场合,如连续生产过程和离散产品加工,这时,环境的变化不能被视为随机干扰。,75,现代工业控制系统是高度复杂的系统,主要表现在:系统结构和参数具有高维性,时变性;传感器和执行器数量大;信息结构复杂,需要处理的数据量庞大等等。为提高社会和经济效益,往往提出多样性的高性能控制目标,如降低成本和能耗,提高产品质量等,然而多样性的高性能要求往往是相互矛盾的,如何实现有效综合,不仅要求生产过程控制自动化,而且希望实现生产与经营管理的综合自动化。对于与控制对象有强相互作用,非结构化和不确定的环境,传统控制理论常常显得无能为力,而促使人们去探索控制理论的新途径。于是,智能控制应运而生。,76,混沌,蝴蝶效应:亚马逊河热带雨林中的一只蝴蝶扇动了两下翅膀,可能两周之后会引发美国德克萨斯州的一场龙卷风。“失之毫厘,差之千里”。初始条件的微小的差别能引起结果的巨大的差异。,77,英国海岸线有多长?,78,欧几里得几何学的研究对象是具有特征长度的几何物体:一维空间:线段,有长度,没有宽度;二维空间:平行四边形,有周长、面积;三维空间:球,表面积、体积;自然界中很多的物体具有特征长度,诸如:人有高度、山有海拔高度等。有一类问题却比较特别,曼德布罗特Mandelbrot就提出了这样一个问题:英国的海岸线有多长?,79,也许你会认为,这个问题太简单了,要测量海岸线那还不容易,利用地图或航空测量都能获得答案。但是,1967年在国际权威的美国科学杂志上发表了一篇划进代的的论文,它的标题就是英国的海岸线有多长?统计自相似性与分数维数中,文章作者曼德布罗(Beonit Mandelbrot)是一位当代美籍法国数学家和计算机专家,当时正在纽约的IBM公司的活特生研究中心工作,而他的答案却让你大吃一惊:他认为,无论你做得多么认真细致,你都不可能得到准确答案,因为根本就不会有准确的答案。英国的海岸线长度是不确定的!它依赖于测量时所用的尺度,80,81,英国海岸线有多长?,82,认知的尺度,83,复杂网络:Internet,84,视觉的不确定性:,85,视觉的错觉:,86,认知的不确定性:,87,思维的不确定性,思维有精确的一面,更有不 确定的一面。人类习惯于用自然语言进行思维,思维的结果往往是可能如何、大概如何等定性的结论。人类还擅长通过联想的、直觉的、创造的形象思维来思考,很少象计算机一样做精确的数学运算或者逻辑推理,但是这并不妨碍人类具有发达的、灵活的智能,并不妨碍人类具有发达的、灵活的模式识别能力。,88,模式识别(人脸识别)的不确定性,身份识别表情识别性别识别年龄识别性格识别人种识别.,89,文字识别:,内容识别写字人身份识别性别识别年龄识别风格(性格)识别字体识别.,90,手语(Sign language)识别:,内容识别图形识别身份识别年龄识别风格识别.,91,声音识别:,内容识别说话人身份识别性别识别年龄识别性格识别字体识别.,语调(情感)识别音乐识别方言识别语种识别.,92,纹理识别:,静态纹理指纹脸纹声纹皮、石、木、布纹草地、森林、海滩.,动态纹理海浪喷泉烟雾云彩瀑布.,93,三、不确定性人工智能的基础科学问题,94,不确定性人工智能的基础科学问题:,不确定性知识的形式化表达问题,即不确定性知识的表示问题。,不确定性知识的最好表示,就是使用自然语言表示!要研究自然语言基元的定性定量转换模型,给出不确定性转换模型的形式化方法。,95,研究人类认知活动的切入层次,人脑亚细胞的化学、电学层次,人脑的神经构造层次,自然语言层次,数学语言层次,符号语言层次,脑科学,神经科学,不确定性人工智能,数学,传统人工智能,96,基本理念:,人脑的思维基本上不是纯数学的;自然语言具有不可替代性;自然语言中的基元是语言值,它对应的概念,是人类思维的基本细胞。数据和概念之间的转换是不确定性人工智能研究的基石。,97,不确定性的度量熵,热力学熵 dS=dQ/T 熵增加原理玻尔兹曼熵 分子运动的无序程度和混乱程度仙农熵 H=-k Pi log Pi拓扑熵云模型中的熵和超熵,98,云模型(Cloud model),定性和定量转换模型在众多的不确定性中,随机性和模糊性是最基本的。针对概率论和模糊数学在处理不确定性方面的不足,1995年我国工程院院士李德毅教授在概率论和模糊数学的基础上提出了云的概念,并研究了模糊性和随机性及两者之间的关联性。自李德毅院士等人提出云模型至今短短的十多年,其已成功的应用到数据挖掘、决策分析、智能控制等众多领域。,99,云发生器和逆向云发生器,100,正态云模型的数学解释http:/,101,正态分布和正态隶属函数是正态云的特例。,102,云滴的概率密度分布函数:,103,期望Ex是云在论域空间分布的期望,是最能够代表定性概念的点,或者说是这个概念量化的最典型样本;熵En代表定性概念的可度量粒度,熵越大,通常概念越宏观,也是定性概念不确定性的度量,由概念的随机性和模糊性共同决定.一方面,En是定性概念随机性的度量,反映了能够代表这个定性概念的云滴的离散程度;另一方面,又是定性概念亦此亦彼性的度量,反映了在论域空间可被概念接受的云滴的取值范围;超熵He是熵的不确定性度量,即熵的熵,由熵的随机性和模糊性共同决定。,云滴分布的期望:Ex,104,云滴的方差:,105,云滴的隶属度的不确定性,根据算法产生的确定度Y有的概率密度为与云模型的三个特征参数无关!,106,“云滴的确定度和数字特征无关”的含义,任何定性概念,尽管它们各自有不同的实际含义,即概念的量化值云滴在数域的分布有不同的物理量纲,也尽管所有云滴表现出不同的确定度,不同的人会有不同的认识,不同的时期也会有不同的认识,但是确定度的统计分布,总体上是同一个形态。语言值表示的概念,抛弃它们具体的物理含义,反映在人们脑海中的认知规律是一致的。认知的不确定性中仍然有着确定的规律性,即认识上的共同性。,107,正态分布的前提:,中心极限定理从理论上阐述了正态分布的条件,中心极限定理的简单直观说明:如果决定某一随机事件结果的是大量微小、独立的随机因素之和,并且每一因素的单独作用相对均匀的小,没有一种因素起到主导作用,那么这个随机变量服从正态分布。,108,正态云模型弱化了正态分布的前提条件,决定不确定现象的随机因素单独作用不是 非常均匀地小;各因素相互之间不完全独立;用超熵衡量偏离正态分布的程度,将 正态分布扩展为“泛正态”。,109,论正态云模型的普适性 中国工程科学2004年第6卷第8期 P28-34,110,概念的粒度和粒度计算:用熵作为概念的粒度,进行粒度计算;在不同尺度上的概念,反映了确定性和不确定性之间的转换。,111,四、不确定性的计算机模拟,112,数据场方法实现从感知到记忆到印象,感知,视觉,记忆,记忆随时间而淡忘形成的印象,=0.1,=0.8,=1.2,=1.5,=0.5,2023/4/3,113,随着时间的推移,印象中的爱因斯坦只剩下一双深邃的眼睛,而印象中萨达姆也只剩下那浓密的胡子。,记忆的不确定性:记忆随时间而淡忘形成的印象,114,厌恶 愤怒 快乐 轻蔑 悲伤 恐惧 惊讶,标准像,对一个人不同表情的记忆形成标准像,115,哭脸,笑脸,哭笑不得,3分笑7分哭,7分笑3分哭,势场图,混合势场图,逆变换后的像素图,像素图,116,用场运算急剧降维提取主特征,(a)人脸128*128个象素特征(b)48个重要特征点 128*128 48!,117,影响因子对特征点提取