知识表达与处理方法62朱福喜.ppt
《知识表达与处理方法62朱福喜.ppt》由会员分享,可在线阅读,更多相关《知识表达与处理方法62朱福喜.ppt(94页珍藏版)》请在三一办公上搜索。
1、,第10章 知识表达与处理方法,10.1 概述,10.1.1 知识和知识表示的含义,1知识的定义知识是用人们对于可重复信息之间联系的认识,它是信息经过加工整理、解释、挑选和改造而形成的。比较有代表性的定义有:Feigenbaum:知识是经过裁剪、塑造、解释、选择和转换了的信息。Bernstein:知识由特定领域的描述、关系和过程组成。Heyes-Roth:知识=事实+信念+启发式。,在AI领域,研究知识表示方法的目的是用知识来改善程序的性能,具体表现为:利用知识来帮助选择或限制程序搜索的范围;利用知识来帮助程序识别、判断、规划与学习。AI的研究集中在如何使程序拥有知识而具有智能行为。,3智能系
2、统中的知识,要使计算机系统具有智能,一般来说至少应使系统拥有以下几个方面的知识:关于对象(Object)的知识,如火山、人。知识表示应能表示各种知识对象以及对象的类型、性质等。事件(Event),能表示事件的时序,因果关系等,如:天下雨,火山在一定条件下会爆发等。行为(Performance),如何写文章,如何造句,如何证明定理等。元知识(Metaknowledge),是关于知识的知识,即什么是知识,以及如何运用知识。,10.1.2 AI中知识表示方法分类,AI中知识表示方法注重知识的运用,所以将知识表示方法粗略地可分为以下两大类。1过程式知识表示(procedure)过程性知识是一般是表示如
3、何做的知识,是有关系统变化、问题求解过程的操作、演算和行为的知识。这种知识是隐含在程序之中的,机器无法从程序的编码中抽取出这些知识。过程式知识表示描述表示控制规则和控制结构的知识,给出一些客观规律,告诉怎么作。,.陈述式知识表示(declarative),陈述式知识描述系统状态、环境和条件,以及问题的概念、定义和事实。陈述式知识表示描述这种事实性知识,描述客观事物所涉及的对象是什么,有时有必要给出对象之间的联系。它的表示与知识运用(推理)是分开处理的。这种知识是显式表示的,如:isa(John,man)isa(ABC,triangle)cat(a,b)cat(b,c)cat(c,a),10.1
4、.3 AI对知识表示方法的要求,从知识利用上讲,衡量知识表示方法可以从以下三个方面考察:便于获取,便于表示新知识,并以合适方式与已有知识相连接。便于搜索,在求解问题时,能够较快地在知识库中找出有关知识。因此,知识库应具有较好的记忆组织结构。便于推理,要能够从已有知识中推出需要的答案或结论。,10.1.4 知识表示要注意的问题,理想的内部表示要能真实的直接反映外部世界的事实,内部知识表示与自然语言和外部世界三者之间的关系可用下图描述。,10.2 逻辑表示法,逻辑是一种比较常见的知识表示法,在人工智能领域中,很早就使用一阶谓词逻辑来表示知识。一阶谓词逻辑是一种形式语言,其根本目的在于把数学中的逻辑
5、论证进行符号化,使我们能够采用数学演绎的方式,证明一个新的语句(或断言)是从哪些已知正确的语句推导出来的,从而也就这个新语句也是正确的。,例10.1 已知命题公式集合s可以转化为如下2条子句。起大风(5日)起大风(x日)天气变冷(x+1)日)根据是否可以推断6日天气要变冷呢?可以用如下的反证法予以证明。首先假设6日天气不会变冷,用公式表示为 天气变冷(6日),逻辑表示法的主要优点:自然。逻辑表示法是人们对问题直观理解的一种描述,易于被人们接受。明确。逻辑表示法对如何表示事实以及如何表示事实之间的复杂关系有明确的规定。灵活。逻辑表示法把知识和知识处理的方法有效地区分开来了,使得在使用知识时,无需
6、考虑程序处理知识的细节问题。模块化。各条知识都是相对独立的,容易模块化,添加、删除、修改知识的工作比较容易。,10.3产生式表示法,1943年美国数学家波斯特(Post)首先提出的产生式系统(production system),产生式是指类似于AAa的符号变换规则。产生式系统的广泛使用主要有两点理由:用产生式系统结构求解问题过程和人类求解问题的思维过程很相像,因而可以用来模拟人们求解问题时的思维过程。人们可以把产生式当作人工智能系统中的一个基本的知识结构单元。,10.3.1 产生式系统的组成,产生式系统由全局数据库(Global Database)、产生式规则集(Set of Product
7、 Rules)和控制策略(Control Strategies)三部分组成。各部分之间的关系如图3-3所示。,全局数据库是产生式系统所使用的主要数据结构,它存放输入的事实和问题状态以及所求解问题的所有信息,包括推理的中间结果和最后结果。全局数据库中的数据根据应用的问题不同,可以是常量、变量、谓词、表结构、图像等等。全局数据库中的数据是产生式规则的处理对象。,规则集是某领域知识的用规则形式的表示的集合,规则用产生式来表示。规则集包含将问题从初始状态转换到目标状态的那些变换规则。规则的一般形式为:条件行为 或 前提结论用一般计算机程序语言表示为:if then,控制策略或控制系统是规则的解释程序,
8、它规定了如何选择一条可应用的规则对全局数据库进行操作,即决定了问题求解过程或推理路线。控制策略负责产生式规则前提或条件语全局数据库中数据的匹配,按一定的策略从匹配超过的规则(可能不止一条)中选出一条加以执行(执行规则行为部分规定的操作,或得到规则结论部分描述的结论),并在合适的时候结束产生式系统的运行。,10.3.2 产生式系统的知识表示,产生式系统的知识表示方法,包括事实的表示和规则的表示。1.事实的表示(1)孤立事实的表示 孤立事实通常用三元组(对象,属性,值)或(关系,对象,对象)表示,其中对象就是语言变量。,若要表示老王、老张是朋友,则可表示成(friend,Wang,Zhang)如果
9、增加不确定的度量,可增加一个因子表示两人友谊的可信度。如(friendship,Wang,Zhang,0.8)可理解为王、张二人友谊的可信度为0.8。,(2)有关联事实的表示 a.树型结构在MYCIN霉菌素系统中表示事实用的是四元组,为了查找的方便,它把不同的对象(即上下文)按层次组成一种上下文树。,b.网状结构在PROSPECTOR(探勘者;采矿者)探矿系统中,整个静态知识以语义网络的结构把相关的知识连在一起,这样就使查找更加方便了。PROSPECTOR将不同对象的矿石按子集和成员关系组成一个网络。网络最左分支表示“方铅矿是硫化铅的成员,硫化铅是硫化矿的子集,而硫化矿又是矿石的子集”。其中s
10、表示子集关系,表示y是x的子集;e表示成员关系,表示y是x的成员。,2.规则的表示(1)单个规则的表示 对于单个规则一般由前项和后项两部分组成。前项由逻辑连接词组成各种不同的前提条件;后项表示前提条件为真时,应采取的行为或所得的结论。如果考虑不精确推理,则可考虑附加可置信度量值。MYCIN规则中,无论前项或后项,其基本部分是关联三元组(特性对象取值)或一个谓词加上三元组。,MYCIN系统中的规则定义为:=(IF THEN ELSE)其中各部分的定义分别为:=(AND)=(OR|()=()=|=(),具体的MYCIN规则以及它在机器内部用LISP 语言的表示。MYCIN系统中有如下所示的一个典型
11、规则:前提条件:细菌革氏染色阴性 形态杆状 生长需氧结论:该细菌是肠杆菌属,CF=0.8。,采用LISP表达式描述为:PREMISE:($AND(SAME CNTXT GRAM GRAMNEG)(SAME CNTXT MORPH ROD)(SAME CNTXT AIR AEROBIC)ACTION:(CONCLUDE CNTXT CLASS ENTEROBACTERIACEAE肠杆菌科 TALLY 0.8),SAME,$AND,CONCLUDE为自定义的函数SAME(C,P,LST)的3个自变量分别是上下文C,临床参数(特性)P,P的可能取值LST。SAME谓词函数的取值是根据其自变量对象-特
12、性-取值所表达内容的置信度,取0.21.0之间任一数值,当置信度CF0.2时取为NIL。$ANDconditioncondition也是特殊的谓词函数,与LISP中系统定义的函数AND不同,其取值范围与SAME函数类似。TALLY是规则的置信度。,(2)有关联规则间关系的表示在知识库(规则库)中某些规则常按某种特征组织起来放在一起,形成某种结构。这样既便于规则库的维护管理,也方便于规则的使用。a.规则按参数分类在MYCIN中每一项特性(临床参数)设有一种专门的特征表如:,IDENT:属细菌属性PROP-ORG CONTAINED-IN:(RULE 030)EXPECT:(ONE OF(ORGA
13、NISMS)LABDATA:T LOOKAHEAD:(RULE004,RULE054,RULE168)PROMPT:(Enter the identity(genus)of*)TRANS:(THE IDENTITY OF*)UPDATED-BY:(RULE021,RULE003,,lookahead:指明哪些规则的前提涉及该参数。update-by:指出从哪些规则的行为部分可存取该参数。EXPECT:指出该参数的取值范围,如(YN)指取值是或否;LABDATA:指出该参数是否为实验的原始数据,若为T,则在推理时可向用户提问,索取该参数;,PROMPT:为MYCIN向用户显示的提示符,其中*号表
14、示在提问的过程中可用当前涉及的上下文替代的内容;TRANS:为便于人机对话,指出如何将该参数的内容翻译成英语表达式。,b.规则的网状结构 规则之间可以以各种方式相互联系,当某一规则的结论正好是另一规则的前提或前提的一部分时,这两个规则就形成了一种“序关系”。如果用箭头表示这种序关系,在规则之间就形成了一种复杂的网状结构。例10.2 PROSPECTOR系统中由不同规则所形成的部分推理网络图如图3-6所示,这是Kuroko-型均匀结构的硫化矿沉积的部分矿床模型。,10.3.3 产生式系统的推理方式,1.正向推理 正向推理是从已知事实出发,通过规则库求得结论,称为数据驱动方式,也称作自底向上的方式
15、。推理过程是:规则集中规则的前件与数据库中的事实进行匹配,得到匹配的规则集合;从匹配规则集合中选择一条规则作为使用规则;执行使用规则,将该使用规则后件的执行结果送入数据库。重复这个过程直到达到目标。,例10.3 动物识别系统IDENTFIER包含有如下规则:规则I2如果该动物能产乳,那么它是哺乳动物。规则I8如果该动物是哺乳动物,它反刍,那么它是有蹄动物而且是偶蹄动物。规则I11 如果该动物是有蹄动物,它有长颈,它有长腿,它的颜色是黄褐色,它有深色斑点,那么 它是长颈鹿。,根据规则,假如已知某个动物产乳,依规则I2可以推出这个动物是哺乳动物。如果再知该动物反刍时,依规则I8又可以推出该动物有蹄
16、且是偶蹄动物,于是得到新的事实:该动物是有蹄动物。再加上该动物有长腿、长颈等事实,利用规则I11,可以推出该动物是长颈鹿。,2.逆向推理,逆向推理是从目标(作为假设)出发,逆向使用规则,找到已知事实。逆向推理过程如下:规则集中的规则后件与假设的目标事实进行匹配,得到匹配的规则集合。从匹配规则集合中选择一条规则作为使用规则。将使用规则的前件作为新的假设子目标。重复这个过程,直至各子目标均为已知事实后成功结束。,3.双向推理,双向推理,又叫混合推理,既自顶向下,又自底向上,从两个方向作推理,直至某个中间界面上两个方向的结果相符便成功结束。不难想象这种双向推理较正向推理或逆向推理所形成的推理网络来得
17、小,从而推理效率更高。例如,在动物识别系统中,已知某动物具有特征:长腿、长颈、反刍、产乳。为了识别一个动物,可以进行以下的双向推理.,10.3.4 产生式规则的选择与匹配,通常搜索策略的主要任务是确定如何选取规则的方式和方法。选择规则的基本方式有两种:()不考虑给定问题所具有的特定知识。()考虑问题领域可应用的知识。选择规则的方法可以使用匹配。,1.规则的匹配,匹配方式有如下几种:(1)用索引匹配 对全局数据库Gd(Global database)加索引,再通过映射函数找出相应的规则。例如:自动情报检索系统,将用户需求输入到Gd,其中的关键词作为索引。如用作者名为索引,则利用已知作者名找书的规
18、则;用书名为索引,则利用已知书名找书的规则。,(2)变量匹配 例如,符号积分,使用规则:udvuv-vdu,而系统实际求积分时,要查找Gd中xdy 的形式,要求x与u,y与v匹配。(3)近似匹配 在匹配中,有大部分条件符合或接近符合,则可认为规则匹配。,2规则的选取,在匹配之后,可用规则如果有若干条,如何选择哪一条来执行?在不考虑利用启发式知识的情况下,有如下一些原则可用于规则地选择。(1)专用与通用性排序,如果某一规则的条件部分比另一规则的条件部分所规定的情况更为专门化,则更为专门化的规则优先使用。那么如何确定哪个规则更专门化呢?下面用实例说明。,例10.4 美式足球训练规则:pr1:If
19、是第四次开始进攻(Fourth down)且进攻方前三次进攻中前进的距离少于10码 then 可以在第四次进攻时踢悬空球pr2:If 是第四次开始进攻(Fourth down)且进攻方前三次进攻中前进的距离少于10码)且进攻位置在对方球门线30码之内 then 可以射门(field goal),以上两个规则,pr2比pr1更专门化,因为pr2条件限制更多一些。通常的判定方法是:如果某一规则的前件集包含另一规则的所有前件,则前一规则较后一规则更为专门化。如果某一规则中的变量处在第二规则中是常量,而其余相同,则后一规则比前一规则更专门化。,(2)规则排序,通过对问题领域的了解,规则集本身就可划分优
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 知识 表达 处理 方法 62 朱福喜

链接地址:https://www.31ppt.com/p-5805622.html