粗糙集理论的基本概念.ppt
《粗糙集理论的基本概念.ppt》由会员分享,可在线阅读,更多相关《粗糙集理论的基本概念.ppt(225页珍藏版)》请在三一办公上搜索。
1、人的分类能力是对事物的认识能力,是一种知识。从认知科学的观点来理解知识,知识可以被理解为对事物的分类能力及知识的分类能力可用知识系统的集合表达形式来描述。知识在不同的范畴中有许不同的含义。粗糙集理论认为,知识直接与真实或抽象世界的不同分类模式联系在一起。知识被看作是关于论域的划分,是一种对对象进行分类的能力。,第2章 粗糙集理论的基本概念2.1知识与知识库,定义1.1(知识和概念(范畴或信息粒)设U是给定研究对象的非空有限集合,称为一个论域。论域U的任何一个子集X U,称为论域U的一个概念或范畴。论域U的一个划分X1,X2,Xn(概念簇)称为关于U的抽象知识,简称知识。为了规范化,我们认为空集
2、也是一个概念,称为空概念。在粗糙集理论中,主要讨论的是那些能够在论域U上形成划分或覆盖的知识。,我们知道U的划分X1,X2,Xn与U上的等价关系R一一对应,即给定U的一个划分X1,X2,Xn等同于给定U上的一个等价关系R,从数学的角度讲,关系的表示和处理比分类的表示和处理简单得多,因此,我们通常用等价关系或关系来表示分类及知识。因此知识也可以定义为,设R是U上的一个等价关系,U/R=X1,X2,Xn 表示R产生的分类,称为关于U的一个知识。通常情形下,我们在问题求解的过程中,处理的不是论域U上的单一划分(知识或分类),而是论域U上的一簇划分,这导致了知识库的概念。,定义1.2(知识库)U为给定
3、的一个论域,S是U上的一簇等价关系,称二元组K=(U,S)是关于论域U上的一个知识库或近似空间。因此,论域上的等价关系就代表着划分和知识。这样,知识库就表示了论域上的由等价关系(这里指属性特征及其有限个的交)导出的各种各样的知识,即划分或分类模式,同时代表了对论域的分类能力,并隐含着知识库中概念之间存在的各种关系。,定义2.3(不可分辨关系(不分明关系)给定一个论域U和U上的一簇等价关系S,若PS,且P,则P(P中所有等价关系的交集)仍然是论域U上的一个等价关系,称为P上的不可分辨关系,记为IND(P),也常简记为P。而且,,这样,U/IND(P)=xIND(P)|xU 表示与等价关系IND(
4、P)相关的知识,称为知识库K=(U,S)中关于论域U的P-基本知识(P-基本集)。在不可能产生混淆的情况下,即P,U和K都明确时,为了简便,我们可用P代替IND(P)。用U/P代替U/IND(P),IND(P)的等价类也称为知识P的基本概念或基本范畴。事实上,P基本范畴拥有知识P的论域的基本特征,换句话说,他们是知识的基本模块。特别地,如果QS,则称Q是关于论域U的Q-初等知识,Q的等价类为知识S的Q初等概念或初等范畴。我们用IND(K)=IND(P)|P S表示知识库K=(U,S)中所有等价关系,他对于集合的交运算是封闭的。任意有限个P-基本范畴的并,称为P-范畴;知识库K=(U,S)中所有
5、的范畴称为K-范畴。,定义2.4(两个知识库的关系)设K1=(U,S1)和K2=(U,S2)为两个知识库,如果IND(S1)=IND(S2),即U/IND(S1)=U/IND(S2),则称知识库K1与K2是等价的,记为K1K2或者S1S2。因此当两个知识库有同样的基本范畴集时,这两个知识库中的知识都能使我们确切的表达关于论域的完全相同的事实。这就意味着可以用不同的属性集对论域的对象进行描述,以表达关于论域完全相同的知识。如果IND(S1)IND(S2),我们称知识库K1(知识S1)比知识库K1(知识S2)更精细,或者说K2(知识S2)比K1(知识S1)更粗糙。当S1比S2更精细时,我们也称S1
6、为S2的转化,或S2为S1的泛化。泛化意味着将某些范畴组合在一起,而特化则是将范畴分割成更小的概念。如果上述两种情形都不满足,则称两个知识库不能比较粗细。,表2.1积木的信息表,2.2粗糙集的基本定义及其性质,其中,X,Y为论域U的子集,符号“”表示集合的补运算。,例2.3如表2.2(一个决策表)所示,对于属性子集(等价关系)P=头疼,肌肉疼请判断论域的一个子集合X=e2,e3,e5是否为P的粗糙集。若不是,请说明理由;若是,请求出X的P-下近似集,上近似集,边界域,正域,负域.表2.2 例2.3中的一个医疗诊断决策表,2.3粗糙集的特征粗糙集的数字特征1.集合的近似精度和粗糙度定义2.7(近
7、似精度和粗糙度)给定一个论域U和U上的一个等价关系R,,称等价关系R定义的集合X的近似精度和粗糙度分别为,集合(范畴或概念)的不精确性是由于边界域的存在而引起的,集合的边界域越大,其精确性则越低。,反应了在知识R下对于集合X表达的范畴了解的程度。显然,对每一个R和,X的R-边界域为空集,所以集合X是R-可定义的(R-精确集);当 1时,集合X有非空R-边界域,,所以集合X是R-不可定义的(R-粗糙集);,X的R-粗糙度与精度恰恰相反,它反映了我们在知识R下对于集合X表达的范畴了解的不完全程度。,当X为空集时,我们规定,例2.6 给定一个知识库K=(U,S)和知识库中一个等价关系RIND(K),
8、它导出的等价类如下:Y1=x1,x4,x8,Y2=x2,x5,x7,Y3=x3,Y4=x6。其中,论域U=x1,x2,x8。试计算下列集合的R-近似精度和粗糙度,其中,,直观上看,粗糙集理论对事情的不精确性表述不需要任何假定的先验知识,而只是依赖于所给定的知识表达系统,通过上、下近似算子直接计算得到的,这一点与概率论和模糊集合论是完全不同的。从粗糙集理论的角度看,客观事物的不精确性是由于我们所掌握知识的有限性所导致,换句话说,是由对事物所包含对象的分类能力有限的结果所引起的。因此,人们在没有任何先验知识的条件下,可以通过分类的手段来处理不精确的数值特征,进而表示概念得精确程度。,2.近似分类精
9、度和近似分类质量,定理 2.8 给定一个论域U和其上的一个等价关系(知识)R,其对应的划分或商集为,。如果,,都有,成立,则对于任意,,都有,至此,我们已经介绍了两种刻画粗糙集的方法。其一为用近似程度的精确度来表示粗糙集的数字特征;其二为用粗糙集的分类表示粗糙集的拓扑特征。粗糙集的数字特征表示了集合边界域的大小,但没有说明边界域地结构;而粗糙集的拓扑特征没有给出边界域大小的信息,它提供的是边界域的结构。此外,粗糙集的数字特征和粗糙集的拓扑特征之间存在一种关系。首先,如果集合为内不可定义或全不可定义,则其精度为0;其次,当集合为外不可定义或全不可定义时,则它的补集的精度为0。这样,即使知道了集合
10、的近似精度,我们也不能确定它的拓扑结构;反过来,集合的拓扑结构也不具备精度的信息。,因此,在粗糙集的实际应用中,我们需要将边界域的两种信息结合起来,既要考虑近似精度因素,也要考虑到集合的拓扑结构。下面再通过一个例子来说明这两种表示之间的关系。例 2.17 给定一个知识库,和一个等价关系,.其中论域为,且R的等价类为:,试计算和讨论下列集合的数字特征和拓扑特征。,解:(1)对集合,下近似,上近似,因为,是R-可定义集,,边界域,近似精度,(2)对集合,下近似,上近似,而言:,因为,,同时,边界域,近似精度,(3)对集合,下近似,上近似,根据定义2.12可知,集合X3为R-内不可定义。,近似精度,
11、所以X2是R-粗糙可定义。,边界域,(4)对于集合,下近似,上近似,根据定义2.12可知,集合X4为R-外不可定义。,(5)对于集合,下近似,上近似,根据定义2.12可知,集合X5为R-全不可定义;,近似精度,边界域,近似精度,边界域,2.4 粗糙集中的隶属关系 在集合论中,成员与集合的隶属关系(成员关系)是所有关系中最基本的关系。对隶属关系的分析是我们进行计算、推理的基础。本节主要介绍粗糙集中的隶属关系。,粗糙集合论的成员关系,定义2.14给定一个知识库(近似空间)(,),其中,为论域上的等价关 系簇或单个的等价关系。,则定义,(.),为元素关于知识的隶属于集合粗糙隶属度,也称为集合的-粗糙
12、隶属函数,其中,|表示集合的基数,xR表示元素关于知识R的等价类。,注:在粗糙集理论中,隶属度函数(成员关系)依赖于我们的知识R,即一个对象是否属于一个集合依赖于我们所掌握的知识R,成员关系并不是绝对的。,性质2.4 粗糙集理论中成员关系(隶属度函数)的性质,值越大说明对象x属于集合X的程度就越高。当,时,表明对象x依据知识R判断肯定不属于集合X;当,时,表明对象x依据知识R判断肯定属于集合X;当隶属度,时,表明对象x依据知识R判断有可能属于集合X,同时也有可能不属于集合X,即对象x落入集合X的-边界域。这足以说明集合X的模糊性完全是由边界域不空引起的。,(2)对象x依据知识R判断肯定属于集合
13、,对象x依据知识R判断可能属于集合,对象x依据知识R判断肯定不属于集合,就是集合X的特征函数。,提供的不可区分关系,是一个等价关系。,是论域U中两两互不相交的集合组成的集合簇,则xU,其隶属度函数定义为,(2.17),我们可以利用粗糙隶属度函数来定义粗糙集合论的基本概念,例如上近似、下近似、边界域、正域、负域等。定义 2.15 给定一个论域U和U上的一个等价关系R,xU,我们如下定义集合X的R-下近似集,R-边界域,R-正域,R-负域。,由此可以看出,粗糙集定义的两种方法都是强调粗糙集概念的各个方面。由近似定义诱导出粗糙集的拓扑结构,而隶属度函数的方法则强调它的数值性质,用概率论术语可以解释为
14、:,在粗糙集理论中,一个对象是否隶属于某一集合(概念),不是该元素的客观性质,而且取决于我们对它的了解程度,即知识的分类能力。这更符合人类的认知过程。,.粗糙集中的集合关系,.集合的粗糙包含关系粗糙集合论的基本概念之一是粗糙包含关系。类似地,我们可以通过上近似和下近似来定义粗糙包含关系。,显然,集合的包含关系不同于集合的粗糙包含关系,下面给出一个例子来描述粗糙包含关系。,性质2.5粗糙包含关系的性质,2.5.2 集合的粗糙相等关系 集合的粗糙相等不同于一般的相等关系。在许多实际问题的求解过程中,我们利用所掌握的知识很难判断两个范畴之间是否完全相同,通常只能够判断两者之间是否存在较大的差异(粗糙
15、不等)或较小的差异或极小的差异或极其微小的差异(粗糙相等,也就是说两个范畴的特征之间只有微小的差异)。有时,可能还要分别考虑概念的正例、反例之间存在的关系,这可以通过下粗相等或上粗相等关系来刻画。集合的粗糙相等关系对实际问题的求解有应用价值。下面将介绍这些内容。,实际上,集合的粗糙相等关系主要是比较集合的拓扑结构,而不是集合的元素。在一个给定的知识库中,基于不同的知识,两个集合可能是精确相等,也可能是粗糙(近似)相等,或许是粗糙不相等。从粗糙集的观点看,集合的相等是一个相对概念,不是绝对的,它与我们所掌握的知识、或者说对事物的了解程度密切相关。综上所述,粗糙集的基本性质,诸如成员的隶属关系、集
16、合的包含关系、集合的相等关系等都是相对的,都与我们所掌握的知识R相关。因此,在这样的意义下,可以认为粗糙集的方法是经典集合论方法的主观认识。,2.6 知识约简 知识约简在智能信息或数据的处理中占有十分重要的地位,也是粗糙集理论的核心内容之一。一般来讲,知识库中的知识(属性或等价关系)并不是同等重要的,甚至其中某些知识是不必要的,或者说是冗余的。所谓的知识约简是指在保持知识库的分类能力不变的条件下,删除其中不必要的知识。本节主要介绍知识的约简和核,还包括概念簇的约简。2.6.1 知识的约简与核 知识约简中有两个最基本的概念:约简(reduction)与核(core)。由于它涉及知识的独立性,所以
17、我们先介绍知识独立性的定义。,如果对每一个RP,R都为P中必要的,则称P为独立的,否则称P是依赖的或不独立的。定理2.10 如果知识P是独立的,GP,则G一定也是独立的。,定义2.19(知识的约简)给定一个知识库K=(U,S)和知识库上的等价关系PS,对任意的GP,若G满足以下两条:(1)G是独立的,(2)IND(G)=IND(P)。则称G是P的一个约简,记为GRED(P),其中,RED(P)表示P的全体约简组成的集合。显然,知识的任何一个约简与知识本身对知识库中的任意一个范畴的表达都是等同的,即它们对论语的分类能力相同。一般而言,知识的约简不唯一,可以有多种约简。,定义2.20(知识的核)给
18、定一个知识库K=(U,S)和知识库上的一族等价关系PS,对任意的RP,若R满足 IND(P-R)IND(P),(2.24)则称R为P中必要的,P中所有必要的知识组成的集合称为P的核,记为CORE(P)。注意,核具有唯一性。核与约简的关系如下所述。定理:2.11 CORE(P)=RED(P)。定理2.11表明,知识的核等于知识的所有约简的交集,意味着核包含在知识的每一个约简之中,是约简的最基础部分。,直观上讲,知识的核是它最重要的部分。核概念有两方面的作用:其一是核可以作为有所约简的计算基础,因为知识的核包含在知识的每一个约简之中,且计算可以直接进行;其二是核可以解释为知识特征的最主要部分,在知
19、识约简时它不能被删除,否则将减弱知识的分类能力。例2.20 给定一个知识库K=(U,S),其中,论域为U=x0,x1,x2,x8,且S=R1,R2,R3,等价关系R1,R2,R3和IND(IR)对应的等价类分别为:U/R1=x1,x4,x5,x2,x8,x3,x6,x7;U/R2=x1,x3,x5,x6,x2,x4,x7,x8;U/R3=x1,x5,x6,x2,x7,x8,x3,x4;U/IND(S)=x1,x5,x2,x8,x3,x4,x6,x7;试讨论R1,R2,R3对知识IND(S)是否必要,并求IND(S)的核和所有约简。,解:因为,所以,R 2为S中不必要的。,所以,R 1为S中必要
20、的。,因为,因为,所以,R 3为S中不必要的。下面求S的核和约简:显然,CORE(S)=R1。因为,显然,U/IND(R1,R2)U/R1,说明R1在IND(R1,R2)中为必要的,U/IND(R1,R2)U/R2,说明R2在IND(R1,R2)中为必要的。因此,知识R1,R2R1,R2,R3满足定义2.19的条件,所以它是知识 R1,R2,R3的一个约简。,因为,显然,U/IND(R1,R3)U/R1,说明R1在IND(R1,R3)中为必要的,U/IND(R1,R3)U/R2,说明R3在IND(R1,R3)中为必要的。,由此可知,知识 R1,R3独立的。因此,知识 R1,R3 R1,R2,R
21、3满足定义2.19的条件,所以它也是知识 R1,R2,R3的一个约简。综上所述,知识S=R1,R2,R3有两个约简分别为R1,R2和 R1,R3,这三个知识对论域U具有相同的分类能力,但通过约简表达的知识更简单,更易理解,适用性更强。不难验证:R1,R2 R1,R3=R1,即定理2.11成立。,例2.21 在不考虑决策属性前提下,试分别讨论2.3中条件属性(知识)1,2,3对知识1,2,3是否必要,并求出知识1,2,3的核和所有约简。其中,论域U=e1,e2,e6;知识1的分类U/1=X1,X2=e1,e2,e3,e4,e5,e6;知识2的分类U/2=Y1,Y2=e1,e2,e3,e4,e6,
22、e5;知识3的分类U/3=C1,C2,C3=e1,e4,e2,e5,e3,e6;知识1,2,3的分类U/IND(1,2,3)=e1,e2,e3,e4,e5,e6。注意:这里集合中元素的对等关系按序排列。,解:(1)考虑属性1(头痛),因为U/IND(1,2,3-1)=U/IND(2,3)=e1,e4,e2,e3,e6,e5 U/IND(1,2,3),所以属性1在1,2,3中是必要的。(2)考虑属性2(肌肉痛),因为U/IND(1,2,3-1)=U/IND(1,3)=e1,e2,e3,e4,e5,e6=U/IND(1,2,3),所以属性2在1,2,3中是必要的。,(3)考虑属性3(体温),因为U
23、/IND(1,2,3-3)=U/IND(1,2)=e1,e2,e3,e4,e6,e5 U/IND(1,2,3),所以属性3在1,2,3中是必要的。根据定义2.20 可知:CORE(1,2,3)=1,3。以下求出知识1,2,3的所有约简,因为U/IND(1,3-1)=U/IND(3)U/IND(1),说明1在U/IND(1,3)中为必要的。U/IND(1,3-3)=U/IND(1)U/IND(3),说明3在U/IND(1,3)中为必要的。由此可知1,3是独立的。这样,1,31,2,3 满足定义2.19的条件,因此,1,3是1,2,3的唯一的一个约简。,对于本题而言,核与约简是相同的,但在复杂的知
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 粗糙 理论 基本概念

链接地址:https://www.31ppt.com/p-6192491.html