粗糙集理论的基本概念.ppt
《粗糙集理论的基本概念.ppt》由会员分享,可在线阅读,更多相关《粗糙集理论的基本概念.ppt(225页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 人的分类能力是对事物的认识能力,人的分类能力是对事物的认识能力,是一种知识。从认知科学的观点来理解知是一种知识。从认知科学的观点来理解知识,知识可以被理解为对事物的分类能力识,知识可以被理解为对事物的分类能力及知识的分类能力可用知识系统的集合表及知识的分类能力可用知识系统的集合表达形式来描述。知识在不同的范畴中有许达形式来描述。知识在不同的范畴中有许不同的含义。粗糙集理论认为,知识直接不同的含义。粗糙集理论认为,知识直接与真实或抽象世界的不同分类模式联系在与真实或抽象世界的不同分类模式联系在一起。知识被看作是关于论域的划分,是一起。知识被看作是关于论域的划分,是一种对对象进行分类的能力。一种
2、对对象进行分类的能力。第第2章章 粗糙集理论的基本概念粗糙集理论的基本概念2.1知识与知识库知识与知识库定义定义1.1(知识和概念(范畴或信息粒)(知识和概念(范畴或信息粒)设设U是给定研究对象的非空有限集合,称为是给定研究对象的非空有限集合,称为一个论域。论域一个论域。论域U的任何一个子集的任何一个子集X U,称为论域称为论域U的一个概念或范畴。论域的一个概念或范畴。论域U的一的一个划分个划分X1,X2,Xn(概念簇)称为关于(概念簇)称为关于U的抽象知识,简称知识。为了规范化,我的抽象知识,简称知识。为了规范化,我们认为空集也是一个概念,称为空概念。们认为空集也是一个概念,称为空概念。在粗
3、糙集理论中,主要讨论的是那些能在粗糙集理论中,主要讨论的是那些能够在论域够在论域U上形成划分或覆盖的知识。上形成划分或覆盖的知识。我们知道我们知道U的划分的划分X1,X2,Xn与与U上上的等价关系的等价关系R一一对应,即给定一一对应,即给定U的一个划的一个划分分X1,X2,Xn等同于给定等同于给定U上的一个等上的一个等价关系价关系R,从数学的角度讲,关系的表示和,从数学的角度讲,关系的表示和处理比分类的表示和处理简单得多,因此,处理比分类的表示和处理简单得多,因此,我们通常用等价关系或关系来表示分类及知我们通常用等价关系或关系来表示分类及知识。因此知识也可以定义为,设识。因此知识也可以定义为,
4、设R是是U上的上的一个等价关系,一个等价关系,U/R=X1,X2,Xn 表示表示R产生的分类,称为关于产生的分类,称为关于U的一个知识。的一个知识。通常情形下,我们在问题求解的过程中,通常情形下,我们在问题求解的过程中,处理的不是论域处理的不是论域U上的单一划分(知识或分上的单一划分(知识或分类),而是论域类),而是论域U上的一簇划分,这导致了上的一簇划分,这导致了知识库的概念。知识库的概念。定义定义1.2(知识库(知识库)U为给定的一个论域,为给定的一个论域,S是是U上的一簇等价关系,称二元组上的一簇等价关系,称二元组K=(U,S)是关于论域)是关于论域U上的一个知识库上的一个知识库或近似空
5、间。或近似空间。因此,论域上的等价关系就代表着划因此,论域上的等价关系就代表着划分和知识。这样,知识库就表示了论域上分和知识。这样,知识库就表示了论域上的由等价关系(这里指属性特征及其有限的由等价关系(这里指属性特征及其有限个的交)导出的各种各样的知识,即划分个的交)导出的各种各样的知识,即划分或分类模式,同时代表了对论域的分类能或分类模式,同时代表了对论域的分类能力,并隐含着知识库中概念之间存在的各力,并隐含着知识库中概念之间存在的各种关系。种关系。定定义义2.3(不可分辨关系(不分明关系)(不可分辨关系(不分明关系)给给定一个定一个论论域域U和和U上的一簇等价关系上的一簇等价关系S,若若P
6、S,且且P,则则P(P中所有等价关系的中所有等价关系的交集)仍然是交集)仍然是论论域域U上的一个等价关系,上的一个等价关系,称称为为P上的不可分辨关系,上的不可分辨关系,记为记为IND(P),也常也常简记为简记为P。而且,。而且,这样,这样,U/IND(P)=xIND(P)|x U 表示与表示与等价关系等价关系IND(P)相关的知识,称为知识库相关的知识,称为知识库K=(U,S)中中关于论域关于论域U的的P-基本知识(基本知识(P-基本集基本集)。在不可能产。在不可能产生混淆的情况下,即生混淆的情况下,即P,U和和K都明确时,为了简便,都明确时,为了简便,我们可用我们可用P代替代替IND(P)
7、。用。用U/P代替代替U/IND(P),IND(P)的等价类也称为知识的等价类也称为知识P的基本概念或基本范畴。的基本概念或基本范畴。事实上,事实上,P基本范畴拥有知识基本范畴拥有知识P的论域的基本特征,的论域的基本特征,换句话说,他们是知识的基本模块。特别地,如果换句话说,他们是知识的基本模块。特别地,如果Q S,则称则称Q是关于论域是关于论域U的的Q-初等知识,初等知识,Q的等价的等价类为知识类为知识S的的Q初等概念或初等范畴。初等概念或初等范畴。我们用我们用IND(K)=IND(P)|P S表示知识库表示知识库K=(U,S)中所有等价关系,他对于集合的交运算是封中所有等价关系,他对于集合
8、的交运算是封闭的。任意有限个闭的。任意有限个P-基本范畴的并,称为基本范畴的并,称为P-范畴;范畴;知识库知识库K=(U,S)中所有的范畴称为中所有的范畴称为K-范畴。范畴。定义定义2.4(两个知识库的关系)设(两个知识库的关系)设K1=(U,S1)和和K2=(U,S2)为两个知识库,如果为两个知识库,如果IND(S1)=IND(S2),即即U/IND(S1)=U/IND(S2),则称知识库,则称知识库K1与与K2是等是等价的,记为价的,记为K1K2或者或者S1S2。因此当两个知识库。因此当两个知识库有同样的基本范畴集时,这两个知识库中的知识都有同样的基本范畴集时,这两个知识库中的知识都能使我
9、们确切的表达关于论域的完全相同的事实。能使我们确切的表达关于论域的完全相同的事实。这就意味着可以用不同的属性集对论域的对象进行这就意味着可以用不同的属性集对论域的对象进行描述,以表达关于论域完全相同的知识。如果描述,以表达关于论域完全相同的知识。如果IND(S1)IND(S2),我们称知识库,我们称知识库K1(知识(知识S1)比知识)比知识库库K1(知识(知识S2)更精细,或者说)更精细,或者说K2(知识(知识S2)比)比K1(知识(知识S1)更粗糙。当)更粗糙。当S1比比S2更精细时,我们也称更精细时,我们也称S1为为S2的转化,或的转化,或S2为为S1的泛化。泛化意味着将某的泛化。泛化意味
10、着将某些范畴组合在一起,而特化则是将范畴分割成更小些范畴组合在一起,而特化则是将范畴分割成更小的概念。如果上述两种情形都不满足,则称两个知的概念。如果上述两种情形都不满足,则称两个知识库不能比较粗细。识库不能比较粗细。表2.1积木的信息表 U(积积木木)R1(颜颜色)色)R2(形状(形状)R3(体(体积积)X1X2X3X4X5X6X7X8红红蓝蓝红红蓝蓝黄黄黄黄红红黄黄圆圆形形方形方形三角形三角形三角形三角形圆圆形形方形方形三角形三角形三角形三角形小小大大小小小小小小小小大大大大2.2粗糙集的基本定义及其性质粗糙集的基本定义及其性质其中,其中,X,Y为论域为论域U的子集,符号的子集,符号“”表
11、示集合的补运算。表示集合的补运算。例例2.3如表如表2.2(一个决策表)所示,(一个决策表)所示,对对于于属性子集(等价关系)属性子集(等价关系)P=头头疼,肌肉疼疼,肌肉疼请请判判断断论论域的一个子集合域的一个子集合X=e2,e3,e5是否是否为为P的粗的粗糙集。若不是,糙集。若不是,请说请说明理由;若是,明理由;若是,请请求出求出X的的P-下近似集,上近似集,下近似集,上近似集,边边界域界域,正域正域,负负域域.表表2.2 例例2.3中的一个医中的一个医疗诊疗诊断决策表断决策表论论域域U条件属性条件属性决策决策d头头痛痛a1肌肉痛肌肉痛a2体温体温a3e1e2e3e4e5e6是是是是是是否
12、否否否否否是是是是是是是是否否是是正常正常高高很高很高正常正常高高很高很高否否是是是是否否否否是是2.3粗糙集的特征粗糙集的特征粗糙集的数字特征粗糙集的数字特征1.集合的近似精度和粗糙度集合的近似精度和粗糙度定定义义2.7(近似精度和粗糙度)给定一个论域U和U上的一个等价关系R,称等价关系称等价关系R定定义义的集合的集合X的近似精度的近似精度和粗糙度分和粗糙度分别为别为集合(范畴或概念)的不精确性是由于集合(范畴或概念)的不精确性是由于边边界域的界域的存在而引起的,集合的存在而引起的,集合的边边界域越大,其精确性界域越大,其精确性则则越低。越低。反反应应了在知了在知识识R下下对对于集合于集合X
13、表达的范畴了解的程表达的范畴了解的程度。度。显显然,然,对对每一个每一个R和和X的的R-边边界域界域为为空集,所以集合空集,所以集合X是是R-可定可定义义的的(R-精精确集确集);当;当 1时,集合时,集合X有非空有非空R-边界域,边界域,所以集合所以集合X是是R-不可定不可定义义的(的(R-粗糙集);粗糙集);X的的R-粗糙度与精度恰恰相反,它反映了我粗糙度与精度恰恰相反,它反映了我们们在知在知识识R下下对对于集合于集合X表达的范畴了解的不完全程度。表达的范畴了解的不完全程度。当当X为空集时,我们规定为空集时,我们规定例例2.6 给给定一个知定一个知识库识库K=(U,S)和知和知识库识库中一
14、中一个等价关系个等价关系R IND(K),它它导导出的等价出的等价类类如如下:下:Y1=x1,x4,x8,Y2=x2,x5,x7,Y3=x3,Y4=x6。其中,。其中,论论域域U=x1,x2,x8。试计试计算下列集合的算下列集合的R-近似精度和粗糙度,近似精度和粗糙度,其中,其中,直观上看,粗糙集理论对事情的不精确性表直观上看,粗糙集理论对事情的不精确性表述不需要任何假定的先验知识,而只是依赖述不需要任何假定的先验知识,而只是依赖于所给定的知识表达系统,通过上、下近似于所给定的知识表达系统,通过上、下近似算子直接计算得到的,这一点与概率论和模算子直接计算得到的,这一点与概率论和模糊集合论是完全
15、不同的。从粗糙集理论的角糊集合论是完全不同的。从粗糙集理论的角度看,客观事物的不精确性是由于我们所掌度看,客观事物的不精确性是由于我们所掌握知识的有限性所导致,换句话说,是由对握知识的有限性所导致,换句话说,是由对事物所包含对象的分类能力有限的结果所引事物所包含对象的分类能力有限的结果所引起的。因此,人们在没有任何先验知识的条起的。因此,人们在没有任何先验知识的条件下,可以通过分类的手段来处理不精确的件下,可以通过分类的手段来处理不精确的数值特征,进而表示概念得精确程度。数值特征,进而表示概念得精确程度。2.近似分类精度和近似分类质量近似分类精度和近似分类质量类别类别样样品品特征特征W1W2x
16、1x2x3 x4x5x6x7x8x9x10R10.360.400.200.180.270.540.520.680.490.81R20.100.200.300.402.500.600.700.800.900.50 定理定理 2.8 给给定一个定一个论论域域U和其上的一个等价和其上的一个等价关系(知关系(知识识)R,其其对应对应的划分或商集的划分或商集为为。如果。如果,都有,都有成立,成立,则对则对于任意于任意,都有,都有 至此,我们已经介绍了两种刻画粗糙集的方法。至此,我们已经介绍了两种刻画粗糙集的方法。其一为用近似程度的精确度来表示粗糙集的数字其一为用近似程度的精确度来表示粗糙集的数字特征;其
17、二为用粗糙集的分类表示粗糙集的拓扑特征;其二为用粗糙集的分类表示粗糙集的拓扑特征。粗糙集的数字特征表示了集合边界域的大特征。粗糙集的数字特征表示了集合边界域的大小,但没有说明边界域地结构;而粗糙集的拓扑小,但没有说明边界域地结构;而粗糙集的拓扑特征没有给出边界域大小的信息,它提供的是边特征没有给出边界域大小的信息,它提供的是边界域的结构。界域的结构。此外,粗糙集的数字特征和粗糙集的拓扑特征此外,粗糙集的数字特征和粗糙集的拓扑特征之间存在一种关系。首先,如果集合为内不可定之间存在一种关系。首先,如果集合为内不可定义或全不可定义,则其精度为义或全不可定义,则其精度为0;其次,当集合为;其次,当集合
18、为外不可定义或全不可定义时,则它的补集的精度外不可定义或全不可定义时,则它的补集的精度为为0。这样,即使知道了集合的近似精度,我们也。这样,即使知道了集合的近似精度,我们也不能确定它的拓扑结构;反过来,集合的拓扑结不能确定它的拓扑结构;反过来,集合的拓扑结构也不具备精度的信息。构也不具备精度的信息。因此,在粗糙集的因此,在粗糙集的实际应实际应用中,我用中,我们们需要将需要将边边界界域的两种信息域的两种信息结结合起来,既要考合起来,既要考虑虑近似精度因素,近似精度因素,也要考也要考虑虑到集合的拓扑到集合的拓扑结结构。构。下面再通下面再通过过一个例子来一个例子来说说明明这这两种表示之两种表示之间间
19、的的关系。关系。例例 2.17 给给定一个知定一个知识库识库和一个等价关系和一个等价关系.其中其中论论域域为为且且R的等价的等价类为类为:试计试计算和算和讨论讨论下列集合的数字特征和拓扑特征。下列集合的数字特征和拓扑特征。解:(1)对集合下近似下近似 上近似上近似 因因为为是是R-可定义集,可定义集,边边界域界域 近似精度近似精度 (2)对对集合集合下近似下近似 上近似上近似而言:因因为为,同,同时时边边界域界域近似精度近似精度(3)对对集合集合下近似下近似上近似上近似根据定根据定义义2.12可知,集合可知,集合X3为为R-内不可定内不可定义义。近似精度近似精度所以所以X2是是R-粗糙可定义。
20、粗糙可定义。边界域边界域(4)对对于集合于集合下近似下近似上近似上近似根据定根据定义义2.12可知,集合可知,集合X4为为R-外不可定外不可定义义。(5)对对于集合于集合下近似下近似上近似上近似根据定根据定义义2.12可知,集合可知,集合X5为为R-全不可定全不可定义义;近似精度近似精度边界域边界域近似精度近似精度边界域边界域2.4 粗糙集中的隶属关系粗糙集中的隶属关系 在集合论中,成员与集合的隶属关系(成员关在集合论中,成员与集合的隶属关系(成员关系)是所有关系中最基本的关系。对隶属关系的系)是所有关系中最基本的关系。对隶属关系的分析是我们进行计算、推理的基础。本节主要介分析是我们进行计算、
21、推理的基础。本节主要介绍粗糙集中的隶属关系。绍粗糙集中的隶属关系。粗糙集合论的成员关系粗糙集合论的成员关系定定义义2.14给给定一个知定一个知识库识库(近似空(近似空间间)(,),其中,其中,为论为论域上的等价关域上的等价关 系簇或系簇或单单个的等价关系。个的等价关系。则则定定义义(.)为为元素关于知元素关于知识识的隶属于集合粗糙隶属的隶属于集合粗糙隶属度,也称度,也称为为集合的集合的-粗糙隶属函数,其中,粗糙隶属函数,其中,|表示集合的基数,表示集合的基数,xR表示元素关于知表示元素关于知识识R的等的等价价类类。注:在粗糙集理论中,隶属度函数(成员关系)依注:在粗糙集理论中,隶属度函数(成员
22、关系)依赖于我们的知识赖于我们的知识R,即一个对象是否属于一个集合,即一个对象是否属于一个集合依赖于我们所掌握的知识依赖于我们所掌握的知识R,成员关系并不是绝对,成员关系并不是绝对的。的。性性质质2.4 2.4 粗糙集理粗糙集理论论中成中成员员关系(隶属度函数)关系(隶属度函数)的性的性质质 值值越大越大说说明明对对象象x属于集合属于集合X的的程度就越高。当程度就越高。当 时时,表明,表明对对象象x依据知依据知识识R判断肯定不属于集合判断肯定不属于集合X;当;当 时时,表明,表明对对象象x依据知依据知识识R判断肯定属于集合判断肯定属于集合X;当隶属度;当隶属度时时,表明,表明对对象象x依据知依
23、据知识识R判断有可能属于集合判断有可能属于集合X,同同时时也有可能不属于集合也有可能不属于集合X,即,即对对象象x落入集落入集合合X的的-边边界域。界域。这这足以足以说说明集合明集合X的模糊性的模糊性完全是由完全是由边边界域不空引起的。界域不空引起的。(2)对对象象x依据知依据知识识R判断肯定属于集合判断肯定属于集合对对象象x依据知依据知识识R判断可能属于集合判断可能属于集合 对对象象x依据知依据知识识R判断肯定不属于集合判断肯定不属于集合 就是集合就是集合X的特征函数。的特征函数。提供的不可区分关系提供的不可区分关系是一个等价关系。是一个等价关系。是是论论域域U中两两互中两两互不相交的集合不
24、相交的集合组组成的集合簇,成的集合簇,则则 xU U,其隶属度,其隶属度函数定函数定义为义为 (2.17)我我们们可以利用粗糙隶属度函数来定可以利用粗糙隶属度函数来定义义粗糙集合粗糙集合论论的基本概念,例如上近似、下近似、的基本概念,例如上近似、下近似、边边界域、正域、界域、正域、负负域等。域等。定定义义 2.15 给给定一个定一个论论域域U和和U上的一个等价关系上的一个等价关系R,xU U,我,我们们如下定如下定义义集合集合X的的R-下近似集,下近似集,R-边边界域,界域,R-正域,正域,R-负负域。域。由此可以看出,粗糙集定由此可以看出,粗糙集定义义的两种方法的两种方法都是都是强强调调粗糙
25、集概念的各个方面。由近粗糙集概念的各个方面。由近似定似定义诱导义诱导出粗糙集的拓扑出粗糙集的拓扑结结构,而隶构,而隶属度函数的方法属度函数的方法则则强强调调它的数它的数值值性性质质,用用概率概率论术语论术语可以解可以解释为释为:在粗糙集理在粗糙集理论论中,一个中,一个对对象是否隶属于某象是否隶属于某一集合(概念),不是一集合(概念),不是该该元素的客元素的客观观性性质质,而且取决于我而且取决于我们对们对它的了解程度,即知它的了解程度,即知识识的分的分类类能力。能力。这这更符合人更符合人类类的的认认知知过过程。程。.粗糙集中的集合关系粗糙集中的集合关系.集合的粗糙包含关系集合的粗糙包含关系粗糙集
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 粗糙 理论 基本概念
限制150内