高级人工智能.pptx
《高级人工智能.pptx》由会员分享,可在线阅读,更多相关《高级人工智能.pptx(87页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十一章第十一章 l 粗粗 糙糙 集集 Rough SetRough Set 5/13/20231内容提要内容提要一、概述二、知识分类三、知识的约简四、决策表的约简五、粗糙集的扩展模型六、粗糙集的实验系统七、粒度计算简介5/13/20232一、一、概述概述 现实生活中有许多含糊现象并不能简单地用真、假值来表示如何表示和处理这些现象就成为一个研究领域。早在1904年谓词逻辑的创始人G.Frege就提出了含糊(Vague)一词,他把它归结到边界线上,也就是说在全域上存在一些个体既不能在其某个子集上分类,也不能在该子集的补集上分类。5/13/20233模糊集模糊集 1965年,Zadeh提出了模糊集
2、,不少理论计算机科学家和逻辑学家试图通过这一理论解决G.Frege的含糊概念,但模糊集理论采用隶属度函数来处理模糊性,而基本的隶属度是凭经验或者由领域专家给出,所以具有相当的主观性。5/13/20234粗糙集的提出粗糙集的提出 20世纪80年代初,波兰的Pawlak针对G.Frege的边界线区域思想提出了粗糙集(Rough Set)他把那些无法确认的个体都归属于边界线区域,而这种边界线区域被定义为上近似集和下近似集之差集。由于它有确定的数学公式描述,完全由数据决定,所以更有客观性。5/13/20235粗糙集的研究粗糙集的研究 粗糙集理论的主要优势之一是它不需要任何预备的或额外的有关数据信息。自
3、提出以来,许多计算机科学家和数学家对粗糙集理论及其应用进行了坚持不懈的研究,使之在理论上日趋完善,特别是由于20世纪80年代末和90年代初在知识发现等领域得到了成功的应用而越来越受到国际上的广泛关注。5/13/20236粗糙集的研究粗糙集的研究 1991年波兰Pawlak教授的第一本关于粗糙集的专著Rough Sets:Theoretical Aspects of Reasoning about Data 和1992年R.Slowinski主编的关于粗糙集应用及其与相关方法比较研究的论文集的出版,推动了国际上对粗糙集理论与应用的深入研究。1992年在波兰Kiekrz召开了第1届国际粗糙集讨论会
4、。从此每年召开一次与粗糙集理论为主题的国际研讨会。5/13/20237研究现状分析研究现状分析2001年5月在重庆召开了“第1届中国Rough集与软计算学术研讨会”,邀请了创始人Z.Pawlak教授做大会报告;2002年10月在苏州第2届中国粗糙集与软计算学术研讨会2003年5月在重庆第3届中国粗糙集与软计算学术研讨会2004年10月中下旬在浙江舟山召开第4届中国粗糙集与软计算学术研讨会2005年8月1日至5日在鞍山科技大学召开第五届中国Rough集与软计算学术研讨会(CRSSC2005)2006第六届中国粗糙集与软计算学术研讨会在浙江师范大学5/13/20238研究现状分析研究现状分析200
5、7年粗糙集与软计算、Web智能、粒计算联合学术会议,山西大学2008年第8届中国粗糙集与软计算学术会议、第2届中国Web智能学术研讨会、第2届中国粒计算学术研讨会联合学术会议(CRSSC-CWI-CGrC2008),河南师范大学 中科院计算所、中科院自动化所、重庆邮电学院、南昌大学、西安交通大学、山西大学、合肥工业大学、北京工业大学、上海大学5/13/20239研究现状分析研究现状分析曾黄麟.粗集理论及其应用(修订版).重庆:重庆大学出版社,1998刘清.RoughSet及Rough推理.北京:科学出版社,2001张文修等.RoughSet理论与方法.北京:科学出版社,2001王国胤.Roug
6、hSet理论与知识获取.西安:西安交通大学出版社,2001史忠植.知识发现.北京:清华大学出版社,2002苗夺谦苗夺谦/王国胤王国胤/刘清刘清/林早阳林早阳/姚一姚一豫.粒计算-过去现在与展望.科学出版社,20075/13/202310二、二、知识分类知识分类基本粗糙集理论认为知识就是人类和其他物种所固有的分类能力。基本粗糙集理论认为知识就是人类和其他物种所固有的分类能力。例如,在现实世界中关于环境的知识主要表明了生物根据其生存观来对各种各样的情形进行分类区别的能力。每种生物根据其传感器信号形成复杂的分类模式,就是这种生物的基本机制。分类是推理、学习与决策中的关键问题。因此,粗糙集理论假定知识
7、是一种对对象进行分类的能力。这里的“对象”是指我们所能言及的任何事物,比如实物、状态、抽象概念、过程和时刻等等。即知识必须与具体或抽象世界的特定部分相关的各种分类模式联系在一起,这种特定部分称之为所讨论的全域全域或论域论域(universeuniverse)。对于全域及知识的特性并没有任何特别假设。事实上,知识构成了某一感兴趣领域中各种分类模式的一个族集(family),这个族集提供了关于现实的显事实,以及能够从这些显事实中推导出隐事实的推理能力。5/13/202311二、二、知识分类知识分类 为数学处理方便起见,在下面的定义中用等价关系来代替分类。一个近近似似空空间间(approximate
8、 space)(或知知识识库库)定义为一个关系系统(或二元组)K K=(U,R R)其中U(为空集)是一个被称为全域或论域(universe)的所有要讨论的个体的集合,R R是U上等价关系的一个族集。5/13/202312二、二、知识分类知识分类 设P PR R,且P P,P P中所有等价关系的交集称为P P上的一种不可区分关系(indiscernbility relation)(或称难区分关系),记作IND(P P),即 xIND(p)=xR RP 注意,IND(P P)也是等价关系且是唯一的。5/13/202313二、二、知识分类知识分类 给定近似空间K K=(U,R R),子集XU称为U
9、上的一个概念概念(concept),形式上,空集也视为一个概念;非空子族集P PR R所产生的不分明关系IND(P P)的所有等价类关系的集合即U/IND(P P),称为基本知识基本知识(basic knowledge),相应的等价类称为基本概念基本概念(basic concept);特别地,若关系QR R,则关系Q就称为初等知识初等知识(elementary knowledge),相应的等价类就称为初等概念初等概念(elementary concept)。一般用大写字母P,Q,R等表示一个关系,用大写黑体字母P P,Q Q,R R等表示关系的族集;xR或R(x)表示关系R中包含元素xU的概念
10、或等价类。为了简便起见,有时用P P代替IND(P P)。根据上述定义可知,概念即对象的集合,概念的族集(分类)就是U上的知识,U上分类的族集可以认为是U上的一个知识库,或说知识库即是分类方法的集合。5/13/202314二、二、知识分类知识分类 粗糙集理论与传统的集合理论有着相似之处,但是它们的粗糙集理论与传统的集合理论有着相似之处,但是它们的出发点完全不同。传统集合论认为,一个集合完全是由其元出发点完全不同。传统集合论认为,一个集合完全是由其元素所决定,一个元素要么属于这个集合,要么不属于这个集素所决定,一个元素要么属于这个集合,要么不属于这个集合,即它的隶属函数合,即它的隶属函数 X X
11、(x x)0,10,1。模糊集合对此做了拓广,。模糊集合对此做了拓广,它给成员赋予一个隶属度,即它给成员赋予一个隶属度,即 X X(x x)0,10,1,使得模糊集合,使得模糊集合能够处理一定的模糊和不确定数据,但是其模糊隶属度的确能够处理一定的模糊和不确定数据,但是其模糊隶属度的确定往往具有人为因素,这给其应用带来了一定的不便。而且,定往往具有人为因素,这给其应用带来了一定的不便。而且,传统集合论和模糊集合论都是把隶属关系作为原始概念来处传统集合论和模糊集合论都是把隶属关系作为原始概念来处理,集合的并和交就建立在其元素的隶属度理,集合的并和交就建立在其元素的隶属度maxmax和和minmin
12、操作上,操作上,因此其隶属度必须事先给定(传统集合默认隶属度为因此其隶属度必须事先给定(传统集合默认隶属度为1 1或或0 0)。)。在粗糙集中,隶属关系不再是一个原始概念,因此无需人为在粗糙集中,隶属关系不再是一个原始概念,因此无需人为给元素指定一个隶属度,从而避免了主观因素的影响。给元素指定一个隶属度,从而避免了主观因素的影响。5/13/202315Information Systems/TableslIS is a pair(U,A)lU is a non-empty finite set of objects.lA is a non-empty finite set of attribu
13、tes such that for every l is called the value set of a.AgeLEMSx16-3050 x216-300 x331-451-25x431-451-25x546-6026-49x616-3026-49x746-6026-495/13/202316Decision Systems/TableslDS:l is the decision attribute(instead of one we can consider more decision attributes).lThe elements of A are called the condi
14、tion attributes.AgeLEMSWalkx16-3050yesx216-300nox331-451-25nox431-451-25yesx546-6026-49nox616-3026-49yesx746-6026-49no5/13/202317Issues in the Decision Tablel相同或不可区分的对象可能被表示多次相同或不可区分的对象可能被表示多次The same or indiscernible objects may be represented several times.l有些属性可能是多余的 Some of the attributes may be
15、 superfluous.5/13/202318不可区分性不可区分性IndiscernibilitylThe equivalence relation A binary relation which is reflexive(xRx for any object x),symmetric(if xRy then yRx),and transitive(if xRy and yRz then xRz).lThe equivalence class of an element consists of all objects such that xRy.5/13/202319不可区分性不可区分性In
16、discernibility(2)lLet IS=(U,A)be an information system,then with any there is an associated equivalence relation:where is called the B-indiscernibility relation.lIf then objects x and x are indiscernible from each other by attributes from B.lThe equivalence classes of the B-indiscernibility relation
17、 are denoted by 5/13/202320不可区分性实例不可区分性实例 IndiscernibilitylThe non-empty subsets of the condition attributes are Age,LEMS,and Age,LEMS.lIND(Age)=x1,x2,x6,x3,x4,x5,x7lIND(LEMS)=x1,x2,x3,x4,x5,x6,x7lIND(Age,LEMS)=x1,x2,x3,x4,x5,x7,x6.AgeLEMSWalkx16-3050yesx216-300nox331-451-25nox431-451-25yesx546-6026
18、-49nox616-3026-49yesx746-6026-49no5/13/202321概念的边界概念的边界 知识的粒度性是造成使用已有知识不能精确地表示知识的粒度性是造成使用已有知识不能精确地表示某些概念的原因。这就产生了所谓的关于不精确的某些概念的原因。这就产生了所谓的关于不精确的“边界边界”思想。著名哲学家思想。著名哲学家FregeFrege认为认为“概念必须概念必须有明确的边界。没有明确边界的概念,将对应于一有明确的边界。没有明确边界的概念,将对应于一个在周围没有明确界线的区域个在周围没有明确界线的区域”。粗糙集理论中的。粗糙集理论中的模糊性就是一种基于边界的概念,即一个不精确的模糊
19、性就是一种基于边界的概念,即一个不精确的概念具有模糊的不可被明确划分的边界。为刻画模概念具有模糊的不可被明确划分的边界。为刻画模糊性,每个不精确概念由一对称为上近似与下近似糊性,每个不精确概念由一对称为上近似与下近似的精确概念来表示,它们可用隶属函数定义的精确概念来表示,它们可用隶属函数定义5/13/202322粗糙集的基本定义粗糙集的基本定义知识的分类观点 粗糙集理论假定知识是一种对对象进行分类的能力。而知识必须与具体或抽象世界的特定部分相关的各种分类模式联系在一起,这种特定部分称之为所讨论的全域全域或论域论域(universeuniverse)。为数学处理方便起见,在下面的定义中用等价关系
20、来代替分类。5/13/202323粗糙集的基本定义粗糙集的基本定义定定义义1 1 一个近近似似空空间间(approximate space)(或知知识库识库)定义为一个关系系统(或二元组)K K=(U,R R),其中U(为空集)是一个被称为全域或论域(universe)的所有要讨论的个体的集合,R R是U上等价关系的一个族集。定定义义2 2 设P PR R,且P P,P P中所有等价关系的交集称为P P上的一种不分明关系(indiscernbility relation)(或称不可区分关系),记作IND(P P)5/13/202324粗糙集的基本定义粗糙集的基本定义 定定义义3 3 给定近似空
21、间K K=(U,R R),子集XU称为U上的一个概概念念(concept),形式上,空集也视为一个概念;非空子族集P PR R所产生的不分明关系IND(P P)的所有等价类关系的集合即U/IND(P P),称为基基本本知知识识(basic knowledge),相应的等价类称为基基本本概概念念(basic concept);特别地,若关系QR R,则 关 系 Q就 称 为 初初 等等 知知 识识(elementary knowledge),相应的等价类就称为初初等等概概念念(elementary concept)。5/13/202325上近似、下近似和边界区域上近似、下近似和边界区域定义定义5
22、:X的下近似:R*(X)=x:(xU)(xRX)X的上近似:R*(X)=x:(xU)(xRX)X的边界区域:BNR(X)=R*(X)R*(X)若BNR(X),则集合X就是一个粗糙概念。下近似包含了所有使用知识R可确切分类到X的元素,上近似则包含了所有那些可能是属于X的元素。概念的边界区域由不能肯定分类到这个概念或其补集中的所有元素组成。POSR(X)=R*(X)称为集合X的R-正区域正区域,NEGR(X)=UR*(X)称为集合X的R-反区域反区域。5/13/202326Lower&UpperApproximations(2)Lower Approximation:Upper Approxima
23、tion:上近似、下近似和边界区域上近似、下近似和边界区域5/13/202327新型的隶属关系新型的隶属关系 传统集合论中,一个元素的隶属函数X(x)0,1。而粗糙集理论中,X(x)0,1 定定义义4 4 设XU且xU,集合X的粗粗糙糙隶隶属属函函数数(rough membership function)定义为 其中R是不分明关系,R(x)=xR=y:(yU)(yRx)=1当且仅当xRX 0当且仅当xRX=0当且仅当xRX=5/13/202328隶属关系隶属关系显然有显然有 0,10,1。我们可以看到,这里的隶属关系。我们可以看到,这里的隶属关系是根据已有的分类知识客观计算出来的,可以被解是根
24、据已有的分类知识客观计算出来的,可以被解释为一种条件概率,能够从全域上的个体加以计算,释为一种条件概率,能够从全域上的个体加以计算,而不是主观给定的。而不是主观给定的。5/13/202329集近似实例集近似实例 Set ApproximationlLet W=x|Walk(x)=yes.lThe decision class,Walk,is rough since the boundary region is not empty.AgeLEMSWalkx16-3050yesx216-300nox331-451-25nox431-451-25yesx546-6026-49nox616-3026-
25、49yesx746-6026-49no5/13/202330集近似实例集近似实例 Set Approximation(2)yesyes/nonox1,x6x3,x4x2,x5,x7AW5/13/202331UsetU/RR:subset of attributes粗糙集近似图示粗糙集近似图示5/13/202332Lower&Upper 近似近似 (3)X1=u|Flu(u)=yes=u2,u3,u6,u7RX1=u2,u3=u2,u3,u6,u7,u8,u5X2=u|Flu(u)=no=u1,u4,u5,u8RX2=u1,u4 =u1,u4,u5,u8,u7,u6Theindiscernibi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高级 人工智能
限制150内