数据挖掘与知识发现讲稿.docx
《数据挖掘与知识发现讲稿.docx》由会员分享,可在线阅读,更多相关《数据挖掘与知识发现讲稿.docx(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、装订线第2章 知识表表示知识表示示是人工工智能研研究中极极为重要要的研究究课题之之一。无无论应用用人工智智能技术术解决什什么问题题,首先先遇到的的就是所所涉及的的各类知知识如何何加以表表示。不不同的知知识有不不同的表表示方法法,研究究知识表表示方法法,不单单是解决决如何将将知识存存储在计计算机中中,更重重要的是是应该能能够方便便和正确确地使用用知识。合理的的知识表表示,可可以使问问题求解解变得容容易,并并且有较较高的求求解效率率。评价一个个好的知知识表示示系统应应具有以以下几点点: 具有表示示某个专专门领域域所需要要的知识识能力,并保证证知识库库中的知知识是相相容的; 具有从已已知知识识推导出
2、出新知识识的能力力,容易易建立表表达新知知识所需需要的新新结构; 便于新知知识的获获取,最最简单的的情况是是能够由由人直接接输入知知识到知知识库中中; 便于将启启发式知知识附加加到知识识结构中中,以便便把推理理集中在在最希望望的方向向上。为了实现现上述目目标,人人们至今今已提出出了几十十种甚至至上百种种的知识识表示方方法。但但没有一一种表示示能包打打天下。较为常常见的知知识表示示方法有有:l 一阶谓词词逻辑表表示 l 产生式表表示或称称规则表表示 l 语义网表表示 l 框架表示示 l 面象对象象表示l 过程表示示l 脚本表示示l 神经元表表示l 特性表表表示2.1一一阶谓词词逻辑表表示谓词逻辑
3、辑是一种种形式语语言,也也是目前前能够表表达人类类思维活活动的一一种最精精确的语语言。它它与人类类的自然然语言比比较接近近,即可可方便地地存储到到计算机机中,又又可被计计算机进进行精确确处理。因此,谓词逻逻辑是最最早且最最主要用用于人工工智能知知识描述述的方法法之一。它是一一种基于于数理逻逻辑的知知识表示示方式。而数理理逻辑是是一门研研究推理理的科学学,它作作为人工工智能的的基础,在人工工智能的的发展中中占有重重要地位位。人工工智能中中用到的的逻辑可可分为两两大类: 一阶经典典命题逻逻辑和谓谓词逻辑辑 除经典以以外的那那些逻辑辑2.1.1一阶阶谓词逻逻辑表示示的逻辑辑基础谓词逻辑辑是在命命题逻
4、辑辑的基础础上发展展起来的的,为此此先讨论论一阶谓谓词逻辑辑知识表表示中所所需要的的一些逻逻辑基础础。如命命题、谓谓词、连连接词、量词、谓词公公式等。 1. 命题和和真值定义2.1:一一个陈述述句称为为一个断断言。凡凡有真假假意义的的断言称称为命题题。(即即可以确确定真假假意义的的陈述句句)注: 命题的的意义通通常称为为真值,它它只有真真(T)假(FF)两种种情况。 在命命题逻辑辑中,命命题通常常用大写写的英文文字母来来表示。一个命命题不能能同时为为真又为为假。 一个个命题可可在一定定条件下下为真,在另一一条件下下为假。如,PP:“北京今今天有雨雨”,需根根据当天天的情况况决定其其真值。 没有
5、有真假意意义的感感叹句、疑问句句等都不不是命题题。如,P:今今天好冷冷呀!;Q:今今天的温温度有多多少度? 命题题的优点点是简单单、明确确;缺点点是无法法描述客客观事物物的结构构及其逻逻辑特征征,也无无法表示示不同事事物间的的共性。如,“杨青是是教师”和“李文是是教师”这两个个命题,用命题题逻辑表表示时,无法把把两人都都是教师师这一共共同特征征表示出出来。 2. 论域和和谓词论域是由由所讨论论对象之之全体构构成的非非空集合合。论域域中的元元素称为为个体。论域又又称个体体域。在谓词逻逻辑中,命题是是用谓词词表示的的。一个谓词词可分为为:谓词词名和个体两部部分。其其中,个个体是用用来表示示某个独独
6、立存在在的事物物或者某某个抽象象的概念念;谓词词名是用用来表示示个体的的性质、状态或或个体之之间的关关系等。通常,谓谓词名用用大写英英文字母母表示,个体用用小写英英文字母母表示。如:王宏宏是学生生 谓词表表示为:STUUDENNT(WWangghonng) 桂林山山水甲天天下 谓词表表示为:甲天下下(桂林林山水) 桂林在在广西的的北部 谓谓词表示示为:在在(北部部,桂林林,广西西) 广西西师大校校园坐落落在桂林林 谓词表表示为:坐落在在(广西西师大校校园,桂桂林) 全州州是桂林林的县 谓词词表示为为:县(全州,桂林)x6 谓词表表示为:Greeateer(xx,6) 王宏宏的父亲亲是教师师 谓
7、词表表示为:TEAACHEER(ffathher(Wannghoong)) 谓词的的形式定定义如下下:定义2.2 设设D是个个体域,P:是是一个映映射,其其中则称P是是一个nn元谓词词。记为为:,是个体体。注:在谓谓词中,个体可可以是常常量、变变元或函函数。函数的定定义形式式为: 定义2.3 设设D是个个体域,的一个个映射,则称是是D上的的一个nn元函数数。记作作:,是个体体。说明: 谓词词和函数数的定义义形式相相似,但但却是两两个不同同的概念念。 谓词词的真值值是T或或F,而而函数无无真值可可言,其其值是DD中的某某个个体体。谓词实实现的是是从个体体域中的的个体到到T或FF的映射射,而函函数
8、实现现的是同同一个体体域中从从一个个个体到另另一个个个体的映映射。 在谓谓词逻辑辑中,函函数本身身不能单单独使用用,它必必须嵌入入到谓词词中。 如果果中的个体体都是常常量、变变元或函函数,则则称其为为一阶谓谓词。若若某个本本身又是是另一个个一阶谓谓词,则则称它为为二阶谓谓词。3. 连连接词和和量词连接词是是用来连连接简单单命题,并由简简单命题题构成复复合命题题的逻辑辑运算符符号。在一阶谓谓词逻辑辑中,有有5个连连接词和和2个量量词。由由于命题题逻辑可可看作谓谓词逻辑辑的一种种特殊形形式,因因此5个个连接词词同样适适应于命命题逻辑辑,但22个量词词仅适应应在于谓谓词逻辑辑。:称为“非”。它表表示
9、其后后命题的的否定:称为“析取”。它表表示所连连接的两两个命题题之间具具有“或”的关系系:称为“合取”。它表表示所连连接的两两个命题题之间具具有“与”的关系系:称为“条件”或“蕴含”。它表表示“若则”的语语义。如如,表示示“P蕴含含Q”,读作作:“如果PP,则QQ”,其中中P称为为条件的的前件,Q称为为条件的的后件。:称为“双条件件”。它表表示“当且仅仅当”的语义义。如,表示PP当且仅仅当Q,即读作作“P当且且仅当QQ”。谓词逻辑辑真值表表PQTTFTTTTTFFTFFFFTTTFTFFFTFFTT在一阶谓谓词逻辑辑中,引引入了22个量词词符号:全程量量词符号号和存在在量词符符号。-所所有的,
10、任一个个-至至少有一一个,存存在有量词是由由量词符符号和被被其量化化的变元元所组成成的表达达式,是是用来对对谓词中中的个体体作出量量的规定定。如,“对对论域中中的所有有个体”,表示示为;“对论域域中的某某个个体体”,表示示为。命题为真真,当且且仅当论论域中的的所有,都有为为真命题为真真,当且且仅当论论域中至至少存在在一个,使得为为真 4. 项与合合式公式式在一阶谓谓词逻辑辑中,合合法的表表达式称称为合式式公式(即谓词词公式)。定义2.4 项项满足如如下规则则:(1) 单独一个个个体词词是项;(2) 若是项,是n元元函数,则是项项;(3) 由(1)、(22)生成成的表达达式是项项。可见,项项是把
11、个个体常量量、个体体变量和和函数统统一起来来的概念念。定义2.5 原原子谓词词公式的的含义为为: 若是是项,PP是谓词词符号,则称PP()为为原子谓谓词公式式。定义2.6 满满足如下下规则的的谓词演演算可得得到合式式公式:(1) 单个原子子谓词公公式是合合式公式式;(2) 若A是合合式公式式,则也也是合式式公式;(3) 若A、BB是合式式公式,则也都都是合式式公式;(4) 若A是合合式公式式,是项项,则和和也都是是合式公公式。注:在合合式公式式中,连连接词之之间的优优先级顺顺序为: 5. 自由变变元和约约束变元元当一个谓谓词公式式含有量量词时,通常把把位于量量词后面面的单个个谓词或或者用括括弧
12、括起起来的合合式公式式称为该该量词的的辖域。辖域内内与量词词中同名名的变元元称为约约束变元元,不受受约束的的变元称称为自由由变元。如这里,是是的辖域域,其中中的是的约束束变元;中的是自自由变元元。公式式中所有有的都是是自由变变元。注:在谓谓词公式式中,变变元的名名字是无无关紧要要的,可可以把一一个名字字换成别别的名字字。换名时注注意两点点:当对量量词辖域域内的约约束变元元更名时时,必须须把同名名的约束束变元都都统一换换成另外外一个相相同的名名字,且且不能与与辖域内内的自由由变元同同名;当对辖辖域内自自由变元元更名时时,不能能改成与与约束变变元同名名。如上上例可表表示为:命题公式式是谓词词公式的
13、的一种特特殊情况况,也可可用连接接词把单单个命题题连接起起来构成成合式公公式。如如,都是是命题公公式。2.1.2谓词词逻辑的的知识表表示方法法谓词逻辑辑不仅可可以用来来表示事事物的状状态、属属性、概概念等事事实性知知识,也也可以用用来表示示事物的的因果关关系。对事实性性知识,常用符符号连接接起来的的谓词公公式表示示。对事物间间的因果果关系,通常用用蕴含式式表示。如,对对“如果则”可表示示为“”当用谓词词逻辑表表示知识识时,先先要根据据所表示示的知识识定义谓谓词,然然后再用用连接词词或者量量词把这这些词连连接起来来,形成成一个谓谓词公式式。例1 用谓谓词逻辑辑表示知知识“每个人人都有一一个父亲亲
14、”。谓词: PEERSOON(xx):表表示x是人 HAASFAATHEER(xx,y):表表示x有父亲亲y则该知识识可用谓谓词表示示为:例2 用谓谓词逻辑辑表示知知识“所有教教师都有有自己的的学生”。谓词: TEEACHHER(x):表表示x是教师师 STTUDEENT(y):表表示y是学生生 TEEACHHERSS(x,y):表表示x是y的老师师则该知识识可用谓谓词表示示为:例3 用谓谓词逻辑辑表示知知识“所有的的整数不不是偶数数就是奇奇数”。谓词: II(x): x是整数数 EE(x):x是偶数数 OO(x):x是奇数数 则该知识识可用谓谓词表示示为:例4 用谓谓词逻辑辑表示知知识:王宏
15、是计计算机系系的一名名学生。李明是王王宏的同同班同学学。凡是计算算机系的的学生都都喜欢编编程序。谓词: CCOMPPUTEER(xx): 表示xx是计算算系的学学生 CCLASSSMAATE(x,y): 表示xx是y的同班班同学 LLIKEE(x,y): 表示xx喜欢y则上述知知识表示示为: CCOMPPUTEER(WWangghonng) CCLASSSMAATE(Limmingg,Waanghhongg)2.1.3谓词词逻辑表表示的应应用 示例例1 机器人人移盒子子问题设在一房房间里,c处有有一个机机器,aa和b处处各有一一张桌子子,分别别称为aa桌和bb桌,aa桌上有有一盒子子,如图图所
16、示。要求机机器人从从c处出出发把盒盒子从aa桌拿到到b桌子子上,然然后再回回到c处处。试用用谓词逻逻辑来描描述机器器人的行行动过程程。分析:此此例中的的谓词公公式,不不仅要用用来描述述事物的的状态、位置,而且还还要用来来表示动动作。定义的谓谓词:TTABLLE(xx):xx是桌子子 EEMPTTY(yy):yy手中是是空中 AAT(yy,z): yy在z的的附近 HHOLDDS(yy,w): yy拿着ww OON(ww,x):w在在x桌面面上由此知,问题的的初始状状态是: 问问题的目目标状态态: ATT(roobott,c) ATT(roobott,c) EMPPTY(robbot) EMMP
17、TYY(roobott) ONN(boox,aa) ON(boxx,b)TABLLE(aa) TABBLE(a)TABLLE(bb) TABBLE(b)显然,机机器人行行动的目目标是把把问题的的初始状状态转换换为目标标状态。而要实实现问题题的状态态转换,则需要要完成一一系列的的操作。对于每每个操作作,一般般都可分分为条件件和动作作部分。条件部部分用来来说明执执行该操操作必须须具备的的先决条条件,动动作部分分给出了了该操作作对问题题状态的的改变情情况。条条件部分分可用谓谓词公式式来表示示,动作作部分则则是通过过在执行行该操作作前的问问题状态态中删去去和增加加相应的的谓词来来实现。本例中,机器人人
18、需要执执行的操操作: GGotoo(x,y): 从xx处走到到y处 Picckupp(x): 在在x处拿拿起盒子子 Settdowwn(xx): 在x处处放下盒盒子其对应的的条件和和动作如如下: Gooto(x,yy) 条条件:AAT(rroboot,xx) 动动作:删删除表: ATT(roobott,x) 添添加表:AT(robbot,y)Pickkup(x) 条条件:OON(bbox,x),TABBLE(x),AT(robbot,x),EMPPTY(robbot) 动动作:删删除表: EMMPTYY(roobott), ON(boxx,x) 添添加表: HOOLDSS(robbot,box
19、x)Setddownn(x) 条条件:AAT(rroboot,xx ),TABBLE(x),HOLLDS(robbot,boxx) 动动作:删删除表: HOOLDSS(roobott,boox) 添添加表: EMMPTYY(roobott), ON(boxx,x)由此得出出,机器器人行动动规划问问题的求求解过程程为: 示例例2 机器人人摞积木木问题 设机器器人有一一只机械械手,要要处理的的世界有有一张桌桌子,桌桌子可堆堆放若干干相同的的积木块块。机械械手有44个操作作积木的的典型动动作:从从桌面上上拣起一一块积木木;将手手中的积积木放到到桌面上上;在积积木上再再摞上一一块积木木;从积积木上面面
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 知识 发现 讲稿
限制150内