人工智能第四章非经典推理优秀PPT.ppt
人工智能第四章非经典推理第1页,本讲稿共85页4.1 4.1 不确定性推理不确定性推理l不确定性推理是研究复杂系统不完全性和不确定性不确定性推理是研究复杂系统不完全性和不确定性的有力工具。的有力工具。l有三种不确定性,即关于知识的不确定、关于证据有三种不确定性,即关于知识的不确定、关于证据的不确定性和关于结论的不确定性。的不确定性和关于结论的不确定性。关于结论的不确定性也叫做规则的不确定性,它表示当规关于结论的不确定性也叫做规则的不确定性,它表示当规则的条件被完全满足时,产生某则的条件被完全满足时,产生某种结论的不确定程度。种结论的不确定程度。第2页,本讲稿共85页4.1.14.1.1不确定性推理的定义不确定性推理的定义 不确定性推理,就是从不确定性的初始证据(即已知事不确定性推理,就是从不确定性的初始证据(即已知事实)出发,通过运用不确定性的知识,最终推出具有一定实)出发,通过运用不确定性的知识,最终推出具有一定程度的不确定性但却是合理或近乎合理的结论的思维过程。程度的不确定性但却是合理或近乎合理的结论的思维过程。4.1.2 4.1.2 造成知识不精确性的主要原因造成知识不精确性的主要原因 (1 1)很多原因导致同一结果。如医学上导致低烧的病因就很)很多原因导致同一结果。如医学上导致低烧的病因就很多,医生只能作出猜测性判断。多,医生只能作出猜测性判断。(2 2)信息的不完备性。如战场态势估计、股市波动预)信息的不完备性。如战场态势估计、股市波动预测等。测等。(3 3)背景知识的不充分性。如人类目前对癌症机理还)背景知识的不充分性。如人类目前对癌症机理还不了解。不了解。(4 4)信息描述的模糊性。如)信息描述的模糊性。如“今天天气比较好今天天气比较好”。第3页,本讲稿共85页 (5)推理规则的模糊性。如)推理规则的模糊性。如“若物价上涨过快,就要紧缩信若物价上涨过快,就要紧缩信贷贷”等模糊规则。等模糊规则。(6)推理能力的局限性。如天气预报,气象专家只能满足于)推理能力的局限性。如天气预报,气象专家只能满足于时间不太长、精度尽可能好的预测算法。时间不太长、精度尽可能好的预测算法。(7)解题方案的不唯一性。无论是政治、经济、文化,)解题方案的不唯一性。无论是政治、经济、文化,还是军事领域中的很多问题,一般都有多种可选方案,在还是军事领域中的很多问题,一般都有多种可选方案,在无法绝对地判断各方案优劣的情况下,只好选择主观上认无法绝对地判断各方案优劣的情况下,只好选择主观上认为相对较优的方案,这又是一种不精确推理。为相对较优的方案,这又是一种不精确推理。4.1.34.1.3不确定性推理的基本问题不确定性推理的基本问题 除了必须解决经典推理方法中同样存在的推理方向、除了必须解决经典推理方法中同样存在的推理方向、推理方法、控制策略等基本问题外,一般还需要着重解决推理方法、控制策略等基本问题外,一般还需要着重解决不确定性的表示与度量、不确定性匹配、不确定性的传递不确定性的表示与度量、不确定性匹配、不确定性的传递算法,以及不确定性的合成等问题。算法,以及不确定性的合成等问题。第4页,本讲稿共85页(1 1)不确定性的表示与度量)不确定性的表示与度量选择不确定性表示方法时应考虑的因素:选择不确定性表示方法时应考虑的因素:根据领域问题的特征将其不确定性比较准确地描根据领域问题的特征将其不确定性比较准确地描述出来,以满足问题求解的需要;述出来,以满足问题求解的需要;便于推理过程中对不确定性的推算。便于推理过程中对不确定性的推算。l 知识的不确定性表示知识的不确定性表示 静态强度:表示相应知识的不确定性程度的某个数静态强度:表示相应知识的不确定性程度的某个数值。它可以是相应知识在应用中成功的概率,也可以值。它可以是相应知识在应用中成功的概率,也可以是该条知识的可信程度等,其值范围因其意义与使用是该条知识的可信程度等,其值范围因其意义与使用方法的不同而不同。方法的不同而不同。l 证据的不确定性表示证据的不确定性表示 推理中证据的来源:用户在求解问题时提供的初始推理中证据的来源:用户在求解问题时提供的初始证据及推理中得到的中间结果。证据及推理中得到的中间结果。第5页,本讲稿共85页 动态强度:表示相应证据的不确定性程度的数值。初始动态强度:表示相应证据的不确定性程度的数值。初始证据的动态强度由用户给出;推理过程中所得到的中间结论证据的动态强度由用户给出;推理过程中所得到的中间结论(或中间结果)的动态强度由不确定性传递算法计算得到。(或中间结果)的动态强度由不确定性传递算法计算得到。l 不确定性的度量:对于不同的知识及不同的证据,其不不确定性的度量:对于不同的知识及不同的证据,其不确定性的程度一般是不相同的,需要用不同的数据表示其确定性的程度一般是不相同的,需要用不同的数据表示其不确定性程度,还需事先规定其取值范围,只有这样每个不确定性程度,还需事先规定其取值范围,只有这样每个数据才会有确定的意义。例如,在专家系统数据才会有确定的意义。例如,在专家系统MYCIN中,中,l 可信度:表示知识及证据的不确定性;可信度:表示知识及证据的不确定性;l 取值范围:取值范围:-1,1;l 当可信度当可信度0时,其值越大表示相应的知识或证据越接近于时,其值越大表示相应的知识或证据越接近于“真真”;l 当可信度当可信度0,称称为事件为事件B已发生条件下,事件已发生条件下,事件A发生的条件概率发生的条件概率第13页,本讲稿共85页3.3.全概率公式与全概率公式与BayesBayes公式公式(1 1)全概率公式)全概率公式设事件设事件A A1 1,A A2 2,A An n满足:满足:(1)(1)任意两个事件都互不相容,即当任意两个事件都互不相容,即当ijij时,有时,有A Ai iAAj j=(i=1=(i=1,2 2,n n;j=1j=1,2 2,n)n);(2)P(A(2)P(Ai i)0(i=1)0(i=1,2 2,n)n);(3)(3)对任何事件对任何事件B B有:有:第14页,本讲稿共85页l例:例:A A1 1=取红桃牌取红桃牌 A A2 2=取方块牌取方块牌 A A3 3=取黑桃牌取黑桃牌 A A4 4=取梅花牌取梅花牌 A A5 5=取王牌取王牌 B=B=取花脸牌取花脸牌 解解:P(B)=P(AP(B)=P(A1 1)P(B|A)P(B|A1 1)+P(A)+P(A2 2)P(B|A)P(B|A2 2)+P(A +P(A3 3)P(B|A)P(B|A3 3)+P(A)+P(A4 4)P(B|A)P(B|A4 4)+P(A +P(A5 5)P(B|A)P(B|A5 5)=(13/543/13)4+2/540 =(13/543/13)4+2/540 =12/54 =12/54第15页,本讲稿共85页(2 2)BayesBayes公式公式设事件设事件A A1 1,A A2 2,A An n两两互不相容,且它们构成全部样本两两互不相容,且它们构成全部样本空间,则对任何事件空间,则对任何事件B B有:有:称称这这个个公公式式为为BayesBayes公公式式,同同时时称称P(AP(Ai i),P(B|AP(B|Ai i)的的值值为为先先验验概概率率;P(AP(Ai i|B)|B)的的值值为为后后验验概概率率。BayesBayes公公式式就就是是从从先先验验概率推导出后验概率的公式。概率推导出后验概率的公式。【注意】:贝叶斯公式与全概率公式的区别。【注意】:贝叶斯公式与全概率公式的区别。(1)全概率公式是由原因到结果的计算公式;)全概率公式是由原因到结果的计算公式;(2)贝贝叶叶斯斯公公式式是是在在已已知知某某种种结结果果发发生生的的情情况况下下,寻寻求求使使这这个个结结果果发发生生的的原原因因。贝贝叶叶斯斯公公式式在在实实际际问问题题中中有有着着十分重要的应用。十分重要的应用。第16页,本讲稿共85页4.3 4.3 确定性理论(可信度方法)确定性理论(可信度方法)1 1、可信度的概念、可信度的概念 可信度是指人们根据以往经验对某个事物或现象为真的程可信度是指人们根据以往经验对某个事物或现象为真的程度的一个判断,即人们对某个事物或现象为真的相信程度。度的一个判断,即人们对某个事物或现象为真的相信程度。在确定性理论中不确定性是用可信度表示的。在确定性理论中不确定性是用可信度表示的。2 2、C-FC-F模型模型(1 1)知识的不确定性)知识的不确定性在在C-FC-F模型中,知识是用产生式规则表示的。模型中,知识是用产生式规则表示的。IF E THEN H IF E THEN H (CF(H,E)CF(H,E)E E是知识的前提条件(证据),可以是一个简单是知识的前提条件(证据),可以是一个简单条件,也可以是由合取和析取构成的复合条件。条件,也可以是由合取和析取构成的复合条件。H H是知识的结论,可以是一个或多个结论。是知识的结论,可以是一个或多个结论。第17页,本讲稿共85页lCF(H,E)CF(H,E)是知识的可信度。是知识的可信度。CF(H,E)CF(H,E)的具体值由领域专家给的具体值由领域专家给出,其取值范围为出,其取值范围为 一一1 1,11。CF(H,E)CF(H,E)0 0表示证据存在,增表示证据存在,增加结论为真的确定性程度,加结论为真的确定性程度,CF(H,E)CF(H,E)越大结论越真,越大结论越真,CF(H,E)CF(H,E)1 1表示证据存在结论为真。相反,表示证据存在结论为真。相反,CF(H,E)CF(H,E)0 0表示证据存在,增表示证据存在,增加结论为假的确定性程度,加结论为假的确定性程度,CF(H,E)CF(H,E)越小结论越假,越小结论越假,CF(H,E)CF(H,E)一一1 1表示证据存在结论为假。表示证据存在结论为假。CF(H,E)CF(H,E)0 0时,则表示证据与时,则表示证据与结论无关。结论无关。例如:例如:IF IF 发烧发烧 AND AND 流鼻涕流鼻涕 THEN THEN 感冒感冒(0.8)(0.8)第18页,本讲稿共85页 (2 2)可信度的定义)可信度的定义 CF(H,E)=MB(H,E)-MD(H,E)CF(H,E)=MB(H,E)-MD(H,E)MB(H,E):MB(H,E):信任增长度,表示证据信任增长度,表示证据E E的出现,使结论的出现,使结论H H为真的信为真的信任增长度。任增长度。若若P P(H H)=1=1 否则否则 MD(H,E)MD(H,E):不信任增长度,表示证据不信任增长度,表示证据E E的出现,对结论的出现,对结论H H的不的不信任增长度。信任增长度。若若P P(H H)=0=0 否则否则 P P(H H)为为H H的先验概率,的先验概率,P P(H|EH|E)为为H H的条件概率的条件概率第19页,本讲稿共85页 MB MB(H H,E E)00表示因证据表示因证据E E的出现增加对结论的出现增加对结论H H为真的信任增为真的信任增长度,即长度,即P P(H|EH|E)PP(H H)MD MD(H H,E E)00表示因证据表示因证据E E的出现增加对结论的出现增加对结论H H为真的不信任为真的不信任增长度,即增长度,即P P(H|EH|E)PP(H)P(H|E)P(H)若若P(H|E)=P(H)P(H|E)=P(H)若若P(H|E)P(H)P(H|E)0时,时,MD(H,E)=0 当当MD(H,E)0时,时,MB(H,E)=0第20页,本讲稿共85页l值域值域 0MB(H,E)1 0MD(H,E)1 -1CF(H,E)1l典型值典型值 -1 则则P(H|E)=0 CF(H/E)=0 则则P(H|E)=P(H)1 则则P(H|E)=1l对对H的信任增长度等于对非的信任增长度等于对非H的不信任增长度的不信任增长度 MD(H,E)=MB(H,E)lCF不同于概率不同于概率P 对于概率有:对于概率有:P(H)+P(H)=1 且且0 P(H),P(H)1 而而 CF(H|E)+CF(H|E)=0 即:对即:对H的可信度与对非的可信度与对非H的可信度之和等于的可信度之和等于0第21页,本讲稿共85页l对同一前提对同一前提E,若支持若干个不同的结论若支持若干个不同的结论Hi,则则 (3 3)证据的不确定性)证据的不确定性 证据的不确定性是用证据的确定性因子证据的不确定性是用证据的确定性因子CF(E)CF(E)表示的。表示的。原始证据的确定性因子由用户主观地给出,非原始证据原始证据的确定性因子由用户主观地给出,非原始证据的确定性因子由不确定性推理获得。的确定性因子由不确定性推理获得。值域值域l当证据当证据E E以某种程度为真时,有以某种程度为真时,有0 0CF(E)lCF(E)l。l当证据当证据E E以某种程度为假时,有以某种程度为假时,有-1-1CF(E)CF(E)0 0。l当证据当证据E E一无所知时,有一无所知时,有CF(E)CF(E)0 0。典型值典型值l 当证据当证据E E肯定为真时,有肯定为真时,有CF(E)CF(E)l l。l 当证据当证据E E肯定为假时,有肯定为假时,有CF(E)CF(E)-1-1。l 当证据当证据E E一无所知时,有一无所知时,有CF(E)CF(E)0 0。第22页,本讲稿共85页(4 4)不确定性推理算法)不确定性推理算法vE E肯定存在肯定存在 在在证证据据E E肯肯定定存存在在时时有有CF(E)CF(E)1 1,那那么么结结论论H H的确定性因子为规则的确定性因子,即的确定性因子为规则的确定性因子,即 CF(H)CF(H)CF(HCF(H,E)E)vE E不是肯定存在不是肯定存在 在在客客观观的的现现实实世世界界中中,对对证证据据的的观观察察往往往往也也是是不不确确定定的的。除除此此之之外外,证证据据E E可可能能还还是是另另一一条条规规则则的的结结论论,这这时时也也常常常常是是不不确确定定的的。在在这这种种情情况况下下,结结论论H H的的确确定定性性因因子子CF(H)CF(H)不不仅仅取取决决于于规规则则的的确确定定性性因因子子CF(HCF(H,E)E),而而且且还还取取决决于于证据证据E E的确定性因子的确定性因子CF(E)CF(E)。计算公式为计算公式为 CF(H)CF(H)CF(HCF(H,E)max0E)max0,CF(E)CF(E)第23页,本讲稿共85页v证据是多个条件的逻辑组合证据是多个条件的逻辑组合l证据是合取连接证据是合取连接 即即 E=EE=E1 1 AND E AND E2 2 AND ANDAND EAND En n 则则 CF(E)CF(E)CF(ECF(E1 1 AND E AND E2 2 AND.AND E AND.AND En n)minCF(EminCF(E1 1),CF(ECF(E2 2),.,CF(ECF(En n)l证据是析取连接证据是析取连接 这时,这时,E EE E1 1 OR E OR E2 2 OR.OR E OR.OR En n,有有 CF(E)CF(E)CF(ECF(E1 1 OR E OR E2 2 0R.OR E 0R.OR En n)maxCF(EmaxCF(E1 1),CF(ECF(E2 2),.,CF(ECF(En n)第24页,本讲稿共85页(5 5)结论不确定性的合成)结论不确定性的合成 当多条知识推出相同结论,且这些知识的前提相互独当多条知识推出相同结论,且这些知识的前提相互独立,结论的可信度又不相同,则可用不确定性的合成算立,结论的可信度又不相同,则可用不确定性的合成算法求出该结论的综合可信度。法求出该结论的综合可信度。若有两条规则分别是若有两条规则分别是 IF EIF E1 1 THEN H (CF(H THEN H (CF(H,E E1 1)IF E IF E2 2 THEN H (CF(H THEN H (CF(H,E E2 2)那末首先分别计算出那末首先分别计算出CF1(H)CF1(H)和和CF2(H)CF2(H):CF1(H)CF1(H)CF(HCF(H,E E1 1)max0)max0,CF(ECF(E1 1)CF2(H)CF2(H)CF(HCF(H,E E2 2)max0)max0,CF(ECF(E2 2)第25页,本讲稿共85页然后用公式然后用公式 CF CF1 1(H)(H)十十CFCF2 2(H)-CF(H)-CF1 1(H)CF(H)CF2 2(H)(H)若若CFCF1 1(H)0 (H)0 且且CFCF2 2(H)0(H)0CFCF1212(H)(H)CF CF1 1(H)(H)十十CFCF2 2(H)(H)十十CFCF1 1(H)CF(H)CF2 2(H)(H);若若CFCF1 1(H)(H)0 0且且CFCF2 2(H)(H)0 0 (CF (CF1 1(H)(H)十十CFCF2 2(H)/(1-min|CF(H)/(1-min|CF1 1(H)|,|CF(H)|,|CF2 2(H)|)(H)|);其他其他计算出由计算出由E E1 1和和E E2 2组合而导出的确定性因子组合而导出的确定性因子CFCF1212(H)(H)。第26页,本讲稿共85页举例举例有如下的推理规则:有如下的推理规则:Rule l:IF E1 THEN H (0.9)Rule 2:IF E2 THEN H (0.7)Rule 3:IF E3 THEN H (-0.8)Rule 4:IF E4 AND E5 THEN E1 (0.7)Rule 5:IF E6 AND(E7 0R E8)THEN E2 (1.0)HE1E2E6E4E5ORAND0.9-0.80.71.0R1R3R4R5E3E7E80.7R2AND第27页,本讲稿共85页 在图中,在图中,E3、E4、E5、E6、E7和和E8为原始证据,其确定性为原始证据,其确定性因子由用户给出,假定它们的值为:因子由用户给出,假定它们的值为:CF(E3)0.3,CF(E4)0.9,CF(E5)0.6,CF(E6)0.7,CF(E7)-0.3,CF(E8)0.8。求求CF(H)=?解:先求出解:先求出CF(E1)、CF(E2)和和CF(E3)。CF(E1)07max0,CF(E4 AND E5)07max0,minCF(E4),CF(E5)07max0,min09,06 07max0,06 o706 0.42第28页,本讲稿共85页CF(E2)1max0,CF(E6 AND(E7 OR E8)1max(0,minCF(E6),maxCF(E7),CF(E8)1max0,minCF(E6),max-0.3,0.8 1max0,min0.7,0.8 1max0,0.7 10.7 0.7CF(E3)0.3CF1(H)09max0,CF(E1)09max0,042 09042 038第29页,本讲稿共85页CF2(H)07max0,CF(E2)07max0,07 0707 049CF3(H)08CF(E3)0803 024 CF1(H)0 且且CF2(H)0 CF12(H)CF1(H)十十CF2(H)CF1(H)CF2(H)038十十0490380.4906838CF12(H)0 且且CF3(H)1LS1时时,O(H|E)O(H)O(H|E)O(H),说说明明E E支支持持H H,LSLS越越大大,O(H|E)O(H|E)就就越越大大,即即P(H|E)P(H|E)越越大大,说说明明E E对对H H的的支支持持越越强强。当当LSLS时时,O(H|E)O(H|E),从从而而有有P(H|E)1P(H|E)1,说明说明E E的存在导致的存在导致H H为真。为真。当当LS=1LS=1时,时,O(H|E)O(H|E)O(H)O(H),说明说明E E对对H H没有影响没有影响 当当LS1LS1时,时,O(H|E)O(H)O(H|E)1LN1时时,O(H|O(H|E)O(H)E)O(H),说说明明 E E支支持持H H,LNLN越越大大,O(H|O(H|E)E)就就越越大大,即即P(H|P(H|E)E)越越大大,说说明明 E E对对H H的的支支持持越越强强。当当LNLN时时,O(H|O(H|E)E),从而有从而有P(H|P(H|E)1E)1,说明说明 E E的存在导致的存在导致H H为真。为真。当当LN=1LN=1时,时,O(H|O(H|E)E)O(H)O(H),说明说明 E E对对H H没有影响没有影响 当当LN1LN1时,时,O(H|O(H|E)O(H)E)1LS1且且LN1LN1;LS1 LS1LN1 LS=LN=1 LS=LN=1第38页,本讲稿共85页在在主主观观BayesBayes方方法法中中,一一条条规规则则变变成成了了如如下下的的形形式式:IF IF E E THEN(LSTHEN(LS,LN)HLN)H 其中参数其中参数LSLS,LNLN和先验几率和先验几率O(H)O(H)要由领域专家主观给出。要由领域专家主观给出。2.2.证据不确定性的描述证据不确定性的描述 在主观在主观BayesBayes方法中,证据方法中,证据E E的不确定性采用概率的不确定性采用概率P P的等价形式的等价形式几几率来描述。率来描述。P(E)0 P(E)0 当当E E为假时为假时 O(E)=O(E)=当当E E为真时为真时 1-P(E)1-P(E)(0 0,+)当当E E非真也非假时非真也非假时3.3.组合证据不确定性的计算组合证据不确定性的计算证据合取情况:证据合取情况:E=EE=E1 1 AND E AND E2 2 AND ANDAND EAND En n设设在在观观察察S S之之下下,证证据据E E1 1,E E2 2,E En n的的概概率率为为P(EP(E1 1|S)|S)、P(EP(E2 2|S)|S)、P(EP(En n|S)|S),那么有那么有 P(E|S)P(E|S)MinP(EMinP(E1 1|S)|S),P(EP(E2 2|S)|S),.,P(EP(En n|S)|S)第39页,本讲稿共85页4.4.不确定性的更新不确定性的更新 根据证据根据证据E E的概率的概率P P(E E)及及LSLS,LNLN的值,把的值,把H H的先验概的先验概率率P P(H H)或先验几率或先验几率O O(H H)更新为后验概率或后验几率更新为后验概率或后验几率(1 1)当证据)当证据E E肯定为真时肯定为真时(P(E)P(E)1)1)可直接使用公式可直接使用公式 O(H|E)O(H|E)LSO(H)LSO(H)以求得使用规则以求得使用规则EHEH后,后,O(H)O(H)的更新值的更新值O(H|E)O(H|E)。证据析取情况证据析取情况 E=EE=E1 1 OR E OR E2 2 0R 0ROR EOR En n设在观察设在观察S S之下,证据之下,证据E E1 1,E E2 2,.,E En n的概率为的概率为P(EP(E1 1|S)|S)、P(EP(E2 2|S)|S)、.、P(EP(En n|S)|S),那么有那么有P(E|S)P(E|S)maxP(EmaxP(E1 1|S)|S),P(EP(E2 2|S)|S),P(EP(En n|S)第40页,本讲稿共85页若需要以概率的形式表示,则对上式反复应用公式若需要以概率的形式表示,则对上式反复应用公式 P(E)=O(E)/(1+O(E)P(E)=O(E)/(1+O(E)计算出计算出P(H|E)=(LSP(H)/(LS-1)P(H)+1)P(H|E)=(LSP(H)/(LS-1)P(H)+1)(2 2)当证据)当证据E E肯定为假时肯定为假时(P(P(E)E)1)1)可直接使用公式可直接使用公式 O(H|O(H|E)E)LNLNO(H)O(H)以求得使用规则以求得使用规则EHEH后,后,O(H)O(H)的更新值的更新值O(H|O(H|E)E)。若以概率的形式表示若以概率的形式表示P(H|P(H|E)=(LNE)=(LNP(H)/(LN-1)P(H)+1)P(H)/(LN-1)P(H)+1)第41页,本讲稿共85页(3)(3)当证据当证据E E不确定时不确定时(P(E)1)P(E)1)设设S S是与是与E E有关的所有观察,对规则有关的所有观察,对规则EHEH来说有公式来说有公式 P(H|S)P(H|S)P(H|E)P(E|S)P(H|E)P(E|S)十十P(H|P(H|E)P(E)P(E|S)E|S)l当当P(E|S)P(E|S)1 1时,时,P(P(E|S)=0,E|S)=0,证据证据E E必然出现,有必然出现,有 P(H|S)P(H|S)P(H|E)P(H|E)LSP(H)/(LS-1)P(H)+1)LSP(H)/(LS-1)P(H)+1)l当当P(E|S)P(E|S)0 0时,时,P(P(E|S)=1,E|S)=1,证据证据E E必然不出现必然不出现有有 P(H|S)=P(H|P(H|S)=P(H|E)=LNP(H)/(LN-1)P(H)+1)E)=LNP(H)/(LN-1)P(H)+1)l当当P(E|S)P(E|S)P(E)P(E)时,即观察时,即观察S S对对E E无影响无影响有有 P(H|S)=P(H|E)P(E)+P(H|P(H|S)=P(H|E)P(E)+P(H|E)P(E)P(E)E)=P(H)=P(H)l当当P(E|S)P(E|S)为其他值时为其他值时 可以从可以从P(E|S)P(E|S)分别为分别为0 0,P(E)P(E)和和1 1这这3 3个特殊点采用分个特殊点采用分段线性插值的方法,确定与其相应的段线性插值的方法,确定与其相应的P(H|S)P(H|S)值。值。第42页,本讲稿共85页称为称为EH公式公式P(E)P(E|S)01P(H|S)P(H|E)P(H)P(H|E)P(H/E)+P(E/S)若若 0 P(E/S)P(E)P(H)+P(E/S)P(E)若若 P(E)P(E/S)1P(H)P(H/E)P(E)P(H/E)P(H)1 P(E)P(H/S)=第43页,本讲稿共85页由用户根据观察由用户根据观察S给出给出P(E|S)相当困难相当困难引入引入可信度可信度的概念的概念(为用户回答方便,采用(为用户回答方便,采用-5到到5这这11个整数之一作为证据的个整数之一作为证据的可信度,用户可以根据实际情况从中选择)可信度,用户可以根据实际情况从中选择)可信度可信度C(E|S)和概率和概率P(E|S)的对应关系如下:的对应关系如下:C(E|S)=-5,即在观察,即在观察S下证据下证据E肯定不存在,肯定不存在,P(E|S)=0C(E|S)=0,表示,表示S与与E无关,即无关,即P(E|S)=P(E)C(E|S)=5,即在观察,即在观察S下证据下证据E肯定存在,肯定存在,P(E|S)=1C(E|S)为其它数时,可通过对上述三点进行分段线性插值为其它数时,可通过对上述三点进行分段线性插值得到得到CP公式公式 第44页,本讲稿共85页-5 -4 -3 -2 -1 0 1 2 3 4 5 P(E|S)=1P(E|S)=0P(E|S)P(E)C(E/S)第45页,本讲稿共85页5.5.结论不确定性的合成结论不确定性的合成设一组相互独立的证据设一组相互独立的证据E E1 1、E E2 2E En n的观察分别为的观察分别为S S1 1、S S2 2S Sn n,且且有规则有规则E E1 1HH,E E2 2HH,E En nHH。假定由这些规则得到的结论假定由这些规则得到的结论H H的后验几率分别是的后验几率分别是O(H|SO(H|S1 1)、O(H|SO(H|S2 2)O(H|SO(H|Sn n),那么由这些那么由这些独立证据的组合相应得到的结论独立证据的组合相应得到的结论H H的后验几率为的后验几率为O(H|SO(H|S1 1,S,S2 2,S,Sn n)=)=O(H|SO(H|S1 1)X O(H|S O(H|S2 2)X O(H|S O(H|Sn n)X 0(H)O(H)O(H)O(H)O(H)O(H)O(H)第46页,本讲稿共85页例例1 设有如下规则:设有如下规则:规则规则1:IF E1 THEN(2,0.001)H规则规则2:IF E2 THEN(100,0.001)H且且O(H)=0.1,C(E1|S1)=2,C(E2|S2)=1 计算计算O(H|S1,S2)HE1S1E2S2第47页,本讲稿共85页第48页,本讲稿共85页第49页,本讲稿共85页例例2 PROSPECTOR专专家家系系统统中中的的部部分分推推理理网网络络如如图图所所示示。图图中中各各结结点点的的先先验验概概率率标标在在结结点点的的右右上上方方,规规则则的的LS和和LN值值标标在在该该规规则则连连线线的的一一侧侧。用用户户给给出出的的各各原原始始证证据据在在各各自自的的观察之下概率为:观察之下概率为:P(E1|S1)0.7,P(E2|S2)0.6,P(E3|S3)0.02。现现 要要 求求 计计 算算 结结 论论 H2的的 后后 验验 概概 率率P(H2|S1,S2,S3)。H2H1E3E1E265,0.01300,0.00012,0.000001100,0.0000010.010.030.10.40.2第50页,本讲稿共85页即有如下规则:即有如下规则:R1:IF ER1:IF E1 1 THEN(2,0.000001)H THEN(2,0.000001)H1 1R2:IF ER2:IF E2 2 THEN(100,0.000001)H THEN(100,0.000001)H1 1R3:IF HR3:IF H1 1 THEN(65,0.01)H THEN(65,0.01)H2 2R4:IF ER4:IF E3 3 THEN(300,0.0001)H THEN(300,0.0001)H2 2和专家给出的先验概率:和专家给出的先验概率:P(EP(E1 1)=0.2,P(E)=0.2,P(E2 2)=0.4,P(E)=0.4,P(E3 3)=0.03,)=0.03,P(HP(H1 1)=0.1,P(H)=0.1,P(H2 2)=0.01)=0.01用户给出的在观察用户给出的在观察S S下证据下证据E E的概率:的概率:P(EP(E1 1|S|S1 1)=0.7,P(E)=0.7,P(E2 2|S|S2 2)=0.6,P(E)=0.6,P(E3 3|S|S3 3)=0.02)=0.02第51页,本讲稿共85页解解 1根据根据P(E1|Sl)计算计算P(H1|Sl)由于由于P(E1|S1)0.70.2P(E1),所以所以P(H1|E1)LS P(H1)(LS-1)P(H1)十十1 20.1 0.1818 (2-1)0.1十十1 P(H1|S1)P(H1)十十P(H1|E1)-P(H1)1-P(E1)P(E1|S1)-P(E1)0.1十十 0.1818-0.1(0.7-0.2)1-0.2 0.151125P(H|S)P(H1|E1)P(H1)P(H|E)P(E1)P(E|S)01P(E1|S1)P(H1|S1)P(H/S)=P(H|E)+(P(H)-P(H|E)/P(E)P(E|S)0P(E|S)P(E)P(H/S)=P(H)+(P(H/E)-P(H)/(1-P(E)(P(E/S)-P(E)P(E)P(E|S)1第52页,本讲稿共85页2根据根据P(E2|S2)计算计算P(H1|S2)。由于由于P(E2|S2)0.80.4P(E2),所以所以 P(H1|E2)LS P(H2)(LS-1)P(H2)+1 1000.1 0.9174311 990.1+1 P(H1|S2)P(H1)+P(H1|E2)-P(H1)1-P(E2)P(E2|S2)-P(E2)0.1+0.9174311-0.1 (0.6-0.4)1-0.4 0.372477P(H|S)P(H1|E2)P(H1)P(H|E)P(E2)01P(E2|S2)P(H1|S2)第53页,本讲稿共85页3.根据独立证据根据独立证据E1和和E2计算计算P(H1|S1,S2)。先计算后验几率先计算后验几率O(H1|S1,S2),由于由于 O(H1)P(H1)0.1 0.1111111 1-P(H1)1-0.1 O(H1|S1)P(H1|S1)0.151125 1-P(H1|S1)1-0.151125 0.1780297 O(H1|S2)P(H1|S2)0.372477 1-P(H1|S2)1-0.372477 0.593567 由此得:由此得:O(H1|S1,S2)O(H1|S1)O(H1|S2)O(H1)O(H1)O(H1)0.1780297 0.593567 0.111111 0.9510532 0.111111 0.111111然后计算后验概率然后计算后验概率P(H1|Sl,S2),得,得 P(H1|S1,S2)O(H1|S1,S2)0.9520532 1+O(H1|S1,S2)1.9510532 0.4874563第54页,本讲稿共85页4根据根据P(H1|Sl,S2)计算计算P(H2|S1,S2)由于由于P(H1|S1,S2)0.48745630.1P(H1),所以所以 P(H2|H1)LSP(H2)65 0.01 (LS-1)P(H2)+1 640.01+1 0.3963414P(H2|S1,S2)P(H2)P(H2|H1)-P(H2)1-P(H1)P(H1|Sl,S2)-P(H1)0.01十十0.3963414-0.01 (0.4874563-0.1)1-0.1 0.1763226P(H|S)P(H2|Hl)P(H2)P(H|E)P(H1)01P(H1|S1,S2)P(H2|S1,S2)第55页,本讲稿共85页5根据根据P(E3|S3)计算计算P(H2|S3)。由于由于P(E3|S3)0.020.03,所以所以 P(H2|E3)LNP(H2)(LN-1)P(H2)+1 0.00010.01 0.000001 -0.99990.1+1P(H2|S3)P(H2|E3)+P(H2)-P(H2|E3)P(E3|S3)P(E3)0.000001十十0.01-0.0000010.02 0.03 0.006667 P(H2)P(H|S)P(H2|E3)P(H2)P(H2|E3)P(E3)01P(E3|S3)P(H2|S3)第56页,本讲稿共85页 6根据独立证据根据独立证据H1和和E3计算计算P(H2|S1,S2,S3)先计算后验几率先计算后验几率O(H2|Sl,S2,S3),由于由于 O(H2)P(H2)0.01 0.010l0l 1-P(H2)1-0.01 O(H2|S1,S2)P(H2|S1,S2)1-P(H2|S1,S2)0.1763226 0.2140675 0.8236774 O(H2|S3)P(H2|S3)1-P(H2|S3)0.006667 0.00671174 0.993333第57页,本讲稿共85页因此得因此得O(H2|S1,S2,S3)O(H2|S1,S2)O(H2|S3)O(H2)O(H2)O(H2)0.21406750.006711740.010101 0.010101 0.010101 0.142239最后得到后验概率最后得到后验概率 P(H2|S1,S2,S3)O(H2|S1,S2,S3)1+O(H2|S1,S2,S3)0.142239 0.1245 1+0.142239以上计算表明,经推理后假设以上计算表明,经推理后假设H2的概率已从先验概率的概率已从先验概率0.01增大到后验概率增大到后验概率0.1245。第58页,本讲稿共85页l主观主观Bayes方法的优点是:方法的优点是:1基于基于Bayes规则的计算方法具有理论基础和规则的计算方法具有理论基础和易于理解的数学性质,它提供了两个规则强度,易于理解的数学性质,它提供了两个规则强度,恰当地处理了证据存在和不存在两种情况对假恰当地处理了证据存在和不存在两种情况对假设的影响,以及分段线性插值方法较好地处理设的影响,以及分段线性插值方法较好地处理了主观概率的数学不一致性了主观概率的数学不一致性.2该方法的计算工作量适中。