第06章-贝叶斯网络.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第06章-贝叶斯网络.ppt》由会员分享,可在线阅读,更多相关《第06章-贝叶斯网络.ppt(117页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2023/3/81高级人工智能高级人工智能第六章第六章 贝叶斯网络贝叶斯网络概概 率率 推推 理理2023/3/82内容提要内容提要6.1 6.1 概述概述 6.2 6.2 贝叶斯概率贝叶斯概率基础基础6.3 6.3 贝叶斯贝叶斯问题的求解问题的求解6.4 6.4 简单贝叶斯简单贝叶斯学习模型学习模型6.5 6.5 贝叶斯贝叶斯网络的建造网络的建造6.6 6.6 贝叶斯贝叶斯潜在语义模型潜在语义模型6.7 6.7 半监督半监督文本挖掘文本挖掘算法算法2023/3/836.1 概概 述述l贝叶斯网络是用来表示贝叶斯网络是用来表示变量间连接概率变量间连接概率的的图形图形模式模式,它提供了一种自然的
2、表示,它提供了一种自然的表示因果信息因果信息的方的方法,用来发现数据间的潜在关系。在这个网络法,用来发现数据间的潜在关系。在这个网络中,用中,用节点节点表示表示变量变量,有向边有向边表示表示变量间变量间的依的依赖赖关系关系。l贝叶斯方法以其独特的贝叶斯方法以其独特的不确定性不确定性知识表达形式、知识表达形式、丰富的丰富的概率表达概率表达能力、综合先验知识的能力、综合先验知识的增量学增量学习习特性等成为当前数据挖掘众多方法中最为引特性等成为当前数据挖掘众多方法中最为引人注目的焦点之一。人注目的焦点之一。2023/3/846.1 概概 述述6.1.1 贝叶斯网络的发展历史贝叶斯网络的发展历史l贝叶
3、斯贝叶斯(Reverend Thomas Bayes,1702-1761)学派奠学派奠基性的工作是贝叶斯的论文基性的工作是贝叶斯的论文“关于几率性问题求解的关于几率性问题求解的评论评论”。或许是他自己感觉到它的学说还有不完善的。或许是他自己感觉到它的学说还有不完善的地方,这一论文在他生前并没有发表,而是在他死后,地方,这一论文在他生前并没有发表,而是在他死后,由他的朋友发表的。著名的数学家拉普拉斯由他的朋友发表的。著名的数学家拉普拉斯(Laplace P.S.)用贝叶斯的方法导出了重要的用贝叶斯的方法导出了重要的“相继律相继律”,贝叶斯,贝叶斯的方法和理论逐渐被人理解和重视起来。但由于当时的方
4、法和理论逐渐被人理解和重视起来。但由于当时贝叶斯方法在理论和实际应用中还存在很多不完善的贝叶斯方法在理论和实际应用中还存在很多不完善的地方,因而在十九世纪并未被普遍接受。地方,因而在十九世纪并未被普遍接受。2023/3/856.1 概概 述述6.1.1 贝叶斯网络的发展历史贝叶斯网络的发展历史l二十世纪初,意大利的菲纳特(二十世纪初,意大利的菲纳特(B.de Finetti)以及英以及英国的杰弗莱(国的杰弗莱(Jeffreys H.)都对贝叶斯学派的理论作出都对贝叶斯学派的理论作出重要的贡献。第二次世界大战后,瓦尔德(重要的贡献。第二次世界大战后,瓦尔德(Wald A.)提出了提出了统计的决策
5、统计的决策理论,在这一理论中,贝叶斯解占有理论,在这一理论中,贝叶斯解占有重要的地位;信息论的发展也对贝叶斯学派做出了新的重要的地位;信息论的发展也对贝叶斯学派做出了新的贡献。贡献。1958年英国最悠久的统计杂志年英国最悠久的统计杂志Biometrika全文全文重新刊登了贝叶斯的论文,重新刊登了贝叶斯的论文,20世纪世纪50年代,以罗宾斯年代,以罗宾斯(Robbins H.)为代表,提出了经验贝叶斯方法和经为代表,提出了经验贝叶斯方法和经典方法相结合,引起统计界的广泛注意,这一方法很快典方法相结合,引起统计界的广泛注意,这一方法很快就显示出它的优点,成为很活跃的一个方向。就显示出它的优点,成为
6、很活跃的一个方向。2023/3/866.1 概概 述述6.1.1 贝叶斯网络的发展历史贝叶斯网络的发展历史l随着人工智能的发展,尤其是机器学习、数据挖掘等随着人工智能的发展,尤其是机器学习、数据挖掘等兴起,为贝叶斯理论的发展和应用提供了更为广阔的兴起,为贝叶斯理论的发展和应用提供了更为广阔的空间。贝叶斯理论的内涵也比以前有了很大的变化。空间。贝叶斯理论的内涵也比以前有了很大的变化。8080年代年代贝叶斯网络贝叶斯网络用于专家系统的知识表示,用于专家系统的知识表示,9090年代年代进一步研究进一步研究可学习的贝叶斯网络可学习的贝叶斯网络,用于数据采掘和机,用于数据采掘和机器学习。近年来,贝叶斯学
7、习理论方面的文章更是层器学习。近年来,贝叶斯学习理论方面的文章更是层出不穷,内容涵盖了人工智能的大部分领域,包括因出不穷,内容涵盖了人工智能的大部分领域,包括因果推理、不确定性知识表达、模式识别和聚类分析等。果推理、不确定性知识表达、模式识别和聚类分析等。并且出现了专门研究贝叶斯理论的组织和学术刊物并且出现了专门研究贝叶斯理论的组织和学术刊物International Society Bayesian Analysis。2023/3/876.1 概概 述述6.1.2 贝叶斯方法的基本观点贝叶斯方法的基本观点l贝叶斯贝叶斯分析方法的分析方法的特点特点是是用概率去表示所有形式用概率去表示所有形式的
8、不确定性,学习或其它形式的推理都用概率规的不确定性,学习或其它形式的推理都用概率规则来实现则来实现。l贝叶斯贝叶斯学习的结果学习的结果表示为随机变量的概率分布,表示为随机变量的概率分布,它可以解释为我们对不同可能性的信任程度。它可以解释为我们对不同可能性的信任程度。l贝叶斯贝叶斯学派的起点是贝叶斯的两项工作:学派的起点是贝叶斯的两项工作:贝叶斯贝叶斯定理定理和和贝叶斯假设贝叶斯假设。l贝叶斯贝叶斯定理将事件的定理将事件的先验概率先验概率与与后验概率后验概率联系起联系起来来。2023/3/886.1 概概 述述6.1.2 贝叶斯方法的基本观点贝叶斯方法的基本观点 假定假定随机向量随机向量x,的的
9、联合分布密度联合分布密度是是p(x,),它们它们的的边际密度边际密度分别为分别为p(x)、p()。一般情况下设一般情况下设x是是观测向观测向量量,是是未知参数向量未知参数向量,通过观测向量获得未知参数向,通过观测向量获得未知参数向量的估计,量的估计,贝贝叶斯叶斯定理定理记作:记作:()是是的先验分布的先验分布 (6.1)2023/3/896.1 概概 述述6.1.2 贝叶斯方法的基本观点贝叶斯方法的基本观点 贝贝叶斯叶斯方法方法对未知参数向量估计的一般过程对未知参数向量估计的一般过程为:为:将将未知参数看成未知参数看成随机向量,这是随机向量,这是贝贝叶斯叶斯方法与传统的参方法与传统的参数估计方
10、法的最大区别。数估计方法的最大区别。根据以往对参数根据以往对参数的知识,确定先验分布的知识,确定先验分布(),它是它是贝贝叶叶斯斯方法容易引起争议的一步,因此而受到经典统计界的攻击。方法容易引起争议的一步,因此而受到经典统计界的攻击。计算后验分布密度,做出对计算后验分布密度,做出对未知参数的推断。未知参数的推断。在第在第步,步,如果没有任何以往的知识来帮助确定如果没有任何以往的知识来帮助确定(),贝贝叶斯提出可以采用均匀分布作为其分布,即参数在它的变叶斯提出可以采用均匀分布作为其分布,即参数在它的变化范围内,取到各个值的机会是相同的,化范围内,取到各个值的机会是相同的,称这个称这个假定假定为为
11、贝贝叶叶斯假设斯假设。2023/3/8106.1 概概 述述6.1.3 贝叶斯网络的应用领域贝叶斯网络的应用领域l 辅助智能决策l 数据融合l 模式识别l 医疗诊断l 文本理解l 数据挖掘1.贝叶斯方法用于分类及回归分析贝叶斯方法用于分类及回归分析2.用于因果推理和不确定知识表达用于因果推理和不确定知识表达3.用于聚类模式发现用于聚类模式发现2023/3/8史忠植 高级人工智能116.2 6.2 贝叶斯贝叶斯概率概率基础基础 6.2.1 概率论基础概率论基础 概率论概率论是研究是研究随机现象规律性随机现象规律性的数学的数学。随机现象随机现象是指在是指在相同的条件下,其出现的结果是不确定的现象。
12、随机现象相同的条件下,其出现的结果是不确定的现象。随机现象又又可分为可分为个别随机现象个别随机现象和和大量的随机现象。对大量的随机现象大量的随机现象。对大量的随机现象进行观察所得到的规律性,被人们称为进行观察所得到的规律性,被人们称为统计规律性统计规律性。在统计上,我们习惯在统计上,我们习惯把一次对现象的观察、登记或实验把一次对现象的观察、登记或实验叫做叫做一次试验一次试验。随机性实验随机性实验是指对随机现象的观察。是指对随机现象的观察。随机试随机试验在完全验在完全相同的条件相同的条件下,可能出现下,可能出现不同的结果不同的结果,但所有可能,但所有可能结果的范围是结果的范围是可以估计可以估计的
13、,即随机试验的结果具有的,即随机试验的结果具有不确定性不确定性和和可预计性可预计性。在统计上,一般把。在统计上,一般把随机实验的结果随机实验的结果,即,即随机现随机现象的具体表现象的具体表现称为称为随机事件随机事件,简称,简称事件事件。随机事件是指试验中随机事件是指试验中可能出现可能出现,也也可能不出现可能不出现的结果。的结果。2023/3/8126.2 6.2 贝叶斯贝叶斯概率概率基础基础 6.2.1 概率论基础概率论基础 定义定义6.1 统计概率统计概率 若在大量重复试验中,事若在大量重复试验中,事件件A发生的频率稳定地接近于一个固定的常数发生的频率稳定地接近于一个固定的常数p,它它表明事
14、件表明事件A出现的可能性大小,则称此常数出现的可能性大小,则称此常数p为事件为事件A发生的概率,记为发生的概率,记为P(A),即即 pP(A)(6.2)可见概率就是频率的稳定中心。任何事件可见概率就是频率的稳定中心。任何事件A的概率的概率为不大于为不大于1的非负实数,即的非负实数,即0P(A)1 2023/3/8史忠植 高级人工智能136.2 6.2 贝叶斯贝叶斯概率概率基础基础 定义定义6.2 古典概率古典概率 我们设一种次试验有且仅有我们设一种次试验有且仅有有限的有限的N个可能结果,即个可能结果,即N个基本事件,而个基本事件,而A事件包事件包含着含着K个可能结果,则称个可能结果,则称K/N
15、为事件为事件A的概率,记为的概率,记为P(A)。即即P(A)K/N 定义定义6.3 几何概率几何概率 假设假设是几何型随机试验的是几何型随机试验的基本事件空间,基本事件空间,F是是中一切可测集的集合,则对于中一切可测集的集合,则对于F中的任意事件中的任意事件A的的概率概率P(A)为为A与与的体积之比,即的体积之比,即 P(A)V(A)/V()(6.3)2023/3/8史忠植 高级人工智能146.2 6.2 贝叶斯贝叶斯概率概率基础基础 定义定义6.4 条件概率条件概率 我们把事件我们把事件B已经出已经出现的条件下,事件现的条件下,事件A发生的概率记做为发生的概率记做为P(A|B)。并称为在并称
16、为在B出现的条件下出现的条件下A出现的出现的条件概率条件概率,而称而称P(A)为为无条件概率无条件概率。若事件若事件A与与B中的任一个出现,并不影响中的任一个出现,并不影响另一事件出现的概率,即当另一事件出现的概率,即当P(A)P(AB)或或P(B)P(BA)时,时,则称则称A与与B是相互独立的事件是相互独立的事件。2023/3/8史忠植 高级人工智能156.2 6.2 贝叶斯贝叶斯概率概率基础基础 定理定理6.1 加法定理加法定理 两个不相容两个不相容(互斥互斥)事事件之和的概率,等于两个事件概率之和,即件之和的概率,等于两个事件概率之和,即P(A+B)P(A)P(B)两个互逆事件两个互逆事
17、件A和和A-1的概率之和为的概率之和为1。即当。即当A+A-1,且且A与与A-1互斥,则互斥,则P(A)P(A-1)1,或常有或常有P(A)1P(A-1)。若若A、B为两任意事件,则为两任意事件,则P(A+B)P(A)P(B)P(AB)2023/3/8史忠植 高级人工智能166.2 6.2 贝叶斯贝叶斯概率概率基础基础 定理定理6.2 乘法定理乘法定理 设设A、B为两个为两个不相不相容容(互斥互斥)非零事件,则其乘积的概率等于非零事件,则其乘积的概率等于A和和B概率的乘积,即概率的乘积,即P(AB)P(A)P(B)或或 P(AB)P(B)P(A)设设A、B为两个任意的非零事件,则其乘为两个任意
18、的非零事件,则其乘积的概率等于积的概率等于A(或或B)的概率与在的概率与在A(或或B)出现出现的条件下的条件下B(或或A)出现的条件概率的乘积。出现的条件概率的乘积。P(AB)P(A)P(B|A)或或 P(AB)P(B)P(A|B)2023/3/8史忠植 高级人工智能176.2 6.2 贝叶斯贝叶斯概率概率基础基础6.2.2 贝叶斯概率贝叶斯概率 (1)先验概率。先验概率。先验概率是指根据历史的先验概率是指根据历史的资料或主观判断所确定的各事件发生的概率,资料或主观判断所确定的各事件发生的概率,该类概率该类概率没能经过实验证实没能经过实验证实,属于检验前的概,属于检验前的概率,所以称之为率,所
19、以称之为先验概率先验概率。先验概率一般分为。先验概率一般分为两类,一是两类,一是客观先验概率客观先验概率,是指利用过去的历,是指利用过去的历史资料计算得到的概率史资料计算得到的概率;二是;二是主观先验概率主观先验概率,是指在无历史资料或历史资料不全的时候,只是指在无历史资料或历史资料不全的时候,只能凭借人们的主观经验来判断取得的概率能凭借人们的主观经验来判断取得的概率。2023/3/8史忠植 高级人工智能186.2 6.2 贝叶斯贝叶斯概率概率基础基础 (2)后验概率。后验概率。后验概率一般是指后验概率一般是指利用贝利用贝叶斯公式叶斯公式,结合调查等方式结合调查等方式获取了新的附加获取了新的附
20、加信息,对先验概率进行修正后得到的更符合信息,对先验概率进行修正后得到的更符合实际的概率。实际的概率。(3)联合概率。联合概率。联合概率也叫联合概率也叫乘法公式乘法公式,是指两个任意事件的乘积的概率是指两个任意事件的乘积的概率,或称之为,或称之为交事件的概率交事件的概率。2023/3/8史忠植 高级人工智能196.2 6.2 贝叶斯贝叶斯概率概率基础基础 (4)全概率公式全概率公式。设设B1,B2,Bn是两两互斥的事是两两互斥的事件,且件,且P(Bi)0,i=1,2,n,B1+B2+,+Bn=。另有一事件另有一事件A=AB1+AB2+,+ABn称满足上述条件的称满足上述条件的B1,B2,Bn为
21、为完备事件组完备事件组。B1B2B3BnA6.2 6.2 贝叶斯贝叶斯概率概率基础基础 由由此此可可以以形形象象地地把把全全概概率率公公式式看看成成为为“由由原原因因推推结结果果”,每每个个原原因因对对结结果果的的发发生生有有一一定定的的“作作用用”,即即结结果果发发生生的的可可能能性性与与各各种种原原因因的的“作作用用”大大小小有有关关。全全概概率率公公式式表表达达了了它它们们之之间的关系。间的关系。诸诸Bi是是原因原因A是是结果结果B1B2B3B4B5B6B7B8A6.2 6.2 贝叶斯贝叶斯概率概率基础基础 该公式于该公式于1763年由贝叶斯年由贝叶斯(Bayes)给出。它给出。它是在观
22、察到事件是在观察到事件A已发生的条件下,寻找导致已发生的条件下,寻找导致A发生的每个原因的概率。发生的每个原因的概率。(5)贝贝叶叶斯斯公公式式。贝贝叶叶斯斯公公式式也也叫叫后后验验概概率率公公式式,亦亦叫叫逆逆概概率率公公式式,其其用用途途很很广广。设设先先验验概概率率为为P(Bi),调调 查查 所所 获获 的的 新新 附附 加加 信信 息息 为为 P(Aj|Bi)(i=1,2,n;j=1,2,m),则则贝贝叶叶斯斯公公式式计计算算的的后后验验概率为概率为(6.5)2023/3/8史忠植 高级人工智能22贝叶斯规则贝叶斯规则l基于条件概率的定义lp(Ai|E)是在给定证据下的后验概率lp(A
23、i)是先验概率lP(E|Ai)是在给定Ai下的证据似然lp(E)是证据的预定义后验概率=iiiiiiii)p(AA|p(E)p(AA|p(Ep(E)p(AA|p(EE)|p(A=p(B)A)p(A)|p(Bp(B)B)p(A,B)|p(AA1A2A3A4A5A6E2023/3/8史忠植 高级人工智能23贝叶斯网络的概率解释贝叶斯网络的概率解释l任何完整的概率模型必须具有表示(直接或间接)该领域变量联合分布的能力。完全的枚举需要指数级的规模(相对于领域变量个数)l贝叶斯网络提供了这种联合概率分布的紧凑表示:分解联合分布为几个局部分布的乘积:l从公式可以看出,需要的参数个数随网络中节点个数呈线性增
24、长,而联合分布的计算呈指数增长。l网络中变量间独立性的指定是实现紧凑表示的关键。这种独立性关系在通过人类专家构造贝叶斯网中特别有效。2023/3/8史忠植 高级人工智能246.46.4 简单贝叶斯学习模型简单贝叶斯学习模型 简单贝叶斯简单贝叶斯(nave Bayes或或simple Bayes)学习模型学习模型将训练实例将训练实例I分解成特征向量分解成特征向量X和决策类别变量和决策类别变量C。简单贝简单贝叶斯模型假定特征向量的各分量间相对于决策变量是相对叶斯模型假定特征向量的各分量间相对于决策变量是相对独立的,也就是说独立的,也就是说各分量独立地作用于决策变量各分量独立地作用于决策变量。尽管这
25、。尽管这一假定一定程度上限制了简单贝叶斯模型的适用范围,然一假定一定程度上限制了简单贝叶斯模型的适用范围,然而在实际应用中,不仅以而在实际应用中,不仅以指数级指数级降低了贝叶斯网络构建的降低了贝叶斯网络构建的复杂性,复杂性,而且在许多领域,在违背这种假定的条件下而且在许多领域,在违背这种假定的条件下,简,简单贝叶斯也表现出相当的健壮性和高效性单贝叶斯也表现出相当的健壮性和高效性111,它已经成,它已经成功地应用到分类、聚类及模型选择等数据挖掘的任务中。功地应用到分类、聚类及模型选择等数据挖掘的任务中。目前,许多研究人员正致力于改善特征变量间独立性的限目前,许多研究人员正致力于改善特征变量间独立
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 06 贝叶斯 网络
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内