人工智能-4与或图搜索.ppt





《人工智能-4与或图搜索.ppt》由会员分享,可在线阅读,更多相关《人工智能-4与或图搜索.ppt(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章 与或图的搜索目标目标初始节点与或图(树)表示问题三解梵塔问题ABC123三解梵塔问题(1,1,1)(3,3,3)(1,1,1)(1,2,2)(1,2,2)(3,2,2)(3,2,2)(3,3,3)(1,1,1)(1,1,3)(1,1,3)(1,2,3)(1,2,3)(1,2,2)(3,2,2)(3,2,1)(3,2,1)(3,3,1)(3,3,1)(3,3,3)(1,1,1)A,B,C3.1 与或图初始节点与或图目标目标初始节点基本概念与或图是一个超图,节点间通过连接符连接。K-连接符:.K个与或耗散值的计算k(n,N)=Cn+k(n1,N)+k(ni,N)其中:N为终节点集 Cn为连
2、接符的耗散值.i个nn1n2ni目标目标初始节点 解图:能解节点终节点是能解节点若非终节点有“或”子节点时,当且仅当其子节点至少有一能解时,该非终节点才能解。若非终节点有“与”子节点时,当且仅当其子节点均能解时,该非终节点才能解。不能解节点没有后裔的非终节点是不能解节点。若非终节点有“或”子节点,当且仅当所有子节点均不能解时,该非终节点才不能解。若非终节点有“与”子节点时,当至少有一个子节点不能解时,该非终节点才能解。3.2 与或图启发式搜索算法AO*目标目标初始节点与或图的启发式搜索算法AO*算法 105-106两个过程:图生成过程,即扩展节点计算耗散值的过程AO*算法举例其中:h(n0)=
3、3 h(n1)=2 h(n2)=4 h(n3)=4 h(n4)=1 h(n5)=1 h(n6)=2 h(n7)=0 h(n8)=0设:K连接符的耗散值为K目标目标初始节点n0n1n2n3n4n5n6n7n8目标目标初始节点n0n1n2n3n4n5n6n7n8初始节点n0n1(2)n4(1)n5(1)红色:4=1+1+1+1黑色:3=2+1目标目标初始节点n0n1n2n3n4n5n6n7n8初始节点n0n4(1)n5(1)红色:4黑色:6n1n2(4)n3(4)5目标目标初始节点n0n1n2n3n4n5n6n7n8红色:5黑色:6初始节点n0n4(1)n5(1)n1n2(4)n3(4)5n6(2
4、)n7(0)n8(0)2目标目标初始节点n0n1n2n3n4n5n6n7n8红色:5黑色:6初始节点n0n4(1)n5(1)n1n2(4)n3(4)5n6(2)n7(0)n8(0)213.3 博弈树(Game tree)搜索3.3 博弈树(Game tree)搜索20世纪60年代,研制出的西洋跳棋和国际象棋的博弈程序达到了大师级的水平。1958约翰麦卡锡提出博弈树搜索算法1997年,IBM公司研制的“深蓝”国际象棋 程序,采用博弈树搜索算法,该程序战胜了国际象棋世界冠军卡斯帕罗夫。1.1.概述概述博弈问题特点:博弈问题特点:双人对弈,轮流走步。双人对弈,轮流走步。信息完备,双方所得到的信息是一
5、样的。信息完备,双方所得到的信息是一样的。零和,即对一方有利的棋,对另一方肯定零和,即对一方有利的棋,对另一方肯定是不利的,不存在对双方均有利或无利的是不利的,不存在对双方均有利或无利的棋。棋。1.1.概述概述博弈的特性博弈的特性两个棋手交替地走棋两个棋手交替地走棋 ;比赛的最终结果,是赢、输和平局中的比赛的最终结果,是赢、输和平局中的一种;一种;可用图搜索技术进行,但效率很低;可用图搜索技术进行,但效率很低;博弈的过程,是寻找置对手于必败态的博弈的过程,是寻找置对手于必败态的过程;过程;双方都无法干预对方的选择。双方都无法干预对方的选择。1.1.概述概述2.Grundy2.Grundy博弈博
6、弈下棋的双方是对立的,命名博弈的双方,下棋的双方是对立的,命名博弈的双方,一方为一方为“正方正方”,这类节点称为,这类节点称为“MAX”节节点;另一方为点;另一方为“反方反方”,这类节点称为,这类节点称为“MIN”节点。正方和反方是交替走步的,节点。正方和反方是交替走步的,因此因此MAX节点和节点和MIN节点会交替出现。节点会交替出现。2.Grundy2.Grundy博弈博弈Grundy博弈是一个分钱币的游戏。有博弈是一个分钱币的游戏。有 一堆数目为一堆数目为N的钱币,由两位选手轮流进的钱币,由两位选手轮流进行分堆,要求每个选手每次只把其中某行分堆,要求每个选手每次只把其中某一堆分成数目不等的
7、两小堆。例如,选一堆分成数目不等的两小堆。例如,选手甲把手甲把N分成两堆后,轮到选手乙就可以分成两堆后,轮到选手乙就可以挑其中一堆来分,如此进行下去,直到挑其中一堆来分,如此进行下去,直到有一位选手无法把钱币再分成不相等的有一位选手无法把钱币再分成不相等的两堆时就得认输。两堆时就得认输。2.Grundy2.Grundy博弈博弈设初始状态为设初始状态为(7,MIN),建立问题的状,建立问题的状态空间图,图中所有终结点均表示该选态空间图,图中所有终结点均表示该选手必输的情况,取胜方的目标是设法使手必输的情况,取胜方的目标是设法使棋局发展为结束在对方走步时的终结点棋局发展为结束在对方走步时的终结点上
8、。上。(7)(6,1)(5,2)(4,3)(5,1,1)(4,2,1)(3,2,2)(3,3,1)(4,1,1,1)(3,2,1,1)(2,2,2,1)(3,1,1,1,1)(2,2,1,1,1)(2,1,1,1,1,1)对方-min先走我方-max胜ABC2.Grundy2.Grundy博弈博弈有向图中有四个出度为零的结点有向图中有四个出度为零的结点:A,B,C结点结点A是是MAX(我方我方)的搜索目标,而结的搜索目标,而结点点B,C则为则为MIN(对方对方)的搜索目标。的搜索目标。2.Grundy2.Grundy博弈博弈搜索策略要考虑的问题是:搜索策略要考虑的问题是:对对MIN走步后的每一
9、个走步后的每一个MAX结点,必须证结点,必须证明明MAX对对MIN可能走的每一个棋局对弈后可能走的每一个棋局对弈后能获胜,即能获胜,即MAX必须考虑应付必须考虑应付MIN的所有的所有招法,这是一个与的含意,因此含有招法,这是一个与的含意,因此含有MAX符符号的结点可看成与结点。号的结点可看成与结点。2.Grundy 2.Grundy 博弈博弈对对MAX走步后的每一个走步后的每一个MIN结点,只须证结点,只须证明明MAX有一步能走赢就可以,即有一步能走赢就可以,即MAX只要只要考虑能走出一步棋使考虑能走出一步棋使MIN无法招架就成,无法招架就成,因此含有因此含有MIN符号的结点可看成或结点。符号
10、的结点可看成或结点。2.Grundy 2.Grundy 博弈博弈对弈过程的搜索图呈现出与或图表示的形式。对弈过程的搜索图呈现出与或图表示的形式。实现一种取胜的策略就是搜索一个解图的问实现一种取胜的策略就是搜索一个解图的问题,解图就代表一种完整的博弈策略。题,解图就代表一种完整的博弈策略。2.Grundy 2.Grundy 博弈博弈中国象棋中国象棋一盘棋平均走50步,总状态数约为10的161次方。假设1毫微秒走一步,约需10的145次方年。结论:不可能穷举。3.3.极小极大搜索过程极小极大搜索过程对各个局面进行评估对各个局面进行评估评估的目的:对后面的状态提前进行考虑,评估的目的:对后面的状态提
11、前进行考虑,并且以各种状态的评估值为基础作出最好的并且以各种状态的评估值为基础作出最好的走棋选择。走棋选择。评估的方法:用评价函数对棋局进行评估。评估的方法:用评价函数对棋局进行评估。赢的评估值设为赢的评估值设为+,输的评估值设为,输的评估值设为-,平局的评估值设为平局的评估值设为0。评估的标准:由于下棋的双方是对立的,只评估的标准:由于下棋的双方是对立的,只能选择其中一方为评估的标准方。能选择其中一方为评估的标准方。3.3.极小极大搜索过程极小极大搜索过程MAX节点和节点和MIN节点节点命名博弈的双方,一方为命名博弈的双方,一方为“正方正方”,对每,对每个状态的评估都是对应于该方的输赢的。个
12、状态的评估都是对应于该方的输赢的。例如,赢例如,赢2个,输个,输1个等,都是指正方的。个等,都是指正方的。正方每走一步,都在选择使自己赢得更多正方每走一步,都在选择使自己赢得更多的节点,因此这类节点称为的节点,因此这类节点称为“MAX”节点;节点;3.3.极小极大搜索过程极小极大搜索过程另一方为另一方为“反方反方”,对每个状态的评估,对每个状态的评估都是对应于对手的输赢的。例如,赢都是对应于对手的输赢的。例如,赢2个,个,输一个,其实是指自己输输一个,其实是指自己输2个,赢个,赢1个的。个的。反方每走一步,都在选择使对手输得更反方每走一步,都在选择使对手输得更多的节点,因此这类节点称为多的节点
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 搜索

限制150内