高级搜索技术 精选文档.ppt
《高级搜索技术 精选文档.ppt》由会员分享,可在线阅读,更多相关《高级搜索技术 精选文档.ppt(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、高级搜索技术 本讲稿第一页,共六十九页大大 纲纲再谈alpha与beta迭代搜索渴望搜索主要变异(极小窗口)搜索NULL MOVE搜索着法顺序相关的启发式其它本讲稿第二页,共六十九页零再谈alpha与beta本讲稿第三页,共六十九页最原始的最原始的alphaalpha和和betabeta涵义涵义再谈alpha与beta alpha和beta是搜索过程中的重要约束,违反该约束的分支对最终的搜索结果不起作用,因而应将其剪枝(alpha剪枝或beta剪枝)。因此,搜索算法能产生的剪枝越多越好;对于一个特定的结点,剪枝产生的越早越好。采用最朴素的alpha-beta搜索计算的结果与MiniMax搜索来
2、计算的结果是完全一样的。本讲稿第四页,共六十九页174298MAXMINMIN77(1)(1)下图是何种剪枝?下图是何种剪枝?再谈alpha与beta本讲稿第五页,共六十九页MAXMAXMIN45682434(2)(2)下图是何种剪枝?下图是何种剪枝?再谈alpha与beta本讲稿第六页,共六十九页最原始的最原始的alphaalpha和和betabeta再谈alpha与beta1)Max手握alpha,使alpha有不断增大的趋势;Min手握beta,使beta有不断减小的趋势。Max的alpha值对应一个叶节点的值;Min的beta值也对应一个叶节点的值。2)产生剪枝的唯一根据是“alpha
3、 beta”。双方均能接受的值应当落在(alpha,beta)区间上,该约束一般被称为窗口。(试想:为什么“alpha beta”就一定剪枝?)本讲稿第七页,共六十九页最原始的最原始的alphaalpha和和betabeta再谈alpha与beta3)alpha剪枝是因为beta突然被儿子结点的返回值减小,减小后的beta满足了2),或者说,违背了约束alpha;类似地,beta剪枝是因为alpha突然被儿子结点的返回值增大,增大后的alpha满足了2),或者说,违背了约束beta。4)基于NegaMax的alpha-beta搜索中,仅有beta剪枝。本讲稿第八页,共六十九页窗口的初始化窗口的
4、初始化再谈alpha与beta1)在最朴素的alpha-beta搜索中,初始窗口取为(-INFINITY,+INFINITY)。这代表,在开始搜索之前,Max和Min都做最坏的假定,它保证了最佳解(特定条件下的博弈树中的某个叶子)一定包含在搜索的状态空间之中。2)思考问题:若初始窗口比(-INFINITY,+INFINITY)小,能保证搜索一定找到最优解么?答:不能保证。Why?本讲稿第九页,共六十九页搜索算法中的窗口搜索算法中的窗口再谈alpha与beta1)在搜索算法的执行中,窗口充当了约束(相当于多主体的分支界限法)。a)属于Max(在偶数层)的祖先结点向对应子树中的偶数层子孙结点施加了
5、alpha约束;b)属于Min(在奇数层)的祖先结点向对应子树中的奇数层子孙结点施加了alpha约束。本讲稿第十页,共六十九页搜索算法中的窗口搜索算法中的窗口再谈alpha与beta2)在搜索函数的递归调用中,从父节点向子节点传递了一个窗口,但从儿子结点仅返回一个返回值,不返回窗口。3)窗口是以“值传递”的形式向下传播给子孙结点的。4)从儿子返回的(估值,或搜索函数返回值)值:Max结点返回alpha,其值可能修改祖先的beta;Min结点返回beta,其值可能修改祖先的alpha。本讲稿第十一页,共六十九页MAXMAXMIN45682434黑板上演示窗口变化!黑板上演示窗口变化!再谈alph
6、a与beta本讲稿第十二页,共六十九页返回值与窗口返回值与窗口再谈alpha与betaA1A2A3An(alpha,beta)Value=-Search()If(Value alpha&Value=beta)A1A2A3AnValue=-Search()(alpha,beta)发生了剪枝(Pruning/cutting-off)MINMAX返回值与窗口返回值与窗口再谈alpha与beta本讲稿第十五页,共六十九页尝试小的初始窗口尝试小的初始窗口n 在朴素alpha-beta搜索中,初始窗口为(-INFINITY,+INFINITY)。n 考虑不采用(-INFINITY,+INFINITY)。若
7、给定博弈树和估值函数,则其解也随之确定,若解的真实估值为v。a)当分别采用包含了v的两个初始窗口分别搜索时,每个搜索算法都能找到解,且小窗口的剪枝效率更高!b)当所采纳的初始窗口并没有包含v,则搜索算法将错失解。这时,需要关注两种朴素alpha-beta搜索算法。再谈alpha与beta本讲稿第十六页,共六十九页Fail-hard alpha-betaFail-hard alpha-beta再谈alpha与beta本讲稿第十七页,共六十九页Fail-soft alpha-betaFail-soft alpha-beta再谈alpha与beta本讲稿第十八页,共六十九页Fail-soft vs.
8、Fail-hardFail-soft vs.Fail-hard再谈alpha与beta1)只有在采用了非全窗口的初始窗口时,讨论Fail-soft和Fail-hard才有意义。a)在根结点处采用非(-INFINITY,+INFINITY)。b)中间结点的全窗口是(alpha,beta),但在对应的子树采用(a0,b0)搜索。alphaa0,beta b0。本讲稿第十九页,共六十九页Fail-soft vs.Fail-hardFail-soft vs.Fail-hard再谈alpha与beta2)Fail-soft在寻找解失败的时候,可以指示真值在哪个范围;Fail-hard无法区分开“找解失败
9、”与“真值为alpha”两种情况,Fail-hard也不能在找解失败后指出解的范围。3)在没有用全窗口搜索时,Fail-soft的返回值valpha,这是称为Fail-low(与此情形区分);vbeta,称为Fail-high(与此情形区分)。3)Fail-soft是几乎所有alpha-beta改进算法的基础。本讲稿第二十页,共六十九页Fail-low/high Fail-low/high 与与cutting-offcutting-off再谈alpha与betan Fial-low/high是指返回值落在搜索前预设(猜测)的窗口(a,b)之外。Fail-high或Fail-low说明预先猜测的
10、窗口范围有失准确,凭借该窗口寻找根节点的最佳着法的努力失败了。n 剪枝是指某些着法或分枝对最终的搜索结果没有影响,因而可以不搜索。本讲稿第二十一页,共六十九页1)改进的前提:改进后仍然能找到解。2)改进的途径:a)在博弈树中,更多地产生剪枝:找到某个比(-INFINITY,+INFINITY)小,但包含解v的小窗口。b)对于单个结点,更早地产生剪枝:着法排序,尽可能早地访问最好的儿子。改进改进alpha-betaalpha-beta的途径的途径再谈alpha与beta本讲稿第二十二页,共六十九页壹迭代搜索本讲稿第二十三页,共六十九页宽度优先:完备性、最优性、空间瓶颈。深度优先:非完备性、非最优
11、性、线性空间需求。双向宽度优先搜索:完备性、最优性、空间瓶颈下降。几种搜索策略几种搜索策略迭代加深搜索本讲稿第二十四页,共六十九页当采用深度优先搜索方式时,因无法知道解的深度,最大搜索深度的设置便成了个难题。a)无法准确地预测解的深度;b)因为竞赛时间有限制,程序可用的时间资源受限。无法精确控制时间(深度大可能超时,否则过早结束搜索);最大深度的设定最大深度的设定迭代加深搜索本讲稿第二十五页,共六十九页DFID(Depth First Iterative Deepening)的执行过程如图所示:DFIDDFID迭代加深搜索DFID执行过程的示意图直至时间耗尽本讲稿第二十六页,共六十九页1)以深
12、度优先的方式模拟深度优先,因而可找到路径最短的解。2)迭代加深为优化时间控制提供支持。3)浅层迭代对深层迭代有重要的启发作用。4)迭代加深的额外代价并不高(见下页的证明和解释)。DFIDDFID的特点的特点迭代加深搜索本讲稿第二十七页,共六十九页当分枝因子为R,当前迭代的最大深度为d时,DFID总的代价为:Time(R,d)=(Rd+2Rd-1+dR+(d+1)R0)=Rd(1+2R-1+dR1-d+(d+1)R-d)Rd(1-1/R)-2R=2:Time(R,d)=4 RdR=3:Time(R,d)=9/4 RdR=4:Time(R,d)=16/9 RdR=5:Time(R,d)=25/16
13、 Rd 可见,分支因子越大,迭代加深越有优势。DFIDDFID的特点的特点迭代加深搜索本讲稿第二十八页,共六十九页还有一种称为“迭代加宽”的迭代搜索技术。总之,在复杂棋类中,迭代以相对较小的代价获取了有弹性的搜索控制策略,并提供了采用启发式方法的重要途径。总结总结迭代加深搜索本讲稿第二十九页,共六十九页二渴望搜索本讲稿第三十页,共六十九页当分枝因子为R,当前迭代的最大深度为d时,DFID总的是一种猜测初始窗口的搜索。基于事前猜测的返回值val,预设初始窗口为(val,val)。基于fail-soft alpha-beta搜索。执行该搜索可有三种情况:a)返回值v落在窗口(val,val),v即
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高级搜索技术 精选文档 高级 搜索 技术 精选 文档
限制150内