三、智猪博弈ppt课件.ppt
《三、智猪博弈ppt课件.ppt》由会员分享,可在线阅读,更多相关《三、智猪博弈ppt课件.ppt(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 智猪博弈智猪博弈 以不变应万变以不变应万变3.1 博弈论要点o博弈论的基本概念包括:参与人、行动、信息、博弈论的基本概念包括:参与人、行动、信息、战略、支付函数、结果、均衡战略、支付函数、结果、均衡 其中,参与人、行动、结果合称博弈规则其中,参与人、行动、结果合称博弈规则o博弈有不同的种类:博弈有不同的种类:n从行动顺序角度:从行动顺序角度:o静态博弈静态博弈。参与人同时选择行动参与人同时选择行动o动态博弈。参与人的行动有先后顺序动态博弈。参与人的行动有先后顺序3.1 博弈论要点n从拥有信息角度:从拥有信息角度:o完全信息博弈。每个参与人对所有其他参完全信息博弈。每个参与人对所有其他参与人的
2、特征、战略空间、支付函数有准确与人的特征、战略空间、支付函数有准确的知识的知识o不完全信息博弈。不完全信息博弈。o将二角度结合,博弈有四种:将二角度结合,博弈有四种:n完全信息静态博弈完全信息静态博弈n完全信息动态博弈完全信息动态博弈n不完全信息静态博弈不完全信息静态博弈n不完全信息动态博弈不完全信息动态博弈博弈论模型GP,A,S,I,U o一个博弈需要有五方面内容组成:参与人、行动、一个博弈需要有五方面内容组成:参与人、行动、信息、结果信息、结果oP:为局中人,能够独立决策,独立承担责任的个:为局中人,能够独立决策,独立承担责任的个人或组织,以最终实现自身利益最大化为目标。人或组织,以最终实
3、现自身利益最大化为目标。oA:各局中人的所有可能的策略或行动的集合。分:各局中人的所有可能的策略或行动的集合。分为有限博弈和无限博弈为有限博弈和无限博弈,后者表现为连续对策、重后者表现为连续对策、重复博弈和微分对策等。复博弈和微分对策等。oS:博弈的进程或次序。分为静态博弈和动态博弈。:博弈的进程或次序。分为静态博弈和动态博弈。oI:博弈信息:博弈信息,能够影响最后博弈结局的所有局中人能够影响最后博弈结局的所有局中人的情报。信息在博弈中占重要地位的情报。信息在博弈中占重要地位,博弈的赢得很博弈的赢得很大程度上依赖于信息的准确度与多寡。如果各方对大程度上依赖于信息的准确度与多寡。如果各方对各种局
4、势下所有局中人的得益状况完全清楚各种局势下所有局中人的得益状况完全清楚,称为称为完全信息博弈。反之为不完全信息博弈。在动态博完全信息博弈。反之为不完全信息博弈。在动态博弈中还有一类信息弈中还有一类信息:轮到行动的博弈方是否完全了轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为解此前对方的行动。如果完全了解则称之为“具有具有完美信息完美信息”的博弈。反之称为的博弈。反之称为“不完美信息的动态不完美信息的动态博弈博弈”。由于信息不完美。由于信息不完美,博弈的结果只能是概率博弈的结果只能是概率期望期望,而不能像完美信息博弈那样有确定的结果。而不能像完美信息博弈那样有确定的结果。oU:
5、为局中人获得利益:为局中人获得利益,也是博弈各方追求的最终目也是博弈各方追求的最终目标。分为零和博弈和变和博弈。零和博弈中各方利标。分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。系,争取双赢的局面。3.2 完全信息静态博弈:纳什均衡完全信息静态博弈:纳什均衡o设有两个人一起玩游戏,每个人都有不同的策略,设有两个人一起玩游戏,每个人都有不同的策略,谁都希望自己出谁都希望自己出“高招高招”使自己获胜使自己获胜(即寻求效用即寻求效用的最大化的最大化),但获胜并不完全依赖于自己的行为能,但获胜并不完全
6、依赖于自己的行为能力,还依赖于对手怎么做。力,还依赖于对手怎么做。o有时,双方会形成这样一种状态:我的最好策略有时,双方会形成这样一种状态:我的最好策略所依赖的条件就是你的最好策略。换言之:如果所依赖的条件就是你的最好策略。换言之:如果你那样做,我这样最好,而你你那样做,我这样最好,而你“那样那样”做恰恰又做恰恰又是你的最佳策略。是你的最佳策略。o通俗地讲:如果别人不动,我也不能动通俗地讲:如果别人不动,我也不能动3.2 完全信息静态博弈:纳什均衡完全信息静态博弈:纳什均衡o假设假设n个人参与博弈,给定其他人战略的条件个人参与博弈,给定其他人战略的条件下,每个人选择自己的最优战略。纳什均衡指下
7、,每个人选择自己的最优战略。纳什均衡指的是的是“由所有参与人的最优战略组成的一个组由所有参与人的最优战略组成的一个组合合”o几个人制订了一个协议,这几个人是否能自愿几个人制订了一个协议,这几个人是否能自愿遵守?他们会自觉遵守,这个协议就构成一个遵守?他们会自觉遵守,这个协议就构成一个纳什均衡。纳什均衡。o如果一个协议不构成纳什均衡,它就不可能自如果一个协议不构成纳什均衡,它就不可能自动实施,需要外力胁迫,这就无所谓动实施,需要外力胁迫,这就无所谓“协议协议”o占优战略均衡:不论其他人采取什么策略,占优战略均衡:不论其他人采取什么策略,A之某之某策略的策略的payoff总是最高,即为总是最高,即
8、为“占优战略占优战略”如果一个博弈的某个策略组合中的所有策略都是各如果一个博弈的某个策略组合中的所有策略都是各方的上策,那么这个策略组合将是所有人都愿意选方的上策,那么这个策略组合将是所有人都愿意选择的择的,必然是比较稳定的结果必然是比较稳定的结果,这是这是“占优战略均衡占优战略均衡”。反映了所有人的绝对偏好,因此十分稳定。但。反映了所有人的绝对偏好,因此十分稳定。但这种情况较少见。这种情况较少见。o划线法:横向,如果划线法:横向,如果“列列”选中一个策略,在我的选中一个策略,在我的最佳策略下划线;纵向,如果最佳策略下划线;纵向,如果“行行”选中一个策略,选中一个策略,在我的最佳策略下划线。某
9、个策略组合中的两个支在我的最佳策略下划线。某个策略组合中的两个支付之下都有横线,此即较为可能的解。如果这种解付之下都有横线,此即较为可能的解。如果这种解只有一组,此即上策均衡。只有一组,此即上策均衡。3.2 完全信息静态博弈:完全信息静态博弈:纳什均衡纳什均衡基本分析思路和方法基本分析思路和方法3.3 智猪博弈智猪博弈 猪圈很长,一头有一踏板,另一头是饲料的出口猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的的“劳动劳动
10、”,加起来要消耗相当于,加起来要消耗相当于2份的猪食。份的猪食。假设猪圈里有一头大猪、一头小猪。若大猪先到槽假设猪圈里有一头大猪、一头小猪。若大猪先到槽边,大小猪吃到食物的收益比是边,大小猪吃到食物的收益比是9 1;同时到槽边,;同时到槽边,收益比是收益比是7 3;小猪先到槽边,收益比是;小猪先到槽边,收益比是6 4。那么,那么,在两头猪都有智慧的前提下,在两头猪都有智慧的前提下,如何选择进食方式如何选择进食方式?“笼中猪笼中猪”博弈的具体情况如下:如果两只博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进猪同时踩踏板,同时跑向食槽,大猪吃进7份,份,得益得益5份,小猪吃进份,小
11、猪吃进3份,实得份,实得1份;如果大猪份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进踩踏板后跑向食槽,这时小猪抢先,吃进4份,份,实得实得4份,大猪吃进份,大猪吃进6份,付出份,付出2份,得益份,得益4份;份;如果大猪等待,小猪踩踏板,大猪先吃,吃进如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益份,得益9份,小猪吃进份,小猪吃进1份,但是付出了份,但是付出了2份,实得份,实得-1份;如果双方都懒得动,所得都是份;如果双方都懒得动,所得都是0。下表给出这个博弈的支持矩阵下表给出这个博弈的支持矩阵用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择:用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选
12、择:综合来看,无论大猪是选择行动还是等待,小猪的选择都综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。将是等待,即等待是小猪的占优策略。小猪小猪按按 等待等待大猪大猪按按等待等待5,14,49,-10,0智猪博弈的结果智猪博弈的结果o 利益分配格局决定两头猪的理性选择:小猪利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小份。对小猪而言,无论大猪是否踩动踏板,小猪将选择猪将选择“搭便车搭便车”策略,也就是舒舒服服地等策略,也就是舒舒服服地等在食槽边,这是
13、最好的选择。在食槽边,这是最好的选择。o现在来看大猪。由于小猪有现在来看大猪。由于小猪有“等待等待”这个优这个优势策略,大猪只剩下了两个选择:等待,一份势策略,大猪只剩下了两个选择:等待,一份也得不到;踩踏板得到也得不到;踩踏板得到4份。所以份。所以“等待等待”就变就变成了大猪的劣势策略,当大猪知道小猪是不会成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。食槽之间。o 最终结果是小猪选择等待。最终结果是小猪选择等待。o在这个例子中,对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈 ppt 课件
限制150内