科学发展与社会和谐的互动机制研究讲义cayx.pptx
《科学发展与社会和谐的互动机制研究讲义cayx.pptx》由会员分享,可在线阅读,更多相关《科学发展与社会和谐的互动机制研究讲义cayx.pptx(63页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、科学发展与社会和谐科学发展与社会和谐的互动机制研究的互动机制研究何何 伟伟电电 话话:13983785167:13983785167 Email:Email:博 士教 授博弈论系列博弈论系列选题背景选题背景竞争是一切社会、经济关系的根本基础。竞争是一切社会、经济关系的根本基础。人是经济人具有自利行为。人是经济人具有自利行为。构建社会主义和谐社会,合作是关键。构建社会主义和谐社会,合作是关键。在没有集权约束的情况下,能否出现合作?在没有集权约束的情况下,能否出现合作?在面临在面临“合作合作”还是还是“不合作不合作”这两难选择中,你应该怎样做?有没有这两难选择中,你应该怎样做?有没有一个一个“最优
2、的最优的”的策略?的策略?合作及其实现路径是什么?合作及其实现路径是什么?作为社会经济活动的参加者和制度设计者,如何才能促进有效的合作作为社会经济活动的参加者和制度设计者,如何才能促进有效的合作?.对这些问题的回答极大地影响对这些问题的回答极大地影响着人们在与他人的社会、政治、经着人们在与他人的社会、政治、经济交往时的思维和行为。济交往时的思维和行为。1.完全公平的政治完全公平的政治是可能存在的吗是可能存在的吗?(发展与和谐、效率与公平、竞争与发展与和谐、效率与公平、竞争与合作的关系)合作的关系)1.1 1.1 民意能保证决策的民意能保证决策的正确性吗正确性吗?人们都承认:民主制度比独裁制度要
3、好。但是为什么民主比独裁好?1.少数服从多数。因为胳膊反正拗不过大腿,真要打起来,少数势必打不过多数。民主乃是人类有史以来发现的唯一的和平变革方式。2.多数人的决定比少数人的明智。3.多数人也可能犯错误,可是在意见变为决策的过程中,正确意见总会出现,而且会逐渐为多数人接受。请用请用“是是”、“不是不是”回答回答(一一)“请问,青少年犯罪率上升,你担心吗?”“你认为在我们的中小学里缺乏严格的纪律训练吗?”“你认为年轻人欢迎在他们生活中搞一些模拟军事活动吗?”“对青年人提出挑战性的要求,他们会积极响应吗?”“也许你赞成重新恢复兵役?”_引自是,首相 民主反映民意,民意能保证决策的正确性吗民主反映民
4、意,民意能保证决策的正确性吗?请用请用“是是”、“不是不是”回答回答(二二)“请问,你是不是担心爆发战争?请问,你是不是担心爆发战争?”“你对军备的增长很不高兴吧?你对军备的增长很不高兴吧?”“你认为发给青年人枪支并教他们如何杀人,有危险吗?你认为发给青年人枪支并教他们如何杀人,有危险吗?”“你认为违反人们的意志,强迫他们拿起武器是错误的吗?你认为违反人们的意志,强迫他们拿起武器是错误的吗?”“也许你反对恢复兵役?也许你反对恢复兵役?”_引自是,首相 民主反映民意,民意能保证决策的正确性吗民主反映民意,民意能保证决策的正确性吗?投票箱里的妖怪投票箱里的妖怪 A、B、C三位竞选某一公职,而三位竞
5、选某一公职,而9位选民位选民的偏好如下:的偏好如下:2位认为位认为A是第一,是第一,B第二,第二,C第三;第三;4位认为位认为C是第一,是第一,A第二,第二,B第三;第三;3位认为位认为B是第一,是第一,A第二,第二,C第三。第三。选民的选择不变,三种不同的投票规则,产生了三位不同的优胜者,这个结果叫人深思,似乎决定胜负的不是个人的政治主张,而是游戏规则。那么,究竟谁才是“民众真正的期待”呢?1.2 Arrow1.2 Arrow(阿罗)不可能性定理(阿罗)不可能性定理(完全的民主可能存在吗完全的民主可能存在吗?)?)在正常理性的情况下,即使知道所有投票者的偏好,也不可能通过一定的方法从每个投票
6、人的偏好次序得出整个集体的偏好次序,不可能通过一定的程序准确地表达集体偏好,从而促成“完美”的公共决策。阿罗在福利经济学上的这一贡献使他获得 1972年诺贝尔经济学奖。Arrow不可能性定理的换一种说法:社会的选择方法不可能既是有效率的,又是民主的。物理学上的“测不准原理”(1927年海森伯提出测不准关系),说明对粒子的坐标和动量不可能同时进行准确的测量。h是普朗克常数。阿罗从此得出:“对于每一存在真正意见分歧的选择,存在一个独裁者。”这就是说,在社会选择中,国家的权威是不可避免的。(构建社会主义和谐社会与党的领导)“科学发展观,核心是以人为本,基本要求是全面协调可持续,根本方法是统筹兼顾。”
7、(在中国共产党第十七次全国代表大会上的报告)第一要义是发展,第一要义是发展,2.合作及其实现途径合作及其实现途径零和博弈与非零和博弈零和博弈与非零和博弈研究竞争性问题的理论和方法研究竞争性问题的理论和方法博弈论博弈论零和博弈零和博弈非零和博弈非零和博弈你输我赢(下棋,体育比赛)你死我活你的也是我的你好我好大家都好皆大欢喜有钱大家赚2.1 2.1 合作问题的提出合作问题的提出竞争是一切社会、经济关系的根本基础 两个基本假设:怎么会产生合作呢怎么会产生合作呢?最著名的回答是由托马斯最著名的回答是由托马斯霍布斯在霍布斯在300多年前给出的,他悲多年前给出的,他悲观地认为,观地认为,在有政府存在之前,
8、在有政府存在之前,自然王国充满着由自私的个体的自然王国充满着由自私的个体的残酷竞争引起的矛盾,生活显得残酷竞争引起的矛盾,生活显得“孤独、贫穷、野蛮和浅薄孤独、贫穷、野蛮和浅薄”。按照他的观点,按照他的观点,没有集权的合作没有集权的合作是不可能产生的。是不可能产生的。因此,一个强因此,一个强有力的政府是必要的。有力的政府是必要的。我们所见到的合作现象我们所见到的合作现象为了国家安全而寻求的合作关税谈判欧佩克的合作两个公司商定共同的价格水平管理者之间的互通有无.我们所见到的不合作现象我们所见到的不合作现象违背合同,不遵守协议违规行为工作中互相拆台,互不支持记者为得到更多消息而对消息来源加以保密体
9、育比赛向对方提供具有误导性、欺骗性等不真实信息房地产开发商有意隐瞒房源、价格等信息,诱使消费者购房不合作是否能给各方带来好处?不合作是否能给各方带来好处?个体对自身利益的追求个体对自身利益的追求整体的利益损失整体的利益损失个体利益的更大损失个体利益的更大损失我们的假设是:每个个体都在追求自身利益最大化,但问题是:我们的假设是:每个个体都在追求自身利益最大化,但问题是:价格大战价格大战贸易壁垒贸易壁垒 这一类问题都是这一类问题都是“囚犯的困境囚犯的困境”。实事上,。实事上,许多重要的政治、社会和许多重要的政治、社会和经济过程的最好的模型都经济过程的最好的模型都是以是以“囚犯困境囚犯困境”为基础为
10、基础的。的。基本模型基本模型 “囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(向警察坦白,从而背叛背叛他的同伙),或者保持沉默(不向警察坦白,也就是与他的同伙合作合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以警方就给这两个囚犯来了一点儿刺激刺激:(1)如果他们保持沉默,也就是与对方合作,则他们会被无罪释放(R=3R=3:对双方合作的奖励:对双方合作的奖励)。(2)如果他
11、们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金(T=5T=5:对背叛的诱惑:对背叛的诱惑)。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏(S=0S=0:给笨蛋的报酬:给笨蛋的报酬)。(3)如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏(P=1P=1:对双方背叛的惩罚:对双方背叛的惩罚)。TRPS假设“囚犯困境囚犯困境”式的游戏可以进行多次乃至无限多次式的游戏可以进行多次乃至无限多次:如果两位自私者玩一次这个游戏如果两位自私者玩一次这个游戏如果两位自私者玩有限次这个游戏如果两位自私者玩有
12、限次这个游戏如果两位自私者玩无限次这个游戏如果两位自私者玩无限次这个游戏结论结论背叛背叛背叛背叛?在非零和对策情况下,如何选择我们的在非零和对策情况下,如何选择我们的策略呢?策略呢?显然,显然,NashNash均衡点并没有给我们提供一个满意的结论。均衡点并没有给我们提供一个满意的结论。那么,在这样一个两难选择中到底能不能找到令人满意的答那么,在这样一个两难选择中到底能不能找到令人满意的答案呢?难道我们真的无路可走了吗?案呢?难道我们真的无路可走了吗?对未来的考虑,是会影响现在的决策的对未来的考虑,是会影响现在的决策的如果对策者想将对策继续下去,就一定会考虑未来的收益,因如果对策者想将对策继续下
13、去,就一定会考虑未来的收益,因而要考虑未来对现在的影响。而要考虑未来对现在的影响。一般说来,对策者可能会认为未来的收益并没有当前的收益那一般说来,对策者可能会认为未来的收益并没有当前的收益那么重要。么重要。折扣系数折扣系数 w用来反映未来对现在影响程度的一个常数在考虑未来利益的情况下,是否存在最在考虑未来利益的情况下,是否存在最优策略?优策略?命题命题1 1 如果折扣系数如果折扣系数w w足够大,则不存在足够大,则不存在独立于独立于对方对方所采用的策略的最优策略。所采用的策略的最优策略。答案:答案:一个令人伤心的命题!一个令人伤心的命题!一个特定策略的有效性不仅取决于它自己的特性,而且取决于它
14、要相遇的其他策略的特性。不存在单一的最优策略不存在单一的最优策略(独立于对方的最优策略)的论证留下了这样一个问题,在两个个体有足够大的概率打交道的情况下,会出现什么样的行为模式。2.2 2.2 第一次计算机模拟竞赛第一次计算机模拟竞赛(目的:为寻找“最佳”的对策策略)为寻找“最佳”的对策策略,美国密西根大学的Robert Axelord 教授组织了一次别开生面的的计算机竞赛。竞赛方式:每位参赛者提交一个体现在每一步选择合作或不合作规则的程序;每个程序要和所有其它程序比赛,还要和一个“随机”程序(随机地选择合作或背叛)比赛;每次比赛的局数为200次;记录下每个参赛程序的得分。“善良的善良的”规则
15、:从不首先背叛规则:从不首先背叛1.善有善报善有善报 不首先背叛或至少在游戏快要结束之前不背叛,是区分这次计算机“囚犯困境”竞赛中成功的规则和不成功的规则的唯一特性。2.除了善良,还需要宽容除了善良,还需要宽容宽容性宽容性对方背叛之后的合作倾向对方背叛之后的合作倾向第一名第一名“一报还一报一报还一报”:一次惩罚后就让过去的过去了。第八名第八名“弗雷德曼弗雷德曼”:决不首先背叛,但一旦受到挑衅,就永远 报复下去。(得理不让人,太缺少宽容性)3.“恶有恶报恶有恶报”一个狡诈的规则:“乔斯”基本想法:基本想法:试图偶尔背叛而不受到惩罚。比如,它十次会有试图偶尔背叛而不受到惩罚。比如,它十次会有一次在
16、对方合作之后背叛,而不是在对方合作后总是合作。一次在对方合作之后背叛,而不是在对方合作后总是合作。“一报还一报”与“乔斯”的对局结果(236分241分1双方合作;2“一报还一报”合作;3“乔斯”合作;4均不合作 这次竞赛的的很重要的教训是认识到在双方竞争的环境下,避免反射效应是很重要的。不善良的规则在比赛中表现不佳。不善良的规则在比赛中表现不佳。“乔斯乔斯”的的平均得分为平均得分为304304分,排在第分,排在第12 12位。位。进一步的分析表明进一步的分析表明许多人在游戏中没有受到挑衅就早早开始背叛,这个许多人在游戏中没有受到挑衅就早早开始背叛,这个 特点从长远来看是要付出大代价的。特点从长
17、远来看是要付出大代价的。任何参赛者所显示出的宽容性比理想的要小得多。任何参赛者所显示出的宽容性比理想的要小得多。最与重不同的规则最与重不同的规则“DOWNING”,由于对其它人的初始假设,由于对其它人的初始假设太悲观而做了蠢事。太悲观而做了蠢事。为了更好地应付双方竞争的环境,有许多东西要学。即使为了更好地应付双方竞争的环境,有许多东西要学。即使是政治学、社会学、经济学、心理学和数学方面的策略专家,是政治学、社会学、经济学、心理学和数学方面的策略专家,也会犯诸如太计较自己的利益、不够宽容、和对对方的反应太也会犯诸如太计较自己的利益、不够宽容、和对对方的反应太悲观等错误。悲观等错误。2.3 第二次
18、计算机模拟竞赛(目的:为了进一步验证“一报还一报”策略的成功)为了验证“一报还一报”策略的胜利不是偶然的,Robert教授组织了第二次计算机模拟竞赛。第二轮竞赛的参赛者,都得到了一份关于第一轮竞赛的详细分析报告。他们不仅知道第一轮竞赛的结果,而且知道用于分析成功的思想和概念以及所发现的易犯的错误。因此,第二轮比赛比第一轮比赛有一个更高的起点。第二次比赛共有62个程序,它们的提供者来自:计算机科学、物理学、数学、心理学、经济学、政治学、社会学和进化生物学的教授,他们来自美国、加拿大、英国、挪威、瑞士和新西兰。参加第一轮比赛的对策论专家们也被邀请再试一次。在第二轮竞赛中,在第二轮竞赛中,63个规则
19、(包括随机程序)在循环赛中有个规则(包括随机程序)在循环赛中有3969个配对方式,共有上百万次的对局。个配对方式,共有上百万次的对局。谁是第二次胜利者?谁是第二次胜利者?胜利者还是:胜利者还是:“一报还一报一报还一报”策略策略超过一半的参赛程序是善良的。显然大部分参赛者吸收了第一轮中首先背叛没有好处的教训。前15名中只有一个是不善良的。后15名中只有一个是善良的。规则是否善良与最后得分的相关性为:规则是否善良与最后得分的相关性为:0.58 “一报还一报一报还一报”是第一轮中提交的最简单的程序,但是第一轮中提交的最简单的程序,但它赢得了竞赛。它也是第二轮中最简单的程序,又赢得了它赢得了竞赛。它也
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 科学 发展 社会 和谐 互动 机制 研究 讲义 cayx
限制150内