第三讲决策理论的基本模型zl.pptx
第三讲:决策理论的基本模型第三讲:决策理论的基本模型 主要内容:主要内容:1.决策的基本模型决策的基本模型2.个体偏好假设个体偏好假设 3.效用存在性定理效用存在性定理 4.相关问题讨论相关问题讨论 1.决策的基本模型决策的基本模型 不确定性下的决策通常可用下述两个不确定性下的决策通常可用下述两个模型之一描述。模型之一描述。1)概率模型概率模型(Probability Model);2)状状 态态 变变 量量 模模 型型(State-variable Model)。在每一种模型中,我们所说的决策者都在每一种模型中,我们所说的决策者都是是在在彩彩票票(lotteries)中中进进行行选选择择的的人人,两两者的者的区别区别仅在于其对彩票的定义不同仅在于其对彩票的定义不同。在在概概率率模模型型中中,彩彩票票是是彩彩金金的的概概率率分分布布;而而在在状状态态变变量量模模型型中中,彩彩票票是是从从可能状态集到彩金集的函数。可能状态集到彩金集的函数。这这两两个个模模型型各各自自有有其其最最为为合合适适的的应应用领域。用领域。概概率率模模型型适适用用于于描描述述彩彩金金依依赖赖于于具具有有明明显显客客观观概概率率的的事事件件这这一一类类的的赌赌博博,我我 们们 称称 这这 样样 的的 事事 件件 为为 客客 观观 未未 知知(objective unknowns)事件事件。这这类类赌赌博博有有安安斯斯库库姆姆和和奥奥曼曼(1963)的的“轮轮盘盘彩彩票票”(roulette lotteries)和和奈奈特特(Knight,1921)的的“风风险险”(risk)等。等。例例如如,依依赖赖于于掷掷一一枚枚匀匀质质的的硬硬币币、轮轮盘盘的的自自旋旋,或或者者从从装装有有同同样样大大小小而而颜颜色色不不同同的的球球的的瓮瓮中中随随机机地地抽抽取取一一个个球球(各各色色球球的的总总体体已已知知)之之类类的的赌赌博博都都可可以以用用概概率模型充分地描述。率模型充分地描述。在概率模型中,用到一个重要的假在概率模型中,用到一个重要的假定是:定是:就决策的目的而言,具有相同概率就决策的目的而言,具有相同概率分布的两个客观未知是完全等价的分布的两个客观未知是完全等价的。例如,如果用例如,如果用“以各自以各自l2的概率的概率得到得到100美元或美元或0美元的彩金美元的彩金”来描述一来描述一张彩票,我们假定彩金是由掷一枚匀质张彩票,我们假定彩金是由掷一枚匀质的硬币来决定还是由从一个装有的硬币来决定还是由从一个装有50个白个白球和球和50个黑球的瓮中抽取一个球来决定,个黑球的瓮中抽取一个球来决定,都是无关紧要的。都是无关紧要的。许许多多事事件件不不具具有有明明显显的的概概率率,如如一一个个未未来来运运动动赛赛事事的的结结果果或或者者股股票票市市场场未未来来的的行行情情等等,这这类类事事件件我我们们称称为为主主观观未未知知(subjective unknowns)事件。事件。例例如如,安安斯斯库库姆姆和和奥奥曼曼(1963)的的“赛赛 马马 彩彩 票票”(horse lotteries)或或 奈奈 特特(1921)的的“不不确确定定性性”(uncertainty)都都相当于是依赖主观未知事件的赌博。相当于是依赖主观未知事件的赌博。上上述述事事件件可可用用状状态态变变量量模模型型来来描描述述,因因为为该该模模型型允允许许我我们们描描述述彩彩金金是是如如何何由由不不可可预预见见事事件件决决定定的的,而而不不必必事事先先对对这这些事件明确其概率。些事件明确其概率。对对于于任任何何一一个个有有限限集集Z,用用 表表示示集集Z上的概率分布集,即上的概率分布集,即 用用 X 表表示示决决策策者者最最终终可可能能获获得得的的彩彩金金(prize)所所组组成成的的集集;用用 表表示示可可能能的的状状态态(state)所所组组成成的的集集,其其中中之之一一将将是是世世界真实状态界真实状态(true state of the world)。为为了了简简化化描描述述,我我们们假假定定 X 和和 两两者都是有限集。者都是有限集。我我们们将将彩彩票票定定义义为为某某个个函函数数 f,对对X 中中的的每每个个彩彩金金 s 和和 中中的的每每个个状状态态 t,f都都给给出出一一个个非非负负实实数数 ,使使得得对对 中中的的每个每个 t 都有都有 令令L表表示示所所有有这这样样的的彩彩票票所所组组成成的的集集合,即合,即 对对 中中的的任任一一状状态态 t 和和L中中的的任任一一彩彩票票 f,表表示示在在状状态态 t 下下由由 f 确确定定的的X上的概率分布,即上的概率分布,即 因因此此,这这里里的的每每个个数数 都都可可以以被被理理解解为为:若若 t 是是世世界界真真实实状状态态,则则由由彩彩票票 f 得得到到彩彩金金 x 的的客客观观条条件件概概率率是是 。为为使使上上述述解解释释合合乎乎情情理理,状状态态必必须须被被定定义义得得足足够够的的广广泛泛,以以致致于于包包括括所所有有可能影响到彩金获得的主观未知事件可能影响到彩金获得的主观未知事件。从而,一旦确定了状态,余下的只从而,一旦确定了状态,余下的只是客观概率,而是客观概率,而对于任何一个规范界定对于任何一个规范界定的赌博而言,其可能彩金集的客观概率的赌博而言,其可能彩金集的客观概率分布总是可以被计算出来的分布总是可以被计算出来的。因因此此,我我们们对对彩彩票票的的上上述述规规范范定定义义,可可用用于于表表示示任任何何一一个个彩彩金金既既依依赖赖于于客客观观未未知知事事件件又又依依赖赖主主观观未未知知事事件件的的赌赌博博。所所以以,概概率率模模型型和和状状态态变变量量模模型型中中的的彩彩票都只是上述彩票的特例。票都只是上述彩票的特例。我我们们所所说说的的彩彩金金可可以以是是任任何何的的商商品品组组合合或或资资源源配配置置。我我们们假假定定,定定义义 X 中中的的彩彩金金时时,已已经经使使得得这这些些彩彩金金是是互互不不相相同同的的,且且穷穷尽尽了了决决策策者者各各种种决决策策的的可可能能结果结果。更更进进一一步步,我我们们假假定定 X 中中的的一一个个彩彩金金表表示示了了决决策策者者在在由由其其决决策策导导致致的的局局势势中中他他所所关关心心的的各各方方面面的的一一个个完完备备描描述述。因因而而,给给定定决决策策者者关关于于世世界界真真实实状状态态的的任任一一信信息息,他他应应该该能能给给出出其其在在彩彩票票集集上上的偏好序的偏好序。决决策策者者关关于于世世界界真真实实状状态态可可能能拥拥有有的的信信息息可可以以用用一一个个事事件件(event)来来描描述述,每个事件都是每个事件都是 的一个非空子集。用的一个非空子集。用 表示所有事件组成的集,则表示所有事件组成的集,则 对对于于L中中的的任任意意两两个个彩彩票票 f 和和 g,以以及及 中中的的任任一一事事件件S,当当且且仅仅当当,如如果果决决策策者者知知道道了了世世界界真真实实状状念念在在S中中,则则对对他他来来说说,f 至至少少是是和和 g 一一样样的的理理想想选选择择时时,则有则有 也也就就是是说说,当当且且仅仅当当决决策策者者在在只只知知道道事事件件 S 已已经经发发生生而而又又必必须须在在 f 和和 g 之之间择其一时,选择了彩票间择其一时,选择了彩票 f,才有,才有 应注意:应注意:对对于于 中中任任何何可可能能发发生生的的事事件件S,假假定定决决策策者者在在彩彩票票集集上上都都具具有有定定义义完完善善的偏好的偏好。在在决决策策理理论论的的一一些些论论述述中中,一一个个决决策策者者的的条条件件偏偏好好是是在在做做任任何何观观察察之之前前,由由他他所所确确定定的的先先验验偏偏好好(用用贝贝叶叶斯斯公公式式)推推导导而而来来的的,但但是是,这这种种推推导导不不能能在在先先验概率为验概率为0的事件下给出彩票的优劣关系。的事件下给出彩票的优劣关系。在在博博弈弈论论的的领领域域内内,这这一一疏疏漏漏并并不不像像看看上上去去那那样样无无关关紧紧要要。Kreps和和wilson,(1982)已已经经证证明明,一一个个理理性性决决策策者者在在观观察察到到零零概概率率事事件件后后的的信信念念和和偏偏好好特特征征对对分分析析一一个个博博弈弈可可能能会会起起到到至至关关重重要要的的作用。作用。为为了了解解释释上上述述定定义义,考考虑虑从从一一个个瓮瓮中中取取一一个个球球,瓮瓮中中黑黑球球的的比比例例是是 ,白白球球的的比比例例是是(1 )。设设想想若若取取出出的的是是黑黑球球,则则决决策策者者赌赌 f,而而若若取取出出的的是是白白球球,则则这这个决策考将赌个决策考将赌 g。于于是是,如如果果 t 是是真真实实状状态态,该该决决策策者者最终得到彩金最终得到彩金 x 的概率是的概率是 因因而而,表表示示这这个个基基于于 f 和和 g,并并按按照照这这个个随随机机的的彩彩票票选选择择过过程程而而生生成的成的复合彩票复合彩票。对对任任一一彩彩金金 x,我我们们令令 x 表表示示一一个个总总是是肯定给出彩金肯定给出彩金 x 的彩票。即对每个状态的彩票。即对每个状态 t 有:有:2 个体偏好假设个体偏好假设 一一个个理理性性决决策策者者的的偏偏好好所所应应满满足足的的一一些些基基本本性性质质可可以以用用以以下下公公理理3.13.8表表示。示。公理公理 3.1A(完备性完备性):公理公理 3.1B(传递性传递性):公公理理3.1A和和3.1B断断定定了了偏偏好好在在彩彩票票集上构成完备的传递序集上构成完备的传递序。公理公理3.2(相关性相关性):公公理理3.2断断言言,只只有有可可能能状状态态才才是是与与决决策策者者相相关关的的,因因此此,给给定定事事件件S,对对于于只只在在S以以外外的的状状态态有有所所不不同同的的两两个个彩彩票票对对决策者而言将是无差异决策者而言将是无差异公理公理3.3(单调性单调性):公公理理3.3认认为为:得得到到一一个个较较好好的的彩彩票票的概率总是越高越好的概率总是越高越好。公理公理3.4(连续性连续性):基于公理基于公理3.3、公理、公理3.4可以认为:可以认为:总总是是随随着着 增增大大而而连连续续地地变变得得越越来来越越好好,因因此此,对对偏偏好好次次序序介介于于 f 和和 h 之之间间的的任任一一彩彩票票,总总存存在在某某个个由由 f 和和 h 随机化产生的一个复合彩票与之一样好随机化产生的一个复合彩票与之一样好。公理公理3.5A(客观替代性客观替代性):公理公理3.5B(严格客观替代性严格客观替代性):公理公理3.6A(主观替代性主观替代性):公理公理3.6B(严格主观替代性严格主观替代性):替替代代性性公公理理(也也被被称称为为独独立立性性公公理理或或肯肯定定性性公公理理)在在下下述述意意义义上上或或许许是是公公理系中最重要的理系中最重要的个:个:即即使使没没有有其其他他的的公公理理,替替代代性性公公理理也也能能对对决决策策者者偏偏好好应应具具有有的的性性质质产产生生很很强的限制。强的限制。上上述述公公理理表表达达了了这这样样的的思思想想:即即如如果果决决策策者者必必须须在在两两个个选选择择中中取取其其一一,又又存存在在两两个个互互斥斥事事件件且且其其中中之之一一必必然然发发生生,而而他他在在每每个个事事件件下下都都偏偏好好于于第第一一个个选选挥挥,那那么么,在在知知道道哪哪个个事事件件发发生生之之前前,他他一一定定偏偏好好于于第第一一个个选选择择(否否则则,他他将将表表现现出出一一种种偏偏好好,按按照照这这种种偏偏好好,必必然然存存在在某某个个事事件件使使得得他他在在知知道道该该事事件件是是真真实实的的之之后后,他他肯肯定定想想颠颠倒倒偏偏好好顺顺序序而偏好于第二个选择而偏好于第二个选择)。公理公理3.7(利害性利害性):公公理理3.7要要求求决决策策者者绝绝不不会会对对所所有有的的彩金都是无差异的彩金都是无差异的。该该公公理理只只是是一一个个正正则则性性条条件件以以保保证证在在每每个个状状态态下下决决策策者者都都会会多多少少有有点点利利害害关系发生。关系发生。公理公理3.8(状态中性状态中性):公公理理3.8断断言言,决决策策者者在在世世界界所所有有状状态下对客观赌博总是具有相同的偏好序态下对客观赌博总是具有相同的偏好序。如如果果上上述述公公理理不不成成立立,那那是是因因为为同同样样的的彩彩金金在在不不同同的的状状态态下下可可以以有有不不同同的的评价值。评价值。3.3 效用存在性定理效用存在性定理 上上的的一一个个条条件件概概率率函函数数(conditional-probability function)是任何一个这样的函数:是任何一个这样的函数:它它能能对对 中中的的每每个个状状态态 t 和和每每个个事事件件S都都具具体体指定非负的条件概率指定非负的条件概率 ,且使得,且使得 给定任一这样的条件概率函数,有给定任一这样的条件概率函数,有 定理定理 公理公理3.13.7同时满足的充要同时满足的充要条件是存在一效用函数条件是存在一效用函数 和一个条件概率函数和一个条件概率函数 使得使得(3.1)式、式、(3.2)式和式和(3.3)式成立。式成立。定理定理3.2 公理公理3.13.8同时满足的充同时满足的充要条件是:要条件是:式式(3.1)(3.3)对一个状态对一个状态独立的效用函数也成立。独立的效用函数也成立。为为了了能能在在实实践践中中应应用用上上述述结结论论,我我们需要一个对所有们需要一个对所有 x、t 和和 S 来确定效用来确定效用 和概率和概率 的程序。的程序。雷雷费费(1968)证证明明:上上述述程程序序确确实实存存在,它们构成了实际决策分析的基础。在,它们构成了实际决策分析的基础。2.4 相关问题讨论相关问题讨论1)决策者的目标)决策者的目标 决策者追求期望效用最大化而非期望决策者追求期望效用最大化而非期望货币最大化。货币最大化。考察考察Ellsberg游戏。游戏。连续掷一枚匀质的硬币,直到出现连续掷一枚匀质的硬币,直到出现反面为止。若连续出现正面的次数为反面为止。若连续出现正面的次数为n,则掷硬币者可得则掷硬币者可得 元现金。元现金。Ellsberg游戏的期望现金收益趋于无游戏的期望现金收益趋于无穷大,但现实中很少有人愿意出较大的穷大,但现实中很少有人愿意出较大的一笔钱(如一笔钱(如50元)去玩该游戏。元)去玩该游戏。2)贝叶斯决策模型的不足贝叶斯决策模型的不足 (1)效用函数的不适用性。)效用函数的不适用性。考察一个著名的悖论考察一个著名的悖论Allais悖论。悖论。这这此此人人或或许许感感到到1200万万美美元元明明显显地地好好于于100万万美美元元,所所以以,与与 相相比比,彩彩金金低低些些的的彩彩票票即即使使中中彩彩概概率率稍稍稍稍高高一一点点也是没有吸引力的。也是没有吸引力的。另另一一方方面面,它它们们宁宁可可按按受受 ,中中肯肯定定的的100万万美美元元,而而不不愿愿意意接接受受 ,即即以以1的的概概率率一一无无所所获获作作为为代代价价去去换换取取 10将将其其彩彩金金从从100万万美美元元提提高高到到1200万万美美元的诱惑。元的诱惑。上述偏好无法用任何效用函数去解释。上述偏好无法用任何效用函数去解释。这是因为:这是因为:(2)主观概率的不适用性。)主观概率的不适用性。考察下列悖论考察下列悖论Raiffa悖论。悖论。假假设设 A 表表示示美美州州队队将将在在下下一一次次全全明明星星赛赛(美美国国棒棒球球赛赛事事)中中获获胜胜这这个个状状态态,而而N 表表示示联联盟盟队队将将在在下下一一次次全全明明星星赛赛中中获获胜胜这这个个状状态态(假假设设这这两两个个队队中中间间必必然然有有一个队在全明星赛中获胜一个队在全明星赛中获胜)。许多对美国捧球赛几乎一无所知的许多对美国捧球赛几乎一无所知的人都表示如下偏好:人都表示如下偏好:也也就就是是说说,他他们们将将严严格格地地偏偏好好通通过过掷掷一一枚枚公公正正的的硬硬币币并并以以100美美元元赌赌正正面面朝朝上上胜胜于于以以100美美元元赌赌全全明明星星赛赛中中哪哪个个队队会会获获胜胜。这这样样的的偏偏好好是是不不能能用用 上上任任何何主主观观概率分布来解释的。概率分布来解释的。由由于于 中中至至少少有有一一个个状状态态的的发发生生概概率率必必定定大大于于或或等等于于0.5,故故赌赌这这个个状状态态下下胜胜队队所所给给出出的的期期望望效效用用一一定定至至少少与与赌赌掷掷一一枚枚公公正正的的硬硬币币所所给给出出的的期期望望效效用用一一样样大。大。事实上,注意事实上,注意 (3)决策模型的不适用性。)决策模型的不适用性。考察卡尼曼考察卡尼曼特弗斯基悖论。特弗斯基悖论。比较下列选择情形。比较下列选择情形。情情形形A:你你准准备备观观看看戏戏剧剧表表演演,为为此此你你已已经经花花40美美元元买买了了一一套套票票,在在你你将将到到剧剧院院之之际际,突突然然发发觉觉票票从从口口袋袋中中丢丢失失了了,你你必必须须决决定定是是再再花花40美美元元去去另另买买一一套套票票(还还有有类类似座位的票出售似座位的票出售)还是简单地回家。还是简单地回家。情情形形B:你你准准备备到到剧剧院院观观看看演演出出,票票的的价价格格是是每每套套40美美元元,你你没没有有事事先先买买好好票票,而而在在临临行行时时放放了了40美美元元在在口口袋袋中中,在在你你将将到到剧剧院院之之际际,突突然然发发觉觉钱钱从从你你的的口口袋袋中中丢丢失失了了,你你必必须须决决定定是是用用赊赊帐帐卡卡(尚在尚在)买票还是简单地回家。买票还是简单地回家。正正如如卡卡尼尼曼曼和和特特弗弗斯斯基基所所指指出出的的,大大多多数数人人都都说说在在情情形形A中中他他们们会会简简单单地地回回家家,但但在在情情形形B中中会会买买票票。然然而而,在在这这两两种种情情形形的的每每一一种种情情形形中中,由由两两个个选选择择所所得得到到的的最最后后结结果果都都是是:要要么么观观看看演演出出并并支支出出了了80美美元元,要要么么没没有有观观看看演演出出而而支支出了出了40美元。美元。对对于于现现有有的的决决策策模模型型(即即期期望望效效用用最最大大化化),只只要要它它假假定定在在这这两两种种情情形形中中,决决策策者者所所关关心心的的所所有有因因素素只只是是货货币币财财富富水水平平和和戏戏剧剧消消费费水水平平,都都不不可可能能对对这这样样的的行行为为做出解释。做出解释。3.凸出扰动分析凸出扰动分析 某某 给给 定定 决决 策策 问问 题题 的的 一一 个个 扰扰 动动(perturbation)就就是是任任何何另另一一个个(在在某某种种意义上意义上)与之非常相似的决策问题。与之非常相似的决策问题。对对任任何何一一个个给给定定的的决决策策问问题题,如如果果实实际际面面临临这这个个决决策策问问题题的的人人很很可可能能会会采采取取其其在在某某个个扰扰动动决决策策问问题题中中一一样样的的行行动动,我们就说这个扰动是凸出的我们就说这个扰动是凸出的(salient)。当当人人们们发发现现某某个个决决策策问问题题难难以以理理解解而而且且扰扰动动情情形形又又与与他他们们通通常常体体验验的的情情形形很很相相像像时时,这这个个决决策策问问题题的的特特定定扰扰动动可可能也是凸出的。能也是凸出的。如如果果我我们们能能对对个个人人决决策策问问题题的的凸凸出出扰扰动动进进行行预预测测,那那么么在在这这个个凸凸出出扰扰动动中中最最大大化化决决策策者者期期望望效效用用的的决决策策可可能能会会是是对其行为的一个准确预测。对其行为的一个准确预测。重重新新考考虑虑前前述述赌赌美美国国全全明明星星赛赛哪哪个个队会获胜的问题。队会获胜的问题。假设以下彩票集假设以下彩票集 被被无无增增加加信信息息地地提提供供给给决决策策者者,也也就就是是当当决决策策者者被被提提供供上上述述选选项项时时,没没有有关关于于状态集中真实状态的任何新的信息。状态集中真实状态的任何新的信息。在在一一般般情情况况下下,人人们们只只有有在在拥拥有有一一些些特特殊殊信信息息或或信信念念时时才才去去打打赌赌。因因此此,对对于于某某个个对对棒棒球球赛赛知知之之其其少少的的人人来来说说,当当有有人人提提供供给给他他的的打打赌赌选选项项中中有有赌赌美美州州队队胜胜这这个个选选择择时时,他他通通常常会会认认为为:对对方方(赌赌项项提提供供者者)有有信信息息表表明明美美州州队队可可能能会输。会输。因因此此,一一个个去去赌赌全全明明星星赛赛中中某某方方获获胜胜的的机机会会应应该该(由由贝贝叶叶斯斯公公式式)让让一一个个对对棒棒球球赛赛一一无无所所知知的的人人降降低低其其对对该该方方获获胜胜的的主主观观概概率率,因因此此他他可可能能更更愿愿意意去去赌赌一一枚公正的硬币。枚公正的硬币。在在受受控控实实验验中中,实实验验对对象象被被尽尽可可能能无无信信息息地地提提供供赌赌项项,其其至至被被告告知知这这些些赌赌项项是是无无附附加加信信息息地地提提供供的的。但但这这会会被被实实验验对对象象认认为为是是很很不不自自然然的的,以以致致实实验验对对象象反反而而会会以以为为:实实验验人人员员只只会会提提供供他他们们认认为为会会输输的的队给自己赌胜。队给自己赌胜。阅读文献阅读文献1陈珽陈珽.决策分析,科学出版社,决策分析,科学出版社,19862罗罗杰杰B.迈迈而而森森.博博弈弈论论矛矛盾盾冲冲突突分分析,中国经济出版社,析,中国经济出版社,20013岳岳超超源源.决决策策理理论论与与方方法法,科科学学出出版版社社,20034李李保保明明.效效用用理理论论与与纳纳什什均均衡衡,经经济济科科学学出版社,出版社,20035von Neumann J.,O.Morgenstern Theory of Games and Economic Behavior,Princeton University Press,1944 6Raiffa H.Decision Analysis,Mass:Addison-Wesley,19687Ramsey F.P.Truth and Probability,in H.E.Kyburg Jr.,H.E.Smokler,eds.Studies in Subjective Probability,New York:Wiley,19648Allais M.,O.Hagen eds.Expected Utility Hypothesis and Allais Paradox,Boston:Reidel,19799Kreps David.A Corse in Microe-conomics,Princeton University Press,199010Mas-Collel A.,M.Whinston and Jerry Green.Micro-economic Theory,Oxford University Press,199511 R.J Aumann Subjectivity and Correlation in Randomized Strategies,Journal of mathematical Economics,1974,1:6796 继续!休息一会!