随机决策理论与方法.ppt
《随机决策理论与方法.ppt》由会员分享,可在线阅读,更多相关《随机决策理论与方法.ppt(68页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、随机决策理论与方法随机决策理论与方法现在学习的是第1页,共68页*决策理论与方法-随机决策理论与方法随机性决策随机性决策vv风险性决策(随机性决策)风险性决策(随机性决策):指有多种未来状态和:指有多种未来状态和相应后果,但只能得到各种状态发生的概率而难以相应后果,但只能得到各种状态发生的概率而难以获得充分可靠信息的决策问题。获得充分可靠信息的决策问题。vv特点特点:状态的随机性;决策结果的效用特性。:状态的随机性;决策结果的效用特性。vv决策的已知变量决策的已知变量:状态空间的概率分布状态空间的概率分布状态空间的概率分布状态空间的概率分布=,后果的效用函数后果的效用函数后果的效用函数后果的效
2、用函数(或损失函数或损失函数或损失函数或损失函数):u u(c(cij ij),c cij ij表示采取方案表示采取方案表示采取方案表示采取方案a ai i时出现状态时出现状态时出现状态时出现状态 j j的后果的后果的后果的后果vv解决问题的主要理论方法解决问题的主要理论方法:概率论与数理统计:概率论与数理统计现在学习的是第2页,共68页*决策理论与方法-随机决策理论与方法随机决策理论与方法随机决策理论与方法1、主观概率、主观概率2、效用函数、效用函数3、决策准则、决策准则4、贝叶斯决策分析、贝叶斯决策分析现在学习的是第3页,共68页*决策理论与方法-随机决策理论与方法主观概率主观概率概率的定
3、义概率的定义vv古典概率的定义古典概率的定义古典概率的定义古典概率的定义:在相同条件下进行了:在相同条件下进行了:在相同条件下进行了:在相同条件下进行了n n次试验(随机试验),其中次试验(随机试验),其中次试验(随机试验),其中次试验(随机试验),其中事件事件事件事件A A发生的次数发生的次数发生的次数发生的次数n nA A称为事件称为事件称为事件称为事件A A发生的频数,比值发生的频数,比值发生的频数,比值发生的频数,比值n nA A/n n称为事件称为事件称为事件称为事件A A发发发发生的频率,记为生的频率,记为生的频率,记为生的频率,记为f fn n(A)(A),则古典概率的定义为:,
4、则古典概率的定义为:,则古典概率的定义为:,则古典概率的定义为:p p(A)=(A)=limlimn nf fn n(A)(A)vvLaplaceLaplace的定义的定义的定义的定义:p p(A)=(A)=k k/n n;其中;其中;其中;其中k k为事件为事件为事件为事件A A所包含的基本事件数,所包含的基本事件数,所包含的基本事件数,所包含的基本事件数,n n为基本事件为基本事件为基本事件为基本事件e ei i的总数。(基本事件数有限,每个基本事件等概率)的总数。(基本事件数有限,每个基本事件等概率)的总数。(基本事件数有限,每个基本事件等概率)的总数。(基本事件数有限,每个基本事件等概
5、率)vv公理化定义公理化定义公理化定义公理化定义:E E是随机事件,是随机事件,是随机事件,是随机事件,S S是是是是E E的样本空间,对的样本空间,对的样本空间,对的样本空间,对E E的每一事件的每一事件的每一事件的每一事件A A,对应有确定的实数对应有确定的实数对应有确定的实数对应有确定的实数p p(A)(A),若,若,若,若p p(A)(A)满足:满足:满足:满足:非负性:非负性:非负性:非负性:p p(A)0(A)0;规范性:规范性:规范性:规范性:p p(S)=1(S)=1;列可加性:对两两不相容事件列可加性:对两两不相容事件列可加性:对两两不相容事件列可加性:对两两不相容事件A A
6、k k,有,有,有,有p p(k kA Ak k)=)=k kp p(A(Ak k)。(A(Ai iAAj j=,=,i i j j)现在学习的是第4页,共68页*决策理论与方法-随机决策理论与方法主观概率主观概率概率的定义概率的定义vv客观客观客观客观(Objective)(Objective)概率概率概率概率:上述三种定义的概率是在多次重复试验:上述三种定义的概率是在多次重复试验:上述三种定义的概率是在多次重复试验:上述三种定义的概率是在多次重复试验(随机试验)中,随机事件(随机试验)中,随机事件(随机试验)中,随机事件(随机试验)中,随机事件A A发生的可能性的大小的度量,称为客发生的可
7、能性的大小的度量,称为客发生的可能性的大小的度量,称为客发生的可能性的大小的度量,称为客观概率。观概率。观概率。观概率。vv主观主观主观主观(Subjective)(Subjective)概率概率概率概率:在实际管理决策中,许多事件的发生概率是:在实际管理决策中,许多事件的发生概率是:在实际管理决策中,许多事件的发生概率是:在实际管理决策中,许多事件的发生概率是无法通过随机试验获得的,或条件不允许,或事件本身不允许。因无法通过随机试验获得的,或条件不允许,或事件本身不允许。因无法通过随机试验获得的,或条件不允许,或事件本身不允许。因无法通过随机试验获得的,或条件不允许,或事件本身不允许。因此需
8、要一种方法来人为设定事件发生的概率,称为主观概率。此需要一种方法来人为设定事件发生的概率,称为主观概率。此需要一种方法来人为设定事件发生的概率,称为主观概率。此需要一种方法来人为设定事件发生的概率,称为主观概率。主观主观主观主观概率是人们根据经验、各方面的知识以及了解到的客观情况进概率是人们根据经验、各方面的知识以及了解到的客观情况进概率是人们根据经验、各方面的知识以及了解到的客观情况进概率是人们根据经验、各方面的知识以及了解到的客观情况进行分析、推理、综合判断,对特定事件发生的可能性的信念行分析、推理、综合判断,对特定事件发生的可能性的信念行分析、推理、综合判断,对特定事件发生的可能性的信念
9、行分析、推理、综合判断,对特定事件发生的可能性的信念(或意见、看法)的度量(或意见、看法)的度量(或意见、看法)的度量(或意见、看法)的度量(Savage,1954)(Savage,1954)。现在学习的是第5页,共68页*决策理论与方法-随机决策理论与方法主观概率主观概率先验分布与先验假设先验分布与先验假设vv先验分布先验分布先验分布先验分布(Prior Distribution)(Prior Distribution):根据先验信息所确定的概率分布:根据先验信息所确定的概率分布:根据先验信息所确定的概率分布:根据先验信息所确定的概率分布叫先验分布,获得先验分布是贝叶斯分析的基础。叫先验分布
10、,获得先验分布是贝叶斯分析的基础。叫先验分布,获得先验分布是贝叶斯分析的基础。叫先验分布,获得先验分布是贝叶斯分析的基础。决策中先验决策中先验决策中先验决策中先验分布的获得具有高度的主观性分布的获得具有高度的主观性分布的获得具有高度的主观性分布的获得具有高度的主观性。vv先验假设先验假设先验假设先验假设:为使先验分布估计规范化,需要做一定的假设。:为使先验分布估计规范化,需要做一定的假设。:为使先验分布估计规范化,需要做一定的假设。:为使先验分布估计规范化,需要做一定的假设。连通性假设连通性假设连通性假设连通性假设:指事件:指事件:指事件:指事件A A和事件和事件和事件和事件B B发生的可能性
11、是可比的,即发生的可能性是可比的,即发生的可能性是可比的,即发生的可能性是可比的,即p p(A)(A)p p(B),(B),p p(A)(A)p p(B),(B),p p(A)(A)(A)p p(B),(B),p p(B)(B)p p(C),(C),则则则则p p(A)(A)p p(C)(C)。(满足连通性和传递性的二元关系才能构成完全序)。(满足连通性和传递性的二元关系才能构成完全序)。(满足连通性和传递性的二元关系才能构成完全序)。(满足连通性和传递性的二元关系才能构成完全序)部分与全体关系假设部分与全体关系假设部分与全体关系假设部分与全体关系假设:若事件:若事件:若事件:若事件A A是事
12、件是事件是事件是事件B B的一部分,则的一部分,则的一部分,则的一部分,则p p(B)(B)p p(A)(A)。现在学习的是第6页,共68页*决策理论与方法-随机决策理论与方法主观概率主观概率先验分布估计先验分布估计:比较法比较法vv比较法比较法1-离散型离散型(对事件发生的各种状态加以比较确定相对事件发生的各种状态加以比较确定相对事件发生的各种状态加以比较确定相对事件发生的各种状态加以比较确定相对似然率对似然率对似然率对似然率)某气象专家对当年的气候状况进行评估,认为当年气候正某气象专家对当年的气候状况进行评估,认为当年气候正某气象专家对当年的气候状况进行评估,认为当年气候正某气象专家对当年
13、的气候状况进行评估,认为当年气候正常常常常(1 1)与受灾的可能性之比约为与受灾的可能性之比约为与受灾的可能性之比约为与受灾的可能性之比约为3:23:2;如果受灾,则水灾;如果受灾,则水灾;如果受灾,则水灾;如果受灾,则水灾(2 2)、旱灾、旱灾、旱灾、旱灾(3 3)的可能性相当。据此,我们可推算出当年的可能性相当。据此,我们可推算出当年的可能性相当。据此,我们可推算出当年的可能性相当。据此,我们可推算出当年气候状况的先验分布:气候状况的先验分布:气候状况的先验分布:气候状况的先验分布:(1 1)+)+(2 2)+)+(3 3)=1;)=1;(1 1)/()/(2 2)+)+(3 3)=3/2
14、;)=3/2;(2 2)=)=(3 3)解得:解得:解得:解得:(1 1)=0.6)=0.6,(2 2)=0.2)=0.2,(3 3)=0.2)=0.2思考:设某决策问题有思考:设某决策问题有思考:设某决策问题有思考:设某决策问题有n n个状态,有个状态,有个状态,有个状态,有mm个专家对各状态发个专家对各状态发个专家对各状态发个专家对各状态发生的可能性进行了比较评估,我们如何综合利用所有专家生的可能性进行了比较评估,我们如何综合利用所有专家生的可能性进行了比较评估,我们如何综合利用所有专家生的可能性进行了比较评估,我们如何综合利用所有专家的评估结果得到最终的先验分布?的评估结果得到最终的先验
15、分布?的评估结果得到最终的先验分布?的评估结果得到最终的先验分布?现在学习的是第7页,共68页*决策理论与方法-随机决策理论与方法主观概率主观概率先验分布估计:打赌法先验分布估计:打赌法vv打赌法(离散型)打赌法(离散型)设打赌者设打赌者设打赌者设打赌者(A)(A)的个人财产为的个人财产为的个人财产为的个人财产为WW。设事件。设事件。设事件。设事件E E发生时发生时发生时发生时A A获得收入获得收入获得收入获得收入为为为为p p,(0(0p p11;p pW:a a b b表示表示表示表示a a优于优于优于优于b b。满足传递性和非对称性。满足传递性和非对称性。满足传递性和非对称性。满足传递性
16、和非对称性。无差异无差异无差异无差异:a a b b表示表示表示表示a a与与与与b b无差异。满足自反性、对称性和无差异。满足自反性、对称性和无差异。满足自反性、对称性和无差异。满足自反性、对称性和传递性。传递性。传递性。传递性。弱序弱序弱序弱序:a a b b表示表示表示表示a a不劣于不劣于不劣于不劣于b b。满足自反性、传递性和反对。满足自反性、传递性和反对。满足自反性、传递性和反对。满足自反性、传递性和反对称性。称性。称性。称性。展望展望展望展望/前景前景前景前景(prospect)(prospect)(事态体事态体事态体事态体):各种后果):各种后果):各种后果):各种后果(n n
17、种种种种)及后果出及后果出及后果出及后果出现的概率的组合,记为:现的概率的组合,记为:现的概率的组合,记为:现的概率的组合,记为:P Pj j=,(j j=1,2,m;m=1,2,m;m为行动的可能种数为行动的可能种数为行动的可能种数为行动的可能种数)现在学习的是第21页,共68页*决策理论与方法-随机决策理论与方法效用函数效用函数效用的定义效用的定义复合展望:当无法确定采取某个行动时,可随机选择一种复合展望:当无法确定采取某个行动时,可随机选择一种复合展望:当无法确定采取某个行动时,可随机选择一种复合展望:当无法确定采取某个行动时,可随机选择一种行动,设选择行动行动,设选择行动行动,设选择行
18、动行动,设选择行动a aj j的概率为的概率为的概率为的概率为q qj j。则决策的展望就是一种。则决策的展望就是一种。则决策的展望就是一种。则决策的展望就是一种复合展望,记为复合展望,记为复合展望,记为复合展望,记为P=P=。所有展望。所有展望。所有展望。所有展望(包括简单展望和复合展望)构成展望空间。(包括简单展望和复合展望)构成展望空间。(包括简单展望和复合展望)构成展望空间。(包括简单展望和复合展望)构成展望空间。vv效用的定义效用的定义若展望空间上的实值函数若展望空间上的实值函数若展望空间上的实值函数若展望空间上的实值函数u u对于展望空间的任意两个展望对于展望空间的任意两个展望对于
19、展望空间的任意两个展望对于展望空间的任意两个展望P P1 1、P P2 2,有,有,有,有P P1 1PP2 2 iffiff u u(P(P1 1)u u(P(P2 2),则称,则称,则称,则称u u为效用函数。为效用函数。为效用函数。为效用函数。现在学习的是第22页,共68页*决策理论与方法-随机决策理论与方法效用函数效用函数效用的定义效用的定义vv效用存在性公理(效用存在性公理(理性行为公理理性行为公理)连通性:任意两个展望的优劣都是可比的连通性:任意两个展望的优劣都是可比的连通性:任意两个展望的优劣都是可比的连通性:任意两个展望的优劣都是可比的传递性:展望的优劣满足传递性传递性:展望的
20、优劣满足传递性传递性:展望的优劣满足传递性传递性:展望的优劣满足传递性复合保序性:展望的优劣关系是可以复合的,且复合不会复合保序性:展望的优劣关系是可以复合的,且复合不会复合保序性:展望的优劣关系是可以复合的,且复合不会复合保序性:展望的优劣关系是可以复合的,且复合不会破坏原有的优劣关系破坏原有的优劣关系破坏原有的优劣关系破坏原有的优劣关系展望的优劣是相对的,没有无限优的展望,也不存在无限展望的优劣是相对的,没有无限优的展望,也不存在无限展望的优劣是相对的,没有无限优的展望,也不存在无限展望的优劣是相对的,没有无限优的展望,也不存在无限劣的展望。劣的展望。劣的展望。劣的展望。现在学习的是第23
21、页,共68页*决策理论与方法-随机决策理论与方法效用函数效用函数效用的定义效用的定义vv效用的公理化定义效用的公理化定义:在上述公理系统中,若展望空:在上述公理系统中,若展望空间上存在实值函数间上存在实值函数u,有:,有:对展望空间中的任意展望对展望空间中的任意展望对展望空间中的任意展望对展望空间中的任意展望P P1 1、P P2 2,P P1 1PP2 2 iffiff u u(P(P1 1)u u(P(P2 2)u u(P P1 1+(1-+(1-)P)P2 2)=)=u u(P(P1 1)+(1-)+(1-)u u(P(P2 2)()(复合展望的效用等复合展望的效用等复合展望的效用等复合
22、展望的效用等于展望效用的复合于展望效用的复合于展望效用的复合于展望效用的复合)对满足上述条件的对满足上述条件的对满足上述条件的对满足上述条件的u u1 1,u u2 2,必有必有必有必有u u1 1(P(Pi i)=)=bubu2 2(P(Pi i)+)+c c,其中其中其中其中b b,c cR R1 1,b b00。(。(。(。(任意两个决策人的效用是任意两个决策人的效用是任意两个决策人的效用是任意两个决策人的效用是线性相关线性相关线性相关线性相关的的的的)现在学习的是第24页,共68页*决策理论与方法-随机决策理论与方法效用函数效用函数基数性和序数性基数性和序数性vv前述定义的效用是一种基
23、数效用,不仅能够反映决前述定义的效用是一种基数效用,不仅能够反映决策者的偏好次序,还能够反映决策者的偏好强度。策者的偏好次序,还能够反映决策者的偏好强度。vv但在实际决策中,有时只需要偏好次序而不一定需但在实际决策中,有时只需要偏好次序而不一定需要知道偏好强度就可以决策。此时只需要序数效用要知道偏好强度就可以决策。此时只需要序数效用就可以了。有关序数效用的应用在多属性决策中介就可以了。有关序数效用的应用在多属性决策中介绍。绍。vvHicks对效用函数的基数性和序数性的比喻对效用函数的基数性和序数性的比喻:如果:如果知道两个人的身高,那么我们可以把高个儿排在第知道两个人的身高,那么我们可以把高个
24、儿排在第一位;如果不知道他俩的身高也没关系,让他们比一位;如果不知道他俩的身高也没关系,让他们比一下就可以了。一下就可以了。现在学习的是第25页,共68页*决策理论与方法-随机决策理论与方法效用函数效用函数效用函数值的估计效用函数值的估计vv概率当量法概率当量法概率当量法概率当量法(Von Neumann,Morgenstern(Von Neumann,Morgenstern,N-MN-M法法法法):设决设决设决设决策系统的自然状态集策系统的自然状态集策系统的自然状态集策系统的自然状态集=1 1,n n、行动集行动集行动集行动集A=A=a a1 1,a amm、后、后、后、后果集果集果集果集C
25、=C=c cij ij=c c(a ai i,j j),最优后果为,最优后果为,最优后果为,最优后果为c c*=max*=max c cij ij,最劣后果为,最劣后果为,最劣后果为,最劣后果为c c0 0=min=min c cij ij。则对于任意后果。则对于任意后果。则对于任意后果。则对于任意后果c cij ij的效用值的效用值的效用值的效用值u(u(c cij ij),可按以下步骤获,可按以下步骤获,可按以下步骤获,可按以下步骤获得:得:得:得:设设设设u(c*)=1,u(cu(c*)=1,u(c0 0)=0)=0;建立简单展望建立简单展望建立简单展望建立简单展望p,c*;1-p,c,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 随机 决策 理论 方法
限制150内