第四章 随机模拟精选文档.ppt
第四章 随机模拟本讲稿第一页,共五十七页一、随机模拟简介一、随机模拟简介 随机模拟方法又称蒙特卡罗(随机模拟方法又称蒙特卡罗(Monte Carlo)方法或统)方法或统计试验法,是指随机系统可以用概率模型来描述并进行试计试验法,是指随机系统可以用概率模型来描述并进行试验的方法。验的方法。随机模拟方法在现在精算和风险分析中起着非常重要随机模拟方法在现在精算和风险分析中起着非常重要的作用。的作用。模拟模拟是建立系统或决策问题的数学或逻辑模型,并以该模是建立系统或决策问题的数学或逻辑模型,并以该模型进行试验,以获得对系统行为的认识或帮助解决决策问型进行试验,以获得对系统行为的认识或帮助解决决策问题的过程。题的过程。本讲稿第二页,共五十七页蒙特卡罗模拟方法的原理蒙特卡罗模拟方法的原理计算图中不规则图形的面积计算图中不规则图形的面积与正方形图形面积的比率与正方形图形面积的比率:xf(x)aa0 选择一组随机数选择一组随机数(x,y),x,y均属于均属于(0,(0,b),),b a,在在 正方形内描出坐标点正方形内描出坐标点(x,y)多次多次重复这一过程,到重复这一过程,到 某一步为止。某一步为止。本讲稿第三页,共五十七页什么时候用模拟?什么时候用模拟?在费用和时间上均难以对风险系统进行大量实测;在费用和时间上均难以对风险系统进行大量实测;由于实际风险系统的损失后果严重而不能进行实测;由于实际风险系统的损失后果严重而不能进行实测;难以对复杂的风险系统构造精确的解析模型;难以对复杂的风险系统构造精确的解析模型;用解析模型不易求解;用解析模型不易求解;对解析模型进行验证。对解析模型进行验证。本讲稿第四页,共五十七页模拟的基本步骤:模拟的基本步骤:建立恰当模型;建立恰当模型;设计试验方法;设计试验方法;从概率分布中重复生成随机数;从概率分布中重复生成随机数;分析模拟结果。分析模拟结果。步骤步骤3 3是任何随机模拟的基本要素,本章将讨论是任何随机模拟的基本要素,本章将讨论几种常用分布的随机数生成方法,并通过几个简单例几种常用分布的随机数生成方法,并通过几个简单例子来说明随机模拟方法在保险精算中的应用。子来说明随机模拟方法在保险精算中的应用。本讲稿第五页,共五十七页均匀随机数模拟定积分均匀随机数模拟定积分计算计算常规方法不易计算,利用随机数常规方法不易计算,利用随机数获得一近似值。获得一近似值。设设UU0,1,0,1,Y=f(U),),则则由数理统计知识可知,由数理统计知识可知,利用某种手段产生利用某种手段产生0,1上的均匀随机数:上的均匀随机数:则则本讲稿第六页,共五十七页二、均匀随机数与伪随机数二、均匀随机数与伪随机数对随机现象进行模拟,首要的问题是解决随机数的生成问对随机现象进行模拟,首要的问题是解决随机数的生成问题,服从均匀分布题,服从均匀分布U(0,1)的随机数是一切随机模拟的基础。的随机数是一切随机模拟的基础。因而产生因而产生0,1区间上的服从均匀分布的随机数是随机区间上的服从均匀分布的随机数是随机模拟的关键。模拟的关键。随机数应满足的条件:随机数应满足的条件:统计性能好统计性能好 周期长周期长 计算简便计算简便本讲稿第七页,共五十七页产生均匀随机数的方法:产生均匀随机数的方法:检表法检表法 物理方法物理方法 数学方法数学方法真随机数真随机数(平方取中法、倍积取中法、乘同余法平方取中法、倍积取中法、乘同余法)利用递推公式利用递推公式和一组初值和一组初值 ,逐步求出逐步求出本讲稿第八页,共五十七页产生均匀随机数的数学方法:产生均匀随机数的数学方法:1.1.自然取中法自然取中法(平方取中法平方取中法):用数学式子表示就是:用数学式子表示就是:任取一任取一m位正整数为初值位正整数为初值w0 逐步求出逐步求出 将数列除以将数列除以10m,则得,则得0,1上的均匀随机数列上的均匀随机数列本讲稿第九页,共五十七页例例1.设设w03456,利用,利用平方取中法,求服从区间平方取中法,求服从区间0,1上上服从均匀分布的随机数列。服从均匀分布的随机数列。解:解:得到得到0,1上的均匀随机数列上的均匀随机数列则则则则则则本讲稿第十页,共五十七页产生均匀随机数的数学方法:产生均匀随机数的数学方法:2.2.倍积取中法:倍积取中法:用数学式子表示就是:用数学式子表示就是:任取一任取一m位正整数为初值位正整数为初值w0 再选取一正整数再选取一正整数k(m位)位)步骤与平方取中法一样。步骤与平方取中法一样。本讲稿第十一页,共五十七页产生均匀随机数的数学方法:产生均匀随机数的数学方法:3.3.乘同余法乘同余法(一阶线性同余法一阶线性同余法):最常用最常用 其数学公式为其数学公式为这里这里k,m和和w0 都是正整数都是正整数 根据模运算可知根据模运算可知wn 的可能值是的可能值是0,1,m1,因而最,因而最多经过多经过m次运算,将出现重复。所以在采用乘同余法时,次运算,将出现重复。所以在采用乘同余法时,必须选择适当的必须选择适当的k,m使得对任意初值使得对任意初值w0,不发生重复的,不发生重复的的数列的项数必须足够大。的数列的项数必须足够大。本讲稿第十二页,共五十七页例例2.如果选择如果选择m999563,k470001,根据乘同余法,根据乘同余法求出求出5个在区间个在区间0,1上服从均匀分布的随机数。上服从均匀分布的随机数。解:解:取初值取初值w0671800,则有,则有本讲稿第十三页,共五十七页例例2.如果选择如果选择m999563,k470001,根据乘同余,根据乘同余法求出法求出5个在区间个在区间0,1上服从均匀分布的随机数。上服从均匀分布的随机数。解:解:故,所求出的故,所求出的5个个随机数为随机数为本讲稿第十四页,共五十七页3.3.乘同余法乘同余法(一阶线性同余法一阶线性同余法):这里这里k1,m和和w0 都是正整数都是正整数混合乘同余法混合乘同余法高阶混合乘同余法(二阶)高阶混合乘同余法(二阶)本讲稿第十五页,共五十七页例例3 用二阶线性同余法产生用二阶线性同余法产生3个个0,1区间上均匀分布区间上均匀分布的随机数,取的随机数,取m=998 917,k1=36 6528,k2=508 531,w0=931 125,w1=970 710。解:解:w2=(k1 w1+k2w0)mod(m)=366528*970710+508531*931125(Mod 998917)假设假设w2=456531,则有,则有u1=456531/998 917=0.4570 w3=(k1 w2+k2w1)mod(m)=366528*456531+508531*970710(Mod 998917)假设假设w3=541290,则有,则有u2=541290/998 917=0.5419 假设假设w4=236974,则有,则有u3=236974/998917=0.2372 本讲稿第十六页,共五十七页 验证这些随机数是否满足区间验证这些随机数是否满足区间0,10,1上均匀分布的上均匀分布的随机变量的抽样分布特征,一般用卡方检验法检验随机变量的抽样分布特征,一般用卡方检验法检验均匀性,用相关系数法检验独立性。均匀性,用相关系数法检验独立性。在实际应用中,常见的统计软件都可以产生很好的在实际应用中,常见的统计软件都可以产生很好的均匀分布的伪随机数,它们能很好地近似真实的均匀分均匀分布的伪随机数,它们能很好地近似真实的均匀分布随机数,所以,可以认为有一个布随机数,所以,可以认为有一个“黑箱黑箱”能产生任意能产生任意所需的均匀分布随机数。所需的均匀分布随机数。本讲稿第十七页,共五十七页三、一般分布的随机数三、一般分布的随机数已知来自均匀分布已知来自均匀分布0,1上的随机数上的随机数u,对于随机变量,对于随机变量XF(x),求来自,求来自X的随机数(子样)。的随机数(子样)。2.3.1 常用方法:常用方法:反函数法:反函数法:理论上,任意随机变量都可以由它产生相应的理论上,任意随机变量都可以由它产生相应的随机数;随机数;取舍法取舍法 Box-Muller方法方法 极方法极方法本讲稿第十八页,共五十七页1.反函数法反函数法 若若XF(x),令令x=F-1(u),则,则x就是所要求就是所要求的随机数,其中的随机数,其中u为为0,1上的均匀分布的随机上的均匀分布的随机数。数。说明:说明:1、若、若UU(0,1),则随机变量,则随机变量F-1(U)的分布函的分布函数数F(x),即在分布相等的意义上,即在分布相等的意义上x=F-1(u)。2、若已知、若已知X的分布函数为的分布函数为F(x),只要产生一,只要产生一个均匀分布随机数个均匀分布随机数u,对应地取分布函数,对应地取分布函数F(x)的的u分分为点即可。为点即可。本讲稿第十九页,共五十七页2.取舍法取舍法 若若X的分布密度函数的分布密度函数(x)可分解为:可分解为:(x)=Ch(x)g(x)其中其中C为大于等于为大于等于1的常数,的常数,0 g(x)1,h(x)是是一个简单的密度函数一个简单的密度函数(用反函数法易求用反函数法易求)先产生均匀分布的随机数先产生均匀分布的随机数u;再产生与再产生与u对应的对应的h(x)的随机数的随机数y;若若u g(y),则令则令x=y;否则新生成均匀分布的随机数否则新生成均匀分布的随机数u。本讲稿第二十页,共五十七页3.Box-Muller方法方法 首先产生首先产生0,1区间上两个独立的均匀分布的随区间上两个独立的均匀分布的随机数机数u1与与u2,令,令 x1=(-2lnu1)1/2 cos(2u2)x2=(-2lnu2)1/2 sin(2 u2)则则x1,x2就是两个相互独立的服从就是两个相互独立的服从N(0,1)分布)分布的随机数。的随机数。本讲稿第二十一页,共五十七页4.极方法极方法 首先产生首先产生0,1区间上两个独立的均匀分布的随机数区间上两个独立的均匀分布的随机数u1与与u2,令,令 vi=2ui1 =v12+v22 若若 1,重新生成,重新生成u1和和u2;否则令;否则令 则则x1,x2就是两个相互独立的服从就是两个相互独立的服从N(0,1)分布的)分布的随机数。随机数。本讲稿第二十二页,共五十七页2.3.2 连续型随机变量的模拟连续型随机变量的模拟例例1 设随机变量设随机变量X的分布函数为的分布函数为 F(x)=xn 0 x00的指数分布,其的指数分布,其分布函数为分布函数为 F(x)=1-e-l lx x0试用反函数法给出试用反函数法给出X的随机数。的随机数。解:解:令令x=F-1(u),则,则 u=F(x)=1-e-l lx 或者或者 1-u=e l lx于是于是即为即为X的随机数,其中的随机数,其中u为为0,1上上均匀分布的随机数。均匀分布的随机数。又又故故 也也为为X的随机数。的随机数。本讲稿第二十四页,共五十七页例例3 设随机变量设随机变量X服从参数为服从参数为c0,g g00的韦布尔分布,其的韦布尔分布,其分布函数为分布函数为 试用反函数法给出试用反函数法给出X的随机数。的随机数。解:解:令令x=F-1(u),则,则于是于是即为即为X的随机数,其中的随机数,其中u为为0,1上均匀分布的随机数。上均匀分布的随机数。本讲稿第二十五页,共五十七页例例4 设随机变量设随机变量X的概率密度为的概率密度为 f(x)=20 x(1-x)3,0 x1试用取舍法模拟随机变量试用取舍法模拟随机变量X。解:解:由于随机变量由于随机变量X在区间在区间(0,1)之外的值都等于零,之外的值都等于零,不妨取不妨取 h(x)=1,0 x1下面确定满足下面确定满足f(x)=ch(x)g(x)的最小整数的最小整数c求函数求函数 的最大值,得的最大值,得于是有于是有c=135/64,采用以下取舍法对随机变量采用以下取舍法对随机变量X进行模拟:进行模拟:(1)产生产生(0,1)上的均匀随机数上的均匀随机数u;(2)若若ug(u),则取则取x=u,为,为X的随机数;的随机数;(3)否则重新生成否则重新生成(0,1)上的均匀随机数。上的均匀随机数。本讲稿第二十六页,共五十七页例例5 试产生标准正态分布试产生标准正态分布N(0,1)的随机数。的随机数。可用方法:可用方法:1)反函数法)反函数法(分布函数没有显式,所以它的分位点需要查表分布函数没有显式,所以它的分位点需要查表得到;得到;查表法:查表法:先得到先得到0,1上均匀分布的随机数上均匀分布的随机数u,查标,查标准分布函数表准分布函数表F F(x)=)=u,则则x为标准正态分布的一个随机数。为标准正态分布的一个随机数。)2)Box-Muller方法方法3)极方法)极方法4)中心极限定理)中心极限定理本讲稿第二十七页,共五十七页试产生标准正态分布试产生标准正态分布N(0,1)的随机数。的随机数。4)中心极限定理)中心极限定理 先得到先得到0,1上均匀分布的随机数上均匀分布的随机数u1,u2,un,且,且u1,u2,un相互独立,令相互独立,令则则x为标准正态分布的一个随机数为标准正态分布的一个随机数.特别地,特别地,n12时,时,或或对计算速度要求较高,对正态分对计算速度要求较高,对正态分布地尾端情况要求不高。布地尾端情况要求不高。本讲稿第二十八页,共五十七页例例6(利用某些随机变量间的关系求解某些分布的随机数利用某些随机变量间的关系求解某些分布的随机数)已知标准正态分布已知标准正态分布N(0,1)的的5个随机数:个随机数:0.49,0.32,0.62,1.31,0.23求:求:1.相应的相应的N(2,1)的的5个随机数;个随机数;2.相应的相应的5个参数为个参数为m m=2,s s2=1的对数正态分布的随机的对数正态分布的随机数数.N(0,1)随机数随机数x:0.49,0.32,0.62,1.31,0.23N(2,1)随机数随机数y:y=2+1*x对数正态分布的随机数对数正态分布的随机数z:z=ey=e2+1*x1.51 2.32 1.38 3.31 2.234.52 10.18 3.97 27.39 9.30若若lnXN(m m,s s2)则则X服从参数为服从参数为m m,s s2的对数的对数正态分布。正态分布。本讲稿第二十九页,共五十七页例例7(利用某些随机变量间的关系求解某些分布的随机数利用某些随机变量间的关系求解某些分布的随机数)试求试求c c2(n)分布的随机数。分布的随机数。先生成先生成N(0,1)的的n个独立的随机数个独立的随机数x1,x2,xn,则则就是就是c c2(n)分布的随机数。分布的随机数。P48页例页例46(指数分布合成指数分布合成G G分布随机数的例子分布随机数的例子)本讲稿第三十页,共五十七页2.3.3 离散型随机变量的模拟离散型随机变量的模拟反函数法反函数法X的概率分布为的概率分布为 首先,用分布函数首先,用分布函数F(x):F(a1),F(a2),F(an),将区间将区间0,1划分为划分为n个子区间;个子区间;其次,生成其次,生成0,1上均匀随机数上均匀随机数u;最后,比较最后,比较u与与F(ai),的大小,若的大小,若 F(ai)u F(ai+1),则取则取x=ai+1,就是所得的随机数,就是所得的随机数。Xa1a2anPp1p2pn本讲稿第三十一页,共五十七页例例8 设设X的概率分布为的概率分布为 试用反函数法求得试用反函数法求得X的的5个随机数。若已用个随机数。若已用Excel中的中的RAND函数生成了函数生成了5个个0,1上的均匀随机数:上的均匀随机数:0.51327,0.38110,0.18862,0.73616,0.78422X1234P0.200.150.250.40解:解:0.350.51327 0.6x1=30.350.381100.6x2=300.18862 0.2x3=10.60.73616 1x4=40.60.78422 1x5=4所以,所求的所以,所求的5个随机数为:个随机数为:3,3,1,4,4.本讲稿第三十二页,共五十七页例例9 模拟参数为模拟参数为n,p的二项分布,记为:的二项分布,记为:则二项分布的一个随机数则二项分布的一个随机数x可按如下过程得到:可按如下过程得到:生成生成0,1区间上均匀分布的随机数区间上均匀分布的随机数u,若若uF0,则令,则令x=0;若若Fk-1 u 0.7359 ,则则 x=0 e-0.1=0.9048 0.1043,则则 x=0 e-0.1=0.9048 0.2689,则则 x=0 e-0.1=0.9048 0.9204*0.1125=0.103545,则则 x=1 e-0.1=0.9048 0.5734,则则 x=0 e-0.1=0.9048 0.6904,则则 x=0 e-0.1=0.9048 0.7374,则则 x=0 e-0.1=0.9048 0.9374*0.2109=0.19769766,则则 x =1 e-0.1=0.9048 0.3844,则则 x=0每行后面的每行后面的x的值就是的值就是=0.1的泊松分布的随机数。的泊松分布的随机数。本讲稿第三十八页,共五十七页例例12 产生参数为产生参数为l l=0.5=0.5的泊松分布的随机数。的泊松分布的随机数。解解 e-0.5=0.60653,再产生一系列均匀分布的随机数:,再产生一系列均匀分布的随机数:0.68379,0.10493,0.81889,0.81953,0.35101,0.16703,0.83946 0.35006,0.20226,e-0.5=0.60653 0.68379*0.10493=0.07175,则则 x=1 e-0.5=0.60653 0.81889,又又e-0.5=0.60653 0.81889*0.81953*0.35101=0.23559,则则 x=2 e-0.5=0.60653 0.16703,则则 x=0 e-0.5=0.60653 0.83946*0.35006=0.29386,则则 x =1 e-0.5=0.60653 0.20226,则则 x=0每行后面的每行后面的x的值就是的值就是=0.5的泊松分布的随机数。的泊松分布的随机数。l l越大,越大,运算量越大运算量越大本讲稿第三十九页,共五十七页序号序号随机数随机数xi10.73591020.10431030.2689104 0.9204*0.1125=0.1035450.9204150.57341060.69041070.73741080.9374*0.2109=0.197697660.937419 0.384410e-0.1=0.9048本讲稿第四十页,共五十七页序号序号随机数随机数xi10.68379*0.10493=0.07175 0.68379120.81889*0.81953*0.35101=0.235590.81889*0.81953=0.6711923 0.167031040.83946*0.35006=0.293860.8394615 0.2022610e-0.5=0.60653本讲稿第四十一页,共五十七页例例13 模拟负二项分布模拟负二项分布(帕斯卡分布帕斯卡分布)的随机数的随机数.负二项分布表(负二项分布表(k=6,p=0.6)mP(X=m)P(Xm)00.04670.046710.11200.158720.15680.315530.16720.482740.15050.633250.12040.753660.8830.84190.6837 0.10490.81880.81950.3510 51663均匀随均匀随机数机数本讲稿第四十二页,共五十七页2.3.4 复合型随机变量的模拟复合型随机变量的模拟设设 其中其中Xi 是独立同分布的随机变量,若是独立同分布的随机变量,若N服从泊松分布,服从泊松分布,则称则称S服从复合泊松分布。服从复合泊松分布。首先,生成首先,生成N分布的随机数分布的随机数n1;然后,再生成然后,再生成n 个个Xi分布的随机数分布的随机数x1,x2,xn1;即可得即可得S的一个随机数的一个随机数s1 x1x2 xn1。本讲稿第四十三页,共五十七页四、模拟应用实例四、模拟应用实例模拟的应用:模拟的应用:计算积分计算积分;估计保费;估计保费;计算一些超越数的值,例如计算一些超越数的值,例如;质量检验;质量检验;科学探索。科学探索。本节以例题的方式给出一些模拟在精算模型中的本节以例题的方式给出一些模拟在精算模型中的应用,这些内容只是在模拟的基本方法中加入保险的应用,这些内容只是在模拟的基本方法中加入保险的背景。背景。本讲稿第四十四页,共五十七页例例14 模拟一个复合分布的赔付。其中模拟一个复合分布的赔付。其中(1)索赔次数索赔次数N服从二项分布服从二项分布b(3,1-p),均值为,均值为1.8;(2)赔付额均匀分布于赔付额均匀分布于1,2,3,4,5,6,7,8;(3)索赔额相互独立,且与索赔次数相互独立;索赔额相互独立,且与索赔次数相互独立;(4)模拟索赔次数模拟索赔次数N,以及各次赔付的索赔额,以及各次赔付的索赔额X1,X2,XN,然后再,然后再重复另一个重复另一个N以及赔付额,直至得到满意的模拟数量;以及赔付额,直至得到满意的模拟数量;(5)所有模拟运用反函数法;所有模拟运用反函数法;(6)得到得到(0,1)上的均匀分布随机数为:上的均匀分布随机数为:0.5,0.1,0.7,0.3,0.4,0.7,0.5,0.9,0.3,0.1;计算第三次模拟的计算第三次模拟的N得到的总的赔付额。得到的总的赔付额。本讲稿第四十五页,共五十七页解:解:由题意知由题意知1.8=3*(1-p),得,得p=0.4,故,故N的分布如下:的分布如下:第一个第一个N对应的随机数为对应的随机数为0.5,对应着对应着2次理赔,需使用随机数次理赔,需使用随机数0.1,0.7模拟赔付额;模拟赔付额;N0123P0.0640.2880.4320.216F(x)0.0640.3520.78410.3520.50.784n1=2第二个第二个N对应的随机数为对应的随机数为0.3,对应着对应着1次理赔,需使用随机数次理赔,需使用随机数0.4;0.0640.30.352n2=1第三个第三个N对应的随机数为对应的随机数为0.7,对应着对应着2次理赔,需使用随机数次理赔,需使用随机数0.5,0.9;0.3520.70.784n3=248所以,第三次模拟的所以,第三次模拟的N得到的总的赔付额为得到的总的赔付额为12。本讲稿第四十六页,共五十七页例例15 A公司共有公司共有20辆货运卡车,公司对未来一年的事故损失制辆货运卡车,公司对未来一年的事故损失制定相应的风险管理计划,为此,需要了解未来一年出现超大损定相应的风险管理计划,为此,需要了解未来一年出现超大损失的情况。经过经验分析,失的情况。经过经验分析,已知:已知:(1)下一年度卡车的碰撞事故次数服从均值为下一年度卡车的碰撞事故次数服从均值为2的泊松分布的泊松分布;(2)每次事故的碰撞损失每次事故的碰撞损失(以百元为单位以百元为单位)服从自由度为服从自由度为2的的c c2分布。分布。试确定某个最大损失试确定某个最大损失C,使下一年度公司所有卡车总损失,使下一年度公司所有卡车总损失L超过超过C的概率为的概率为5%。即求。即求C,使,使P(LC)=0.05。分析:分析:损失损失L=c c21+c c22+c c2N为复合泊松分布。采用随机模拟为复合泊松分布。采用随机模拟方法确定方法确定L,需生成泊松分布随机数和,需生成泊松分布随机数和c c2分布随机数,从分布随机数,从而估计而估计C的值。的值。本讲稿第四十七页,共五十七页试验次数试验次数事故次数事故次数总损失总损失模拟次数模拟次数事故次数事故次数总损失总损失1002008628893008749364008859635008959936009059957009141020800926107390093410831000942124311009541258120096613361300975139014009821431150099615711611100418961336本讲稿第四十八页,共五十七页例例16 现有课题需要估计某地区平均每个工时的工伤赔偿损现有课题需要估计某地区平均每个工时的工伤赔偿损失额。已知:失额。已知:(1)赔偿总额赔偿总额B-15cB-15c2(5(5)。其中。其中c c2(5)是自由度为是自由度为5的的c c2分布,分布,B以百万元为单位;以百万元为单位;(2)工人的工作小时数工人的工作小时数H服从正态分布:均值为服从正态分布:均值为25*106小时,小时,标准差为标准差为5*106小时。小时。分析:分析:每小时的工伤赔偿损失为每小时的工伤赔偿损失为B/H。分别模拟。分别模拟B和和H的值,的值,得到得到B/H的值,在计算其平均值即可。的值,在计算其平均值即可。本讲稿第四十九页,共五十七页试验次数试验次数B(百万元)(百万元)H(百万小时百万小时)B/H123.117.91.29217.237.70.46326.725.91.03417.520.90.84517.516.81.04620.425.50.80726.224.51.07823.033.60.68921.723.90.911026.025.30.702222.223.80.932317.624.10.732420.525.20.812517.426.80.65平均值平均值21.224.40.94本讲稿第五十页,共五十七页例例17 现有对某地区机动车辆保险的一些统计研究结果:一般的男现有对某地区机动车辆保险的一些统计研究结果:一般的男性驾驶员平均性驾驶员平均10年有年有1次事故,一般的女性驾驶员平均次事故,一般的女性驾驶员平均20年有年有1次次事故。这样的统计结果在事故。这样的统计结果在A先生家中引起了一场争论:先生家中引起了一场争论:A先生与先生与妻子商定,再接下来的妻子商定,再接下来的10年里,若年里,若A先生发生的事故数超出其妻子先生发生的事故数超出其妻子和女儿发生事故次数中较高者,则和女儿发生事故次数中较高者,则A先生对超出的每一次事故向其先生对超出的每一次事故向其妻子支付妻子支付1000元;若元;若10年里年里A先生的事故次数较其妻子和女儿的先生的事故次数较其妻子和女儿的事故都低,则由其妻子向事故都低,则由其妻子向A先生支付先生支付1000元元(无论两者的差是多少无论两者的差是多少)。假设假设A先生与其妻子女儿都是一般的驾驶员,在接下来的先生与其妻子女儿都是一般的驾驶员,在接下来的10年中发年中发生事故的次数都服从泊松分布,其中生事故的次数都服从泊松分布,其中A先生的泊松分布均值为先生的泊松分布均值为1,其,其妻子和女儿的泊松分布均值为妻子和女儿的泊松分布均值为0.5。是根据随机模拟结果计算是根据随机模拟结果计算A先生向妻子支付金额的平均值。先生向妻子支付金额的平均值。本讲稿第五十一页,共五十七页A先生先生A妻妻A女女支付额支付额试验次数试验次数随机数随机数事故数事故数随机数随机数事故数事故数随机数随机数事故数事故数元元10.9072520.6436410.8962020.9501230.1566400.16408030.1862900.7311510.57491040.3040500.1663100.96773250.3893510.3162400.78919160.1501100.4657300.48360070.9309330.3997500.069070160.471100.6988410.657951170.5794810.8347310.425950180.5634910.1858400.896341190.6276510.0752300.639761200.2827700.5491400.295150210.5221010.6741210.003580合计合计1000300000003000-1000000008000A先生向妻子支付的平均数为先生向妻子支付的平均数为8000/21=381。本讲稿第五十二页,共五十七页五、模拟样本的容量五、模拟样本的容量 类似统计估计,除了利用随机数类似统计估计,除了利用随机数(样本样本)点估计未点估计未知信息外,还有区间估计。知信息外,还有区间估计。模拟次数取决于问题的精度要求,一般而言,模拟次数取决于问题的精度要求,一般而言,精度要求越高,模拟次数就越多,由于都是大次数精度要求越高,模拟次数就越多,由于都是大次数的,因此中心极限定理便起到了重要的作用。的,因此中心极限定理便起到了重要的作用。考虑估计值的精确度:给定考虑估计值的精确度:给定n 和和a a,求,求e e;考虑必要的样本容量:给定考虑必要的样本容量:给定e e 和和a a,求,求n。本讲稿第五十三页,共五十七页例例18 对于例对于例16中男女驾驶员问题的模拟,在事先确定了估中男女驾驶员问题的模拟,在事先确定了估计精度的情况下分析对模拟次数的要求。计精度的情况下分析对模拟次数的要求。首先,分析首先,分析A先生的净支付额为先生的净支付额为0的情况。对于这一事的情况。对于这一事件,以件,以0.95的概率在其真实值上下的概率在其真实值上下10%的范围内波动,求模拟次的范围内波动,求模拟次数。数。再来分析,对再来分析,对A先生的期望支付额的估计以先生的期望支付额的估计以0.99的概率在其真的概率在其真实值上下实值上下10%范围内波动,求所需要的模拟次数。范围内波动,求所需要的模拟次数。解:解:假设进行假设进行n次模拟,次模拟,且且A先生支付为先生支付为0的概率为的概率为p。设设n次模拟中,次模拟中,A先生支付为先生支付为0的次数为随机变量的次数为随机变量X,则则 XB(n,p)所求所求n满足满足本讲稿第五十四页,共五十七页由中心极限定理得由中心极限定理得整理得整理得所以所以采用例采用例16的的模拟结果,得模拟结果,得到到p的估计值的估计值本讲稿第五十五页,共五十七页再来分析,对再来分析,对A先生的期望支付额的估计以先生的期望支付额的估计以0.99的概率在其真实的概率在其真实值上下值上下10%范围内波动,求所需要的模拟次数。范围内波动,求所需要的模拟次数。解:解:假设进行假设进行n次模拟,次模拟,且一次模拟中,且一次模拟中,A先生支付额为随机先生支付额为随机变量,假设其期望为变量,假设其期望为m m ,标准差为,标准差为s s。则则X的期望与方差为的期望与方差为所求所求n满足满足设设n次模拟中,次模拟中,A先生的支付总额为随机变量先生的支付总额为随机变量X,E(X)=nm m,Var(X)=ns s2 本讲稿第五十六页,共五十七页由中心极限定理得由中心极限定理得整理得整理得所以所以采用例采用例16的模拟的模拟结果,得到结果,得到m m和和s s的估计值的估计值本讲稿第五十七页,共五十七页