概率论与数理统计第五章教案.ppt
第五章 大数定律和 中心极限定理湖南商学院信息系湖南商学院信息系 数学教研室数学教研室第五章 大数定律和中心极限定理 第一节 大 数 定 律第二节 中心极限定理 概率论与数理统计是研究随机现象统计概率论与数理统计是研究随机现象统计规律性的学科规律性的学科.随机现象的规律性只有在相随机现象的规律性只有在相同的条件下进行大量重复试验时才会呈现出同的条件下进行大量重复试验时才会呈现出来来.也就是说,要从随机现象中去寻求必也就是说,要从随机现象中去寻求必然的法则,应该研究大量随机现象然的法则,应该研究大量随机现象.研究大量的随机现象,常常采用极限研究大量的随机现象,常常采用极限形式,由此导致对极限定理进行研究形式,由此导致对极限定理进行研究.极极限定理的内容很广泛,其中最重要的有两限定理的内容很广泛,其中最重要的有两种种:与与大数定律大数定律中心极限定理中心极限定理下面我们先介绍大数定律下面我们先介绍大数定律 大量的随机现象中平均结果的稳定性大量的随机现象中平均结果的稳定性 大数定律的客观背景大数定律的客观背景大量抛掷硬币大量抛掷硬币正面出现频率正面出现频率字母使用频率字母使用频率生产过程中的生产过程中的废品率废品率几个常见的大数定律几个常见的大数定律定理定理1(切比雪夫大数定律)切比雪夫大数定律)设设 X1,X2,是相互独立的随是相互独立的随机变量序列,它们都有有限的方差,机变量序列,它们都有有限的方差,并且方差有共同的上界,即并且方差有共同的上界,即 Var(Xi)K,i=1,2,,切比雪夫切比雪夫则对任意的则对任意的0,切比雪夫大数定律表明,独立随机变切比雪夫大数定律表明,独立随机变量序列量序列Xn,如果方差有共同的上界,则如果方差有共同的上界,则与其数学期望与其数学期望 偏差很小的偏差很小的 概率接近于概率接近于1.随机的了,取值接近于其数学期望的概率接随机的了,取值接近于其数学期望的概率接近于近于1.即当即当n充分大时,充分大时,差不多不再是差不多不再是切比雪夫大数定律给出了切比雪夫大数定律给出了平均值稳定性的科学描述平均值稳定性的科学描述 证明切比雪夫大数定律主要的数学证明切比雪夫大数定律主要的数学工具是切比雪夫不等式工具是切比雪夫不等式.设随机变量设随机变量X有期望有期望E(X)和方差和方差 ,则对于任给则对于任给 0,作为切比雪夫大数定律的特殊情况,作为切比雪夫大数定律的特殊情况,有下面的定理有下面的定理.定理定理2(独立同分布下的大数定律独立同分布下的大数定律)设设X1,X2,是独立同分布的随机变量是独立同分布的随机变量序列,且序列,且E(Xi)=,Var(Xi)=,i=1,2,则对任给则对任给 0,下面给出的贝努里大数定律,下面给出的贝努里大数定律,是定理是定理2的一种特例的一种特例.贝努里贝努里 设设Sn是是n重贝努里试验中事件重贝努里试验中事件A发发生的次数,生的次数,p是事件是事件A发生的概率,发生的概率,引入引入i=1,2,n则则 是事件是事件A发生的频率发生的频率 于是有下面的定理:于是有下面的定理:设设Sn是是n重贝努里试验中事件重贝努里试验中事件A发生的发生的 次数,次数,p是事件是事件A发生的概率,则对任给的发生的概率,则对任给的 0,定理定理3(贝努里大数定律贝努里大数定律)或或贝努里贝努里 贝努里大数定律表明,当重复试验次数贝努里大数定律表明,当重复试验次数n充分大时,事件充分大时,事件A发生的频率发生的频率Sn/n与事件与事件A的概率的概率p有较大偏差的概率很小有较大偏差的概率很小.贝努里大数定律提供了通过试验来确贝努里大数定律提供了通过试验来确定事件概率的方法定事件概率的方法.任给任给0,贝努里大数定律贝努里大数定律请看演示请看演示下面给出的独立同分布下的大数定下面给出的独立同分布下的大数定律,不要求随机变量的方差存在律,不要求随机变量的方差存在.设随机变量序列设随机变量序列X1,X2,独立同独立同分布,具有有限的数学期分布,具有有限的数学期E(Xi)=,i=1,2,,则对任给则对任给 0,定理定理3(辛钦大数定律辛钦大数定律)辛钦大数定律辛钦大数定律辛钦辛钦请看演示请看演示 例如要估计某地区的平均亩产量,要例如要估计某地区的平均亩产量,要收割某些有代表性的地块,例如收割某些有代表性的地块,例如n 块块.计计算其平均亩产量,则当算其平均亩产量,则当n 较大时,可用它较大时,可用它作为整个地区平均亩产量的一个估计作为整个地区平均亩产量的一个估计.这一讲我们介绍了大数定律这一讲我们介绍了大数定律 大数定律以严格的数学形式表达了随大数定律以严格的数学形式表达了随机现象最根本的性质之一:机现象最根本的性质之一:它是随机现象统计规律的具体表现它是随机现象统计规律的具体表现.大数定律在理论和实际中都有广泛的应用大数定律在理论和实际中都有广泛的应用.平均结果的稳定性平均结果的稳定性休息片刻继续下一讲休息片刻继续下一讲 第五章第二节 中心极限定理 中心极限定理的客观背景中心极限定理的客观背景 在实际问题中,常常需要考虑许多随机在实际问题中,常常需要考虑许多随机因素所产生总影响因素所产生总影响.例如:炮弹射击的落点与目标的偏差,就受例如:炮弹射击的落点与目标的偏差,就受着许多随机因素的影响着许多随机因素的影响.空气阻力所产生的误差,空气阻力所产生的误差,对我们来说重要的是这些对我们来说重要的是这些随机因素的总影响随机因素的总影响.如瞄准时的误差,如瞄准时的误差,炮弹或炮身结构所引起的误差等等炮弹或炮身结构所引起的误差等等.观察表明,如果一个量是由大量相互独观察表明,如果一个量是由大量相互独立的随机因素的影响所造成,而每一个别因立的随机因素的影响所造成,而每一个别因素在总影响中所起的作用不大素在总影响中所起的作用不大.则这种量一则这种量一般都服从或近似服从正态分布般都服从或近似服从正态分布.自从高斯指出测量误差服从正自从高斯指出测量误差服从正态分布之后,人们发现,正态分布态分布之后,人们发现,正态分布在自然界中极为常见在自然界中极为常见.现在我们就来研究独立随机变量之和所现在我们就来研究独立随机变量之和所特有的规律性问题特有的规律性问题.当当n无限增大时,这个和的极限分布是无限增大时,这个和的极限分布是什么呢?什么呢?在什么条件下极限分布会是正态的呢?在什么条件下极限分布会是正态的呢?由于无穷个随机变量之和可能趋于由于无穷个随机变量之和可能趋于,故我们不研究故我们不研究n个随机变量之和本身而考虑它个随机变量之和本身而考虑它的标准化的随机变量的标准化的随机变量的分布函数的极限的分布函数的极限.的分布函数的极限的分布函数的极限.可以证明,满足一定的条件,上述极可以证明,满足一定的条件,上述极限分布是标准正态分布限分布是标准正态分布.考虑考虑中心极限定理中心极限定理这就是下面要介这就是下面要介绍的绍的 在概率论中,习惯于把和的分布收在概率论中,习惯于把和的分布收敛于正态分布这一类定理都叫做敛于正态分布这一类定理都叫做中心极中心极限定理限定理.我们只讨论几种简单情形我们只讨论几种简单情形.下面给出的独立同分布随机变量序列下面给出的独立同分布随机变量序列的中心极限定理,也称的中心极限定理,也称列维一林德伯格列维一林德伯格(LevyLindberg)定理定理.定理定理1(独立同分布下的中心极限定理独立同分布下的中心极限定理)它表明,当它表明,当n充分大时,充分大时,n个具有期望和方差个具有期望和方差的独立同分布的的独立同分布的r.v之和近似服从正态分布之和近似服从正态分布.设设X1,X2,是独立同分布的随机是独立同分布的随机变量序列,且变量序列,且E(Xi)=Var(Xi)=,i=1,2,,则则定理定理(棣莫佛拉普拉斯定理)棣莫佛拉普拉斯定理)设随机变量设随机变量 服从参数服从参数n,p(0p1)的二的二项分布,则对任意项分布,则对任意x,有有 定理表明,当定理表明,当n很大,很大,0p1是一个定值是一个定值时(或者说,时(或者说,np(1-p)也不太小时),也不太小时),二项二项变变量量 的的分布近似正态分布分布近似正态分布 N(np,np(1-p).请看演示请看演示中心极限定理的直观演示中心极限定理的直观演示下面我们举例说明中心极限定理的应用下面我们举例说明中心极限定理的应用从演示不难看到中心极限定理的客观背景从演示不难看到中心极限定理的客观背景例例:20个个0-1分布的和的分布分布的和的分布X1 f(x)X1+X2g(x)X1+X2+X3 h(x)几个几个(0,1)上均匀分布的和的分布上均匀分布的和的分布0123xfgh 设一批产品的强度服从期望为设一批产品的强度服从期望为14,14,方差为方差为4 4的分布的分布.每箱中装有这种产品每箱中装有这种产品100100件件.求求:(1).:(1).每箱产品的平均强度超过每箱产品的平均强度超过14.514.5的的概率是多少概率是多少.(2).(2).每箱产品的平均强度超过期望每箱产品的平均强度超过期望1414的概率是多少的概率是多少.n=100,n=100,设设X Xi i是第是第i i件产品的强度件产品的强度.E(E(X Xi i)=14,Var()=14,Var(X Xi i)=4)=4 i=1,2,i=1,2,100.,100.每箱产品的平均强度为每箱产品的平均强度为解解:例例1 1根据定理根据定理5.2.15.2.1近似近似 N(0,1)N(0,1)于是于是 计算机在进行数字计算时遵从四舍五入计算机在进行数字计算时遵从四舍五入原则原则.为使我们此题简单考虑为使我们此题简单考虑,我们假定对小数我们假定对小数点后面的第一位进行四舍五入运算点后面的第一位进行四舍五入运算.则误差则误差X X这个随机变量可以认为服从这个随机变量可以认为服从 -0.5,0.5-0.5,0.5上的均匀分布上的均匀分布.现若在一项计算中一共进行了现若在一项计算中一共进行了100100次数字次数字计算计算.例例2 20.0866求求:平均误差落在区间平均误差落在区间上的概率上的概率解解:n=100,n=100,设设X Xi i是第是第i i次运算的误差次运算的误差.误差服从误差服从-0.5,0.5-0.5,0.5上的均匀分布上的均匀分布 E(E(X Xi i)=()=(-0.5+0.5-0.5+0.5)/2=0)/2=0 VarVar(X Xi i)=0.5-(-0.5)=0.5-(-0.5)2 2/12=1/12/12=1/12 i=1,2,i=1,2,100.,100.平均误差为平均误差为根据中心极限定理根据中心极限定理近似近似 N(0,1)N(0,1)于是于是 某单位有某单位有200200部电话分机部电话分机,每部电话约有每部电话约有5%5%的时间要使用外线通话的时间要使用外线通话.设每部电话是否使设每部电话是否使用外线通话是相互独立的用外线通话是相互独立的.求求:该单位总机至少需要安装多少条外线该单位总机至少需要安装多少条外线才能以才能以90%90%以上的概率保证每部电话需要使用以上的概率保证每部电话需要使用外线时可以打通外线时可以打通?解解:例例3 3 X Xi i b(1,p).Xb(1,p).X1 1,X,X2 2,X,X200200相互独立相互独立.设该单位总机安装设该单位总机安装k k条外线条外线,则则:PP每部电话需要使用外线时可以打通每部电话需要使用外线时可以打通=PP使用外线的电话数目使用外线的电话数目k k=PX=PX1 1+X+X2 2+X X200 200 kk 求最小的求最小的k,k,使使PP每部电话需要使用外线时可以打通每部电话需要使用外线时可以打通 90%90%求最小的求最小的k,k,使使PXPX1 1+X+X2 2+X X200 200 kk 90%90%求最小的求最小的k,k,使使 该单位总机至少需要安装该单位总机至少需要安装1414条外线条外线.某市保险公司开办一年人身保险业务某市保险公司开办一年人身保险业务.被被保险人每年需交付保险费保险人每年需交付保险费160160元元.若一年内发若一年内发生重大人身事故生重大人身事故,其本人或家属可获其本人或家属可获2 2万元赔金万元赔金.己知该市人员一年内发生重大人身事故的概率己知该市人员一年内发生重大人身事故的概率为为0.005.0.005.现有现有50005000人参加此项保险人参加此项保险.求求:保险公司一年内从此项业务所得到的保险公司一年内从此项业务所得到的总收益在总收益在2020万元到万元到4040万元之间的概率万元之间的概率.解解:例例4 4 X Xi i b(1,p).P=0.005 b(1,p).P=0.005 X X1 1,X,X2 2,X,X200200相互独立相互独立.则则:P20P20万元万元总收益总收益 40 40万元万元=P20P20万元万元0.0160.016万元保险费万元保险费 参保人数参保人数-2-2万万 元赔金元赔金 一年内发生重大人身事故的人数一年内发生重大人身事故的人数4040万元万元=P20P200.0160.016 5000-5000-2 2(X(X1 1+X+X2 2+X X50005000)4040 npnp=25 np(1-p)=25=25 np(1-p)=25 0.9950.995 总收益在总收益在2020万元到万元到4040万元之间的概率为万元之间的概率为 0.6826.0.6826.不知大家是否还记得街头赌博的演示不知大家是否还记得街头赌博的演示?现在我们用现在我们用中心极限定理中心极限定理来揭穿这个来揭穿这个赌博中的奥秘赌博中的奥秘.请看演示:请看演示:高尔顿钉板试验的理论解释高尔顿钉板试验的理论解释街头赌博街头赌博再看演示请点击再看演示请点击如图如图,钉板有钉板有n=1616层,可以层,可以求出标准差求出标准差 n次碰钉后小球的位置次碰钉后小球的位置Yn近似服从正态分布近似服从正态分布N(0,n).E(Yn)=0,Var(Yn)=n.左右左右8颗钉子以内的概率近似为颗钉子以内的概率近似为95.6%,根据正态分布的查表计算根据正态分布的查表计算知道知道,落在落在2 以内即中线以内即中线说说,落在这以外的概率只有落在这以外的概率只有4%左右左右.即是即是如图钉板有如图钉板有n=1616层,可以层,可以求出标准差求出标准差 根据正态分布的查表计算根据正态分布的查表计算知道知道,落在落在2 以内即中线以内即中线左右左右8颗钉子以内的概率颗钉子以内的概率近似为近似为95.6%,即是说即是说,落落在这以外的概率只有在这以外的概率只有4%4%左左右右.现在你知道为什么摆摊的人敢于现在你知道为什么摆摊的人敢于在上面放那么值钱的东西了吧在上面放那么值钱的东西了吧!这一讲我们介绍了中心极限定理这一讲我们介绍了中心极限定理 在后面的课程中,我们还将经常用到中心在后面的课程中,我们还将经常用到中心极限定理极限定理.中心极限定理是概率论中最著名的结果中心极限定理是概率论中最著名的结果之一,它不仅提供了计算独立随机变量之和之一,它不仅提供了计算独立随机变量之和的近似概率的简单方法,而且有助于解释的近似概率的简单方法,而且有助于解释为为什么很多自然群体的经验频率呈现出钟形曲什么很多自然群体的经验频率呈现出钟形曲线线这一值得注意的事实这一值得注意的事实.