大数定律与中心极限定理讲稿.ppt
第一页,讲稿共三十五页哦背景背景1.1.为何能以某事件发生的频率作为该事件的概率的估计?为何能以某事件发生的频率作为该事件的概率的估计?2.2.为何能以样本均值作为总体期望的估计?为何能以样本均值作为总体期望的估计?3.3.为何正态分布在概率论中占有极其重要的地位?为何正态分布在概率论中占有极其重要的地位?4.4.大样本统计推断的理论基础是什么?大样本统计推断的理论基础是什么?第二页,讲稿共三十五页哦1.1.切比雪夫不等式切比雪夫不等式 设随机变量设随机变量X的数学期望的数学期望E(X)=,方差方差D(X)=2,则对则对任意的正数任意的正数,不等式,不等式2()|D XPX 2()|1D XPX 或或成立成立.第三页,讲稿共三十五页哦利用利用切比雪夫不等式可以估计一些随机事件的概率切比雪夫不等式可以估计一些随机事件的概率。例例1 1 设电站供电网有设电站供电网有1000010000盏灯,夜晚每一盏灯开灯的概盏灯,夜晚每一盏灯开灯的概率是率是0.70.7,假定开、关时间彼此独立,估计夜晚同时,假定开、关时间彼此独立,估计夜晚同时开着的灯数在开着的灯数在68006800与与72007200之间的概率之间的概率解解 设设X X表示在夜晚同时开着的灯的数目,它服从参数为表示在夜晚同时开着的灯的数目,它服从参数为n=10000,p=0.7n=10000,p=0.7的二项分布,则有的二项分布,则有而用而用切比雪夫不等式估计切比雪夫不等式估计E(X)=np=7000,D(x)=np(1-p)=2100E(X)=np=7000,D(x)=np(1-p)=2100P(6800X7200)=P(|X-7000|0.95P(6800X7200)=P(|X-7000|0.95使用切比雪夫不等式只能得到事件的大致概率,能否得到其使用切比雪夫不等式只能得到事件的大致概率,能否得到其较精确的概率较精确的概率呢?这就要用到中心极限定理呢?这就要用到中心极限定理719910000100006801(68007200)0.7 0.3kkkkPXC第四页,讲稿共三十五页哦2.大数定律大数定律 定义定义1 1 设设Y1,Y2,Yn,,是一随机变量序列,是一随机变量序列,a为一常数为一常数.若对任意给定正数若对任意给定正数 0,0,有有则称随机变量序列则称随机变量序列Y1,Y2,Yn,依概率收敛于依概率收敛于alim|1nnP Ya 定义定义2 2 设设X1,X2,Xn,是一随机变量序列是一随机变量序列 .若存在常数列若存在常数列 an 使对任意给定的正数使对任意给定的正数,恒有,恒有 ,则称随机变量序列则称随机变量序列Yn服从大数定律服从大数定律11nnkkYXn lim|1nnnP Ya 第五页,讲稿共三十五页哦注意:01.nnnXanXaXa依概率收敛于,意味着对任意给定的,当 充分大时,事件的概率很大,接近于;并不排除事件的发生,而只是说它发生的可能性很小第六页,讲稿共三十五页哦切比雪夫切比雪夫大数定理大数定理 若若X1,X2,Xn,为独立同分布随机变量为独立同分布随机变量序列序列,E(Xk)=D(Xk)=2(k=1,2,)=1,2,),则对任意的,则对任意的正数正数 0,0,有有11lim|1nknkPXn 或或11lim|0nknkPXn 第七页,讲稿共三十五页哦注意111|1.niiXnn、定理中是指一个随机事件,当时,这个事件的概率趋于112 ,n1nniiXXXn、通俗地说,对于独立同分布且具有均值的随机变量,当 很大时,它们的算术平均很可能接近于。第八页,讲稿共三十五页哦证明证明:(利用切比雪夫不等式)(利用切比雪夫不等式)根据已知条件根据已知条件由切比雪夫不等式,有由切比雪夫不等式,有又又1111()()nnkkkkEXEXnn 11()nkkE Xn 21111()()nnkkkkDXDXnn 2211()nkkD Xnn 22111|)1nkkPXnn 所以所以11lim|1nknkPXn 第九页,讲稿共三十五页哦伯努利大数定理伯努利大数定理设设nA为是为是n次独立重复试验中事件次独立重复试验中事件A发生的次数发生的次数,p是事件是事件A在在每 次 试 验 中 发 生 的 概 率每 次 试 验 中 发 生 的 概 率,则 对 任 意 的则 对 任 意 的正数正数 0,0,有有lim|1AnnPpn 或或lim|0AnnPpn 第十页,讲稿共三十五页哦证:设证:设由切比雪夫大数定理由切比雪夫大数定理,有有所以所以 即即0,1,.kAkXAk 在在第第次次试试验验中中发发生生,在在第第 次次试试验验中中未未发发生生那么那么 相互独立,且服从参数为相互独立,且服从参数为p的的0101分布分布,E(Xk)=p,D(Xk)=p(1-(1-p).).12,nXXX12AnnXXX 11lim|1nknkPXpn lim|1AnnPpn 第十一页,讲稿共三十五页哦辛钦大数定理辛钦大数定理 若若X1,X2,Xn,为独立同分布随机变为独立同分布随机变量序列量序列,E(Xk)=(k=1,2,)=1,2,),则对任意的正数,则对任意的正数 0,0,有有11lim|1nknkPXn 或或11lim|0nknkPXn 第十二页,讲稿共三十五页哦设设 Xn 为独立随机变量序列,记其和为为独立随机变量序列,记其和为问这个和的问这个和的极限分布极限分布是什么?是什么?1niinYX第十三页,讲稿共三十五页哦1.1.独立同分布中心极限定理独立同分布中心极限定理 若若X1,X2,Xn,为独立同分布随机变量序为独立同分布随机变量序列列,E(Xk)=D(Xk)=2(k=1,2,)=1,2,),则随机变量标准,则随机变量标准化量化量的分布函数的分布函数Fn(x)对于任意对于任意x满足满足1nkknXnYn 221lim()()2txnnF xedtx 第十四页,讲稿共三十五页哦1(0,1)nkkXnNn 近近似似21(,)nkkXN nn 近近似似1 1(0,1)/nkkXnNn 近近似似211(,)nkkXXNnn 近近似似2121lim()lim2ntkxknnnXnFxPxedtn 第十五页,讲稿共三十五页哦例例2 每袋味精的净重为随机变量,平均重量为每袋味精的净重为随机变量,平均重量为 100克,标克,标准差为准差为10克克.一箱内装一箱内装200袋味精,求一箱味精的净重大于袋味精,求一箱味精的净重大于20500克的概率克的概率?解:解:设箱中第设箱中第 i 袋味精的净重为袋味精的净重为 Xi,则则Xi 独立同分布,且独立同分布,且 E(Xi)=100,Var(Xi)=100,由中心极限定理得,所求概率为:由中心极限定理得,所求概率为:故一箱味精的净重大于故一箱味精的净重大于20500克的概率为克的概率为0.0002.200120500200 100205001200 100iiPX 1(3.54)第十六页,讲稿共三十五页哦2.2.李雅普诺夫中心极限定理李雅普诺夫中心极限定理 若若X1,X2,Xn,为独立随机变量序列为独立随机变量序列,,若存在正数若存在正数,使当,使当 时,时,则随机变量标准化量则随机变量标准化量Zn的分布函数的分布函数Fn(x)对于任意对于任意x满足满足221lim()()2txnnnF xP Zxedtx 2221(),()0,nkkkknkkE XD XBX 2211|0nkkknEXB n 1121nnkkkknnkkXZ第十七页,讲稿共三十五页哦1121nnkikknnkkXZ 2111 (,)nnnkikkkkXN 近近似似说明:中心极限定理表明无论各随机变量说明:中心极限定理表明无论各随机变量Xk(k=1,2,=1,2,)服从什么服从什么分布,只要满足定理的条件,那么他们的和当分布,只要满足定理的条件,那么他们的和当n很大时,就很大时,就近似服从正态分布,这就是为什么正态随机变量在概率论中近似服从正态分布,这就是为什么正态随机变量在概率论中占有 非常重要地位的一个基本原因占有 非常重要地位的一个基本原因第十八页,讲稿共三十五页哦3.3.棣莫弗棣莫弗拉普拉斯中心极限定理拉普拉斯中心极限定理定理表明:二项分布的极限分布是正态分布,定理表明:二项分布的极限分布是正态分布,即即 设随机变量设随机变量 服从参数为服从参数为n,p的二项分布,的二项分布,则则对任意对任意x,有,有(1,2,)nn 22lim(1)1()2nntxnpPxnppedtx )1(,(pnpnpNn 近近似似地地 第十九页,讲稿共三十五页哦小结小结中中心心极极限限定定理理 中心极限定理中心极限定理独立同分布独立同分布221(),()(,)kknkkE XD XXN nn近似地中心极限定理中心极限定理拉普拉斯拉普拉斯棣莫弗棣莫弗 (,)(,(1)nnb n pN np npp近似地中心极限定理中心极限定理李雅普诺夫李雅普诺夫2211(),()(,)kkkknnkknkkE XD xXNB近似地注注是是相相互互独独立立的的随随机机变变量量,21XX第二十页,讲稿共三十五页哦例例3解:解:所以所以 .105.)10,0(),2,1(201的近似值的近似值,求,求记记上服从均匀分布上服从均匀分布机变量,且都在区间机变量,且都在区间设它们是相互独立的随设它们是相互独立的随个噪声电压个噪声电压一加法器同时收到一加法器同时收到 VPVVnkVnkkk)2012100,520(V4).20,2,1(12100)(,5)(201 NVkVDVEkkkk近似地近似地知,知,由定理由定理易知易知 20121005201052012100520105VpVP第二十一页,讲稿共三十五页哦 387.02012100520Vp 387.020121005201Vp348.0)387.0(1 348.0105VP 即即有有第二十二页,讲稿共三十五页哦例例4(供电问题供电问题)某车间有某车间有200台车床台车床,在生产期间由于需要检修、在生产期间由于需要检修、调换刀具、变换位置及调换工件等常需停车调换刀具、变换位置及调换工件等常需停车.设开工率为设开工率为0.7,并设每台车床的工作是独立的,且在开工时需电力并设每台车床的工作是独立的,且在开工时需电力15千瓦千瓦.问应供应多少瓦电力就能以问应供应多少瓦电力就能以99.9%的概率保证该的概率保证该车间不会因供电不足而影响生产车间不会因供电不足而影响生产?解解 供电所至少要供给这个车间供电所至少要供给这个车间x千瓦的千瓦的电力电力,才能以才能以99.9%99.9%的概率保证这个车间不会因供电不足而影响生的概率保证这个车间不会因供电不足而影响生产产.以以X记记200200台车床在同一时间段内开动的台数,则由已台车床在同一时间段内开动的台数,则由已知条件知条件X服从参数为服从参数为200200,0.70.7的二项分布,于是由棣莫的二项分布,于是由棣莫弗弗拉普拉斯中心极限定理有拉普拉斯中心极限定理有第二十三页,讲稿共三十五页哦2000.7/152000.7(15)()2000.70.32000.70.3XxPXxP /15200 0.7()200 0.70.3x 0.999/152000.73.012000.70.3x 2392.6x 即供电所至少要供给这个车间即供电所至少要供给这个车间2392.62392.6千瓦的电力千瓦的电力.第二十四页,讲稿共三十五页哦 例例5 对于一个学生而言,来参加家长会的家对于一个学生而言,来参加家长会的家长人数是一个随机变量,设一个学生无家长人数是一个随机变量,设一个学生无家长、长、1名家长、名家长、2名家长来参加会议的概率名家长来参加会议的概率分别为分别为0.05、0.8、0.15.若学校共有若学校共有400名名学生,设各学生参加会议的家长数相互独学生,设各学生参加会议的家长数相互独立,且服从同一分布立,且服从同一分布.(1)求参加会议的家长人数求参加会议的家长人数X超过超过450的概率;的概率;(2)求有求有1名家长来参加会议的学生人数不多名家长来参加会议的学生人数不多于于340的概率的概率.第二十五页,讲稿共三十五页哦解解 (1)(1)以以Xk记第记第k个学生来参加会议的家长人数,则个学生来参加会议的家长人数,则由已知条件由已知条件Xk的分布率为的分布率为Xk012P0.050.80.15可以计算可以计算E(Xk)=1.1,D(Xk)=0.19,k=1,2,400.由独立同由独立同分布中心极限定理,得分布中心极限定理,得4001(450)(450)kkP XPX 4001400 1.1450400 1.1()400 0.19400 0.19kkXP 450400 1.11()400 0.19P 1(1.147)0.1251 第二十六页,讲稿共三十五页哦(2)(2)以以Y记由一名家长参加会议的学生人数,则记由一名家长参加会议的学生人数,则Y Y服从参数为服从参数为400400,0.80.8的二项分布的二项分布.于是由于是由棣莫弗棣莫弗拉普拉斯中心极限定理,得拉普拉斯中心极限定理,得从而有从而有1 1名家长来参加会议的学生人数不多于名家长来参加会议的学生人数不多于340340的概率约为的概率约为0.9938.0.9938.340(340)()(1)(1)YnpnpP YPnppnpp 340()(1)npnpp 340400 0.8()400 0.8 0.2 (2.5)0.9938 第二十七页,讲稿共三十五页哦例例6在一个罐子中在一个罐子中,装有装有10个编号为个编号为0-9的同样的球,从罐中的同样的球,从罐中有放回地抽取若干次,每次抽一个,并记下号码有放回地抽取若干次,每次抽一个,并记下号码.(1)至少应取球多少次才能使至少应取球多少次才能使“0”出现的频率在出现的频率在0.09-0.11之间的概率至少是之间的概率至少是0.95?(2)用中心极限定理计算在用中心极限定理计算在100次抽取中次抽取中,数码数码“0”出现次数出现次数在在7和和13之间的概率之间的概率.否则次取到号码第001kXk 设设,k=1,2,第二十八页,讲稿共三十五页哦解(解(1)设应取球设应取球n次,次,0出现频率为出现频率为由中心极限定理由中心极限定理nkkXn11,1.0)1(1nkkXnEnXnDnkk09.0)1(1nnXnkk3.01.01nXnnkk3.01.011),(近似地近似地10N11.0109.01nkkXnP01.0|1.01|1nkkXnP第二十九页,讲稿共三十五页哦30|3.01.01|1nnXnPnkk1)30(2n 95.01)30(2n 欲使欲使975.0)30(n 即即96.130n查表得查表得从中解得从中解得3458n即至少应取球即至少应取球3458次才能使次才能使“0”出现的频率在出现的频率在0.09-0.11之间的概率至少是之间的概率至少是0.95.第三十页,讲稿共三十五页哦(2)在)在100次抽取中次抽取中,数码数码“0”出现次数为出现次数为1001kkX由中心极限定理由中心极限定理,),(近近似似地地10N)()(100110011001 kkkkkkXDXEX其中其中E(Xk)=0.1,D(Xk)=0.09)1,0(N3101001近近似似地地 kkX即即第三十一页,讲稿共三十五页哦1001)137(kkXP)13101(1001kkXP)1()1(1)1(2=0.6826即在即在100次抽取中,数码次抽取中,数码“0”出现次数在出现次数在7和和13之间之间的概率为的概率为0.6826.第三十二页,讲稿共三十五页哦1.甲乙两电影院在竞争甲乙两电影院在竞争10001000名观众,假设每位观众在选择名观众,假设每位观众在选择时随机的,且彼此相互独立,问甲至少应设多少个座时随机的,且彼此相互独立,问甲至少应设多少个座位,才能使观众因无座位而离去的概率小于位,才能使观众因无座位而离去的概率小于1 1?2.根据以往经验,某种电器元件的寿命服从均值为根据以往经验,某种电器元件的寿命服从均值为100小时小时的指数分布的指数分布.现随机地取现随机地取16只,设它们的寿命是相互独立只,设它们的寿命是相互独立的的.求这求这16只元件的寿命的总和大于只元件的寿命的总和大于1920小时的概率小时的概率.第三十三页,讲稿共三十五页哦3.电视台需作节目电视台需作节目A 收视率的调查收视率的调查.每天在播电视的同时每天在播电视的同时,随机地向当地居民打电话询问是否在看电视随机地向当地居民打电话询问是否在看电视.若在看电视若在看电视,再问是否在看节目再问是否在看节目A.设回答设回答看电视的居民户数为看电视的居民户数为n.若要若要保证以保证以95%95%的概率使调查的概率使调查误差在误差在10%10%之内之内,n应取多大?每晚节目应取多大?每晚节目A A 播出一小时播出一小时,调查调查需同时进行需同时进行,设每小时每人能调查设每小时每人能调查2020户户,每户居民每晚每户居民每晚看电视的概率为看电视的概率为70%,70%,电视台需安排多少人作调查电视台需安排多少人作调查,又若又若使调查误差在使调查误差在1%1%之内之内,n取多大?取多大?第三十四页,讲稿共三十五页哦感谢大家观看感谢大家观看第三十五页,讲稿共三十五页哦