统计基础二:大数定律与中心极限定理.pptx
《统计基础二:大数定律与中心极限定理.pptx》由会员分享,可在线阅读,更多相关《统计基础二:大数定律与中心极限定理.pptx(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、中心极限定理中心极限定理-1大数定律与中心极限定理大数定律与中心极限定理 中心极限定理中心极限定理-2独立同分布大数定律:设随机变量X1,X2,X3,Xn,相互独立,且具有相同的方差和期望:E(Xk)=,D(Xk)=2(k1,2,3,),作前n个随机变量的算术平均则对任意小的正数,有 该定律表明,当该定律表明,当n n足够大时,独立同分布的一系列随机变量的算术平足够大时,独立同分布的一系列随机变量的算术平均数接近(以概率收敛于)数学期望,即平均数具有稳定性。从而提供了均数接近(以概率收敛于)数学期望,即平均数具有稳定性。从而提供了用样本平均数估计总体平均数的理论依据。用样本平均数估计总体平均数
2、的理论依据。大数定律大数定律是阐述大量随机变量的平均结果具有稳定性的一系列定律的总称。是阐述大量随机变量的平均结果具有稳定性的一系列定律的总称。中心极限定理中心极限定理-3贝努利大数定律 设A在n重贝努利试验中发生 次,p=P(A),则对任何 0,有说明:贝努利大数定律是说,当n很大时,故可用事件发生的频率近似代替事件发生的概率。例1 设总体X服从参数为2的指数分布,为 来自总体X的简单随机样本,则当n时,依概率收敛于 。中心极限定理中心极限定理-4定义定义q中心极限定理中心极限定理是阐述大量随机变量之和的极限分布是正态分布的一系是阐述大量随机变量之和的极限分布是正态分布的一系列定理的总称。最
3、常用的有:列定理的总称。最常用的有:q独立同分布中心极限定理独立同分布中心极限定理:“随机变量随机变量x1,x2,独立,且服从同一分布,独立,且服从同一分布,若存在有限的数学期望若存在有限的数学期望E(xi)=u和方差和方差D(xi)=2,当当n时,随机变量的总和时,随机变量的总和xi趋于均值为趋于均值为nu,方差为,方差为n 2的正态分布。的正态分布。(即算术平均数(即算术平均数1/n xi=xbar趋于均值为趋于均值为u,方差为,方差为2/n的正态分布)的正态分布)”不论总体服从何种分布,只要它的数学期望和方差存在,不论总体服从何种分布,只要它的数学期望和方差存在,从中抽取容量为从中抽取容
4、量为n的样本,则这个样本的总和或平均数是随机变量,的样本,则这个样本的总和或平均数是随机变量,当当n充分大时,充分大时,xi或或 xbar趋于正态分布。趋于正态分布。中心极限定理中心极限定理-5定义定义q德莫佛德莫佛-拉普拉斯中心极限定理拉普拉斯中心极限定理:“如果用如果用X表示表示n次独立试验中事件次独立试验中事件A发生发生(“成功成功”)的次数,的次数,P是事件是事件A在每次在每次试验中发生的概率试验中发生的概率,则则X服从二项分布服从二项分布,B(n,p),当当n时,时,X趋于均值为趋于均值为np,方差为,方差为npq的正态分布。的正态分布。”正态分布和泊松分布都是二项分布的极限分布,正
5、态分布和泊松分布都是二项分布的极限分布,当当n足够大时,足够大时,可用正态分布近似计算可用正态分布近似计算;当当n足够大且足够大且p小时小时,可用泊松分布近似计算。可用泊松分布近似计算。q中心极限定理是一种十分重要的现象中心极限定理是一种十分重要的现象,它是统计学中应用的许多方法的它是统计学中应用的许多方法的理论基础的组成部分理论基础的组成部分(如如:计算样本均值的置信区间计算样本均值的置信区间)中心极限定理中心极限定理-6利用同样的数据画出两种不同的控制图利用同样的数据画出两种不同的控制图,并仔细比较它们的差异并仔细比较它们的差异:打开文件打开文件CENLIMIT.MTW.分别用下面的两个路
6、径画出个体图和子群大小为分别用下面的两个路径画出个体图和子群大小为5的均值图的均值图 个体图路径个体图路径 均值图路径均值图路径应用应用应用应用中心极限定理中心极限定理-7图形输出图形输出个体数据个体数据个体数据个体数据样本平均样本平均 仔细比较两个图上的控制上下线仔细比较两个图上的控制上下线(UCL和和LCL),有什么不同有什么不同?应用应用应用应用中心极限定理中心极限定理-8个体控制图和个体控制图和 X barX bar控制图的差异控制图的差异15100102030405060应用应用应用应用中心极限定理中心极限定理-9E平均值分布的标准偏差叫做平均值分布的标准偏差叫做 均值标准误差均值标
7、准误差均值标准误差均值标准误差 ,因而其定义为因而其定义为因而其定义为因而其定义为:E这个公式表明平均值比个体数据更稳定,稳定因子是样本数的平这个公式表明平均值比个体数据更稳定,稳定因子是样本数的平方根。方根。s sx=均值标准误差均值标准误差个体值的标准差个体值的标准差n=平均值的样本数平均值的样本数x均值的标准误差(Standard Error of the Mean)其中其中中心极限定理中心极限定理-10 我们经常依靠从测量系统中得到的一个数值来估计我们经常依靠从测量系统中得到的一个数值来估计输入输入或或输输出出变量的值变量的值。减小测量系统误差的简易方法就是把两个或更多的。减小测量系统
8、误差的简易方法就是把两个或更多的读数平均。读数平均。我们的测量系统的精密度自动增加,增加因子是平均值样本我们的测量系统的精密度自动增加,增加因子是平均值样本数的平方根数的平方根,如果我们要想使测量系统的误差减小一半,我们就需如果我们要想使测量系统的误差减小一半,我们就需要把要把4 4次的测量值平均才可以。次的测量值平均才可以。实际应用实际应用测量系统的改善测量系统的改善中心极限定理中心极限定理-11l当总体数据具备正态分布时当总体数据具备正态分布时中心极限定理理解例题模拟中心极限定理理解例题模拟-1l 假设你面前有一个大桶假设你面前有一个大桶,桶里面装有相当多数量的白色纸条桶里面装有相当多数量
9、的白色纸条,每张纸条上都写每张纸条上都写 有数字,且假定这些数字都来自一个具有特定平均值和标准偏差的正态分布有数字,且假定这些数字都来自一个具有特定平均值和标准偏差的正态分布.1)1)从中随机抽出从中随机抽出9 9张白色纸条张白色纸条,并把其上面的并把其上面的9 9个数字求平均个数字求平均,2)2)然后把这个平均值写在一张绿色纸条上然后把这个平均值写在一张绿色纸条上,3)3)把这把这9 9张白色纸条放回原来的桶里张白色纸条放回原来的桶里,4)4)把这张绿色纸条放入另外一个桶里把这张绿色纸条放入另外一个桶里,如此重复上面的步骤,直到盛有绿色纸条的桶放满为止。如此重复上面的步骤,直到盛有绿色纸条的
10、桶放满为止。l白色纸条代表总体的数据;白色纸条代表总体的数据;l绿色纸条代表平均值的样本;绿色纸条代表平均值的样本;l我们用我们用MINITABMINITAB来模拟做这个练习。来模拟做这个练习。中心极限定理中心极限定理-12:让我们用让我们用MINITABMINITAB产生一些模拟的数据来验证我们的理论。产生一些模拟的数据来验证我们的理论。:首先用首先用MINITABMINITAB产生产生9 9列各列各250250个数据,假设这些数据来自一个个数据,假设这些数据来自一个 平均值平均值=70=70、标准偏差标准偏差=9=9的正态分布的正态分布:则列则列C1-C9 C1-C9 代表白色纸条代表白色
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 基础 大数 定律 中心 极限 定理
限制150内