概率与数理统计8[1].4 总体分布的假设检验.ppt
《概率与数理统计8[1].4 总体分布的假设检验.ppt》由会员分享,可在线阅读,更多相关《概率与数理统计8[1].4 总体分布的假设检验.ppt(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四节第四节 总体分布的假设总体分布的假设检验检验-拟合优度检验拟合优度检验 在前面的课程中,我们已经了解了假设检验的基本思想,并讨论了当总体分布为正态时,关于其中未知参数的假设检验问题.然而可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体分布提出一个假设.例如,从例如,从15001500到到19311931年的年的432432年间,每年爆发年间,每年爆发战争的次数可以看作一个随机变量,椐统计,战争的次数可以看作一个随机变量,椐统计,这这432432年间共爆发了年间共爆发了299299次战争,具体数据如下次战争,具体数据如下:战争次数战争次数X01234 223142481
2、54 发生发生 X次战争的年数次战争的年数 在概率论中,大家对泊松分布产生的一般条件已有所了解,容易想到,每年爆发战争的次数,可以用一个泊松随机变量来近似描述.也就是说,我们可以假设每年爆发战争次数分布X近似泊松分布.上面的数据能否证实上面的数据能否证实X 具有具有泊松分布的假设是正确的?泊松分布的假设是正确的?现在的问题是:现在的问题是:又如,某钟表厂对生产的钟进行精确性检查,抽取100个钟作试验,拨准后隔24小时以后进行检查,将每个钟的误差(快或慢)按秒记录下来.问该厂生产的钟的误差是否服从正态问该厂生产的钟的误差是否服从正态分布?分布?再如,某工厂制造一批骰子,再如,某工厂制造一批骰子,
3、声称它是均匀的声称它是均匀的.为检验骰子是否均匀,要把骰子实地投掷若为检验骰子是否均匀,要把骰子实地投掷若干次,统计各点出现的频率与干次,统计各点出现的频率与1/6的差距的差距.也就是说,在投掷中,出也就是说,在投掷中,出现现1点,点,2点,点,6点的概点的概率都应是率都应是1/6.得到的数据能否说明得到的数据能否说明“骰子均匀骰子均匀”的假设是可信的?的假设是可信的?问题是:问题是:K.皮尔逊皮尔逊这是一项很重要的工作,不少人把它视为近代统计学的开端.2-检验法.解决这类问题的工具是英国统计学家K.皮尔逊在1900年发表的一篇文章中引进的所谓2检验法检验法是在总体是在总体X 的分布未知时,根
4、据来的分布未知时,根据来自总体的样本,检验关于总体分布的假设的自总体的样本,检验关于总体分布的假设的一种检验方法一种检验方法.H0:总体X的分布函数为F(x)然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设.这种检验通常称作拟合优度检验,它是一种非参数检验.使用2-检验对总体分布进行检验时,我们先提出原假设:似然估计法估计参数,然后作检验似然估计法估计参数,然后作检验.类型已知,但其参数未知,这时需要先用极大类型已知,但其参数未知,这时需要先用极大分布拟合的分布拟合的2-检验的基本原理和步骤如下的基本原理和步骤如下:在用在用2-检验法法检验假设检验假设H0时,若在时,
5、若在H0下分布下分布3.根据所假设的理论分布,可以算出总体X的值落入每个Ai的概率pi,于是npi就是落入Ai的样本值的理论频数.1.将总体X的取值范围分成k个互不重迭的小区间,记作A1,A2,Ak.2.把落入第i个小区间Ai的样本值的个数记作ni,称为实测频数.所有实测频数之和n1+n2+nk等于样本容量n.标志着经验分布与理论分布之间的差异的大小标志着经验分布与理论分布之间的差异的大小.皮尔逊引进如下统计量表示经验分布皮尔逊引进如下统计量表示经验分布与理论分布之间的差异与理论分布之间的差异:统计量统计量2的分布是什么的分布是什么?在理论分布在理论分布已知的条件下已知的条件下,npi是常量是
6、常量实测频数实测频数理论频数理论频数皮尔逊证明了如下定理皮尔逊证明了如下定理:若原假设中的理论分布若原假设中的理论分布F(x)已经完全给定,已经完全给定,那么当那么当n 时,统计量时,统计量 如果理论分布如果理论分布F(x)中有中有r个未知参数需用相个未知参数需用相应的估计量来代替,那么当应的估计量来代替,那么当n 时,统计量时,统计量2 的分布渐近服从的分布渐近服从(k-r-1)个自由度的个自由度的2分布分布.的分布渐近的分布渐近k-1个自由度的个自由度的2 分布分布.为了便于理解,我们对定理作一为了便于理解,我们对定理作一点直观的说明点直观的说明.在理论分布在理论分布F(x)完全给定的情况
7、下,每个完全给定的情况下,每个pi 都是确定的常数都是确定的常数.由棣莫佛拉普拉斯中心极由棣莫佛拉普拉斯中心极限定理,当限定理,当n充分充分大时,实测频数大时,实测频数 fi 渐近正态,渐近正态,因此因此是是k个近似个近似正态正态的变量的平方和的变量的平方和.这些变量之间存在着一个制约关系:这些变量之间存在着一个制约关系:故统计量故统计量2渐近服从渐近服从(k-1)个自由度的个自由度的2分布。分布。在在F(x)尚未完全给定的情况下,每个未知尚未完全给定的情况下,每个未知参数用相应的估计量代替,就相当于增加一个参数用相应的估计量代替,就相当于增加一个制约条件,制约条件,因此,自由度也随之减少一个
8、因此,自由度也随之减少一个.若若有有r个未知参数需用相应的估计量来代个未知参数需用相应的估计量来代替,替,自由度就减少自由度就减少r个个.故统计量故统计量2渐近服从渐近服从(k-r-1)个自由度的个自由度的2分布。分布。如果根据所给的样本值如果根据所给的样本值 X1,X2,Xn算得统计算得统计量量2的实测值落入拒绝域,则拒绝原假设,否则的实测值落入拒绝域,则拒绝原假设,否则就认为差异不显著而接受原假设就认为差异不显著而接受原假设.得拒绝域得拒绝域:(不需估计参数不需估计参数)(估计估计r r 个参数个参数)根据这个定理,对给定的显著性水平根据这个定理,对给定的显著性水平,查查2 分布表可得临界
9、值分布表可得临界值2 ,使得,使得 皮尔逊定理是在皮尔逊定理是在n无限无限增大时推导出来增大时推导出来的,因而在使用时要注意的,因而在使用时要注意n要足够大,以及要足够大,以及npi 不太小这两个条件不太小这两个条件.根据计算实践,要求根据计算实践,要求n不小于不小于50,以及,以及npi 都都不小于不小于 5.否则应适当合并区间,使否则应适当合并区间,使npi满满足这个要求足这个要求.让我们回到开始的一个例子,检验每年让我们回到开始的一个例子,检验每年爆发战争次数分布是否服从泊松分布爆发战争次数分布是否服从泊松分布.将有关计算结果列表如下将有关计算结果列表如下:提出假设提出假设H0:X服从参
10、数为服从参数为 的泊松分布的泊松分布根据观察结果,得参数根据观察结果,得参数 的极大似然估计为的极大似然估计为按参数按参数为为0.69的泊松分布,计算事件的泊松分布,计算事件X=i 的概率的概率pi,i=0,1,2,3,4pi的估计是的估计是 因因H0所假设的理论分布中有一个未知所假设的理论分布中有一个未知参数,故自由度为参数,故自由度为4-1-1=2.x 0 1 2 3 4ni 223 142 48 15 4 0.58 0.31 0.18 0.01 0.02n 216.7 149.5 51.6 12.0 2.16 战争次数战争次数实测频数实测频数14.160.1830.376 0.251 1
11、.6232.43将将n 5的组予以合并,即将发生的组予以合并,即将发生3次及次及4次次战争的组归并为一组战争的组归并为一组.故认为每年发生战争的次数故认为每年发生战争的次数X服从服从参数为参数为0.69的泊松分布的泊松分布.按按 =0.05,自由度为,自由度为4-1-1=2查查 分布表得分布表得=5.991=2.435.991,由于统计量由于统计量的实测值的实测值未落入否定域未落入否定域.奥地利生物学家孟德尔进行了长奥地利生物学家孟德尔进行了长达八年之久的豌豆杂交试验达八年之久的豌豆杂交试验,并根据并根据试验结果试验结果,运用他的数理知识运用他的数理知识,发现了发现了遗传的基本规律遗传的基本规
12、律.在此,我们以遗传学上的一项伟大发现为在此,我们以遗传学上的一项伟大发现为例,说明统计方法在研究自然界和人类社会的例,说明统计方法在研究自然界和人类社会的规律性时,是起着积极的、主动的作用规律性时,是起着积极的、主动的作用.孟德尔孟德尔子二代子二代子一代子一代黄色纯系黄色纯系绿色纯系绿色纯系他的一组观察结果为:他的一组观察结果为:黄黄70,绿,绿27近似为近似为2.59:1,与理论值相近,与理论值相近.根据他的理论,子二代中根据他的理论,子二代中,黄、绿之比黄、绿之比 近似为近似为3:1,由于随机性,观察结果与由于随机性,观察结果与3:1总有些差距,总有些差距,因此有必要去考察某一大小的差异
13、是否已构因此有必要去考察某一大小的差异是否已构成否定成否定3:1理论的充分根据,这就是如下的检理论的充分根据,这就是如下的检验问题验问题.这里,这里,n=70+27=97,k=2,检验孟德尔的检验孟德尔的3:1理论理论:提出假设提出假设H0:p1=3/4,p2=1/4理论频数为:理论频数为:np1=72.75,np2=24.25实测频数为实测频数为70,27.由于统计量由于统计量的实测值的实测值统计量统计量自由度为自由度为k-1=1=0.41583.841,按按 =0.05,自由度为,自由度为1,查,查 分布表得分布表得=3.841未落入否定域未落入否定域.故认为试验结果符合故认为试验结果符合
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率与数理统计81.4 总体分布的假设检验 概率 数理统计 总体 分布 假设检验
限制150内