《《似然比检验》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《似然比检验》PPT课件.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第4 4.4.4节节 似然比检验似然比检验一、似然比检验的基本步骤一、似然比检验的基本步骤二、从似然比检验导出正态总体的几二、从似然比检验导出正态总体的几个检验个检验问题引入问题引入 第二节涉及到的假设检验问题,都是依赖总体第二节涉及到的假设检验问题,都是依赖总体为正态分布。总体服从什么分布,一般预先无法知为正态分布。总体服从什么分布,一般预先无法知晓,因而需要对总体的分布进行各种假设。晓,因而需要对总体的分布进行各种假设。本节将主要讨论对总体分布的假设检验问题,本节将主要讨论对总体分布的假设检验问题,此类问题通常称为此类问题通常称为非参数统计方法非参数统计方法.本文主要介绍其中常见的本文主
2、要介绍其中常见的3种方法种方法.一、一、拟合拟合检验法检验法说明说明(1)在这里备择假设在这里备择假设H1可以不必写出可以不必写出.则上述假设相当于则上述假设相当于则上述假设相当于则上述假设相当于3.皮尔逊定理皮尔逊定理定理定理4.1注意注意4.多项分布的多项分布的 检验法检验法假设检验的问题为假设检验的问题为由前面的分析可以看出,选择皮尔逊统计量由前面的分析可以看出,选择皮尔逊统计量拒绝域为拒绝域为解解例例1试检验这颗骰子的六个面是否匀称试检验这颗骰子的六个面是否匀称?根据题意需要检验假设根据题意需要检验假设把一颗骰子重复抛掷把一颗骰子重复抛掷 300 次次,结果如下结果如下:H0:这颗骰子
3、的六个面是匀称的这颗骰子的六个面是匀称的.其中其中X表示抛掷这骰子一次所出现的点数表示抛掷这骰子一次所出现的点数(可能值可能值只有只有6个个),在在 H0 为真的前提下为真的前提下,所以拒绝所以拒绝 H0,认为这颗骰子的六个面不是匀称的认为这颗骰子的六个面不是匀称的.5.一般分布的一般分布的 检验法检验法假设检验的问题为假设检验的问题为经过上述处理,此问题又转化为检验多项分布问题经过上述处理,此问题又转化为检验多项分布问题.选择皮尔逊统计量选择皮尔逊统计量拒绝域为拒绝域为例例2(p131例例4.11)某盒中装有白球和黑球,现做某盒中装有白球和黑球,现做下面的试验,用返回式抽取方式从盒中取球,直
4、到取下面的试验,用返回式抽取方式从盒中取球,直到取到白球为止,记录下抽取的次数,重复如此的试验到白球为止,记录下抽取的次数,重复如此的试验100次,其结果为:次,其结果为:抽取次数抽取次数1234频数频数43311565试问该盒中的白球与黑球的个数是否相等试问该盒中的白球与黑球的个数是否相等(=0.05)?解解从题意可知,该总体服从几何分布,从题意可知,该总体服从几何分布,若黑球白球个数相等,则若黑球白球个数相等,则p=1/2,因此因此由此可知,检验的问题是由此可知,检验的问题是计算皮尔逊统计量可得:计算皮尔逊统计量可得:查表可得查表可得显然显然因而接受原假设,黑球白球个数相等因而接受原假设,
5、黑球白球个数相等.6.分布中含有未知参数的分布中含有未知参数的 检验法检验法假设检验的问题为假设检验的问题为 由此可以看到,此问题又可以转化为多项分布的由此可以看到,此问题又可以转化为多项分布的假设检验问题,其统计量为假设检验问题,其统计量为定理定理4.2此类假设检验的拒绝域为此类假设检验的拒绝域为以下举例说明以下举例说明 在一试验中在一试验中,每隔一定时间观察一次由某每隔一定时间观察一次由某种铀所放射的到达计数器上的种铀所放射的到达计数器上的 粒子数粒子数,共观察共观察了了100次次,得结果如下表得结果如下表:例例3解解所求问题为所求问题为:在水平在水平0,05下检验假设下检验假设由最大似然
6、估计法得由最大似然估计法得根据题目中已知表格根据题目中已知表格,具体计算结果见下表具体计算结果见下表,表表1 1 例例3的的拟合检验计算表拟合检验计算表 1 516172611 9 9 2 1 2 1 00.0150.0630.1320.1850.1940.1630.1140.0690.0360.0170.0070.0030.0021.56.313.218.519.416.311.46.93.61.70.70.30.219.39415.62234.8457.4237.10511.739664.6155.538=106.2810.0780.065故接受故接受H0,认为样本来自泊松分布总体认为样本
7、来自泊松分布总体.自自1965年年1月月1日至日至1971年年2月月9日共日共2231天中天中,全世界记录到里氏震级全世界记录到里氏震级4级和级和4级以上地震级以上地震共共162次次,统计如下统计如下:(X表示相继两次地震间隔天数表示相继两次地震间隔天数,Y表示出现的频数表示出现的频数)试检验相继两次地震间隔天数试检验相继两次地震间隔天数 X 服从指数分布服从指数分布.解解所求问题为所求问题为:在水平在水平0.05下检验假设下检验假设例例4由最大似然估计法得由最大似然估计法得X 为连续型随机变量为连续型随机变量,(见下页表见下页表)503126171086680.27880.21960.152
8、70.10620.07390.05140.03580.02480.056845.165635.575224.737417.204411.9718 8.3268 5.7996 4.0176 9.201655.351927.013227.327016.79808.35307.68606.207314.8269=163.563313.2192表表2 例例4的的拟合检验计算表拟合检验计算表在在 H0 为真的前提下为真的前提下,X 的分布函数的估计为的分布函数的估计为故在水平故在水平0.05下接受下接受H0,认为样本服从指数分布认为样本服从指数分布.下面列出了下面列出了84个依特拉斯坎人男子的头颅的最个
9、依特拉斯坎人男子的头颅的最大宽度大宽度(mm),试验证这些数据是否来自正态总体试验证这些数据是否来自正态总体?141 148 132 138 154 142 150 146 155 158150 140 147 148 144 150 149 145 149 158 143 141 144 144 126 140 144 142 141 140145 135 147 146 141 136 140 146 142 137148 154 137 139 143 140 131 143 141 149148 135 148 152 143 144 141 143 147 146150 132 14
10、2 142 143 153 149 146 149 138142 149 142 137 134 144 146 147 140 142140 137 152 145例例5 5解解所求问题为检验假设所求问题为检验假设由最大似然估计法得由最大似然估计法得(见表见表3)在在 H0 为真的前提下为真的前提下,X 的概率密度的估计为的概率密度的估计为 1 4103324 9 30.00870.05190.17520.31200.28110.13360.0375 0.73 4.3614.7226.2123.6111.22 3.156.7941.5524.4010.02=87.675.0914.374.9
11、1表表3 例例5的的拟合检验计算表拟合检验计算表故在水平故在水平0.1下接受下接受H0,认为样本服从正态分布认为样本服从正态分布.二、柯尔莫哥洛夫及斯米尔诺夫检验二、柯尔莫哥洛夫及斯米尔诺夫检验1.检验法的缺点检验法的缺点 此种检验依赖于区间划分,划分的巧合可能导此种检验依赖于区间划分,划分的巧合可能导致检验的错误致检验的错误,例如例如这样的结果不会影响皮尔逊统计量的值,因而可这样的结果不会影响皮尔逊统计量的值,因而可以导致接受错误的假设以导致接受错误的假设.本节将介绍柯尔莫哥洛夫斯米尔诺夫检验法,本节将介绍柯尔莫哥洛夫斯米尔诺夫检验法,柯尔莫哥洛夫检验法可以检验经验分布是否服从某柯尔莫哥洛夫
12、检验法可以检验经验分布是否服从某种理论分布,斯米尔诺夫检验法可以检验两个样本种理论分布,斯米尔诺夫检验法可以检验两个样本是否服从同一分布。是否服从同一分布。2.柯尔莫哥洛夫检验柯尔莫哥洛夫检验首先看两个定理,这是柯尔莫哥洛夫检验的基础首先看两个定理,这是柯尔莫哥洛夫检验的基础.定理定理4 4.3.3 设设F是连续的分布函数,则是连续的分布函数,则定理定理4 4.4.4 设设F是连续的分布函数,则是连续的分布函数,则 上述两个定理证明略。它们将是柯尔莫哥洛夫检验上述两个定理证明略。它们将是柯尔莫哥洛夫检验法的理论基础法的理论基础.假设检验的问题为假设检验的问题为只要原假设不真,则统计量的值就会偏
13、大,因而只要原假设不真,则统计量的值就会偏大,因而给定显著性水平给定显著性水平,可以选择临界值使得,可以选择临界值使得则此检验法的拒绝域为则此检验法的拒绝域为当当n 100时,利用极限分布定理时,利用极限分布定理5.4可得可得例例6(p1366(p136例例4 4.13).13)某矿区煤层厚度的厚度的某矿区煤层厚度的厚度的123个个数据的频数分布如下表所示,试用柯尔莫哥洛夫检数据的频数分布如下表所示,试用柯尔莫哥洛夫检验法检验煤层的厚度是否服从正态分布?验法检验煤层的厚度是否服从正态分布?202.852.60-2.909121.251.10-1.404192.452.30-2.60850.95
14、0.80-1.1033.052.151.85组中值2.90-3.202.00-2.301.70-2.00厚度间隔1076组号2191.551.40-1.7052560.650.50-0.8022410.350.20-0.501频数频数组中值厚度间隔/m组号解解用用X表示煤层厚度,欲假设检验表示煤层厚度,欲假设检验由于参数未知,因而首先对参数进行估计由于参数未知,因而首先对参数进行估计显然显然因此接受原假设,认为煤层厚度服从正态分布因此接受原假设,认为煤层厚度服从正态分布.注注分布函数分布函数F(x)的置信区间的置信区间3.斯米尔诺夫检验斯米尔诺夫检验假设检验的问题为假设检验的问题为为了得到显著
15、性水平下的拒绝域,需要如下定理:为了得到显著性水平下的拒绝域,需要如下定理:定理定理4 4.5.5 如果如果F(x)=G(x),且且F是连续函数,则是连续函数,则定理定理4 4.6.6 上述两个定理证明略。它们将是斯米尔诺夫检验上述两个定理证明略。它们将是斯米尔诺夫检验法的理论基础法的理论基础.如果如果F(x)=G(x),且且F是连续函数,则是连续函数,则只要原假设不真,则统计量的值就会偏大,因而只要原假设不真,则统计量的值就会偏大,因而给定显著性水平给定显著性水平,可以选择临界值使得,可以选择临界值使得则此检验法的拒绝域为则此检验法的拒绝域为例例7(p1397(p139例例4 4.14).1
16、4)工人刚接班时,先抽取工人刚接班时,先抽取150个零件作为样本,在自个零件作为样本,在自动车床工作两小时后,再抽取动车床工作两小时后,再抽取100个零件作为第二次个零件作为第二次样本,测得每个零件距离标准的偏差样本,测得每个零件距离标准的偏差X,其数值列其数值列入下表,试比较两个样本是否来自同一总体入下表,试比较两个样本是否来自同一总体?在自动车床上加工某一零件,在在自动车床上加工某一零件,在频频 数数偏差偏差X的的测量区间测量区间/m频频 数数偏差偏差X的的测量区间测量区间/m30380,5)29235,10)-5,0)-10,-5)-15,-10)1020,25)17431115,20)
17、72715810,15)010解解欲假设检验欲假设检验计算两个样本对应的经验分布函数计算两个样本对应的经验分布函数显然显然因此拒绝原假设,认为不是同一分布因此拒绝原假设,认为不是同一分布.三、独立性检验三、独立性检验1.列联表的形式列联表的形式上述问题可以用一个表格上述问题可以用一个表格列联表列联表来表示如下来表示如下列联表列联表检验的问题为:检验的问题为:统计量选择为统计量选择为拒绝域为拒绝域为例例7(p1437(p143例例4 4.15).15)调查调查339名名50岁以上的吸烟者与慢性岁以上的吸烟者与慢性气管炎的关系,结果如下表气管炎的关系,结果如下表21.020516243吸烟吸烟16.533928356合计合计9.713412113不吸烟不吸烟患病率患病率合计合计未患慢性未患慢性气管炎者气管炎者患慢性气患慢性气管炎者管炎者 检验的问题为:检验的问题为:解解统计量为统计量为观察值为观察值为上侧分位数上侧分位数显然显然因而拒绝原假设,即认为慢性气管炎与吸烟有关因而拒绝原假设,即认为慢性气管炎与吸烟有关再再 见见
限制150内