[精选]分布拟和检验法的基本原理与步骤10855.pptx
本资料来源分布拟和检验分布拟和检验引言引言前面所介绍的各种检验法,前面所介绍的各种检验法,是在总体分布类是在总体分布类型已知的情况下,型已知的情况下,对其中的未知参数进行检验统称对其中的未知参数进行检验统称为为参数检验参数检验.在实际问题中,在实际问题中,有时我们并不能确切预有时我们并不能确切预知总体服从何种分布,知总体服从何种分布,这时就需要根据来自总体的这时就需要根据来自总体的样本对总体分布进行推断,样本对总体分布进行推断,以判断总体服从何种分以判断总体服从何种分这类统计检验称为这类统计检验称为非参数检验非参数检验.布布,解决这类问题的工具是英国统计学家解决这类问题的工具是英国统计学家K.皮尔逊在皮尔逊在1900年发表的一篇文章中引进的所谓年发表的一篇文章中引进的所谓检验法检验法不少人把此项工作视为近代统计学的开端不少人把此项工作视为近代统计学的开端.引例引例 从从1500到到1931年的年的432年间年间,每年爆发战争的每年爆发战争的次数可以看作一个随机变量次数可以看作一个随机变量,椐统计椐统计,这这432年间共年间共爆发了爆发了299次战争次战争,具体数据如下:具体数据如下:根据所学知识和经验根据所学知识和经验,每年爆发战争的次数每年爆发战争的次数用一个泊松随机变量来近似描述,用一个泊松随机变量来近似描述,即可以假设每年即可以假设每年可以可以 4 4 15 3 48 2 142 1 223 0 发生发生 次战争的年数次战争的年数 战争次数战争次数一结为结为:如何利用上述数据检验如何利用上述数据检验服从泊松分布的假服从泊松分布的假设设.爆发战争次数的分布爆发战争次数的分布近似泊松分布近似泊松分布.于是于是问题归问题归又如又如,某工厂制造一批骰子某工厂制造一批骰子,声称它是均匀的声称它是均匀的,即在即在抛掷试验中抛掷试验中,出现出现1点,点,2点,点,6点的概率都应是点的概率都应是为检验骰子是否均匀为检验骰子是否均匀,要重复地进行抛掷骰子的试要重复地进行抛掷骰子的试验验,并统计各点出现的频率与并统计各点出现的频率与的的差距差距.问题归结为问题归结为:如何利用得到的统计数据对如何利用得到的统计数据对“骰子均骰子均匀匀”的假设进行检验的假设进行检验.检验法的基本思想检验法的基本思想检验法是在总体检验法是在总体的分布未知时的分布未知时,根据来自总根据来自总体的样本体的样本,检验关于总体分布的假设的一种检验检验关于总体分布的假设的一种检验方法方法.具体进行检验时,具体进行检验时,先提出原假设:先提出原假设:总体总体的分布函数为的分布函数为如果总体分布为如果总体分布为离散型离散型,则假设具体为则假设具体为总体总体的分布律为的分布律为如果总体分布为如果总体分布为连续型连续型,则假设具体为则假设具体为总体总体的概率密度函数为的概率密度函数为二、然后根据样本的经验分布和所假设的理论分布之间然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设的吻合程度来决定是否接受原假设,这种检验通常这种检验通常称作称作拟合优度检验拟合优度检验,它是一种它是一种非参数检验非参数检验.一般地,一般地,我们总是根据样本观察值用直方图和经验我们总是根据样本观察值用直方图和经验分布函数,分布函数,推断出可能服从的分布,推断出可能服从的分布,然后作检验然后作检验.检验法的基本原理和步骤检验法的基本原理和步骤(1)总体总体的分布函数为的分布函数为(2)区间,区间,记为记为如可取为如可取为其中其中可取可取可取可取区间的划分视具体区间的划分视具体情况而定,情况而定,使每个小区间所含样本值个数不小于使每个小区间所含样本值个数不小于5,而区间个数而区间个数 不要太大也不要太小不要太大也不要太小.提出原假设提出原假设的取值范围分成的取值范围分成个互不相交的小个互不相交的小将总体将总体(3)个小区间个小区间的样本值的个数记作的样本值的个数记作把落入第把落入第称为称为组频数组频数,所有组频数之和所有组频数之和三等于等于样本容量样本容量(4)根据所假设的总体理论分布根据所假设的总体理论分布,算出总体算出总体的值落入第的值落入第个小区间个小区间的概率的概率于是于是就是落入第就是落入第 个小区间个小区间的样本值的的样本值的理论理论频数频数.(5)可可为真时为真时,当当为真时为真时,当当区间区间的频率的频率与概率与概率应很接近应很接近,次试验中样本值落入第次试验中样本值落入第个小个小当当不真不真时时,与与相差较大相差较大.引入统计量引入统计量皮尔逊证明了下列皮尔逊证明了下列 定理:定理:定理定理当当 充分大充分大时,时,近似服从近似服从分布分布.(6)对给定的显著性水平对给定的显著性水平根据定理根据定理,确定确定 值值,使使查查分布表得分布表得,所以拒绝域为所以拒绝域为(7)的实测值落入拒绝域,的实测值落入拒绝域,则拒绝原假设则拒绝原假设否则就认否则就认为差异不显著而接受原假设为差异不显著而接受原假设算得统计量算得统计量若由所给的样本值若由所给的样本值例例1 将一颗骰子掷将一颗骰子掷120次次,所得数据见下表所得数据见下表解解则则16点中每点出点中每点出现的可能性相同现的可能性相同,都为都为1/6.如果用如果用表示第表示第 点出现点出现则待检假设则待检假设在在成立的条件下成立的条件下,理论概率理论概率问这颗骰子是否均匀、问这颗骰子是否均匀、对称对称(取取若这颗骰子是均匀的、若这颗骰子是均匀的、对称的对称的,由由得频率得频率计算结果如下表计算结果如下表.查表得查表得因此分布不含未知参数因此分布不含未知参数,又又由上表由上表,知知123456231/6209/20261/62036/20211/6202020201/61/61/61/20201515025/2025/20合计合计1204.8由上表由上表,知知123456231/6209/20261/62036/20211/6202020201/61/61/61/20201515025/2025/20合计合计1204.8故接受故接受认为这颗骰子是均匀对称的认为这颗骰子是均匀对称的.四、总体含未知参数的情形四、总体含未知参数的情形在对总体分布的假设检验中,在对总体分布的假设检验中,分布函数的形式分布函数的形式,但其中还含有未知参数但其中还含有未知参数,数为数为其中其中为未知参数为未知参数.设设自总体自总体的样本的样本,现要用此样本函数来检验现要用此样本函数来检验假设:假设:总体总体的分布函数为的分布函数为有时只知道总体有时只知道总体的的即分布函即分布函是取是取此类情况可按如下步骤进行检验:此类情况可按如下步骤进行检验:利用样本利用样本求出求出的最的最(1)大似然估计大似然估计(2)则则就变成完全已知的分布函数就变成完全已知的分布函数(3)中用中用代替代替在在时时,计算计算利用利用计算计算的估的估计值计值(4)计算要检验的统计量计算要检验的统计量当当充分大时充分大时,统计量统计量近似地服从近似地服从分布分布;(5)得拒绝域得拒绝域对给定的显著性水平对给定的显著性水平注注:在使用皮尔逊在使用皮尔逊检验法时检验法时,要求要求每个理论频数每个理论频数否则应适当地合否则应适当地合并相邻的小区间,并相邻的小区间,使使满足要求满足要求.以及以及例例2参数为参数为 的泊松分布的泊松分布.根据观察结果根据观察结果,得参数得参数的最大似然估计为的最大似然估计为按参数为按参数为0.69的泊松分布的泊松分布,的估计是的估计是根据引例所给数表根据引例所给数表,将有关计算结果列表如下将有关计算结果列表如下:检验引例中对战争次数检验引例中对战争次数提出的假设提出的假设服从服从计算事件计算事件的概率的概率战争次数战争次数实测频数实测频数01234223142481540.50160.34600.1190.02780.05216.7149.551.612.02.160.1830.3760.2511.654例例2参数为参数为 的泊松分布的泊松分布.根据引例所给数表根据引例所给数表,将有关计算结果列表如下将有关计算结果列表如下:检验引例中对战争次数检验引例中对战争次数提出的假设提出的假设服从服从战争次数战争次数实测频数实测频数01234223142481540.50160.34600.1190.02780.05216.7149.551.612.02.160.1830.3760.2511.654将将的组予以合并的组予以合并,即将以生即将以生3次及次及4次战争的次战争的组归并为一组组归并为一组.因因所假设的理论分布中有一个未所假设的理论分布中有一个未知参数知参数,故自由度为故自由度为按按自由度为自由度为2 查查分布表得分布表得因统计量因统计量的观察值的观察值未落入拒未落入拒绝域绝域.的泊松分布的泊松分布.故认为每年发生战争的次数故认为每年发生战争的次数服从参数为服从参数为0.69例例3投放了四种鱼投放了四种鱼:鲑鱼、鲈鱼、竹夹鱼和鲇鱼的鱼苗鲑鱼、鲈鱼、竹夹鱼和鲇鱼的鱼苗.现在在鱼塘里获得一样本如下现在在鱼塘里获得一样本如下:试取试取检验各类鱼的数量的比例较检验各类鱼的数量的比例较10前是否前是否有显著改变有显著改变.解解按题意需检验假设按题意需检验假设:的分布律为的分布律为一农场院一农场院10年前在一鱼塘里按比例年前在一鱼塘里按比例20:15:40:25序号序号种类种类1234鲑鱼鲑鱼鲈鱼鲈鱼 竹夹鱼竹夹鱼 鲇鱼鲇鱼数量数量(条条)132100200168以以记鱼种类的序号记鱼种类的序号,12340.20 0.150.40 0.25按题意需检验假设按题意需检验假设:的分布律为的分布律为以以记鱼种类的序号记鱼种类的序号,12340.20 0.150.40 0.25所需计算列在下表中所需计算列在下表中.现在现在但但故拒绝故拒绝数量之比较数量之比较10年前有显著改变年前有显著改变.认为各鱼类认为各鱼类完完例例4 在一实验中在一实验中,每隔一定时间观察一次由某种铀每隔一定时间观察一次由某种铀共观察了共观察了100次次,得结果如下表所示得结果如下表所示:其中其中是观察到有是观察到有 个个粒子的次数粒子的次数.从理论上考虑从理论上考虑所放射的到计数器上的所放射的到计数器上的 粒子数粒子数应服从泊松分布应服从泊松分布知知试在水平试在水平0.05下检验假设下检验假设总体总体服从泊松分布服从泊松分布:解解给出给出,估计估计由最由最大似然估计法大似然估计法在在假设下假设下,松分布的假设松分布的假设能取的值为能取的值为所有可所有可参数参数 未具体未具体所以先所以先因在因在中中得得即在即在服从泊服从泊下下,将其分成如表所示的两两不相交的子集将其分成如表所示的两两不相交的子集解解将其分成如将其分成如表所示的两两表所示的两两不相交的子集不相交的子集则则有有估计估计计算结果如表计算结果如表所示所示,其中有些其中有些的组予以适当合并的组予以适当合并,使得每组均有使得每组均有151617261199212100.0150.0630.1320.1850.1940.1630.1140.0690.0360.0170.0070.0030.021.56.313.218.519.416.311.46.93.61.70.70.30.2解解 计算结果如表计算结果如表所示所示,其中有些其中有些的组予以的组予以组均有组均有151617261199212100.0150.0630.1320.1850.1940.1630.1140.0690.0360.0170.0070.0030.021.56.313.218.519.416.311.46.93.61.70.70.30.24.61519.39415.62234.8457.4237.10511.7395.538适当合并适当合并,使得每使得每如表中第四列花如表中第四列花括号所示括号所示.此处此处,并组后并组后因在计算概率时因在计算概率时,估计了一个参数估计了一个参数故故的自由度为的自由度为但但查表得查表得现在现在故在水平故在水平0.05下接受下接受即认为样本来自泊松布总体即认为样本来自泊松布总体.例例5分布分布,从一批棉纱中随机抽取从一批棉纱中随机抽取300条进行拉力试验条进行拉力试验,果列在下表中果列在下表中,我们的问题是检验假设我们的问题是检验假设解解 可按以下四步来检验可按以下四步来检验:(1)分成分成13组组:将观测值将观测值为检验棉纱的拉力强度为检验棉纱的拉力强度(单位单位:公斤公斤)服从正态服从正态结结但是这样分组后但是这样分组后,前两组和最后两组的前两组和最后两组的比较小比较小,故故(2)这里这里就是正态就是正态计算每个区间上的理论频数计算每个区间上的理论频数.把它们合并成为一个组把它们合并成为一个组(见分组数据表见分组数据表)棉纱拉力数据的分组表棉纱拉力数据的分组表解解 可按以下四步来检验可按以下四步来检验:(1)分成组分成组将观测值将观测值(2)这里这里就是正态就是正态计算每个区间上的理论频数计算每个区间上的理论频数.分别用它们的最大似然估计分别用它们的最大似然估计分布分布的分布函数的分布函数,含有两个未知数含有两个未知数 和和来代替来代替.关于关于的计算作如下说明的计算作如下说明:因拉力数据表中因拉力数据表中的每个区间都很狭窄的每个区间都很狭窄,然后将每个区间的中点值乘以该然后将每个区间的中点值乘以该取这个区间的中点取这个区间的中点,区间的样本数区间的样本数,将将这这些些值值相相加加再再除除以以总总样样本本数数就就得得我们可认为每个区间内我们可认为每个区间内都都和和具体样本均值具体样本均值计算得到计算得到:解解(2)计算每个区间上的理论频数计算每个区间上的理论频数.分别用它们的最大似然估计分别用它们的最大似然估计两个未知数两个未知数和和来代替来代替.计算它在上面计算它在上面对于服从对于服从的随机变量的随机变量个区间上的概率个区间上的概率第第(3)如分组表中所列如分组表中所列.中落在每个区间的实际频数中落在每个区间的实际频数计算计算(4)计算统计量值计算统计量值:因为因为故故的自由度为的自由度为解解(4)计算统计量值计算统计量值:因为因为故故的自由度为的自由度为查表得查表得故拒绝原假设故拒绝原假设,即认为棉纱拉力强度不服从正态分布即认为棉纱拉力强度不服从正态分布.内容小结内容小结在实际问题中在实际问题中,有时我们并不能确切预知总体服从有时我们并不能确切预知总体服从何种分布何种分布,这时就需要根据来自总体的样本对总体这时就需要根据来自总体的样本对总体的分布进行推断的分布进行推断,以判断总体服从何种分布以判断总体服从何种分布,这类统这类统计检验称为计检验称为非参数检验非参数检验.本节介绍了一类非参数检本节介绍了一类非参数检验方法验方法:检验法检验法检验法的基本思想检验法的基本思想检验法的基本原理和步骤检验法的基本原理和步骤检验法总体含未知参数的情形检验法总体含未知参数的情形检验法是在总体检验法是在总体的分布未知时的分布未知时,根据来自总根据来自总体的样本检验关于总体分布的假设的一种试验方体的样本检验关于总体分布的假设的一种试验方法法.具体进行检验时具体进行检验时,先提出原假设先提出原假设:总体总体的分布函数为的分布函数为如果总体分布为如果总体分布为离散型离散型,则假设具体为则假设具体为总体总体的分布律为的分布律为如果总体分布为如果总体分布为连续型连续型,则假设具体为则假设具体为总体总体的概率密度函数为的概率密度函数为检验法的基本思想检验法的基本思想检验法的基本思想检验法的基本思想然后根据样本的经验分布和所假设的理论分布之间然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设的吻合程度来决定是否接受原假设,这种检验通常这种检验通常称为称为拟合优度检验拟合优度检验.它是一种它是一种非参数检验非参数检验.一般地一般地,我们总是根据样本观察值用直方图和经验我们总是根据样本观察值用直方图和经验分布函数分布函数,推断出总体可能服从的分布推断出总体可能服从的分布,然后作检验然后作检验.1.将总体将总体的取值范围分成的取值范围分成个互不重迭的小区个互不重迭的小区间间,记为记为2.把落入第把落入第 个小区间个小区间的样本值的个数记作的样本值的个数记作称为称为实测频数实测频数,所有实测频数之和所有实测频数之和等于样本容量等于样本容量3.根据所假设的理论分布根据所假设的理论分布,可算出总体可算出总体的值落的值落入每个入每个的概率的概率于是于是就是落入就是落入的样本的样本值的值的理论频数理论频数.4.引进检验统计量引进检验统计量则当则当充充检验法的基本原理和步骤检验法的基本原理和步骤检验法的基本原理和步骤检验法的基本原理和步骤分大分大时时,布布.对给定的显著性水平对给定的显著性水平确定确定值值,使使查查分布表得分布表得所以拒绝域为所以拒绝域为若由所给的样本值若由所给的样本值算得统计量的实测值算得统计量的实测值落入拒绝域落入拒绝域,则拒绝原假设则拒绝原假设,否则就认为差异不显著否则就认为差异不显著而接受原假设而接受原假设.则统计量则统计量近似服从近似服从分分设总体设总体分布函数为分布函数为其中其中为未知参数为未知参数.设设是取自总体是取自总体的样本的样本.检验假设检验假设:总体总体的分布函数为的分布函数为此种情况下此种情况下,要先利用样本要先利用样本求出求出的最大似然估计的最大似然估计在在中用中用代替代替检验法检验法总体含未知参数情形总体含未知参数情形9、静夜四无邻,荒居旧业贫。3月-233月-23Friday,March 17,202310、雨中黄叶树,灯下白头人。04:09:3604:09:3604:093/17/2023 4:09:36 AM11、以我独沈久,愧君相见频。3月-2304:09:3604:09Mar-2317-Mar-2312、故人江海别,几度隔山川。04:09:3604:09:3604:09Friday,March 17,202313、乍见翻疑梦,相悲各问年。3月-233月-2304:09:3604:09:36March 17,202314、他乡生白发,旧国见青山。17 三月 20234:09:36 上午04:09:363月-2315、比不了得就不比,得不到的就不要。三月 234:09 上午3月-2304:09March 17,202316、行动出成果,工作出财富。2023/3/17 4:09:3604:09:3617 March 202317、做前,能够环视四周;做时,你只能或者最好沿着以脚为起点的射线向前。4:09:36 上午4:09 上午04:09:363月-239、没有失败,只有暂时停止成功!。3月-233月-23Friday,March 17,202310、很多事情努力了未必有结果,但是不努力却什么改变也没有。04:09:3604:09:3604:093/17/2023 4:09:36 AM11、成功就是日复一日那一点点小小努力的积累。3月-2304:09:3604:09Mar-2317-Mar-2312、世间成事,不求其绝对圆满,留一份不足,可得无限完美。04:09:3604:09:3604:09Friday,March 17,202313、不知香积寺,数里入云峰。3月-233月-2304:09:3604:09:36March 17,202314、意志坚强的人能把世界放在手中像泥块一样任意揉捏。17 三月 20234:09:36 上午04:09:363月-2315、楚塞三湘接,荆门九派通。三月 234:09 上午3月-2304:09March 17,202316、少年十五二十时,步行夺得胡马骑。2023/3/17 4:09:3604:09:3617 March 202317、空山新雨后,天气晚来秋。4:09:36 上午4:09 上午04:09:363月-239、杨柳散和风,青山澹吾虑。3月-233月-23Friday,March 17,202310、阅读一切好书如同和过去最杰出的人谈话。04:09:3604:09:3604:093/17/2023 4:09:36 AM11、越是没有本领的就越加自命不凡。3月-2304:09:3604:09Mar-2317-Mar-2312、越是无能的人,越喜欢挑剔别人的错儿。04:09:3604:09:3604:09Friday,March 17,202313、知人者智,自知者明。胜人者有力,自胜者强。3月-233月-2304:09:3604:09:36March 17,202314、意志坚强的人能把世界放在手中像泥块一样任意揉捏。17 三月 20234:09:36 上午04:09:363月-2315、最具挑战性的挑战莫过于提升自我。三月 234:09 上午3月-2304:09March 17,202316、业余生活要有意义,不要越轨。2023/3/17 4:09:3604:09:3617 March 202317、一个人即使已登上顶峰,也仍要自强不息。4:09:36 上午4:09 上午04:09:363月-23MOMODA POWERPOINTLorem ipsum dolor sit amet,consectetur adipiscing elit.Fusce id urna blandit,eleifend nulla ac,fringilla purus.Nulla iaculis tempor felis ut cursus.感感 谢谢 您您 的的 下下 载载 观观 看看专家告诉