假设检验(五).ppt
2023/1/2713.3 非参数假设检验非参数假设检验1分布函数的拟合检验分布函数的拟合检验2023/1/272正态概率纸正态概率纸 设标准正态的分布函数为设标准正态的分布函数为,以以为横坐标为横坐标,为纵坐标作图为纵坐标作图.要求横要求横轴按等间距作刻度轴按等间距作刻度,使使在一条在一条直线上直线上.假设需要检验问题为假设需要检验问题为:则以则以为点在正态概率纸上作图为点在正态概率纸上作图便得一直线便得一直线.2023/1/273一个均值为一个均值为,标准差为,标准差为的正态分布的正态分布的图像是一条通过点的图像是一条通过点(,0.5)而斜率为而斜率为1/的直线的直线.即即是一条直线是一条直线,不妨记为不妨记为:那么那么易知易知,B=0.52023/1/2742023/1/275二、偏度、峰度检验法二、偏度、峰度检验法定义样本的中心矩为:定义样本的中心矩为:样本的偏度:样本的偏度:样本的峰度:样本的峰度:偏度和峰度均具有渐近正态性偏度和峰度均具有渐近正态性(3.3.3)2023/1/276三、Pearson()检验法检验法考虑总体分布的检验问题考虑总体分布的检验问题假设分布函数假设分布函数 的形式已知,但包含的形式已知,但包含 个个未知参数,未知参数,用极大似然法给出未知参数估计。用极大似然法给出未知参数估计。Pearson检验法亦称为检验法亦称为 检验法,检验法,用于检验用于检验假设总体服从某个预先给定的分布假设总体服从某个预先给定的分布 。2023/1/277卡方拟和优度检验卡方拟和优度检验判断样本观察频数判断样本观察频数(Observed frequency)与理论与理论(期望期望)频数频数(Expected frequency)之差是否由抽样误差所引起。之差是否由抽样误差所引起。(2)检验原理检验原理(1)问题问题2023/1/278具体检验过程如下:具体检验过程如下:(1)将将 分成分成 个互不相交的区间个互不相交的区间其中其中 可分别可分别取取(2)计算概率计算概率并计算并计算 ,称为,称为理论频数理论频数。(3)计算样本计算样本 落在落在 中的个数中的个数称为称为实际频数。实际频数。2023/1/279(4)计算检验统计量的值计算检验统计量的值(5)对给定的对给定的 ,查临界值,查临界值 。(6)推断:推断:若若 ,则拒绝,则拒绝若若 ,则接受,则接受2023/1/2710 某研究人员在某地随机抽查了某研究人员在某地随机抽查了150户户3口口之家,结果全家无某疾病有之家,结果全家无某疾病有112户,家庭户,家庭中中1人患病的有人患病的有20户,户,2人患病的有人患病的有11户户3人全患病有人全患病有7户,问该病在该地是否有家户,问该病在该地是否有家族聚集性。族聚集性。例例 1解:如果家庭成员之间的发病与否互不解:如果家庭成员之间的发病与否互不影响影响,则家庭中患病人数则家庭中患病人数X符合二项分布符合二项分布。患病率应与总体的患病率相同患病率应与总体的患病率相同.2023/1/2711(1)总体患病率总体患病率例例 1病人数病人数观察总人数观察总人数=45063原假设成立时原假设成立时,每个家庭中患病的人数为每个家庭中患病的人数为X,理论概率理论概率:理论家庭数理论家庭数:Expected frequency=1502023/1/2712每户发每户发病人数病人数(1)观察观察家庭数家庭数(2)理论理论概率概率(3)理论理论家庭数家庭数(4)0123112 20 11 70.63600.31060.05050.002795.408446.59487.58520.4116经计算得经计算得:例例 1合并合并2023/1/2713统计量的观测值为统计量的观测值为:例例 1自由度自由度拒绝原假设拒绝原假设可以认为该疾病具有家庭聚集性可以认为该疾病具有家庭聚集性.2023/1/2714基于秩的非参数检验基于秩的非参数检验n非参数检验中秩是最常使用的概念。非参数检验中秩是最常使用的概念。n一般来说,秩就是该数据按照升序排列一般来说,秩就是该数据按照升序排列后,每个观测值的位置。例如后,每个观测值的位置。例如:Xi159183178513719Ri75918426310这下面一行(记为这下面一行(记为Ri)就是上面一行数)就是上面一行数据据Xi的秩(的秩(rank)。2023/1/2715Wilcoxon 秩和检验秩和检验n假定第一个样本有假定第一个样本有m个观测值,第二个个观测值,第二个有有n个观测值。把两个样本混合之后把这个观测值。把两个样本混合之后把这m+n个观测值升幂排序,个观测值升幂排序,n记下每个观测值在混合排序下面的秩。记下每个观测值在混合排序下面的秩。之后分别把两个样本所得到的秩相加。之后分别把两个样本所得到的秩相加。n记第一个样本观测值的秩的和为记第一个样本观测值的秩的和为WX而第而第二个样本秩的和为二个样本秩的和为WY。这两个值可以互。这两个值可以互相推算,称为相推算,称为Wilcoxon统计量。统计量。2023/1/2716Wilcoxon 秩和检验秩和检验n如果原假设两个独立样本来自相同的总如果原假设两个独立样本来自相同的总体为真,那么秩将大约均匀分布在两个体为真,那么秩将大约均匀分布在两个样本中,样本中,即小的、中等的、大的秩值应即小的、中等的、大的秩值应该大约被均匀分在两个样本中。该大约被均匀分在两个样本中。n直观上看,如果直观上看,如果WX与与WY之中有一个显之中有一个显著地大,或者显著地小,则可以选择拒著地大,或者显著地小,则可以选择拒绝零假设。即绝零假设。即2023/1/2717例例3.3.5 两组样本数据如下:两组样本数据如下:I 49 52 53 47 50 II 56 48 58 46 55 检验两组样本是否来自同一个总体?检验两组样本是否来自同一个总体?I 4 6 7 2 5 II 9 3 10 1 8 解:将两组样本排序,列出秩次解:将两组样本排序,列出秩次 第第1组的秩和组的秩和=24,第,第II组的秩和组的秩和=30Page 1432023/1/2718Wilcoxon 秩和检验秩和检验 第一个第一个x的样本容量为的样本容量为n1,第二个,第二个y样本容样本容量为量为n2,在容量,在容量n=n1+n2的混合样本中,的混合样本中,x样本的秩和为样本的秩和为Wx,y样本的秩和为样本的秩和为Wy,n当原假设成立,当原假设成立,Wx近似近似N(,2)选择检验统计量为选择检验统计量为U统计量统计量SPSS非参数检验的过程非参数检验的过程n1.Chi-Square test 卡方检验卡方检验n2.Binomial test 二项分布检验二项分布检验n3.Runs test 游程检验游程检验n4.1-Sample Kolmogorov-Smirnov test 一一个样本柯尔莫哥洛夫个样本柯尔莫哥洛夫-斯米诺夫检验斯米诺夫检验n5.2 independent Samples Test 两个独立样两个独立样本检验本检验n6.K independent Samples Test K个独立样本个独立样本检验检验n7.2 related Samples Test 两个相关样本检验两个相关样本检验n8.K related Samples Test K个相关样本检验个相关样本检验homeworkn13n142023/1/2720