第二章非参数统计分析讲解优秀PPT.ppt
《第二章非参数统计分析讲解优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第二章非参数统计分析讲解优秀PPT.ppt(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、其次章单样本非参数检验2022/11/51思索的要点 各种检验方法的思路 各种检验方法统计量的构造 各种检验方法的应用场合 在SPSS与R中如何完成 2022/11/52第一节第一节 卡方检验卡方检验其次节其次节 二项分布检验二项分布检验第三节第三节 单样本的单样本的KSKS检验检验第四节第四节 符号检验符号检验 第五节第五节 Cox-Stuart Cox-Stuart趋势检验趋势检验 第六节第六节 游程检验游程检验第七节第七节 Wilcoxon Wilcoxon符号秩检验符号秩检验2022/11/53第一节 Chi-Square test 卡方检验 卡方检验通常称为拟合优度检验。主要是通过样
2、本观测值检验总体是否听从某个分布。假如数据是连续的,须要将连续的分布进行分段,计算每段的期望概率与观测到的频率之间是否差异很大。在SPSS中的Chi-Square test,主要是对离散的总体进行拟合优度检验。2022/11/54 在实际问题中,会遇到必需了解总体的分布函数的时候,这时利用样本资料对总体的分布函数进行检验就成了特别重要的了。我们须要检验总体的分布函数F(x)是否等于某个给定的函数 F0(x),可以依据阅历来确定。其中含有未知参数时,应利用样本资料接受点估计求得后,再进行检验。一、2拟合优度检验2022/11/55【例1】某金融系统贷款的偿还类型有四种,各种的预期还率为80%、1
3、2%、7%和1%。在一段时间的视察记录中,A型按时偿还的有380笔、B型偿还有69笔、C型有43笔、D笔有8笔。问在5%显著性水平上,这些结果与预期的是否一样。0.05。解:这个问题属于要检验每一类型的出现概率与理论期望概率是否相等,即检验 2022/11/56依据显著性水平,有 ,由于表明5%的显著水平下,不能拒绝原假设,即观测的比率与期望的比率一样。类型A380400-204001.00B69609811.35C43358641.83D85391.80合计500500_5.982022/11/57(1)提出统计假设由统计假设动身,将总体取值范围分为m个互不相容的小区间:假如分布是连续的其检
4、验步骤为:区间个数以714为宜。然后,统计出每个区间内样本点的数目fi,再用pi表示变量在第i个区间的概率,2022/11/58 在原假设为真的条件下,这个统计量近似地听从具有m1r个自由度的2 分布,其中r是须要用样原来估计的总体的未知参数的数目,若没有未知参数须要估计,则r为零。(2)选择适当统计量2022/11/59(3)由给定的显著性水平,查表确定临界值 (这种检验是右侧检验)。(4)利用样本值 计算实际频数 ,再计算阅历概率 ,据以计算的值(5)作结论,若 ,则拒绝原假设,即认为总体的分布函数不为 ;反之,则接受原假设,即认为总体的分布函数为 。2022/11/510 卡方检验的窗口
5、,SPSS的卡方检验主要用来检验离散随机变量的分布。2022/11/511卡方检验的窗口。2022/11/512P值大于0.05,结果说明还贷状况与预期是一样的。2022/11/513 【练习1】盒中有5种球,重复抽取200次(每次抽1个球)各种球出现的次数见下表。问盒中5种球的个数是否相等?显著水平=0.05。种别fi1234535404338442002022/11/514 二项分布检验二项分布检验(binomial test)(binomial test)是通过考察二分类是通过考察二分类变量的每个类别中视察值的频数与特定二项分布下变量的每个类别中视察值的频数与特定二项分布下的期望频数之间
6、是否存在显著差异,来推断抽取样的期望频数之间是否存在显著差异,来推断抽取样本所依靠的总体是否听从特定概率为本所依靠的总体是否听从特定概率为p p的二项分布。的二项分布。二项分布检验的原假设是:抽取样本所依靠的二项分布检验的原假设是:抽取样本所依靠的总体与特定的二项分布无显著差异。总体与特定的二项分布无显著差异。假如检验的假如检验的p p值小于值小于0.050.05,则拒绝原假设。,则拒绝原假设。其次节其次节 二项分布检验二项分布检验2022/11/515 【例2】依据以往的生产数据,某种产品的合格率为90%。现从中随机抽取25个进行检测,合格品为20个。检验该批产品的合格率是否为90%?(产品
7、合格率XB(n,0.9)SPSS的数据格式 表中的“1”表示合格品;“0”表示不合格品 合格品合格品频频数数120052022/11/516第第1步步:指定“频数”变量:点击【Data】【Weight-Cases】,将“频数频数”选入【Frequency Variable】【OK】第第2步:步:选择【Analyze】【Nonparametric Tests-Binomial】选项进入主对话框第第3步:步:将待检验的变量选入【Test Variable List】(本例为“合格品”)第第4步:步:在【Test Proportion】中输入检验的概率 (本例为0.9),点击【OK】(SPSS bi
8、nomial test)2022/11/517SPSS的输出结果 表中的合格品的视察比例为0.8,检验比例为0.9。精确单尾概率为0.098,它表示假如该批产品的合格率为0.9,那么25个产品中合格品数量小于等于20个的概率为0.098。P0.05,不拒绝原假设,没有证据表明该批产品的合格率不是0.92022/11/518【练习2】某地某一时期内诞生40名婴儿,其中女性12名(定Sex=0),男性28名(定Sex=1)。问这个地方诞生婴儿的性比例与通常的男女性比例(总体概率约为0.5)是否不同?2022/11/519 单样本的K-S检验(Kolmogorov-Smirnov检验)是用来检验抽取
9、样本所依靠的总体是否听从某一理论分布。其方法是将某一变量的累积分布函数与特定的分布进行比较。设总体的累积分布函数为F(x),已知的理论分布函数为F0(x),则检验的原假设和备择假设为 H0:F(x)=F0(x);H1:F(x)F0(x)原假设所表达的是:抽取样本所依靠的总体与指定的理论分布无显著差异。SPSS供应的理论分布有正态分布、Poisson分布、匀整分布、指数分布等。第三节 总体分布类型的KS检验2022/11/520 检验统计量 当H0成立且无抽样误差时,统计量D等于0。因此:当D的实际观测值较小时,可以认为零假设H0成立;当D的观测值较大时,则零假设H0可能不成立。其中Fn(x)称
10、为阅历分布。假定有样本1,1,2,2,2,4,5,5,5,10。其阅历分布为2022/11/521 【例3】对某汽车配件供应商供应的10个样本进行检测,得到其长度数据如下(单位:cm)检验该供货商生产的配件长度是否听从正态分布?(=0.05)总体分布类型的检验(K-S检验)12.210.812.011.811.912.411.312.212.012.32022/11/522第第1步:步:选择【Analyze】【Nonparametric Test】【1-Sample K-S】进入主对话框;第第2步:步:将待检验的变量选入【Test Variable List】(本例为“配件长度”);第第3步:
11、步:点击【Exact】,并在对话框中选择 【Exact】,点击【OK】。总体分布类型的检验(SPSS K-S检验)2022/11/523正态分布正态分布匀整分布匀整分布指数分布指数分布波松分布波松分布2022/11/524SPSSSPSS的输出结果的输出结果 精精确确双双尾尾概概率率为为0.6020.050.6020.05,不不拒拒绝绝原原假假设设。没没有有证证据据表表明明该该供供货货商商供供应应的的汽汽车车配配件件长长度度不听从正态分布不听从正态分布 2022/11/525【练习3】某市记录了91天市区内发生交通事故的分布状况如下:一天发生的事故数0123456及以上天数2035168750
12、 利用SPSS检验该数据可能的分布。用SPSS,在正态、匀整、指数和泊松分布中选择。2022/11/526符号检验的统计量为B=得正号的个数。符号检验。设随机变量符号检验。设随机变量X1,Xn是从某个总是从某个总体体X中抽出的简洁随机样本。且分布函数中抽出的简洁随机样本。且分布函数F(X)在在X=0是连续的。假设检验问题是连续的。假设检验问题检验的统计量可以取B。第四节第四节 符号检验符号检验 在原假设为真的条件下,B听从参数为n和0.5的二项分布b(n,0.5)。由于原假设为真时,B应当不太大,也不太小,假如B太大或太小,应当拒绝原假设。2022/11/527 精精确确的的符符号号检检验验是
13、是指指检检验验的的p值值是是由由精精确确的的概概率率给给出出的的。我我们们利利用用正正号号和和负负号号的的数数目目,来来检检验验某某假假设设,这这是是一种最简洁的非参数方法。一种最简洁的非参数方法。【例例4】联联合合国国人人员员在在世世界界上上71个个大大城城市市的的生生活活花花费费指指数数(上上海海是是44位位,数数据据为为63.5)按按自自小小至至大大的的次次序序排排列如下。列如下。一、精确中位数的符号检验一、精确中位数的符号检验2022/11/528 有人说64应当是这种大城市花费指数的中位数,有人说64顶多是低位数(下四分位数),进行检验。数据如下:122.4,109.4,105,10
14、4.6,104.1,100.6,100,99.3,99.1,98.2,97.5,95.2,92.8,91.8,90.8,90.3,89.5,89.4,86.4,86.2,85.7,82.6,81,80.9,79.1,77.9,77.7,76.8,76.6,76.2,74.5,74.3,73.9,71.7,71.2,67.7,66.7,66.2,65.4,65.3,65.3,65.3,64.6,63.5,62.7,60.8,58.2,55.5,55.3,55,54.9,52.7,51.8,49.9,48.2,47.6,46,45.8,45.2,41.9,38.8,37.7,37.5,36.5,3
15、6.4,32.7,32.7,32.2,29.1,27.8,27.82022/11/5292022/11/530 通常在正态总体分布的假设下,关于总体均值的假设检验和区间估计是用与t检验有关的方法进行的。然而,在本例中,总体分布是未知的。为此,首先看该数据的直方图从图中很难说这是什么分布。假定用总体中位数来表示中间位置,这意味着样本点,取大于me的概率应当与取小于me的概率相等。所探讨的问题,可以看作是只有两种可能“成功”或“失败”。2022/11/531符号检验的思路,记成功:X-0大于零,即大于中位数M,记为“+”;失败:X-0小于零,即小于中位数M,记为“-”。令 S+=得正符号的数目 S
16、=得负符号得数目可以知道S+或S 均听从二项分布B(65,0.5)。则可以用来作检验的统计量。其假设为:2022/11/532关于非参数检验统计量须要说明的问题 在非参数检验中,可以得到两个相互等价的统计量,比如在符号检验中,得负号与得正好的个数,就是一对等价的统计量,因为S+S-=N。那么我们在检验时应当用那个呢?我们选择统计量2022/11/533假设检验统计量S-=28是得负号的个数得正号的个数43。P-值检验的结果拒绝零假设结论中位数大于642022/11/534该检验R的代码 x-c(122.4,109.4,105,104.6,104.1,100.6,100,99.3,99.1,98
17、.2,97.5,95.2,92.8,91.8,90.8,90.3,89.5,89.4,86.4,86.2,85.7,82.6,81,80.9,79.1,77.9,77.7,76.8,76.6,76.2,74.5,74.3,73.9,71.7,71.2,67.7,66.7,66.2,65.4,65.3,65.3,65.3,64.6,63.5,62.7,60.8,58.2,55.5,55.3,55,54.9,52.7,51.8,49.9,48.2,47.6,46,45.8,45.2,41.9,38.8,37.7,37.5,36.5,36.4,32.7,32.7,32.2,29.1,27.8,27.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 参数 统计分析 讲解 优秀 PPT
限制150内