研《非参数假设检验》.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《研《非参数假设检验》.ppt》由会员分享,可在线阅读,更多相关《研《非参数假设检验》.ppt(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、特点特点:对样本进行对样本进行分组分组计算均值和标准差计算均值和标准差。如:。如:Means过程比较比较不同性别不同性别同学数学成绩的平均值和方差。同学数学成绩的平均值和方差。数学成绩表数学成绩表性性 别别数数 学学MaleFemale99 79 59 89 79 89 9999 79 59 89 79 89 9988 54 56 2388 54 56 23SPSS的实现过程:的实现过程:Analyze菜单菜单Compare Means项中选择项中选择Means命令。命令。非参数假设检验非参数假设检验追求追求一个总体分布的非参数假设检验一个总体分布的非参数假设检验 (2)(2)两个总体的分布未
2、知两个总体的分布未知,它们是否相同它们是否相同;非参数假设检验非参数假设检验需要处理需要处理的问题:的问题:(1)(1)猜出总体的分布猜出总体的分布(假设假设),),用另一组样本检验。用另一组样本检验。两个总体分布的非参数假设检验两个总体分布的非参数假设检验 内容内容多个总体分布的非参数假设检验多个总体分布的非参数假设检验 配对样本非参数检验配对样本非参数检验 SPSS的非参数检验一个一个总体:单样本总体分布的检验总体:单样本总体分布的检验两个两个总体总体多个多个总体总体独立样本非参数检验独立样本非参数检验配对样本非参数检验配对样本非参数检验独立样本非参数检验独立样本非参数检验一个总体分布的检
3、验一个总体分布的检验检验总体的检验总体的卡方卡方分布分布检验总体的检验总体的二项二项分布分布单样本单样本变量值变量值的的随机性随机性检验检验(游程游程检验检验)单样本的单样本的Kolmogorov Smirnov检验检验检验总体的检验总体的正态正态分布分布 P-P正态正态概率分布图概率分布图(Graphs P-P)Q Q-Q Q正态正态概率单位分布图概率单位分布图(Graphs Q Q-Q Q)检验总体的正态分布的图示法检验总体的正态分布的图示法 是根据变量的累计比例对所指定的理论分布累是根据变量的累计比例对所指定的理论分布累计比例绘制的图形。计比例绘制的图形。是根据变量分布的分位数对所指定的
4、理论分布是根据变量分布的分位数对所指定的理论分布分位数绘制的图形。分位数绘制的图形。半正态分布半正态分布(Half-normal)伽玛分布伽玛分布(Gamma)指数分布指数分布(Exponential)Test Distribution提供提供1313种概率分布:种概率分布:贝塔分布贝塔分布(Beta)卡方分布卡方分布(Chi-square)拉普拉斯分布拉普拉斯分布(Laplace)逻辑斯谛分布逻辑斯谛分布(Logistic)对数正态分布对数正态分布(Lognormal)正态分布正态分布(Normal)帕累托分布帕累托分布(Pareto)T分布分布(Student T)威布尔分布威布尔分布(W
5、eibull)均匀分布均匀分布(Uniform)Bloms方法方法:使用公式:使用公式:Tukey方法方法:使用公式:使用公式:Rankit方法方法:使用公式:使用公式:Van der Waerden方法方法:使用公式:使用公式:n:个案的数目个案的数目r:从从1 1到到n的秩次的秩次式中式中:选择比率估测的公式,每次只能选择一项。若与某个概率分布的统计图一致,即被检验的数据符合所指定的分布,则代表个案的点簇在一条直线上。总体分布的卡方检验的总体分布的卡方检验的原理原理:如果从一个随如果从一个随机变量机变量X X中随机抽取若干个观察样本中随机抽取若干个观察样本,这些观察这些观察样本落在样本落在
6、X的的K个互不相交的子集中的个互不相交的子集中的观察频数观察频数服从一个多项分布服从一个多项分布,该多项分布当该多项分布当K趋于无穷时趋于无穷时,就近似服从就近似服从X X的总体分布。的总体分布。因此,假设样本来自的总体服从某个期望分因此,假设样本来自的总体服从某个期望分布或理论分布,同时获得样本数据各子集的实际布或理论分布,同时获得样本数据各子集的实际观察频数,则可依据下面统计量作出推断观察频数,则可依据下面统计量作出推断:例题例题检验总体的检验总体的卡方卡方分布分布 例题例题:某地一周内每日患忧郁症的人数如表某地一周内每日患忧郁症的人数如表所示,请检验一周内每日人们忧郁的数是否满足所示,请
7、检验一周内每日人们忧郁的数是否满足1:1:2:2:1:1:11:1:2:2:1:1:1。周日患者数131238370480529624731SPSS实现实现过程过程1.1.定义变量;定义变量;2.2.变量加权;变量加权;3.3.进入进入Analyze菜单菜单 用于选择计算非参数检验统计量对应的P值的方法。SPSS提供了3种计算P值的方法:Asymptotic only:渐进性的显著性检验,适合于样本服从渐进分布或较大样本。Monte Carlo:不依赖渐进性方法估测精确显著性,这种方法在数据不满足渐进性分布,而且样本数据过大以致不能计算精确显著性时特别有效。Exact:精确计算法,即准确计算观
8、测结果的统计概率。计算量较大,适用于小样本。练习练习:赛马比赛时,任一马的起点位置是起跑赛马比赛时,任一马的起点位置是起跑线上所指定的标杆位置。现有线上所指定的标杆位置。现有8 8匹马的比赛,位置匹马的比赛,位置1 1是内侧最靠近栏杆的跑道,位置是内侧最靠近栏杆的跑道,位置8 8是外侧离栏杆是外侧离栏杆最远的跑道,下表是某赛马在一个月内某特定圆最远的跑道,下表是某赛马在一个月内某特定圆形跑道上的纪录,并且按照起点的标杆位置分类。形跑道上的纪录,并且按照起点的标杆位置分类。试检验起点标杆位置对赛马结果的影响试检验起点标杆位置对赛马结果的影响。起点标杆位置总数12345678获胜频数29 19 1
9、8 25 17 10 15 11144马在马在8 8个圆形跑道的起点标杆位置上获胜的纪录个圆形跑道的起点标杆位置上获胜的纪录均匀分布检验均匀分布检验 二项分布检验的二项分布检验的基本思想基本思想:根据搜集到的样根据搜集到的样本数据,推断总体分布是否服从某个指定的二项本数据,推断总体分布是否服从某个指定的二项分布。分布。SPSS中的二项分布检验,在样本小于等于中的二项分布检验,在样本小于等于3030时,按照计算二项分布概率的公式进行计算;样时,按照计算二项分布概率的公式进行计算;样本数大于本数大于3030时,计算的是时,计算的是Z统计量,认为在零假统计量,认为在零假设下设下,Z统计量服从正态分布
10、统计量服从正态分布。其其零假设零假设:样本来自的总体与所指定的某个样本来自的总体与所指定的某个二项分布不存在显著的差异。二项分布不存在显著的差异。K:观察变量取值的样本个数,:观察变量取值的样本个数,当当K小于小于n/2/2时,取加号;时,取加号;p为检为检验概率。验概率。练习练习检验总体的检验总体的二项二项分布分布 练习练习:某地某一时期内出生:某地某一时期内出生3535名婴儿,其中名婴儿,其中女孩儿女孩儿1919名(名(Sex=0=0),男孩儿男孩儿1616名(名(Sex=1=1)。)。问,该地区出生婴儿的性别比例与通常的男女性问,该地区出生婴儿的性别比例与通常的男女性别比例(总体概率约为
11、别比例(总体概率约为0.50.5)是否不同?数据如)是否不同?数据如下表所示:下表所示:续续婴儿性别婴儿Sex婴儿Sex1113125120141261311512704116128051170290611803007019031180200320902103301002203401112313501212413535名婴儿的性别名婴儿的性别 操操作作单样本变量值的随机性检验单样本变量值的随机性检验(游程检验游程检验)依时间或其他顺序排列的有序数列中,具有依时间或其他顺序排列的有序数列中,具有相同的事件或符号的相同的事件或符号的连续部分连续部分称为一个称为一个游程游程。调。调用用Runs过程过
12、程可进行游程检验,即用于检验序列中可进行游程检验,即用于检验序列中事件发生过程的事件发生过程的随机性随机性分析分析。单样本变量值的随机性检验是对某变量的取单样本变量值的随机性检验是对某变量的取值出现是否随机进行检验,也称值出现是否随机进行检验,也称游程检验游程检验。例题例题例题例题:某村发生一种地方病,其住户沿一条河排:某村发生一种地方病,其住户沿一条河排列,调查时对发病的住户标记为列,调查时对发病的住户标记为“1 1”,对非发,对非发病的住户标记为病的住户标记为“0 0”,共,共2020户,其取值如下表户,其取值如下表所示:所示:续续3535家住户的发病情况家住户的发病情况住户 发病情况住户
13、发病情况住户发病情况111312512014126131151270411612815117029061180300701913118020132090210330100220340111231350121241操操作作单样本的单样本的KolmogorovSmirnov检验检验 单样本单样本K KS S检验检验是一种拟合优度的非参数检是一种拟合优度的非参数检验,是利用样本数据推断总体是否服从某一理论验,是利用样本数据推断总体是否服从某一理论分布的方法,适用于探索连续性随机变量的分布分布的方法,适用于探索连续性随机变量的分布形态。进行形态。进行Kolmogorov-Smirnov Z Z检验,是
14、将一检验,是将一个变量的实际频数分布与正态分布个变量的实际频数分布与正态分布(Normal)、均均匀分布匀分布(Uniform)、泊松分布泊松分布(Poisson)进行比较进行比较。SPSS实现实现KS检验的过程如下检验的过程如下:(1 1)根据样本数据和用户的指定构造出理论分根据样本数据和用户的指定构造出理论分布,查分布表得到相应的布,查分布表得到相应的理论理论累计概率分布函数累计概率分布函数 。(2 2)利用样本数据计算各样本数据点的累积概利用样本数据计算各样本数据点的累积概率,得到检验率,得到检验累计概率分布函数累计概率分布函数 。(3 3)计算计算 和和 在相应的变量值点在相应的变量值
15、点X X上的差,上的差,得到得到差值差值序列。单样本序列。单样本K KS S检验主要对检验主要对差值差值序列序列进行研究进行研究。例题例题练习练习 例题例题:某地某地144144个周岁儿童身的高数据如下表,问个周岁儿童身的高数据如下表,问该地区周岁儿童身高频数是否成正态分布该地区周岁儿童身高频数是否成正态分布?身高区间人数642684697701671207225732474227616782796831SPSS操作操作 练习练习:某报刊亭为研究每天报刊的销售量某报刊亭为研究每天报刊的销售量,为以后每天报刊进量提供依据为以后每天报刊进量提供依据,统计其在统计其在140140天的天的销售中销售中
16、,某日报的日销售量的频数资料如下表某日报的日销售量的频数资料如下表,问该资料的频数是否服从正态分布问该资料的频数是否服从正态分布?日销售量(份)天数日销售量(份)天数59221021924160169422022922170179723023916180189162402492190199202502596200209252601操作操作两个总体独立样本的非参数检验两个总体独立样本的非参数检验检验两个总体的分布是否相同:检验两个总体的分布是否相同:方差相同方差相同分布分布函数函数形式形式相同相同两个总体的分布若相同两个总体的分布若相同参数相同参数相同均值相同均值相同(2)(2)两个总体的分布未
17、知两个总体的分布未知,它们是否相同它们是否相同;Wald-wolfowitz Runs 游程检验游程检验检验检验分布分布是否相同的方法是否相同的方法Mann-Whitney U秩和检验秩和检验KolmogorovSmirnov检验检验Moses Extreme Reactions极端反应检验极端反应检验SPSS实现过程实现过程零假设零假设:样本来自的两独立总体分布样本来自的两独立总体分布无显著差异无显著差异 K-S检验实现的方法检验实现的方法:将两组样本数据混合并将两组样本数据混合并升序排列升序排列,分别计算两组样本分别计算两组样本秩秩的累计频率和每的累计频率和每个点上的累积频率,然后将两个累
18、计频率个点上的累积频率,然后将两个累计频率相减相减,得到得到差值差值序列数据序列数据。K-S检验检验将关注差值序列,并计算将关注差值序列,并计算K-S的的Z统统计量,依据正态分布表给出相应的相伴概率值计量,依据正态分布表给出相应的相伴概率值。(1 1)KolmogorovSmirnov检验检验两组样本是可以各自独立颠倒顺序的两组样本是可以各自独立颠倒顺序的(2 2)Mann-Whitney U秩和检验法秩和检验法检验这两组样本是否来自同一个总体检验这两组样本是否来自同一个总体(或两组样本或两组样本的总体分布是否相同的总体分布是否相同)。问题问题:有两个总体的样本为有两个总体的样本为:与与可能可
19、能。Mann-Whitney U检验的统计量是:检验的统计量是:式中式中对给定对给定 ,查查 值表值表,得得若若,则总体分布相同。则总体分布相同。两样本两样本Wald-wolfowitz 游程检验游程检验中,中,计算游计算游程的方法与观察值的程的方法与观察值的秩秩有关。有关。首先首先,将两组样本将两组样本混合并升序排列。在数据排序时混合并升序排列。在数据排序时,两组样本的每两组样本的每个观察值对应的样本组标志值序列也随之重新排个观察值对应的样本组标志值序列也随之重新排列列,然后然后对标志值序列对标志值序列求游程求游程。如果计算出的游程数相对如果计算出的游程数相对比较小比较小,则说明样本则说明样
20、本来自的两总体分布形态存在来自的两总体分布形态存在较大较大差距。差距。SPSS将自动计算游程数得到将自动计算游程数得到Z统计量统计量,并依据正并依据正态分布表给出对应的相伴概率值态分布表给出对应的相伴概率值。(3)Wald-wolfowitz 游程检验游程检验 如果跨度或截头跨度很小如果跨度或截头跨度很小,说明两个样本数据说明两个样本数据无法无法充分混合充分混合,认为实验样本存在极端反应认为实验样本存在极端反应。两独立样本的极端反应检验两独立样本的极端反应检验,将一个样本作为控将一个样本作为控制样本制样本,另一个样本作为实验样本。以控制样本做对另一个样本作为实验样本。以控制样本做对照照,检验实
21、验样本是否存在极端反应。检验实验样本是否存在极端反应。首先首先,将两组样本将两组样本混合并升序混合并升序排列排列;然后然后计算控计算控制样本最低秩和最高秩之间的观察值个数制样本最低秩和最高秩之间的观察值个数,即即:Span(跨度跨度)。为控制极端值对分析结果的影响为控制极端值对分析结果的影响,可先去掉样本可先去掉样本两个最极端的观察值后两个最极端的观察值后,再求跨度再求跨度,这个跨度称为这个跨度称为截截头跨度头跨度。零假设零假设:样本来自的两独立总体分布:样本来自的两独立总体分布没有显著差异。没有显著差异。(4)Moses 极端反应检验极端反应检验两组独立样本的总体分布是否相同的检验两组独立样
22、本的总体分布是否相同的检验 点击点击进入进入Analyze菜单的菜单的Nonparametric Tests子菜单子菜单,选择,选择2 Independent Sample命令。命令。Moses Extreme Reactions(极端检验):(极端检验):检验两检验两个独立样本观察值的散布范围是否有差异存在,以个独立样本观察值的散布范围是否有差异存在,以检验两个样本是否来自具有同一分布的总体检验两个样本是否来自具有同一分布的总体。Mann-Whitney U:检验两个独立样本所属的总检验两个独立样本所属的总体均值是否相同体均值是否相同。Kolmogorov-Smirnov Z(KS):推测两
23、个样推测两个样本是否来自具有相同分布的总体本是否来自具有相同分布的总体。Wald-Wolfowitz runs(游程检验):(游程检验):考察两个独考察两个独立样本是否来自具有相同分布的总体立样本是否来自具有相同分布的总体。练习练习 练习练习:研究两个不同厂家生产的灯泡使用寿命是研究两个不同厂家生产的灯泡使用寿命是否存在显著性差异否存在显著性差异,随机抽取两个厂家生产的灯泡随机抽取两个厂家生产的灯泡,试验得到的使用寿命数据如下表试验得到的使用寿命数据如下表:灯泡寿命厂家编号67516821691167016501693165016492680263026502646265126202SPSS操
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 非参数假设检验 参数 假设检验
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内