《最新SPSS-正态性检验方法..doc》由会员分享,可在线阅读,更多相关《最新SPSS-正态性检验方法..doc(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-dateSPSS-正态性检验方法.SPSS-正态性检验方法.正态性检验方法的比较理论部分正态分布是许多检验的基础,比如 F 检验, t 检验,卡方检验等在总体不是正太分 布是没有任何意义。因此,对一个样本是否来自正态总体的检验是至关重要的。当然, 我们无法证明某个数据的确来自正态总体,但如果使用效率高的检验还无法否认总体 是正太的检验,我们就没有理由否认那些和正太分布有关的检
2、验有意义,下面我就对 正态性检验方法进行简单的归纳和比较。一、图示法1. P-P图以样本的累计频率作为横坐标,以按照正态分布计算的相应累计概率作为纵坐标, 以样本值表现为直角坐标系的散点。如果数据服从正态分布,则样本点应围绕第一象 限的对角线分布。2. Q-Q图以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把 样本表现为直角坐标系的散点。如果数据服从正太分布,则样本点应围绕第一象限的 对角线分布。以上两种方法以 Q-Q 图为佳,效率较高。3. 直方图(频率直方图判断方法:是否以钟型分布,同时可以选择输出正态性曲线。4. 箱线图判断方法:观察矩形位置和中位数 , 若矩形位于
3、中间位置且中位数位于矩形的中间 位置,则分布较为对称,否则是偏态分布。5. 茎叶图判断方法:观察图形的分布状态 , 是否是对称分布。二、偏度、峰度检验法(冒牌 K-S 检验法:1. S, K 的极限分布 样本偏度系数 (3322B S B =; 该系数用于检验对称性, S0时, 分布呈正偏态, S0时为尖峰分布, S| 其中 14u-= 2. Jarque-Bera检验(偏度和峰度的联合分布检验法检验统计量为 JB 22164n k S K -=+ (22, JB 过大或过小时,拒绝原假设。 三、非参数检验方法1. Kolmogorov-Smirnov正态性检验 (基于经验分布函数(ECDF
4、的检验(0max |n D F x F x =-(n F x 表示一组随机样本的累计概率函数, (0F x 表示分布的分布函数。当原假设为真时, D 的值应较小,若过大,则怀疑原假设,从而,拒绝域为R D d =。对于给定的 , p P D d =,又 n np P D D = 2. Lilliefor正态性检验 该检验是对 Kolmogorov-Smirnov 检验的修正,参数未知时,由 22, S =可计算得检验统计量 nD 的值。 3. Shapiro-Wilk(W检验 检验统计量:(212211ni i i nn iii i a a X X W aaX X =-=-当原假设为真时, W
5、 的值应接近于 1,若值过小,则怀疑原假设,从而拒绝域为 R W c =。在给定的 水平下 P W c =。4. 2拟合优度检验 (也是基于经验分布函数(ECDF 的检验检验统计量为22211( ( kki i i i i i i i f f np n p p n np =-=-=1 k (- 22211( ( kki i i i i i i i f f np n pp n np =-=-=1 k r (- r 是被估参数的个数若原假设为真时, 2应较小,否则就怀疑原假设,从而拒绝域为 2R d =,对于给定的 , 2P d = 又 22p P =。 四、方法的比较1. 图示法相对于其他方法而
6、言,比较直观,方法简单,从图中可以直接判断,无 需计算,但这种方法效率不是很高,它所提供的信息只是正态性检验的重要补充。2. 经常使用的 2拟合优度检验和 Kolmogorov-Smirnov 检验的检验功效较低, 在许 多计算机软件的 Kolmogorov-Smirnov 检验无论是大小样本都用大样本近似的公式,很 不精准,一般使用 Shapiro-Wilk 检验和 Lilliefor 检验。3. Kolmogorov-Smirnov 检验只能检验是否一个样本来自于一个已知样本,而 Lilliefor 检验可以检验是否来自未知总体。4. Shapiro-Wilk检验和 Lilliefor 检
7、验都是进行大小排序后得到的,所以易受异常值 的影响。5. Shapiro-Wilk检验只适用于小样本场合(3n 50 , 其他方法的检验功效一般随 样本容量的增大而增大。6. 2拟合优度检验和 Kolmogorov-Smirnov 检验都采用实际频数和期望频数进行 检验,前者既可用于连续总体,又可用于离散总体,而 Kolmogorov-Smirnov 检验只适 用于连续和定量数据。7. 2拟合优度检验的检验结果依赖于分组,而其他方法的检验结果与区间划分无 关。8. 偏度和峰度检验易受异常值的影响,检验功效就会降低。9. 假设检验的目的是拒绝原假设, 当 p 值不是很大时, 应根据数据背景再作讨
8、论。SPSS 软件操作1. P-P图操作步骤:(1 工具栏 Analyze - Descriptive Statistics - P-P plots。 2. Q-Q图操作步骤:(1 工具栏 Analyze - Descriptive Statistics - Q-Q plots。 3. 频率直方图操作步骤:(1 工具栏 Analyze - Descriptive Statistics - Frequencies;(2 点击Frequencies窗口中的Statistics选项; (3 点击Frequencies窗口中的Charts选项。 4. K-S 检验 操作步骤: (1 工具栏Analyz
9、e - Descriptive Statistics - Explore; Dependent List是要被探索的变量。 (2 点击Explore窗口中的Plots选项; 选项Normality plots with tests将触发 K-S 检验和 Q-Q 图。 (3 点击Explore窗口中的Options选项; Exclude cases listwise:if a case has a missing value for any variable, then they are excluded from the whole analysis. Exclude cases pairwise: data will be excluded only for an alyses for which she has missing data. K-S 测试结果:红框中的是 p -value。 5. 按分组的 K-S 检验 操作步骤: (1 点击工具栏Data-Split File; Group Based on::按分组的变量,可以多个。 (2 点击OK后,其余按4. K-S 检验操作。 -
限制150内