2022年非参数统计学讲义讲稿.docx
《2022年非参数统计学讲义讲稿.docx》由会员分享,可在线阅读,更多相关《2022年非参数统计学讲义讲稿.docx(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选学习资料 - - - - - - - - - 非参数统计学讲义第四章 多样本模型 1 k 个相关样本的非参数检验在参数统计中,检验几个样本是否来自完全相同的总体,采纳方差分析或 F 检验;运用 F 检验的假定条件是:样本是从正态分布的总体中独立抽选的;总体具有相同的方差;数据的测量层次至少是定距尺度;当被用来分析的数据不符合这些假定条件,或研究者不期望作这些假设,以便增加结论的普遍性时,不宜采纳参数统计的方法,而必需运用非参数方法;假如 k等于或大于 3个样本是按某种或某些条件匹配的,那么 k 个样本称为相关的,否就为独立的;k 个相关和独立样本的差异与两个相关和独立样本之间的差异类似;本
2、节介绍 k 个相关样本的非参数检验;一、 Cochran Q 检验1争论背景Cochran Q 检验也译为科库兰检验;它是用以检验匹配的三组或三组以上的频数或比例之间有无显著差异的方法;这种匹配可以用不同形式获得;例如,检验三种不同类型的采访形式对被采访者的有效答复是否有影响,可以抽选一些人,分成 n 组,每组有3 个匹配的被采访者,要求他们的有关情形相同;每组的 3 名成员被随机地置于 3 种条件之下, 即分别接受三种类型的采访,于是,就获得了 3 个匹配的样本,即 k3,每个样本有 n 个观测结果; k 个相关样本也可以采纳同一组人,对不同的 k 个条件的反应匹配成样本,这类似于两个相关样
3、本中以争论对象作为自身的对比者;例如,检验几种教学手段对同学把握学问是否有显著不同,可以随机抽取 n 个同学,让他们先后置于k 种教学手段之下,再作出评判;这样可以获得k 个匹配的样本,每个样本有n 个观测结果;在现实生活中,许多数据是以二元数据的形式显现的,【例 4-1】村民对四个候选人的评判得到结果:处表 4-1 村民评判结果1 1 0 21 1 N i区组: 20 个村民对 A、B、 C、D 四个候选人的评判理A 0 1 1 0 0 1 1 1 1 1 1 1 1 1 1 16 B 1 1 0 0 0 1 1 1 1 1 0 1 1 0 1 1 0 0 0 0 11 C 0 1 1 1
4、1 0 0 0 0 1 0 0 0 1 1 0 1 0 1 0 9 D 0 0 0 0 1 1 0 0 1 0 0 0 0 1 0 1 1 0 0 0 6 Lj1 3 2 1 2 3 2 2 3 3 1 2 2 3 3 3 2 1 2 1 42 其中: 1 表示同意; 0 表示不同意;关怀的问题是候选人在村民眼中有无区分,即检验H 0:1k是否成立;2基本方法假设有 k 个相关样本,每个样本有 n 个观测结果,检验 k 个样本间是否有显著差异,可以建立双侧备择,假设组为H 0 : k 个样本间无显著差异H 1 : k 个样本间有显著差异由于三个及三个以上样本间差异的方向不便于判定,因而,通常只
5、建立双侧备择进行检验;为对假设作出判定,所分析的数据测量层次为定类尺度即可;获得的数据可排成一个 n 行 k 列的表;假如 H0 为真,那么将测量结果分为“ 胜利” 和“ 失败” 的话,“ 胜利” 与“ 失败” 应随机地分布在表中的各行各列;Cochran Q 检验的统计量定义为k k2 2 2k k 1 N i N k k 1 N i k 1 Ni 1 i 1Q b b 4.1 2 2kN L i kN L ij 1 j 1式中, k 为处理数; b 为区组数;N 为行总和;i L 为列总和;j N i N i j L;N 1k i N i;由于 Q 统计量的抽样分布近似为自由度 df k
6、一 1 的 2 分布,所以依据自由度 dfk 一 1,给定的显著性水平,能够在附表中查找临界值 2 ,假设2Q就在显著性水平 下拒绝 H 0,说明样本之间存在着显著差异;相反,就不能拒绝 H0;3使用说明名师归纳总结 第页1 第 1 页,共 16 页- - - - - - -精选学习资料 - - - - - - - - - 运用 Cochran Q 检验时应留意,只有当行数n 不太小时, Q 的抽样分布才近似于df k 一 1 的2 分布;但是, n 的最小数值日前并没有明确的说明,使用者采纳时视详细问题而定; Cochran Q 检验适用于定类尺度测量的数据,其它测量层次的数据也可以运用,但
7、要象例 4-2 那样,转化为两类,但这样做可能铺张数据中包含的信息;因此,Cochran Q 检验一般只用于定类尺度的数据;4应用【续例 4-1 】候选人的例子Q431622 1132922 6 234229.357.815234422 122 1 0.05因而,拒绝原假设,认为这4 位候选人在选民眼中不同;【例 4-2】消费者对饮料的爱好是否存在差异某商店为打算经营饮料的品种、数量,对消费者的爱好进行了一次调查;随机抽取 18 个消费者,请他们对四种饮料:热牛奶、酸奶、果汁、可口可乐的喜好作出评判,凡喜好的记作 1,不喜好记作 0;调查结果如表 4 2;表 4-2 消费者对饮料喜好的调查结果
8、消费者 热牛奶 酸奶 果汁 可口可乐 合计iy 1 1 0 0 1 2 2 0 0 1 0 1 3 0 0 1 1 2 4 1 1 0 0 2 5 1 0 1 0 2 6 0 1 0 0 1 7 0 0 0 1 1 8 0 1 0 0 1 9 0 1 1 0 2 10 1 1 1 0 3 11 0 0 1 0 1 12 0 0 1 0 1 13 1 0 0 1 2 14 1 1 0 0 2 15 1 1 0 0 2 16 0 1 0 0 1 17 1 0 0 1 2 18 0 0 0 1 1 合计jx 8 8 7 6 29 分析:为检验消费者对四种饮料的爱好是否有差异,建立双侧各择,假设组为由
9、于数据为定类尺度测量,H0:消费者对四种饮料爱好无显著差异这里是四种饮料, k4,所以选用 Cochran H1:消费者对四种饮料爱好有显著差异只有“ 爱好”与“ 不爱好”两种结果, 且是两个以上相关样本,Q 检验;依据表 4 1 的调查数据,运算 H 0成立时的统计量 Q;x 8 表示喜爱第一种饮料热牛奶的总次数,x 2 8 是喜爱酸奶的总4次数,其它的依此类推;x j 29 是全部四种饮料中,消费者表示喜爱的总次数;iy 是第 i 个消费者喜爱各种饮料的次数;j 14 k niy 29,是各个消费者对四种饮料表示喜爱的总次数;x j 表示按样本数运算的消费者喜爱的总次数,而 iy 表示按观
10、看j 1 j 1 i 1k n对象即消费者或说按样品数运算的对各种饮料喜爱的总次数;这两个总和应相等,即有 x j y i;统计量 Q 正是用于说明按j 1 i 1样本数运算的总次数与按样品数运算的总次数的符合程度;按 4.1式,可以运算出Q= 名师归纳总结 第页2 第 2 页,共 16 页- - - - - - -精选学习资料 - - - - - - - - - 依据给定的显著性水平,自由度 df 4l 3,查附表,得到临界值 2 782;明显, Q 052382 782;因而,调查数据在 5的显著性水平上不能拒绝 H 0,即消费者对四种饮料的爱好没有显著差异;【例 4-3】三种不同教学方法
11、的成效是否有显著差异三种不同教学方法:电视教学、课堂讲授、课堂争论,对同学掌握学问的成效是否有所不同;为检验这一问题,抽选部分学生分为 18 组,每组 3 名匹配的同学,他们的有关情形类似;各组中 3 名同学被随机地置于 3 种条件下,即随机地指定接受某种教学方法;实施不同教学方法后进行测验,成果合格为有效,记作 1;成果不合格为无效,记作 0;结果如表 43;表 4-3 实施不同教学方法的同学成果同学组 电视教学 课堂讲授 课堂争论 合计iy 1 0 0 0 0 2 0 1 1 2 3 0 1 0 1 4 0 0 0 0 5 1 0 1 2 6 0 1 1 2 7 0 1 1 2 8 0 1
12、 0 1 9 1 0 1 2 10 0 0 0 0 11 0 1 1 2 12 0 1 1 2 13 0 1 1 2 14 0 1 1 2 15 0 1 1 2 16 1 1 1 3 17 0 0 1 1 18 0 1 1 2 合计x 3 12 13 28 分析:同学的考试成果是定距尺度测量,这里将其转化为合格、不合格两类,就视为定类尺度;合格即教学方法有效为 1,不合格为教学方法无效,记作 0;接受三种不同教学方法的同学在每一组是匹配的,即构成 3 个相关样本, k 3;检验三种教学方法的成效是否存在差异,建立的假设组为H 0 : 三种教学方法的成效无显著差异H 1 : 三种教学方法的成效有
13、显著差异由于是定类尺度测量的数据,相关样本数目大于 2,因此,宜采纳 Cochran Q 检验;利用表 42 的数据运算检验统计量 Q=13 给定显著性水平0 05, df3 1 2,查附表中相应临界值 2 5 99;明显, Q132 599,在 5的显著性水平上调查数据拒绝 H;,说明三种不同教学方法的成效有显著差异;最终的判定,仍可以采纳这种方法,运算其尾概率;5软件处理C o chra n Q Tes t 例 4-1.st aN umber of v alid cases: 18Q = .5238096, df = 3, p .913630Sum Percent PercentVaria
14、ble 0s 1s热 牛 奶 8.000000 55.55556 44.44444酸 奶 8.000000 55.55556 44.44444果 汁 7.000000 61.11111 38.88889可 口 可 乐 6.000000 66.66667 33.33333二、 Friedman 检验第页3 名师归纳总结 - - - - - - -第 3 页,共 16 页精选学习资料 - - - - - - - - - Friedman 检验亦称佛利得曼的 2 检验 ;或佛利得曼双向评秩方差分析,或者 Friedman 秩和检验; 它是对 k 个样本是否来自同一总体的检验;k 个样本是匹配的,实现
15、匹配的方法与前面类似;可以是 k 个条件下同一组受试者构成,即受试对象作为自身的对照者,也可以将受试者分为 n 个组,每组均有 k 个匹配的受试者,随机地将 k 个受试者置于 k 个条件之下形成;在不同受试者匹配的样本中,应尽量使不同受试者的有关因素匹配即相像;1基本方法与 Cochran Q 检验相像, Friedman 检验也是用来检验各个样本所得的结果在整体上是否存在显著差异;因此建立的也是双侧备择,假设组为H 0:k 个样本间无显著差异 或者 H0:1 2 kH1:k 个样本间有显著差异 H1:不全相等为对假设作出判定,所分析的数据应是定序尺度测量;获得的数据排成一个 n 行 k 列的
16、表,行代表不同的受试者或匹配的受试小组,列代表各种条件;由于是定序尺度测量的数据,因此,可以对每一行的观测结果分别评秩,即评等级,等级 1 是最小的,依次排序,秩从 1 到 k;假如 H 0 为真,那么每一列中秩的分布应当是随机的,即各个秩显现在全部列中的频数应几乎相等,也就是说各列的秩和应当大致相等;STEP1:在每一个区组中运算各个处理的秩:bR ;k;STEP2:运算秩和R iR iji1,2,j1STEP3:定义 Friedman 检验统计量为;Q121ik1R ib k12121ik1R i23 b k14.2 bk k2bk kNOTE : Q 越大对 H0 越不利;在小样本时,要
17、查临界值表,查表时,要作变换WQ1;Q2k2 r1,k定,b;因此,b k在大样本时,有Q 的抽样分布在n、k 不太小时,近似于自由度df k l 的2 分布,即在附表中,可以依据给定的显著性水平,自由度 dfk 一 1 查得 H0 为真时,相应的临界值2 ;假设2 ,就在水平上拒绝 H 0,否就不能拒绝H 0;某区组中存在结时,Q 应作适当的修正;2应用【例 4-4】在不同的城市对不同的人群进行血液中铅含量测试;设有 A、 B、 C 三个城市汽车密度不同代表三种不同的处理 k=3,对试验者按职业分组 b=4 取血四个区组 ;他们血液中铅含量及其评秩的结果如下:表 4-4 不同城市居民血液铅含
18、量评秩城市 职业区组iR处理 A 803 1003 512 653 11 B 522 762 523 532 9 C 401 521 341 351 4 由此可以运算出 Q 6.5 W 0.8125【例 4-4】三种不同教学方法的成效是否有显著差异三种不同教学方法同例 4-2,抽选的同学也分为 18 组,每组 3 名匹配的同学,其有关情形类似;各组中 3 名同学被随机地支配接受某种教学方法;实施不同教学方法后,进行测验,按成果高低对 3 名匹配同学的成果排列等级即评秩,结果如表 4 4;表 4-4 实施不同教学方法的同学成果同学组 电视教学 课堂讲授 课堂争论1 1 3 2 2 1 2 3 3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 参数 统计学 讲义 讲稿
限制150内