欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    第四讲 假设检验优秀课件.ppt

    • 资源ID:49403408       资源大小:5.17MB        全文页数:97页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第四讲 假设检验优秀课件.ppt

    第四讲 假设检验第1页,本讲稿共97页例子n开发研制的新药对治疗某种特定疾病的效果n水稻亩产量的影响因素分析n心脏病猝死与日期的关系(2.8:1:1:1:1:1:1)n产品自动生产线工作是否正常?n某种新生产方法是否会降低产品成本?n厂商声称产品质量符合标准,是否可信?第2页,本讲稿共97页案例n澳大利亚统计局公布的2003年第一季度失业率为6.1%。而Roy Morgan公司在调查了14656名14岁以上的居民以后得到的失业率为7.8%。你认为Roy Morgan的结果显著高于统计局的数字吗?n美国劳工局公布的数字表明,1998年11月美国的平均失业时间为14.6周。在费城市市长的要求下进行的一项研究调查了50名失业者,平均失业时间为15.54周。根据调查结果能否认为费城的平均失业时间高于全国平均水平?第3页,本讲稿共97页样本推断总体的情况n总体分布已知的情形下,根据样本数据对总体分布的统计参数进行推断(估计或检验)n总体分布未知的情形,根据样本数据对总体的分布形式或特征进行推断第4页,本讲稿共97页参数假设检验与非参数假设检验n参数假设检验:已知总体分布(给定或假定),猜到总体某个参数的数值(H0),那么这种猜测对不对?需要用一组样本信息来判断。,效率高。有一个总体、两个总体和多个总体的参数检验。n非参数假设检验:又称分布检验。在总体分布未知或知之甚少的情况下,用样本数据对总体分布形态等进行推断。猜出总体分布(H0),用一组样本来检验该假设是否正确。即假设总体服从 ,用样本信息推断总体是否服从某理论分布。检验条件较宽松,适应性强,但功效较低。(含总体的分布类型检验及独立性检验等)第5页,本讲稿共97页假设检验内容第6页,本讲稿共97页4.1 假设检验的基本问题假设检验的基本问题一、假设检验的基本原理一、假设检验的基本原理 二、假设检验的基本步骤二、假设检验的基本步骤三、假设检验的两类错误三、假设检验的两类错误四、利用四、利用P-Value进行检验进行检验第7页,本讲稿共97页4.2 参数检验一、总体均值的假设检验一、总体均值的假设检验二、总体比例的假设检验二、总体比例的假设检验三、总体方差的假设检验三、总体方差的假设检验第8页,本讲稿共97页4.3 方差分析 主要应用在在农业、商业、医学、社会学、经济学等诸多领域 一、方差分析的基本问题 二、单因素方差分析 三、多因素方差分析 四、协方差分析第9页,本讲稿共97页一、方差分析的基本原理n意义:是英国统计学家费歇(R.A.Fisher)20世纪20年代提出,某变量受多种不同因素不同程度的影响,哪些因素有显著影响,通过方差分析来解决。n核心问题n从数据差异角度看:观测变量的数据差异 =控制因素造成+随机因素造成n影响某农作物亩产量的因素n方差分析正是要分析观测变量的变动是主要由控制因素造成还是由随机因素造成的,以及控制变量的各个水平是如何对观测变量造成影响的。第10页,本讲稿共97页一、方差分析的基本原理n基本思路:通过实验或调查,取得不同因素不同水平条件下被考察的随机变量(因变量)的样本;利用样本构造统计量,检验不同条件下的因变即几个不同的总体的均值是否相等,如果均值相等的假设被接受,说明因素及水平对因变量的影响不显著。n方差分析:从观察变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。对观测变量有显著影响的各控制变量其不同水平以及各水平的交互搭配是如何影响观测变量的。第11页,本讲稿共97页一、方差分析的基本原理n方差分析实际上是通过推断控制变量各水平下观测变量的总体分布是否有显著差异来实现的,1、假定:n观测变量各总体服从正态分布n观测变量各总体的方差相同n基于上述假定,方差分析对个总体分布是否有显著差异的推断就转化成对各总体均值是否存在显著差异的推断。第12页,本讲稿共97页因素(Factor):方差分析的对象因素水平(Factor level):因素的内容方差分析:针对一定因素(Factor)分析各总体的各个因素水平(Factor level)是否有差异。单因素方差分析(One-Way analysis of variance):针对一个因素所进行的双因素方差分析(Two-Way analysis of variance):针对两个因素进行的。多因数方差分析:涉及两个以上的因数。基本原理基本原理第13页,本讲稿共97页2、观测值间差异n观察值之间存在的差异主要来自于:n组间方差:因素的不同水平造成的,主要是系统性误差,也包括随机因素的影响,用水平间方差来解释。如饮料的不同颜色带来不同的销售量n组内方差:抽选样本的随机性而产生,是随机因素的影响,通过水平内方差来显示。如相同颜色饮料在不同商场销售量不同。n总离差平方和=组间离差平方和+组内离差平方和第14页,本讲稿共97页观测值间差异n总离差平方和=组间离差平方和+组内离差平方和(即SST=SSA+SSE)n构建统计量:统计学家R.A.Fisher(18901962)提出的,叫 分布n若比值近似为1,控制变量影响不显著,即不拒绝H0;若比值偏离1,方差分析的结果可以得到总体均值不相同。因此方差分析就是通过不同方差的比较,做出接受或拒绝原假设的判断。第15页,本讲稿共97页3、方差分析的步骤n建立方差分析模型n检查方差分析的前提条件是否成立n建立检验的原假设和备释假设n根据样本值计算检验统计量n作出方差分析表n根据F检验结果作出推断第16页,本讲稿共97页4、方差分析的内容n单因素方差分析n多因素方差分析n协方差分析第17页,本讲稿共97页基本思想:单因素方差分析是只针对一个因素进行,用来研究一个控制变量的不同水平是否对观测变量产生显著影响,旨在分析该因素对样本的观察值是否产生影响,各因素水平的样本容量大小可以一致,也可以不一致。二、单因素方差分析第18页,本讲稿共97页举例:消费者对行业的投诉次数如下,消费者协会想知道这几个行业之间的服务质量是否有显著差异?试验号行业(因数水平)零售业旅游业航空公司家电制造业123455766494034683929455631492134404451657758第19页,本讲稿共97页第20页,本讲稿共97页1、分析思路n明确观测变量和控制变量n剖析观测变量的方差第21页,本讲稿共97页2、步骤n比较观测变量总离差平方和中各部分的比例n单因素方差分析一般分为四步:(1)建立原假设和备择假设;(H0控制变量不同水平下观测变量各总体的均值无显著差异)(2)选择检验统计量,计算F和P;(3)给定显著性水平,确定临界值;(4)决策。第22页,本讲稿共97页3、应用举例n例“广告地区与销售额.sav”Analyze Compare Means One-Way ANOVE第23页,本讲稿共97页4、进一步分析nAnalyze Compare Means One-Way ANOVE对比检验(先验对比和趋势检验)多重比较检验方差齐性检验第24页,本讲稿共97页(1)Contrasts检验n先验对比检验能更精确地掌握各水平间或相似子集间均值的差异程度n趋势检验(polynominal):分析随控制变量水平的变化,观测变量值变化的总体趋势是怎样的。线性、二次、三次等?从另一角度把握控制变量不同水平对观测变量总体作用的程度第25页,本讲稿共97页(2)Post Hoc多重比较n当方差分析检验的结果拒绝原假设时,只能得到各水平间的样本均值不完全相同的结论。n如果要想明确是哪一个因素水平的均值或哪几个同其他均值不相等,就需要进行多重比较。n进一步确定控制变量的不同水平对观测变量的影响程度,哪个水平的作用明显区别于其他水平,哪个水平作用不显著等第26页,本讲稿共97页Post Hoc多重比较n目的n如果总体均值存在差异,F检验不能说明哪个水平造成了观察变量的显著差异。多重比较将对每个水平的均值逐对进行比较检验。n常用方法nLSD法(适用于总体方差相等的情形,检验敏感度最高)n实际上就是t检验的变形,只是在变异和自由度的计算上利用了整个样本信息。nBonferroni方法(对犯第一类错误进行了控制)nTukey法;Scheffe法;S-N-K法第27页,本讲稿共97页(3)Options方差齐性n对控制变量不同水平下各观测变量总体方差是否相等进行分析(即方差齐性检验),同两独立样本t检验的方差检验。即控制变量不同水平下各观测变量总体方差是否相nHomogeneity of variance实现方差齐性检验。nDescriptive基本描述统计量nMeans Plot各水平下观测变量均值折线图第28页,本讲稿共97页(4)应用举例n目的n检验某一个控制因素的改变是否会给观察变量带来显著影响.n例如:n考察不同肥料对某农作物亩产量是否有显著差异.n考察不同学历是否对工资收入产生显著影响.n例“广告地区与销售额.sav”n步骤n【Analyze】【Compare Means】【One-way ANOVA】第29页,本讲稿共97页 实际中对某个结果的影响因素可能有多个而不是唯一的,这时就需要进行双因素甚至于多因素方差分析。双因素方差分析的步骤与单因素方差分析的步骤完全类似,但要特别注意计算 F值时每个因素的自由度的确定原则。第30页,本讲稿共97页三、多因素方差分析n多因素方差分析是用来研究两个或以上控制变量的不同水平是否对观测变量产生显著影响。n多因素方差分析不仅能够分析多个因素对观测变量的独立影响,更能分析多个控制因素的交互作用能否对观测变量的分布产生影响,进而最终找到利于观测变量的最优组合。n如农作物产量(品种、施肥量),进一步分析哪种品种与哪种水平的施肥量是提高农作物产量的最优组合。第31页,本讲稿共97页分析思路n明确观测变量和若干控制变量n固定效应因素(Fixed Factor):指的是该因素在样本中所有可能的水平都出现了。n随机效应因素(Random Factor):该因素所有可能的取值在样本中没有都出现,因此要用样本来推论总体情况,包括未出现的水平。这不可避免的存在误差(即随机效应),需要估计该误差的大小,因此被称为随机因素。第32页,本讲稿共97页1、分析思路n剖析观测变量的方差 控制变量独立作用的影响:单个控制变量独立作用对观测变量的影响 控制变量交互作用的影响:多个控制变量不同水平相互搭配后对观测变量产生的影响 随机因素的影响:抽样误差带来的影响n比较观测变量总离差平方和中各部分的比例n通常:第33页,本讲稿共97页分析思路第34页,本讲稿共97页交互作用的判断A与B无交互作用 A与B有交互作用 A1 A2 A1 A2 B1 2 5 B1 2 5 B2 7 10 B2 7 3第35页,本讲稿共97页2、步骤:(1)建立原假设和备择假设(H0各控制变量不同水平下观测变量各总体的均值无显著差异,控制变量各效应和交互作用效应同时为0)第36页,本讲稿共97页步骤(2)选择检验统计量,计算F和P(3)给定显著性水平,确定临界值;(4)决策。第37页,本讲稿共97页3、应用举例n例“广告地区与销售额.sav”。对广告形式、地区以及广告形式与地区的交互作用是否对商品销售额产生影响进行分析。n步骤n【Analyze】【General Linear Model】【Univariate】第38页,本讲稿共97页4、进一步分析模型选择(饱和、不饱和)对比检验(指定对比检验的检验值)控制变量交互作用图形分析均值比较分析(Lsd法)方差齐性检验第39页,本讲稿共97页(1)模型选择n在饱和模型中,观测变量总的变差被分解为控制变量独立作用、控制变量交互作用以及抽样误差三部分。如果研究发现控制变量的某种交互作用没有给观测变量带来显著影响,就可建立非饱和模型n如两因素的非饱和模型:原来的SSAB被合并到SSE 中第40页,本讲稿共97页(2)其他功能n对比检验(Contrasts):与指定的检验值进行比较n控制变量交互作用的图形分析:反映两控制变量的交互情况n均值检验:(Post Hoc)对各控制变量不同水平下观测变量的均值是否存在显著差异进行比较。第41页,本讲稿共97页(3)应用举例n例“广告地区与销售额.sav”。由前面分析可知:广告形式与地区的交互作用不显著,现进一步建立非饱和模型,并进行均值比较分析和交互作用图形分析。变差分解:Correct Model是X1、X2、X1*X2对应变差的和,是 线性模型整体解释的部分Error是随机因素引起的Correct Total=SST第42页,本讲稿共97页四、协方差分析n目的:n将无法或很难人为控制的因素作为协变量,并,并在排除协变量影响的条件下,分析控制变量(可控)对观测变量的作用,从而更准确地地对因素进行评价。n协方差分析仍然采用方差分析的基本思想,并在分析观测变量时,考虑了协变量的影响,认为观测变量的变动受四个因素的影响:控制变量的独立作用、控制变量的交互作用、协变量的作用和随机因素的作用,并在扣除协变量的影响后,再分析控制变量对观测变量的影响。第43页,本讲稿共97页四、协方差分析n原假设:协变量对观测变量的线性影响是不显著的;在协变量影响扣除下,控制变量各水平下观测变量的总体均值无显著差异,控制变量各水平对观测变量的效应同时为零。n检验统计量F是各均方与随机因素引起的均方的比。相对于随机因素引起的变差,协变量带来的变差比例较大,即F较大,说明协变量是引起观测变量变动的主要因素之一,观测变量的的变动可以部分地由协变量来线性解释n在扣除了协变量的线性影响后,控制变量对观测变量的影响同方差分析第44页,本讲稿共97页四、协方差分析n如何扣除协变量对观测变量的线性影响?n如果将控制变量看作解释变量,观测变量看作被解释变量,那么协方差分析就是介于方差分析和线性回归分析之间的分析方法(要求多个协变量间无交互作用,于是可以参照回归分析中对解释变量的处理方式来处理协变量)。n此外,协方差分析中常常要求多个协变量之间无交互作用,且观测变量与协变量间有显著的线性关系第45页,本讲稿共97页协方差分析n基本思路:n协变量是数值型的;与观测变量的线性关系在各水平均成立,且斜率大致相同。nSSSS总=SS=SS协+SS+SSA A+SS+SSB B+SS+SSABAB+SS+SSe en步骤n【Analyze】【General Linear Model】【Univariate】n注意:在弹出的对话框中将协变量选入【Covariate(s)】栏第46页,本讲稿共97页应用举例n“生猪与饲料.sav”第47页,本讲稿共97页变差分解:Correct Model是X1、X2、X1*X2对应变差的和,是线性模型整体解释的部分Error是随机因素引起的Correct Total=SST输出结果分析第48页,本讲稿共97页4.4 非参数检验n一、单样本非参数检验n二、两独立样本非参数检验n三、多独立样本非参数检验n四、两配对样本非参数检验n五、多配对样本非参数检验第49页,本讲稿共97页一、单样本非参数检验n对单个总体的分布形态等进行推断的方法。第50页,本讲稿共97页1、c2检验:拟合优度检验 (定序数据)【例1】一种饮料的容器材料可以选择玻璃、塑料或者金属。为了比较消费者对包装材料的偏好,抽样调查了120名消费者发现,最喜欢玻璃、塑料和金属容器的分别有55、25和40人。根据调查结果,能否认为消费者对3种材料的偏好程度是无差异的(显著性水平a=0.05)?见“材料种类.sav”第51页,本讲稿共97页检验统计量nH0:样本来自的总体分布与期望分布或某一理论分布无显著差异。n如卡方值较小,说明观测频数分布与期望频数分布接近第52页,本讲稿共97页c2检验:拟合适度检验n例2:据以往经验,机床发生故障的频数服从均匀分布。某车间在一周内统计所有机床发生故障频数资料如下:试问故障频数是否服从均匀分布(0.05)星期一 二 三 四 五 六故障频数7 8 3 9 16 17第53页,本讲稿共97页分析:n原假设:一周内故障频数服从均匀分布,则每日发生故障的概率为1/6由分布表查得6-1;0.05=11.07;由于实际值大于临界值拒绝原假设,认为周内机床发生故障频数不服从均匀分布第54页,本讲稿共97页特别说明n大样本、每个单元中的期望频数大于等于5时可以使用c2分布。n小样本时应该按照精确方法计算得到的p值得出结论。nc2检验也可以按照同样的思想对正态分布或者任何想象的其他分布进行检验,但主要用于对定性变量的检验。另外,c2检验也可以用于对两个总体分布的比较。第55页,本讲稿共97页步骤:nAmalyze Nonparametric Tests Chi-Square Test Variable List待检验变量 Expected Range参与分析的观察值的范围 Expected Values给出各个理论值 第56页,本讲稿共97页软件操作:结果分析观观察察数数期望期望数数残差残差1.005540.015.02.002540.0-15.03.004040.0.0总总数数120材料材料卡方卡方11.25011.250dfdf2 2渐渐近近显显著性著性.004.004精确精确显显著性著性.003.003点概率点概率.000.000n结论:计算出的c2统计量的值为11.250,自由度为2,相应的p值(渐近显著性)为0.004,小于a=0.05。所以检验的结论是拒绝总体中消费者对3种材料的偏好程度无差异的零假设。第57页,本讲稿共97页2、二项分布检验(二值变量)n通过样本数据检验样本来自的总体是否服从指定的概率为p的二项分布。n原假设:样本来自的总体与指定的二项分布无显著差异n步骤:Amalyze Nonparametric Tests Binomialn例子:产品合格率.sav;储户对未来收入的看法.sav(乐观,0.6;保守或悲观,0.4)第58页,本讲稿共97页3、K-S检验(连续变量)n以俄罗斯数学家柯尔莫哥和斯米诺夫的名字命名的。K-S检验利用样本数据推断样本来自的总体是否服从某一理论分布。n是一种拟合优度的检验方法,适用于探索连续性随机变量的分布。n原假设:样本来自的总体与指定的理论分布无显著差异第59页,本讲稿共97页【例】n例:周岁儿童身高.sav。检验能否认为总体中儿童身高服从正态分布(显著性水平a=0.05)。nH0:总体中儿童身高服从正态分布。nH1:总体中儿童身高不服从正态分布。又例:储户存款金额总体分布.sav第60页,本讲稿共97页4、游程检验(变量的随机性检验)n通过对样本变量值的分析,实现对总体的变量值出现是否随机进行检验n变量值随机性检验的重要依据是游程。游程指样本序列中连续出现相同的变量值的次数n游程数太大或太小都表明变量值存在不随机的现象nAmalyze Nonparametric Tests Runs第61页,本讲稿共97页变量的随机性检验:游程检验n游程的抽样分布的均值和方差分别为:n大样本时,游程近似服从正态分布nSPSS自动计算Z统计量和概率P值例:电缆数据.sav第62页,本讲稿共97页二、两独立样本非参数检验n在对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布是否存在显著差异的方法。n独立样本:在一个总体中随机抽样对在另一总体中随机抽样没有影响的情况下所获得的样本。n检验方法:曼-惠特尼U检验;K-S检验;W-W游程检验;极端反应检验等第63页,本讲稿共97页1、曼-惠特尼U检验n用于对两个总体分布的比较判断。通过对两组样本平均秩的研究来实现的n原假设:两组独立样本来自的总体分布无显著差异第64页,本讲稿共97页步骤:将两组样本数据 和 混合并按升序排序,得到每个数据各自的秩分别对各组样本数据的秩求平均,得到两个平均秩 对两个平均秩的差距进行比较计算样本 每个秩优于样本 每个秩的个数 U1 ,以及样本 每个秩优于样本 每个秩的个数 U2,,对U1、U2,进行比较,如相差较大,则有必要怀疑原假设的真实性依据U1、U2计算Wilconxon W统计量和曼-惠特尼U统计量第65页,本讲稿共97页步骤:依据U1、U2计算Wilconxon W统计量和曼-惠特尼U统计量。第66页,本讲稿共97页步骤:第67页,本讲稿共97页2、两独立样本的K-S检验n检验两总体分布是否存在显著差异n原假设:两组独立样本来自的两总体的分布无显著差异n分析步骤:(1)两组样本混合并按升序排列(2)分别计算两组样本秩的累计频数和累计频率(3)计算两组累计频率的差,得到秩的差值序列并得到D统计量nSPSS自动计算在大样本下n如果概率P值小于给定的显著性水平 ,则因拒绝原假设H0。认为两总体的分布有显著差异第68页,本讲稿共97页3、极端反应检验n从另一角度检验两独立样本说来自的两总体分布是否存在显著差异n原假设:两独立样本来自的两个总体的分布无显著差异n基本思路:一组样本作为控制样本,另一组作为实验样本。检验实验样本相对于控制样本是否出现了极端反映。如未出现,则认为两总体分布无显著差异第69页,本讲稿共97页步骤(1)两组样本混合按升序排序(2)求出控制样本的最小秩 和最大秩 并计算出跨度(Span):(3)为消除样本数据中极端值对分析结果的影响,在计算跨度之前可按比例(通常为5%)去除控制样本中部分靠近两端的样本值,然后再求跨度,得到截头跨度n如(截头)跨度较小,则是两样本数据无法充分混合,一组样本值显著大于另一组样本值的结果,可以认为相对于控制样本,实验样本出现了极端反应,样本来自的两总体分布存在显著差异。n针对(截头)跨度计算H检验统计量,即:第70页,本讲稿共97页4、两独立样本的游程检验n检验两独立样本来自的两总体的的分布是否无显著差异。n原假设:两组样本来自的两总体的分布无显著差异n步骤:(1)两组样本混合并按升序排列(2)对組标记值序列计算游程数;如两总体分布存在较大差距,那么游程数会相对较少;如游程数比较大,则应是两组样本值充分混合的结果,两总体的分布不会存在显著差异(3)根据游程数计算Z统计量,该统计量近似服从正态分布第71页,本讲稿共97页5、应用举例n两种不同工艺下产品的使用寿命数据,判断其分布是否存在显著差异,进而对两种工艺的优劣进行评价。(显著性水平a=0.05)。“使用寿命.savnH0:两种工艺的使用寿命无显著差异;H1:两种工艺的使用寿命差异显著。n操作:Analyze Nonparametric Tests 2 Independent Samples第72页,本讲稿共97页分析n在弹出的对话框中将“使用寿命”设定为检验变量,“工艺”设定为分组变量,然后单击“定义组”,按照“工艺”的取值进行设定,然后单击“继续”,检验类型使用默认“Mann-Whitney U”,单击“确定”第73页,本讲稿共97页结果分析根据精确检验的p值,在显著性水平大于0.002时我们应该拒绝原假设,结论是本科与研究生的收入的中位数不相等。第74页,本讲稿共97页三、多独立样本的非参数检验通过分析多组独立样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异检验方法:Kruskal-Wallis检验、中位数检验、Jonckheere-Terpstra检验等第75页,本讲稿共97页1、Kruskal-Walls检验n是两独立样本的曼-惠特尼U检验在多个独立样本下的推广n原假设:多个独立样本来自的多个总体的分布无显著差异n基本思想:先将多组样本数据混合并按升序排列,求出个变量的秩;然后,考察各组秩的均值是否存在显著差异n为研究各组秩的差异可借鉴方差分析法第76页,本讲稿共97页Kruskal-Walls检验n方差分析法认为,各样本组秩的总变差一方面来源于不同样本组之间的差异(组间差),另一方面来源于各样本组内的抽样误差(组内差)。如各样本组秩的总变差的大部分可由组间差解释,则表明确实各样本组的总体分布存在显著差异。n基于此,可构造K-W检验统计量第77页,本讲稿共97页Kruskal-Walls检验第78页,本讲稿共97页2、中位数检验n通过对多组独立样本的分析,检验他们来自的总体的中位数是否存在显著差异。n原假设:多个独立样本来自的多个总体的中位数无显著差异n基本思想:如多个总体的中位数无显著差异,或者说多个总体有共同的中位数,那么这个共同的中位数应在各样本组中均处在中间位置上。于是,每组样本中大于或小于该中位数的样本数目应大致相同第79页,本讲稿共97页中位数检验n分析步骤:(1)多组样本混合并按升序排列;(2)分别计算各组样本中大于或小于上述中位数的样本个数;(3)利用卡方检验分析各组样本来自的总体对于上述中位数的分布是否一致;第80页,本讲稿共97页3、Jonckheere-Terpstra检验n检验多个独立样本来自的多个总体的分布是否存在显著差异n原假设:多个独立样本来自的多个总体的分布无显著差异n基本思路:两独立样本的曼-惠特尼U检验类似。计算一组样本的观察值小于其他组样本的观察值的个数第81页,本讲稿共97页4、例:多城市儿童身高.sav。n判断多城市周岁儿童的身高分布是否存在显著差异n操作:Amalyze Nonparametric Tests K Independent Samplesn将“周岁儿童身高”设定为检验变量,“城市”设定为分组变量,然后单击“定义组”,检验类型使用默认“Kruskal-Wallis H”,单击“确定”第82页,本讲稿共97页结果分析n结论:p值为0.003。由于p值很小,所以有理由拒绝原假设,即认为这四个城市儿童身高分布差异显著。第83页,本讲稿共97页特别说明n在样本量较小时,应当使用精确检验的结果,根据c2分布进行近似会有较大的误差。n严格来说用Kruskal-Wallis检验对多个总体的中位数进行假设检验,需要假多个总体分布有类似的形状才能得出可靠的结论。第84页,本讲稿共97页四、两配对样本的非参数检验n是在对总体分布不甚了解的情况下,通过对两组配对样本的分析,推断样本来自的两个总体的分布是否存在显著差异的方法。n检验方法:Wilcoxon检验、符号检验、McNemar检验等第85页,本讲稿共97页1、Wilcoxon检验n基本思路:用第二组样本的各观察值减去第一组样本的各观察值,差值为正则记正号,差值为负则记负号,并同时保存差值数据;然后将差值变量按升序排列,求出差值变量的秩;最后分别计算正号秩总和 和负号秩总和n如果总样本数为n,则 +的最小可能值为0,最大可能值为第86页,本讲稿共97页Wilcoxon检验n如果正号秩总和与负号秩总和大致相当,说明两组样本数据差的正负变化程度基本相当,两配对总体的分布无显著差异n在H0成立下,小样本的检验统计量n在H0成立下,在大样本下利用W可构造Z统计量,它近似服从正态分布第87页,本讲稿共97页2、符号检验nH0:配对样本所来自的总体的分布无显著差异n同两配对样本McNemar检验有类似的解决思路,且利用正负符号的个数实现检验。(1)用第二组样本的各观察值减去第一组样本的各观察值,差值为正则记正号,差值为负则记负号(2)将正号的个数与负号的个数进行比较第88页,本讲稿共97页3、McNemar检验(二值变量)n是一种变化显著性检验,它将研究对象自身作为对照者检验其“前后”的变化是否显著。n原假设:两配对样本来自的两总体的分布无显著差异n如:McNemar列联表学学习习后后学学习习前前不重要(不重要(0)重要(重要(1)不重要(不重要(0)AB重要(重要(1)CD第89页,本讲稿共97页4、举例n例:统计学学习.sav;McNemar检验n训练成绩.sav(符号检验和Wilcoxon检验)n操作:Amalyze Nonparametric Tests 2 Paired Samples第90页,本讲稿共97页五、多配对样本的非参数检验通过分析多组配对样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异检验方法:Friedman检验、Kendall协同系数检验、Cochran Q检验等第91页,本讲稿共97页1、Friedman检验:定距型数据n利用秩实现对多个总体分布是否存在显著差异。nH0:多个配对样本来自的多个总体的分布无显著差异n基本思想:第92页,本讲稿共97页2、Kendall协同系数检验n与Friedman检验方法相结合,可方便地实现对评判者的评价标准是否一致的分析nH0:评价者的评判标准不一致。第93页,本讲稿共97页Kendall协同系数检验第94页,本讲稿共97页3、Cochran Q检验(二值品质变量)n基本思想:认为每行中取1的个数是确定的第95页,本讲稿共97页4、举例n操作:Amalyze Nonparametric Tests K Paired Samplesn例:促销方式.sav Friedman检验 评委打分.sav Kendall检验 航空公司.sav Cochrans Q检验 第96页,本讲稿共97页思考题n假设检验的基本原理是什么?你是如何理解的?n假设检验的基本步骤有哪些?n假设检验的内容是什么?第97页,本讲稿共97页

    注意事项

    本文(第四讲 假设检验优秀课件.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开