第四讲 假设检验优秀PPT.ppt
《第四讲 假设检验优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第四讲 假设检验优秀PPT.ppt(97页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四讲 假设检验第一页,本课件共有97页例子n开发研制的新药对治疗某种特定疾病的效果n水稻亩产量的影响因素分析n心脏病猝死与日期的关系(2.8:1:1:1:1:1:1)n产品自动生产线工作是否正常?n某种新生产方法是否会降低产品成本?n厂商声称产品质量符合标准,是否可信?第二页,本课件共有97页案例n澳大利亚统计局公布的2003年第一季度失业率为6.1%。而Roy Morgan公司在调查了14656名14岁以上的居民以后得到的失业率为7.8%。你认为Roy Morgan的结果显著高于统计局的数字吗?n美国劳工局公布的数字表明,1998年11月美国的平均失业时间为14.6周。在费城市市长的要求下
2、进行的一项研究调查了50名失业者,平均失业时间为15.54周。根据调查结果能否认为费城的平均失业时间高于全国平均水平?第三页,本课件共有97页样本推断总体的情况n总体分布已知的情形下,根据样本数据对总体分布的统计参数进行推断(估计或检验)n总体分布未知的情形,根据样本数据对总体的分布形式或特征进行推断第四页,本课件共有97页参数假设检验与非参数假设检验n参数假设检验:已知总体分布(给定或假定),猜到总体某个参数的数值(H0),那么这种猜测对不对?需要用一组样本信息来判断。,效率高。有一个总体、两个总体和多个总体的参数检验。n非参数假设检验:又称分布检验。在总体分布未知或知之甚少的情况下,用样本
3、数据对总体分布形态等进行推断。猜出总体分布(H0),用一组样本来检验该假设是否正确。即假设总体服从 ,用样本信息推断总体是否服从某理论分布。检验条件较宽松,适应性强,但功效较低。(含总体的分布类型检验及独立性检验等)第五页,本课件共有97页假设检验内容第六页,本课件共有97页4.1 假设检验的基本问题假设检验的基本问题一、假设检验的基本原理一、假设检验的基本原理 二、假设检验的基本步骤二、假设检验的基本步骤三、假设检验的两类错误三、假设检验的两类错误四、利用四、利用P-Value进行检验进行检验第七页,本课件共有97页4.2 参数检验一、总体均值的假设检验一、总体均值的假设检验二、总体比例的假
4、设检验二、总体比例的假设检验三、总体方差的假设检验三、总体方差的假设检验第八页,本课件共有97页4.3 方差分析 主要应用在在农业、商业、医学、社会学、经济学等诸多领域 一、方差分析的基本问题 二、单因素方差分析 三、多因素方差分析 四、协方差分析第九页,本课件共有97页一、方差分析的基本原理n意义:是英国统计学家费歇(R.A.Fisher)20世纪20年代提出,某变量受多种不同因素不同程度的影响,哪些因素有显著影响,通过方差分析来解决。n核心问题n从数据差异角度看:观测变量的数据差异 =控制因素造成+随机因素造成n影响某农作物亩产量的因素n方差分析正是要分析观测变量的变动是主要由控制因素造成
5、还是由随机因素造成的,以及控制变量的各个水平是如何对观测变量造成影响的。第十页,本课件共有97页一、方差分析的基本原理n基本思路:通过实验或调查,取得不同因素不同水平条件下被考察的随机变量(因变量)的样本;利用样本构造统计量,检验不同条件下的因变即几个不同的总体的均值是否相等,如果均值相等的假设被接受,说明因素及水平对因变量的影响不显著。n方差分析:从观察变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。对观测变量有显著影响的各控制变量其不同水平以及各水平的交互搭配是如何影响观测变量的。第十一页,本课件共有97页一、方差分析的基本原理n方差分析实际上是通过推断控制变量各水
6、平下观测变量的总体分布是否有显著差异来实现的,1、假定:n观测变量各总体服从正态分布n观测变量各总体的方差相同n基于上述假定,方差分析对个总体分布是否有显著差异的推断就转化成对各总体均值是否存在显著差异的推断。第十二页,本课件共有97页因素(Factor):方差分析的对象因素水平(Factor level):因素的内容方差分析:针对一定因素(Factor)分析各总体的各个因素水平(Factor level)是否有差异。单因素方差分析(One-Way analysis of variance):针对一个因素所进行的双因素方差分析(Two-Way analysis of variance):针对两
7、个因素进行的。多因数方差分析:涉及两个以上的因数。基本原理基本原理第十三页,本课件共有97页2、观测值间差异n观察值之间存在的差异主要来自于:n组间方差:因素的不同水平造成的,主要是系统性误差,也包括随机因素的影响,用水平间方差来解释。如饮料的不同颜色带来不同的销售量n组内方差:抽选样本的随机性而产生,是随机因素的影响,通过水平内方差来显示。如相同颜色饮料在不同商场销售量不同。n总离差平方和=组间离差平方和+组内离差平方和第十四页,本课件共有97页观测值间差异n总离差平方和=组间离差平方和+组内离差平方和(即SST=SSA+SSE)n构建统计量:统计学家R.A.Fisher(18901962)
8、提出的,叫 分布n若比值近似为1,控制变量影响不显著,即不拒绝H0;若比值偏离1,方差分析的结果可以得到总体均值不相同。因此方差分析就是通过不同方差的比较,做出接受或拒绝原假设的判断。第十五页,本课件共有97页3、方差分析的步骤n建立方差分析模型n检查方差分析的前提条件是否成立n建立检验的原假设和备释假设n根据样本值计算检验统计量n作出方差分析表n根据F检验结果作出推断第十六页,本课件共有97页4、方差分析的内容n单因素方差分析n多因素方差分析n协方差分析第十七页,本课件共有97页基本思想:单因素方差分析是只针对一个因素进行,用来研究一个控制变量的不同水平是否对观测变量产生显著影响,旨在分析该
9、因素对样本的观察值是否产生影响,各因素水平的样本容量大小可以一致,也可以不一致。二、单因素方差分析第十八页,本课件共有97页举例:消费者对行业的投诉次数如下,消费者协会想知道这几个行业之间的服务质量是否有显著差异?试验号行业(因数水平)零售业旅游业航空公司家电制造业123455766494034683929455631492134404451657758第十九页,本课件共有97页第二十页,本课件共有97页1、分析思路n明确观测变量和控制变量n剖析观测变量的方差第二十一页,本课件共有97页2、步骤n比较观测变量总离差平方和中各部分的比例n单因素方差分析一般分为四步:(1)建立原假设和备择假设;(
10、H0控制变量不同水平下观测变量各总体的均值无显著差异)(2)选择检验统计量,计算F和P;(3)给定显著性水平,确定临界值;(4)决策。第二十二页,本课件共有97页3、应用举例n例“广告地区与销售额.sav”Analyze Compare Means One-Way ANOVE第二十三页,本课件共有97页4、进一步分析nAnalyze Compare Means One-Way ANOVE对比检验(先验对比和趋势检验)多重比较检验方差齐性检验第二十四页,本课件共有97页(1)Contrasts检验n先验对比检验能更精确地掌握各水平间或相似子集间均值的差异程度n趋势检验(polynominal):
11、分析随控制变量水平的变化,观测变量值变化的总体趋势是怎样的。线性、二次、三次等?从另一角度把握控制变量不同水平对观测变量总体作用的程度第二十五页,本课件共有97页(2)Post Hoc多重比较n当方差分析检验的结果拒绝原假设时,只能得到各水平间的样本均值不完全相同的结论。n如果要想明确是哪一个因素水平的均值或哪几个同其他均值不相等,就需要进行多重比较。n进一步确定控制变量的不同水平对观测变量的影响程度,哪个水平的作用明显区别于其他水平,哪个水平作用不显著等第二十六页,本课件共有97页Post Hoc多重比较n目的n如果总体均值存在差异,F检验不能说明哪个水平造成了观察变量的显著差异。多重比较将
12、对每个水平的均值逐对进行比较检验。n常用方法nLSD法(适用于总体方差相等的情形,检验敏感度最高)n实际上就是t检验的变形,只是在变异和自由度的计算上利用了整个样本信息。nBonferroni方法(对犯第一类错误进行了控制)nTukey法;Scheffe法;S-N-K法第二十七页,本课件共有97页(3)Options方差齐性n对控制变量不同水平下各观测变量总体方差是否相等进行分析(即方差齐性检验),同两独立样本t检验的方差检验。即控制变量不同水平下各观测变量总体方差是否相nHomogeneity of variance实现方差齐性检验。nDescriptive基本描述统计量nMeans Plo
13、t各水平下观测变量均值折线图第二十八页,本课件共有97页(4)应用举例n目的n检验某一个控制因素的改变是否会给观察变量带来显著影响.n例如:n考察不同肥料对某农作物亩产量是否有显著差异.n考察不同学历是否对工资收入产生显著影响.n例“广告地区与销售额.sav”n步骤n【Analyze】【Compare Means】【One-way ANOVA】第二十九页,本课件共有97页 实际中对某个结果的影响因素可能有多个而不是唯一的,这时就需要进行双因素甚至于多因素方差分析。双因素方差分析的步骤与单因素方差分析的步骤完全类似,但要特别注意计算 F值时每个因素的自由度的确定原则。第三十页,本课件共有97页三
14、、多因素方差分析n多因素方差分析是用来研究两个或以上控制变量的不同水平是否对观测变量产生显著影响。n多因素方差分析不仅能够分析多个因素对观测变量的独立影响,更能分析多个控制因素的交互作用能否对观测变量的分布产生影响,进而最终找到利于观测变量的最优组合。n如农作物产量(品种、施肥量),进一步分析哪种品种与哪种水平的施肥量是提高农作物产量的最优组合。第三十一页,本课件共有97页分析思路n明确观测变量和若干控制变量n固定效应因素(Fixed Factor):指的是该因素在样本中所有可能的水平都出现了。n随机效应因素(Random Factor):该因素所有可能的取值在样本中没有都出现,因此要用样本来
15、推论总体情况,包括未出现的水平。这不可避免的存在误差(即随机效应),需要估计该误差的大小,因此被称为随机因素。第三十二页,本课件共有97页1、分析思路n剖析观测变量的方差 控制变量独立作用的影响:单个控制变量独立作用对观测变量的影响 控制变量交互作用的影响:多个控制变量不同水平相互搭配后对观测变量产生的影响 随机因素的影响:抽样误差带来的影响n比较观测变量总离差平方和中各部分的比例n通常:第三十三页,本课件共有97页分析思路第三十四页,本课件共有97页交互作用的判断A与B无交互作用 A与B有交互作用 A1 A2 A1 A2 B1 2 5 B1 2 5 B2 7 10 B2 7 3第三十五页,本
16、课件共有97页2、步骤:(1)建立原假设和备择假设(H0各控制变量不同水平下观测变量各总体的均值无显著差异,控制变量各效应和交互作用效应同时为0)第三十六页,本课件共有97页步骤(2)选择检验统计量,计算F和P(3)给定显著性水平,确定临界值;(4)决策。第三十七页,本课件共有97页3、应用举例n例“广告地区与销售额.sav”。对广告形式、地区以及广告形式与地区的交互作用是否对商品销售额产生影响进行分析。n步骤n【Analyze】【General Linear Model】【Univariate】第三十八页,本课件共有97页4、进一步分析模型选择(饱和、不饱和)对比检验(指定对比检验的检验值)
17、控制变量交互作用图形分析均值比较分析(Lsd法)方差齐性检验第三十九页,本课件共有97页(1)模型选择n在饱和模型中,观测变量总的变差被分解为控制变量独立作用、控制变量交互作用以及抽样误差三部分。如果研究发现控制变量的某种交互作用没有给观测变量带来显著影响,就可建立非饱和模型n如两因素的非饱和模型:原来的SSAB被合并到SSE 中第四十页,本课件共有97页(2)其他功能n对比检验(Contrasts):与指定的检验值进行比较n控制变量交互作用的图形分析:反映两控制变量的交互情况n均值检验:(Post Hoc)对各控制变量不同水平下观测变量的均值是否存在显著差异进行比较。第四十一页,本课件共有9
18、7页(3)应用举例n例“广告地区与销售额.sav”。由前面分析可知:广告形式与地区的交互作用不显著,现进一步建立非饱和模型,并进行均值比较分析和交互作用图形分析。变差分解:Correct Model是X1、X2、X1*X2对应变差的和,是 线性模型整体解释的部分Error是随机因素引起的Correct Total=SST第四十二页,本课件共有97页四、协方差分析n目的:n将无法或很难人为控制的因素作为协变量,并,并在排除协变量影响的条件下,分析控制变量(可控)对观测变量的作用,从而更准确地地对因素进行评价。n协方差分析仍然采用方差分析的基本思想,并在分析观测变量时,考虑了协变量的影响,认为观测
19、变量的变动受四个因素的影响:控制变量的独立作用、控制变量的交互作用、协变量的作用和随机因素的作用,并在扣除协变量的影响后,再分析控制变量对观测变量的影响。第四十三页,本课件共有97页四、协方差分析n原假设:协变量对观测变量的线性影响是不显著的;在协变量影响扣除下,控制变量各水平下观测变量的总体均值无显著差异,控制变量各水平对观测变量的效应同时为零。n检验统计量F是各均方与随机因素引起的均方的比。相对于随机因素引起的变差,协变量带来的变差比例较大,即F较大,说明协变量是引起观测变量变动的主要因素之一,观测变量的的变动可以部分地由协变量来线性解释n在扣除了协变量的线性影响后,控制变量对观测变量的影
20、响同方差分析第四十四页,本课件共有97页四、协方差分析n如何扣除协变量对观测变量的线性影响?n如果将控制变量看作解释变量,观测变量看作被解释变量,那么协方差分析就是介于方差分析和线性回归分析之间的分析方法(要求多个协变量间无交互作用,于是可以参照回归分析中对解释变量的处理方式来处理协变量)。n此外,协方差分析中常常要求多个协变量之间无交互作用,且观测变量与协变量间有显著的线性关系第四十五页,本课件共有97页协方差分析n基本思路:n协变量是数值型的;与观测变量的线性关系在各水平均成立,且斜率大致相同。nSSSS总=SS=SS协+SS+SSA A+SS+SSB B+SS+SSABAB+SS+SSe
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四讲 假设检验优秀PPT 第四 假设检验 优秀 PPT
限制150内