2012下-第6章-SPSS的方差分析.ppt
《2012下-第6章-SPSS的方差分析.ppt》由会员分享,可在线阅读,更多相关《2012下-第6章-SPSS的方差分析.ppt(110页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1统计软件及其应用统计软件及其应用第六章第六章 SPSS的方差分析的方差分析授课教师:杨小宝授课教师:杨小宝 副教授副教授北京交通大学北京交通大学 交通运输学院交通运输学院2012.112品质变量品质变量X数值型变量数值型变量X品质变量Y交叉列联表、交叉列联表、对应分析、对应分析、对数线性模型对数线性模型Logistic回归回归数值型变量Y方差分析方差分析相关与回归分相关与回归分析析3SPSS的方差分析的方差分析6.1 方差分析概述方差分析概述6.2 单因素方差分析单因素方差分析6.3 多因素方差分析多因素方差分析6.4 协方差分析协方差分析6.5 方差分析中的其它问题方差分析中的其它问题46
2、.1.1 方差分析的作用6.1.2 相关概念6.1.3 方差分析的原理6.1 方差分析概述方差分析概述56.1.1方差分析的作用在在工工农农业业生生产产中中产产量量的的高高低低、质质量量的的优优劣劣,经经济济管管理理中中效效果果的的好好坏坏等等,往往往往是是由由许许多多因因素素所所至至。这这就就要要从从众众多多因因素素中中找找出出主主要要因因素素,分分析析该该因因素素处处在在何何种种状状态态时时,使使产产量量高高、质质量量优优、管管理理效效果果好好。要要解解决决这这类类问题:问题:设计一个试验(试验设计);设计一个试验(试验设计);如如何何分分析析多多因因素素多多状状态态下下试试验验结结果果的
3、的差差异异性?性?6 当当两两个个总总体体方方差差相相等等时时,可可用用 t 检检验验来来检检验验两两个个总总体体均均值值间间的的差差异异性性;当当总总体体是是三三个个或或三三个个以以上上时时如如何何检检验验呢呢?就就要要用用本本章章的的方方差差分分析析。它它是是在在二二十十世世纪纪20 年年代代由由英英国国著著名名统统计计学学家家R.Fisher首首先先应应用用到到农农业业试验中的。试验中的。方方差差分分析析的的作作用用:从从方方差差的的角角度度分分析析试试验验数数据据、判判断断各各因因素素各各状状态态对对试试验验结结果果影影响响大小。大小。7方差分析的一个例子方差分析的一个例子 在在诸诸多
4、多领领域域的的数数量量分分析析研研究究中中,找找到到众众多多影影响响因因素素中中重重要要的的影影响响因因素素是是非非常常重重要要的的。比比如如:在在农农业业生生产产中中,我我们们总总是是希希望望在在尽尽量量少少的的投投入入成成本本下下得得到到较较高高的的农农作作物物产产量量。种种子子的的品品种种、施施肥肥量量、气气候候、地地域域等等,他他们们都都会会给给农农作作物物的的产产量量带带来来或或多多或或少少的的影影响响。我我们们需需要要首首先先分分析析在在众众多多的的影影响响因因素素中中,哪哪些些因因素素对对农农作作物物的的产产量量起起到到了了主主要要的的、关关键键性性的的作作用用,据据此此可可以以
5、根根据据实实际际情情况况对对这这些些关关键键因素加以控制。因素加以控制。8 进进一一步步,在在掌掌握握关关键键影影响响因因素素,如如品品种种、施施肥肥量量因因素素等等之之后后,我我们们还还要要对对不不同同的的品品种种、不不同同的的施施肥肥量量条条件件下下的的产产量量进进行行对对比比分分析析,研研究究究究竟竟哪哪个个品品种种的的产产量量高高,施施肥肥量量究究竟竟多多少少最最合合适适,哪哪种种品品种种与与哪哪种种施施肥肥量量搭搭配配最最优优,等等等等。在在这这些些分分析析研研究究的的基基础础上上,我我们们就就可可以以计计算算出出各各个个组组合合方方案案的的成成本本和和收收益益,并并选选择择最最合合
6、理理的的种种植植方方案案,主主动动的的在在农农作作物物种种植植过过程程中中对对各各种种影影响响因因素素加加以以准准确确控控制制,进进而而获获得得最最理理想想的的效果。效果。9方差分析的另一个例子方差分析的另一个例子表表8-1 该饮料在五家超市的销售情况该饮料在五家超市的销售情况超市超市无色无色粉色粉色橘黄色橘黄色绿色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8【例例例例】某某某某饮饮饮饮料料料料生生生生产产产产企企企企业业业业研研研研制制制制出出出出一一一一种种种种
7、新新新新型型型型饮饮饮饮料料料料。饮饮饮饮料料料料的的的的颜颜颜颜色色色色共共共共有有有有四四四四种种种种,分分分分别别别别为为为为橘橘橘橘黄黄黄黄色色色色、粉粉粉粉色色色色、绿绿绿绿色色色色和和和和无无无无色色色色透透透透明明明明。这这这这四四四四种种种种饮饮饮饮料料料料的的的的营营营营养养养养含含含含量量量量、味味味味道道道道、价价价价格格格格、包包包包装装装装等等等等可可可可能能能能影影影影响响响响销销销销售售售售量量量量的的的的因因因因素素素素全全全全部部部部相相相相同同同同。现现现现从从从从地地地地理理理理位位位位置置置置相相相相似似似似、经经经经营营营营规规规规模模模模相相相相仿仿
8、仿仿的的的的五五五五家家家家超超超超级级级级市市市市场场场场上上上上收收收收集集集集了了了了前前前前一一一一时时时时期期期期该该该该饮饮饮饮料料料料的的的的销销销销售售售售情情情情况况况况,见见见见表表表表5-15-15-15-1。试试试试分分分分析析析析饮饮饮饮料料料料的的的的颜颜颜颜色色色色是是是是否对销售量产生影响。否对销售量产生影响。否对销售量产生影响。否对销售量产生影响。10例子的进一步分析例子的进一步分析1.1.检检验验饮饮料料的的颜颜色色对对销销售售量量是是否否有有影影响响,也也就就是是检验四种颜色饮料的平均销售量是否相同检验四种颜色饮料的平均销售量是否相同2.2.设设 1 1为
9、为无无色色饮饮料料的的平平均均销销售售量量,2 2粉粉色色饮饮料料的的平平均均销销售售量量,3 3为为橘橘黄黄色色饮饮料料的的平平均均销销售售量量,4 4为为绿绿色色饮饮料料的的平平均均销销售售量量,也也就就是是检检验验下下面面的假设的假设H H0 0:1 1 2 2 3 3 4 4 H H1 1:1 1,2 2,3 3,4 4 不全相等不全相等3.3.检验上述假设所采用的方法就是方差分析检验上述假设所采用的方法就是方差分析111、控制因素和随机因素、控制因素和随机因素 在所有的影响因素中可以分为两类:在所有的影响因素中可以分为两类:一一类类是是人人为为可可以以控控制制的的因因素素,称称为为控
10、控制制因因素素或或控控制制变变量量,如如种种子子品品种种的的选选定定,施施肥肥量量的的多少;多少;另另一一类类因因素素是是认认为为很很难难控控制制的的因因素素,称称为为随随机机因因素素或或随随机机变变量量,如如气气候候和和地地域域等等影影响响因因素素。在在多多数数情情况况下下随随机机因因素素指指的的是是实实验验过过程程中的抽样误差。中的抽样误差。6.1.2 相关概念12方差分析的几个基本概念方差分析的几个基本概念2 2、因子因子-控制因素控制因素/变量变量所要检验的对象称为控制因素所要检验的对象称为控制因素/变量或因子变量或因子要要分分析析饮饮料料的的颜颜色色对对销销售售量量是是否否有有影影响
11、响,颜颜色是要检验的因素或因子色是要检验的因素或因子3 3、水平水平控制变量的不同取值称为水平控制变量的不同取值称为水平A A1 1、A A2 2、A A3 3、A A4 4四种颜色就是因素的水平四种颜色就是因素的水平4 4、观察值观察值在每个因素水平下得到的样本值在每个因素水平下得到的样本值每种颜色饮料的销售量就是观察值每种颜色饮料的销售量就是观察值13方差分析中的基本假定方差分析中的基本假定1.每个总体都应服从正态分布每个总体都应服从正态分布对对于于因因素素的的每每一一个个水水平平,其其观观察察值值是是来来自自服服从从正正态分布总体的简单随机样本态分布总体的简单随机样本比如,每种颜色饮料的
12、销售量必需服从正态分布比如,每种颜色饮料的销售量必需服从正态分布2.各个总体的方差必须相同各个总体的方差必须相同对对于于各各组组观观察察数数据据,是是从从具具有有相相同同方方差差的的总总体体中中抽取的抽取的比如,四种颜色饮料的销售量的方差都相同比如,四种颜色饮料的销售量的方差都相同3.观察值是独立的观察值是独立的比比如如,每每个个超超市市的的销销售售量量都都与与其其他他超超市市的的销销售售量量独立独立14 方差分析认为,方差分析认为,如果控制变量的不同水平如果控制变量的不同水平对观测变量产生了显著影响,那么它和随机对观测变量产生了显著影响,那么它和随机变量共同作用必然使得观测变量值显著变动变量
13、共同作用必然使得观测变量值显著变动;反之,如果控制变量的不同水平没有对观;反之,如果控制变量的不同水平没有对观测变量产生显著影响,那么观测变量值的变测变量产生显著影响,那么观测变量值的变动就不明显,其变动可以归结为随机变量影动就不明显,其变动可以归结为随机变量影响造成的。响造成的。6.1.3 方差分析的原理15 根据控制变量的个数可将方差分析分为单根据控制变量的个数可将方差分析分为单因素方差分析、多因素方差分析;根据观测因素方差分析、多因素方差分析;根据观测变量的个数可将方差分析分为一元方差分析变量的个数可将方差分析分为一元方差分析(单因变量方差分析)和多元方差分析(多(单因变量方差分析)和多
14、元方差分析(多因变量方差分析)。因变量方差分析)。166.2 单因素方差分析单因素方差分析6.2.1 基本思想6.2.2 基本步骤6.2.3 基本操作6.2.4 应用举例6.2.5 进一步分析6.2.6 应用举例的进一步分析176.2.1 基本思想1 1、定义、定义:单因素方差分析用来研究单因素方差分析用来研究一个控制一个控制变量的不同水平是否对观测变量产生了变量的不同水平是否对观测变量产生了显著影响显著影响。例如:分析不同施肥量是否。例如:分析不同施肥量是否给农作物的产量产生显著影响;研究不给农作物的产量产生显著影响;研究不同学历是否对工资收入产生显著影响等。同学历是否对工资收入产生显著影响
15、等。182 2、观测变量方差的分解、观测变量方差的分解将观测变量总的离差平方和分解为组间离将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,分别表差平方和和组内离差平方和两部分,分别表示为:示为:其中,其中,SST为观测变量的总离差平方和;为观测变量的总离差平方和;SSA为组间离差平方和,是由控制变量不同为组间离差平方和,是由控制变量不同水平造成的观测变量的变差;水平造成的观测变量的变差;SSE为组内平为组内平方和,是由抽样误差引起的观测变量的变差。方和,是由抽样误差引起的观测变量的变差。19其中:其中:它反映了观测数据它反映了观测数据总的变异程度总的变异程度反反映映因因子子
16、A A的的不不同同水水平效应间的差异平效应间的差异反映了随机误差反映了随机误差 ijij 对响应值影响的总和对响应值影响的总和20各离差平方和的计算各离差平方和的计算-例题例题职称职称1 11 11 12 22 22 22 23 3基本工资基本工资101410141044104410141014984984859859989989889889866866职称职称3 33 33 33 33 34 44 44 4基本工资基本工资84884882782793893888788788788782482482482482482421 在在观观测测变变量量总总离离差差平平方方和和中中,如如果果组组间间离离
17、差差平平方方和和所所占占比比例例较较大大,则则说说明明观观测测变变量量的的变变动动主主要要是是由由于于控控制制变变量量引引起起的的,可可以以主主要要由由控控制制变变量量来来解解释释,即即控控制制变变量量给观测变量带来了显著影响。给观测变量带来了显著影响。3 3、比较观测变量总离差平方和各、比较观测变量总离差平方和各部分的比例部分的比例22这这里里我我们们用用F统统计计量量来来表表示示这这种种比比例例关关系系,如如果果控控制制变变量量的的不不同同水水平平对对观观测测变变量量造造成成了了显显著著影影响响,那那么么观观测测变变量量总总变变差差中中控控制制变变量量所所占占的的比比例例较较大大,则则F值
18、值就就比比较较大大;反反之之,如如果果控控制制变变量量的的不不同同水水平平对对观观测测变变量量没没有有造造成成显显著著影影响响,那那么么观观测测变变量量总总变变差差中中控控制制变变量所占的比例较小,则量所占的比例较小,则F值就比较小。值就比较小。23单因素方差分析表单因素方差分析表(基本结构基本结构)方差来源方差来源平方和平方和SS自由度自由度df均方均方MSF值值 因素因素A误差误差总和总和SSASSESSTk-1n-kn-1MSAMSEF对给定的显著性水平对给定的显著性水平,若若 FF1-(k-1,n-k),则拒绝则拒绝H0。24F分布与拒绝域分布与拒绝域如果均值相等,如果均值相等,如果均
19、值相等,如果均值相等,如果均值相等,如果均值相等,F F F=MSAMSAMSA/MSEMSEMSE1 1 1 F 分布分布F1-(k-1,n-k)0 0拒绝拒绝拒绝拒绝HH0 0不能拒绝不能拒绝不能拒绝不能拒绝H H H H0 0 0 0F F25提出原假设:控制变量不同水平下观测变量各提出原假设:控制变量不同水平下观测变量各总体的均值无显著差异总体的均值无显著差异计算检验统计量和计算检验统计量和P P值值 给定显著性水平与给定显著性水平与p p值做比较:如果值做比较:如果p p值小于显值小于显著性水平,则应该拒绝原假设,反之就不能拒著性水平,则应该拒绝原假设,反之就不能拒绝原假设。绝原假设
20、。6.2.2 基本步骤26在利用在利用SPSS进行单因素方差分析时,应注意数据的组进行单因素方差分析时,应注意数据的组织形式。织形式。SPSS要求定义两个变量分别存放观测变量值要求定义两个变量分别存放观测变量值和控制变量的水平值。基本操作步骤如下:和控制变量的水平值。基本操作步骤如下:1、选择菜单、选择菜单AnalyzeCompare meansOne-Way ANOVA,出现窗口,出现窗口6.2.3 基本操作272、将将观观测测变变量量选选择择到到因因变变量量列列表表Dependent List框框。3、将将控控制制变变量量选选择择到到因因子子Factor框框。控控制制变变量量有几个不同的取
21、值表示其有几个水平。有几个不同的取值表示其有几个水平。至此,至此,SPSS便自动分解观测变量的方差便自动分解观测变量的方差,计算组间方差、组内方差、,计算组间方差、组内方差、F统计量以及对统计量以及对应的概率应的概率p值,完成单因素方差分析的相关计值,完成单因素方差分析的相关计算,并将结果显示到输出窗口中。算,并将结果显示到输出窗口中。28 某企业在制订某商品的广告策略时,对不某企业在制订某商品的广告策略时,对不同广告形式在不同地区的广告效果(销售同广告形式在不同地区的广告效果(销售额)进行了评估。这里以商品销售额为观额)进行了评估。这里以商品销售额为观测变量,广告形式和地区为控制变量,通测变
22、量,广告形式和地区为控制变量,通过单因素方差分析方法分别对广告形式、过单因素方差分析方法分别对广告形式、地区对销售额的影响进行方差分析。地区对销售额的影响进行方差分析。6.2.4 应用举例1、分析广告形式、分析广告形式对销售额的影响对销售额的影响方差分析(广告城市与销售).sav29操作操作方差分析(广告城市与销售).sav30输出结果输出结果方差方差来源来源平方和平方和SS自由度自由度df均方均方MSF值值 因素因素A误差误差总和总和SSASSESSTk-1n-kn-1MSAMSEF311、方差齐性检验、方差齐性检验 由由于于方方差差分分析析的的前前提提是是各各水水平平下下的的总总体体服服从
23、从正正态态分分布布并并且且方方差差相相等等,因因此此有有必必要要对对方方差差齐齐性性进进行行检检验验,即即对对控控制制变变量量不不同同水水平平下下各各观观测测变量不同总体方差是否相等进行分析。变量不同总体方差是否相等进行分析。SPSS单单因因素素方方差差分分析析中中,方方差差齐齐性性检检验验采采用用了了方方差差同同质质性性(Homogeneity of Variance)的的检检验验方方法法,其其零零假假设设是是各各水水平平下下观观测测变变量量总总体体方方差差无无显显著著性性差差异异,实实现现思思路路同同SPSS两两独独立立样本样本t检验中的方差齐性检验。检验中的方差齐性检验。6.2.5 进一
24、步分析322 2、多重比较检验、多重比较检验如果控制变量确实对观测变量产生了显著影如果控制变量确实对观测变量产生了显著影响,响,还应进一步确定,控制变量的不同水平还应进一步确定,控制变量的不同水平对观测变量的影响程度如何对观测变量的影响程度如何,其中哪个水平,其中哪个水平的作用明显大于其它水平,哪些水平的作用的作用明显大于其它水平,哪些水平的作用是不显著的。是不显著的。多重比较检验就是分别对每个水平下的观测多重比较检验就是分别对每个水平下的观测变量均值进行逐对比较,判断两均值之间是变量均值进行逐对比较,判断两均值之间是否存在显著差异。其否存在显著差异。其零假设是相应组的均值零假设是相应组的均值
25、之间无显著差异。之间无显著差异。33SPSS提供的多重比较检验的方法比较多,提供的多重比较检验的方法比较多,有些方法适用在各总体方差相等的条件下,有些方法适用在各总体方差相等的条件下,有些适用在方差不相等的条件下。有些适用在方差不相等的条件下。其中其中LSD方法适用于各总体方差相等的情方法适用于各总体方差相等的情况况,特点是比较灵敏;,特点是比较灵敏;Tukey方法和方法和S-N-K方法适用于各水平下观测变量个数相等的方法适用于各水平下观测变量个数相等的情况情况;Scheffe方法比方法比Tukey方法不灵敏。方法不灵敏。343、其他检验、其他检验(1)先验对比检验)先验对比检验 如果发现某些
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2012 SPSS 方差分析
限制150内