统计学第8章 方差分析.ppt
《统计学第8章 方差分析.ppt》由会员分享,可在线阅读,更多相关《统计学第8章 方差分析.ppt(82页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第8章 方差分析管理统计学管理统计学谢湘生谢湘生广东工业大学管理学院广东工业大学管理学院引例 哪种促销方式最好?某连锁超市公司为了研究不同促销手段对商品销售额的影响,选择了某类日常生活用品在其属下的5个门店分别采用某种促销方式各进行了4个月的试验,实验前该类商品在这5个门店的销售额基本处于同一水平。试验结果见表促销方式月销售额(万元)A1(通常销售)A2(广告宣传)A3(有奖销售)A4(特价销售)A5(买一送一)12.513.115.617.918.215.414.716.519.617.111.812.313.421.816.513.213.613.120.416.2其中“通常促销”是指不采
2、用任何促销手段,“广告宣传”是指没有价格优惠的单纯广告促销,“买一送一”是指买一件商品送另一件小商品。现该公司希望了解的是:(1)不同的促销方式是否对该类商品销量的增长有显著影响?(2)若有显著影响,哪种促销方式效果最好?(3)是否任意两种促销方式的效果之间都存在显著差异?掌握以上信息对该公司制定今后的最佳销售策略,有非常重要的意义?8.1 单因素方差分析方差分析(Analysis of Variances,简记为ANOVA)可以一次对多个总体完成均值是否相同的检验。我们先讨论单因素方差分析8.1.1 问题的提法设对于s个不同的技术方案,分别进行了ns个实验来检验其效果,记方案i的第j个实验的
3、结果为xij,问题是:如何判别这些方案的效果之间是否存在显著区别?从统计的观点只需要检验各方案的平均效果i之间是否存在显著区别即可。单因素方差分析的数据通常可以采用如下的表格方式列出实验效果实验效果方案方案1 1 x11x12x1n1方案方案2 2 x21x22x2n2方案方案s s xs1xs2xsns单因素方差分析虽然起源于对技术方案的评价,但现在它也被用来解决许多具有不同的实际背景的问题。例如方案政策、设备、方法、药品、工艺、原料实验调查、检验、观察、检查、测试所谓“单因素”,就是指分析中只有“方案”这个单一的因素(变量),不同的方案,就是“方案”这一变量的不同取值。这些不同的取值也可以
4、认为是“方案”这个因素的不同水平。实验效果方案1 x11x12x1n1方案2 x21x22x2n2方案s xs1xs2xsns因素或变量的不同取值或水平对应同一水平的不同观察值或样本值xij,下标i对应单一因素的第i个水平,下标j对应第j个样本观察值8.1.2 理论假设与分析假设这s个方案的总体都服从正态分布:N(i,2),这意味着这些总体都有相同的方差,但均值可能互不相同。123随机样本Xij,可以看成各个方案的总体均值i与随机误差ij之和:其中ij N(0,2),并且如果对不同方案进行的不同实验都是独立进行的话,ij之间也是相互独立的。如果表示实验效果的数据都是一元的,则称上述模型为单因素
5、(一元)方差分析的统计模型。相应地,若表示效果的实验数据是多元的,就称为单因素多元模型。ijiXij上述模型中的随机误差可以表示为:但我们并不能观察到总体的均值i,在实际应用时,可以通过样本均值 来估计它,也就是用来估计(观察)真实的误差ij。实验效果方案1 x11x12x1n1方案2 x21x22x2n2方案s xs1xs2xsns样本均值组内平均(第2组):样本总平均:总平均:方案i的主效应:由单因素的方差分析模型 和上式,有即Xij可以表示为总平均、方案i的主效应与随机项之和。由各方案的主效应的表达式知,若对于所有的i都有ai=0,则各方案的均值相同(都等于)。所以单因素方差分析的基本任
6、务就是检验如下的假设:原假设 H0:ai=0 或 1=2=s备择假设 H:ai 不全为 0 或 1,2,s中至少有两个不相等单因素方差模型构成表ij的构成i(行稳定中心)的构成ij(服从 N(0,2)ai(=i-)全局稳定中心主效应(行稳定中心i与全局中心的偏差)随机扰动8.1.3 实际作法按照Xij的构成:可以看到Xij与总的平均水平的偏差由两部分构成:通常用Xij与总的平均水平的偏差的平方和,来反映各Xij与总平均水平的整体波动,记为ST。但与i是观察不到的,所以用相应的样本观察值代替,并且用 代替真实的误差ij。因此可以证明如下的平方和分解公式:也就是总的偏差(波动)可分解为组间变差各方
7、案效果差别导致的偏差。组内变差随机因素导致的偏差。证明见庄楚强等编应用数理统计基础,华南理工大学出版社。实际上,SA既包括了各方案效果差异导致的系统误差,也包括随机误差;而SE仅包括随机误差。也就是也就是,观察值之间的差异来自两个方面:观察值之间的差异来自两个方面:某因素不同水平的影响(系统性影响)其他随机因素的影响(随机性影响)水平间方差(组间方差)水平内方差(组内方差)于是,若假设H0满足,应该有比值:就不会太大,否则就表明H0不成立。此外容易说明相应的F统计量(即将f中的各xij换成Xij后得到的统计量)服从分布F(s 1,n s)。从而F可以作为检验统计量。对给定的显著性水平,可以求得
8、临界值f(s 1,n s),若f f,则拒绝H0。实际算法:(1)先计算组间变差(2)再计算组内变差(3)计算统计值(4)检验对给定的显著性水平,可以求得临界值f(s 1,n s),若f f,则拒绝H0;否则不拒绝H0。注意:(2)在拒绝H0时,我们仅仅能断定至少有两个方案之间的平均效果(均值)存在显著差异,但是到底哪些方案之间有显著差异,哪些之间没有,则无法判定。如果要知道这一结果,理论上应当采用第6章的方法,对不同方案做两两对比,也就是进行多个组合之间的对比检验。完全进行所有比较需要进行 次检验。幸亏这可由SPSS自动完成。(1)这里的检验是单尾检验。直观地看,当H0不满足时,SA 相对于
9、SE而言总是比较大的,因此我们只会在f比较大时拒绝H0。因此,在进行方差分析时,按如下的处理方式:因此,在进行方差分析时,按如下的处理方式:不拒绝不拒绝H0,表示拒绝总体均数相等的证据不足,表示拒绝总体均数相等的证据不足拒绝拒绝H0,接受,接受H1,表示总体均数不全相等表示总体均数不全相等分析终止。分析终止。需要进一步作多重比较需要进一步作多重比较多重比较方法 我们看到,当多个总体的方差相等时,我们既可以进行方差分析,也可以将这些总体两两进行逐对比较。相比之下,方差分析除了前面提到的可以更好的估计方差之外,其另外的一个好处是可以降低犯第一类错误的概率。以引例的分析为例,在那里,我们通过方差分析
10、比较5个总体的均值是否相等,设定的犯第一类错误的概率为0.05.多重比较方法 如果我们将这5个总体两两配对进行比较,则需要作10个两总体均值差的假设检验。若这10个配对假设检验所设定的犯第一类错误的概率(又称为比较性犯第一类错误的概率)均为0.05;则这10次检验中至少有一次犯第一类错误的概率为1-(1-0.05)10=0.40.称这个概率为总的或试验性犯第一类错误的概率。因此对多个总体的均值比较问题因此对多个总体的均值比较问题,通常不会用两两通常不会用两两比较的比较的t t检验来代替方差分析检验来代替方差分析.若 拒绝H0;否则若 不拒绝H0。8.1.4 用统计值 f 的显著性概率p与比较,
11、进行检验在利用计算机软件来做方差分析时,软件通常会给出统计值 f 的最低显著性水平p,这时可根据p值的大小进行检验:ff实际上是过f 的直线截得分布曲线下方右边的面积,若 则表明8.2 用SPSS作单因素方差分析8.2.1 选用系统默认选项的操作示例数据:教材数据光盘中的“CH4CH8茎叶箱方差工资性别岗位300余”步骤:(1)点击AnalysisCompare Means One-way ANOVA(2)选左框中的变量:“当前工资”,用箭头送入右边Dependent list(因变量列表)框中(3)选左框中的变量:“工作性质”,用箭头送入右边Factor(因素变量)框中(4)点击OK,SPS
12、S就给出分析结果。SASEp 结果说明:由于计算得到的p值=0.000.05。因此对给定的显著性水平=0.05,应该拒绝原假设,也就是:不同工作性质的工资存在显著区别。8.2.2 使用选项的操作示例选项的操作示例数据:教材数据光盘中的“CH4CH8茎叶箱方差工资性别岗位300余”步骤:(1)点击AnalysisCompare Means One-way ANOVA(2)选左框中的变量:“当前工资”,用箭头送入右边Dependent list(因变量列表)框中(3)选左框中的变量:“工作性质”,用箭头送入右边Factor(因素变量)框中(4)指定选项:点击Option按钮,机器弹出一个对话窗口在
13、该对话窗口中Statistics选项中,选择Homogeneity-of-variance复选项,表示进行方差齐次性检验。在Missing Values选项中,选择Exclude cases analysis by analysis选项,表示只剔除正在分析的组内的缺失值(这是系统默认选项)。然后按Continue返回上一窗口。(这意味着如果拒绝H0,则也无须再保证各总体有同样的方差)点击Post Hoc按钮,系统弹出Post Hoc Multiple Comparison(各组均值两两比较)窗口。在Equal Variance Assumed(齐次方差假设)选项中选择LSD,其含义是即通过t检
14、验,来对比检验组中两两均值是否存在显著差异,不进行两两均值的误差调整。再在Equal Variance Not Assumed(非齐次方差假设)选项中选择TamHanes T2。其含义是然后点击Continue返回上一窗口。点击Contrasts(对照)按钮,弹出Contrasts对话窗。选择Polynomial激活Degree列表框,选择Linear(默认值).然后在框Coeffcients,依次Add进行对比的各组系数(每输入一组系数以后,Next按钮激活,点击它可再输入下一组系数)。输入完后点击Continue返回上一窗口。注:如果不需要进行特定的对比检验,就无须进行该项选择。最后点击O
15、K,SPSS就可输出结果。关于引例的方差分析1.在SPSS中先建立一个数据文件,文件中包含两个变量:销售额,促销方式。2.其中“促销方式”取值分别为:1,2,3,4,5。分别对应着5种促销方法。再将所有销售数据送入变量,相应地确定“促销方式”的取值。3.调用SPSS的单因素方差分析的功能进行方差分析,步骤同上例。8.3 无重复实验的双因素方差分析8.3.1 问题的提出例如下面的问题:对运动员训练的效果不但与训练方法有关,也与运动员的身体素质有关。如果选出了n组运动员,每个组的运动员有同样的体质特征,每个组有s个运动员,用s种不同方法进行训练,这样可以获得sn个不同的训练效果,怎样判断不同的方法
16、训练效果是否有显著差异?不同体质特征对训练效果是否有显著影响?实际问题中影响实验效果的因素可能不只一个,现在考虑有两个影响因素的情形。问题的有关条件可以概括成如下的表体质1体质2体质n方法1x11x12x1n方法2x21x21x2n方法sxs1xs2xsn因素B1因素B2因素Bn因素A1因素A2因素As其中xij表示因素Ai和因素Bj下的实验效果的观察值问题因素A的不同水平(方案)的效果(均值)有无显著不同?因素B的不同水平(方案)的效果(均值)有无显著不同?所谓“双因素”,是指问题中有两个(反映前提或条件的)变量(因素):变量A和变量B。Ai是变量A的一个取值(又称因素A的一个水平),Bj是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学第8章 方差分析 统计学
限制150内