第八章方差分析教案.doc
《第八章方差分析教案.doc》由会员分享,可在线阅读,更多相关《第八章方差分析教案.doc(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章 方差分析教学目的使学生掌握单因子及二因子(包括无交互作用有交互作用的情形)方差分析的推断法,并能将其应用于教育与心理学等领域。一、方差分析的基本原理在工农业生产及科学研究中,影响产品质量与产量(或研究结果)的因素一般较多,例如影响农作物产量的因素就有种子品种,肥料、雨水等。影响儿童识记效果的因素有教学材料、教学法等。为了找出影响结果(效果)最显著的因素,并指出它们在什么状态下对结果最有利,就要先做些试验,然后对测试的数据进行统计推断,方差分析就是对实测数据进行统计推断的一种方法。方差分析中,常称上述的因素为因子,用A、B、C等表示因素在试验中所处的不同情况或状态称为水平,例如因子A的r
2、个不同水平表为A1,A2,Ar。下面以一简例说明方差分析的原理。例8.1 从小学入学新生中随机抽取20名学生作数学试验,将儿童均分为四组,分别用四种汉字识字教学法进行教学,一段时间后对他们进行统一测验,成绩如下:教 法A1A2A3A4学生成绩yij7482707680888085838480737076827674807382希望通过试验数据推断:不同教学法的教学效果是否有显著差异?在上例中,只考虑了教学法这一个因子(记为A)对教学效果的影响,四种不同的教学法就是该因子的四个不同水平(分别记为A1,A2,A3,A4)。从表中数据看出,即使同一教学法下,由于随机因素(学生个体差异,随机误差等)的
3、影响,学生成绩也不同因而有:(1)学生测试成绩是随机变量;(2)应把同一教学法(同一水平)得到的测验成绩看作同一母体抽得的子样,不同教学法下的测试成绩视为不同母体下抽得的子样,故表中数据应看成从四个母体y1,y2,y3,y4中分别抽了容量为5的子样的观测值判断教学法对测试成绩是否有显著影响的的问题,就是要辨别测试成绩之间的差异主要是由随机误差造成的,还是由不同教学法造成的,这一问题可归结为四个母体是否有相同分布的讨论。由于在实际中有充分的理由认为测试成绩服从正态分布,且在安排试验时,除所关心的因子(这儿是教学法)外,其它试验条件总是尽可能做到一致,这就使我们可以认为每个母体的方差相同,即例8.
4、1中 yiN(i,2) i=1,2,3,4,因此,推断几个母体是否具有相同分布的问题就简化为:检验几个具有相同方差的正态母体是否均值相等的问题,即只需检验H0:1=2=3=4 (8.1)象这类检验若干同方差的正态母体均值是否相等的一种统计分析方法称为方差分析。在实际问题中,影响母体均值的因素可能不止一个,按试验中因子的个数,称为单因子方差分析、二因子方差分析、多因子方差分析等。我们先介绍单因子方差分析,再讨论二因子方差分析,至于多因子方差分析与二因子的类似。二、单因子方差分析:单因子方差分析模型如下: yij=i+ij i=1,2,r; j=1,2,t (8.2) ijN(0,2)这里yi看成
5、第i个水平下的试验结果,yiN(i, 2),在Ai水平下做了t次试验,获得t个数据yij (i=1,t)需检验假设:H0:1=2=r (8.3)现把参数形式改变一下:记 我们称为一般平均,i为因子A的第i个水平的效应,r个效应满足关系式: 于是单因子方差分析模型(8.2)可改写成 (8.4)所要检验的假设(8.3)可改写为H0:1=2=r=0 (8.5)需指出的是在模型(8.4)或(8.2)中,观察到的是yij,而ij是观察不到的,通常称ij为随机误差或随机干扰。下面就来讨论(8.5)的检验我们首先分析引起yij波动的原因,有如下两个 H0为真,波动由随机误差引起引起yij的波动H0不真导致今
6、后我们的yij视情况不同可以表示随机变量,也可以表示观测数据,下面就从分解平方和入手,找出反映上述两个原因的量来,为此先引入 (8.6) (8.7)称是从第i个母体抽得的子样的平均,常称为组平均值,而 称为样本总平均值,我们称 (8.8)为总偏差平方和。由于有 ,i=1,r所以故总偏差平方和有如下分解式 (8.9)其中 (8.10)称为误差的偏差平方和,它反映了观察yij时,抽样误差的大小程度 (8.11)称为因子A的偏差平方和,在(8.5)所示H0为真时,它反映误差的波动,在H0不真时,它反映因子A的不同水平效应间的偏差。下面我们分别计算它们的数学期望 (8.12)所以 (8.13)由(8.
7、12)知,为2 的无偏估计,而当(8.5)为真时,也是2的无偏估计故统计量 (8.14)在假设(8.5)为真时接近1,而(8.5)不真时有偏大的趋势,我们取F作(8.5)的检验统计量,下面就来推导其分布,先看一个重要的定理。定理8.1(柯赫伦定理)设x1,x2,xn为n个独立同服从N(0.1)分布的随机变量,又设Q=Q1+Q2+QK=为变量,其中Qi(i=1,k)是秩为fi的关于x1,xn的非负二次型,则Qi(i=1k)相互独立,且分别服从自由度为fi的分布的充要条件是证:(见教材P378P379)有了上面的定理,我们便可推出(8.14)所示的F-统计量的分布。事实上,当(8.5)所示 H。为
8、真时有1=2=r=0由(8.4)式知一切yijN(,2)且相互独立,即所有yij (i=1r j=1t)可以看作取自正态N(,2)母体的容量为n=rt的子样,而yij -N(0,2)由 上式左边是n个N(0.1)变量的平方和,右边显然是yij的三个非负二次型,Q3的秩显然为1。因 含有r个线性关系故Se从而Q1的秩为n-r因 包含一个线性关系所以SA从而Q2的秩为(r-1)。由于Q1,Q2,Q3三个非负二次型的秩满足(n-r)+(r-1)+1=n由柯赫伦定理知:且它们相互独立,从而有(8.14)所示的F统计量H0 (8.15)以(8.15)作为(8.5) H0:1=2=r=0的检验统计量,对任
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 方差分析 教案
限制150内