单因素试验的方差分析——概率论与数理统计课件.pptx
《单因素试验的方差分析——概率论与数理统计课件.pptx》由会员分享,可在线阅读,更多相关《单因素试验的方差分析——概率论与数理统计课件.pptx(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第 九九 章章方差分析与回归分析方差分析与回归分析第一节第一节 单因素试验的单因素试验的方差分析方差分析一、方差分析原理一、方差分析原理把考察事物的结果称为试验结果把考察事物的结果称为试验结果,也称为也称为试验指标试验指标.因素可分为两类因素可分为两类:平平。影响试验指标的条件称为影响试验指标的条件称为因素因素。一类是人们可以控制的,称为一类是人们可以控制的,称为可控因素可控因素;另一类是人们不能控制的,称为另一类是人们不能控制的,称为不可控因素不可控因素。为了考虑某个因素为了考虑某个因素A对所考察的随机变量对所考察的随机变量X的影响的影响,可以在实验时让其他因素保持不变,而仅让因素可以在实
2、验时让其他因素保持不变,而仅让因素A改变改变,这样的试验称为这样的试验称为单因素试验单因素试验,因素,因素A所处的状态称为所处的状态称为水水在试验中变化的因素称为因子,用在试验中变化的因素称为因子,用A、B、C . 表示,表示,因子在试验中所取的不同状态称为水平,因子因子在试验中所取的不同状态称为水平,因子A的不同的不同水水平平用用12,sA AA表示。表示。以下用字以下用字母母, ,x y 等表示随等表示随机机变量。变量。 例例1 为考察种子品种对作物产量的影响为考察种子品种对作物产量的影响, 同一同一作作物选用三个命名为物选用三个命名为 123,A A A的种子的种子, 分别在条件大分别在
3、条件大体体相同的相同的 5 块等面积的小田块上试种块等面积的小田块上试种, 其作物产量其作物产量 ( 单单位位: kg),如下表,试分析种子的不同品种对作物产量如下表,试分析种子的不同品种对作物产量的的影响影响.1A2A3A1391391511511251251391391321321481481221221061061171171251251371371251251331331421421301301391391261261281285 54 43 32 21 1重复试验序号及作物实测产量重复试验序号及作物实测产量种子品种代种子品种代号号( (水平水平) )这里试验的指标是作物产量这里试验的
4、指标是作物产量, 作物是因素作物是因素, 三种种三种种子品种代表三个不同的水平子品种代表三个不同的水平. 首先首先,形成数据差异的直接原因是种子的不同品形成数据差异的直接原因是种子的不同品种种.因此因此, 每个品种下产量的均值差异检验是我们的主每个品种下产量的均值差异检验是我们的主要任务要任务.这种由因素这种由因素(种子品种种子品种)造成的差异称为条件造成的差异称为条件(系系统统)误差误差. 其次其次, 同一品种下数据表现出来的差异称为试验同一品种下数据表现出来的差异称为试验(随随机机)误差误差, 这是由客观条件的偶然干扰造成这是由客观条件的偶然干扰造成, 与因素与因素(品种品种)无直接联系无
5、直接联系.方差分析正是分析两类误差的有效工具方差分析正是分析两类误差的有效工具. 本问题只考虑品种一种因素,故是单因素试验,即只本问题只考虑品种一种因素,故是单因素试验,即只有有一个因子,记为一个因子,记为 A, 5个不同的品种就是该因子的个不同的品种就是该因子的5个不同个不同的水平,分别记的水平,分别记为为12345,A A A A A由于同一品种在由于同一品种在不不同的田块上的亩产量不同,故可以认为一个品种的亩产同的田块上的亩产量不同,故可以认为一个品种的亩产量量就是一个母体,在方差分析中,总是假定各母体相互就是一个母体,在方差分析中,总是假定各母体相互独独立地服从同方差的正态分布,即第立
6、地服从同方差的正态分布,即第 j个品种的亩产量个品种的亩产量是是一个随机变量,它服从正态分布一个随机变量,它服从正态分布:2(,), 1,2,3,4,5.jNj 试验的目的是检验假试验的目的是检验假设设012345:H是否成立。是否成立。二、单因素试验的数学模型二、单因素试验的数学模型 设在单因素试验中设在单因素试验中,所考察的因素为所考察的因素为A,A有有 s 个水平个水平123,sA A AA现在现在 Aj 水平下做了水平下做了 nj 次试验,次试验,1,2, .js试验的实测数据由下表给出试验的实测数据由下表给出: 1A2AsA11x12x1sx21x22x2sx11nx22nxsn s
7、x为考察因素对指标的影响为考察因素对指标的影响, 把第把第 j 个水平个水平 Aj下的实下的实测测数据数据 12,jjjn jXXX看做是从第看做是从第 j 个总体个总体 jX中抽取的中抽取的容容量为量为 jn的样本的样本 (1,2, ).js在方差分析中总是假定 s个总体相互独立且服从相 同方差(未知)的正态分布. 即水平即水平 Aj 对应的总体对应的总体 2(,)jjXN 要检验的假设是:要检验的假设是:012:sH112:, sH 不全相等(1)我们假定各个水平我们假定各个水平Aj下的样本下的样本 12jjjn jXXX, ,为为 来自具有相同方差来自具有相同方差2 均值分别为均值分别为
8、 (1,2, )jjs的正的正 态总体态总体2(,),jN j与与2 均未知均未知. 设不同水平设不同水平 Aj下的下的 样本之间相互独立样本之间相互独立. 由于由于 2(,),ijjXN 2(0,),ijjXN从而将从而将 ijjX可看成随机误差可看成随机误差, 将其记作将其记作 ,ij则则 ijX可表为可表为 2(0,),1,2,1,2, ,ijjijijijjXNinjs各相互独立,此即单因素试验方差分析的数学模型此即单因素试验方差分析的数学模型. 三、单因素方差分析及其显著性检验的方法三、单因素方差分析及其显著性检验的方法 (一一) 方差分析的任务方差分析的任务 相等相等,即检验下述假
9、即检验下述假设设1. 检验检验 s 个总体个总体 2(,)jN (1,2, )js的均值是的均值是否否012:sH112:, sH 不全相等2. 对未知参数对未知参数 (1,2, )jjs及及2进行估计进行估计. (2)引入记号引入记号 11sjjjnn1,sjjnn其中其中 jj(1,2, )js称为总平均称为总平均. jA的第的第 j 个水平的个水平的效应效应, 表示水平表示水平 Aj下的总体平均下的总体平均效应间的关系:效应间的关系:10sjjjn值与总平均的差异值与总平均的差异, 利用上述记号, 将单因素试验方差分析单因素试验方差分析模的型改写成如下形式:21122,(0,),1,2,
10、1,2, .0.ijjijijijjssXNinjsnnn各相互独立,显然,当且仅当 12s时, ,j即即 0j(1,2, )js由此知假设(2)等价于假设 012:0,sH112:,sH 不全为零. (3)(二二) 离差平方和分解离差平方和分解 引入记号引入记号 11jnjijijxxn(1,2, )js111,jnsijjixxn12,snnnn水平水平Aj下的样本均值下的样本均值, 称为组内平均称为组内平均(或列平均或列平均) 称为总平均称为总平均, 它是从它是从 s 个总体中抽得的样本的样本均值个总体中抽得的样本的样本均值. 用样本值用样本值 xij 与总平均与总平均 x之间的偏差平方
11、和来反映之间的偏差平方和来反映 xij 之间的波动之间的波动. 用样本值用样本值 xij 与总平均与总平均 x之间的偏差平方和来反映之间的偏差平方和来反映 xij 之间的波动之间的波动. 记记 211()jnsTijjiSxx称称ST 为总的偏差平方和为总的偏差平方和. 对其作分解如下对其作分解如下: 221111()()()jjnnssTijijjjjijiSxxxxxx22111111()()2()()jjjnnnsssijjjijjjjijijixxxxxxxx对于第三项对于第三项, 直接计算可得直接计算可得 22111111()()2()()jjjnnnsssTijjjijjjjiji
12、jiSxxxxxxxx对于第三项对于第三项, 直接计算可得直接计算可得 11112()()2()jjnnssijjjjijjjjijixxxxxxxn x12()0sjjjjjjxxn xn x记记 211() ,jnseijjjiSxx222111() =jnssAjjjjijSxxn xnx从而有从而有 TeASSS利用利用(3)可得可得 11()jnjjijjjijxn11111()jnssjijjjjijxnnn从而有从而有 211() ,jnseijjjiS21()sAjjjjSn由此知由此知, Se 反映了误差的波动反映了误差的波动, 称其为误差的偏差称其为误差的偏差 平方和平方和
13、(或称为组内平方和或称为组内平方和), 它集中反映了试验中与它集中反映了试验中与因因素及其水平无关的全部随机误差素及其水平无关的全部随机误差. 在在 H0 为真时为真时, SA 反反 映误差的波动映误差的波动, 在在 H0 不真时不真时, SA 反映因子反映因子A 的不同水的不同水平效应间的差异平效应间的差异(同时也包含误差同时也包含误差), 211() ,jnseijjjiS21()sAjjjjSn由此知由此知, Se 反映了误差的波动反映了误差的波动, 称其为误差的偏差称其为误差的偏差 平方和平方和(或称为组内平方和或称为组内平方和), 它集中反映了试验中与它集中反映了试验中与因因素及其水
14、平无关的全部随机误差素及其水平无关的全部随机误差. 在在 H0 为真时为真时, SA 反反 映误差的波动映误差的波动, 在在 H0 不真时不真时, SA 反映因子反映因子A 的不同水的不同水差平方和差平方和(或效应平方和或效应平方和), 无关的条件误差无关的条件误差, 指标的影响指标的影响.称其为因素称其为因素 A 的的偏偏它描述了试验中与偶然干它描述了试验中与偶然干扰扰其数值大小集中体现了因素及水平其数值大小集中体现了因素及水平对对(三三) Se与与 SA 的统计特性的统计特性 由于由于 2(0,),ijN20,jjNn20,Nn(1,2, , 1,2,)jjs in由此可得由此可得 222
15、22111111()jjjnnnssseijjijjjijjjjijijiESEEnEn E 22222111()()jnssjjjijjnnnsn 同理可同理可得得221(1)sAjjjESsn2(),eESns221(1)sAjjjESsn由此得由此得 2,eSEns221111sAjjjSEnss在在 H0 为真时为真时, 即即 120s时时, 有有 2,1eASSEEnss否则否则 1eASSEEnss2,1eASSEEnss否则否则 1eASSEEnss从而在从而在 H0 不真时不真时, 比值比值 (1)()AeSsSns有偏大的趋势有偏大的趋势, 记为记为 F, 即即 (1).()
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因素 试验 方差分析 概率论 数理统计 课件
限制150内