《方差分析⑵》PPT课件.ppt
《《方差分析⑵》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《方差分析⑵》PPT课件.ppt(138页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、试验统计学试验统计学第四章第四章概率论与数理统计的基础知识概率论与数理统计的基础知识本课程使用区靖祥编本课程使用区靖祥编著的著的试验统计学试验统计学一书作为课本。全程一书作为课本。全程为为50学时,占学分。学时,占学分。第二章第二章常用的试验设计常用的试验设计第三章第三章试验数据的整理试验数据的整理第五章第五章参数区间估计参数区间估计第八章第八章常用试验设计的资料分析常用试验设计的资料分析第六章第六章统计假设测验统计假设测验第七章第七章方差分析方差分析第九章第九章直线相关与回归直线相关与回归第一章第一章绪论绪论第十章第十章 协方差分析协方差分析第二节第二节 处理平均数间的多重比较处理平均数间的
2、多重比较 第一节第一节 方差分析的基本原理方差分析的基本原理第三节第三节 方差分量的估计方差分量的估计 第七章第七章方差分析方差分析第四节第四节 单向分类资料的方差分析单向分类资料的方差分析第五节第五节 两向分类资料的方差分析两向分类资料的方差分析第六节第六节 系统分组资料的方差分析系统分组资料的方差分析第七节第七节 方差分析的基本假设和数据转换方差分析的基本假设和数据转换二、二、组内观察值数目不等的单向分类资料组内观察值数目不等的单向分类资料l单向分类资料单向分类资料(one-wayclassifications)是指那些只含有一个可控因素的资料。通常这个可控因素也就是考察因素。l根据具体的
3、数据结构又分为两种情况:第四节第四节 单向分类资料的方差分析单向分类资料的方差分析一、一、组内观察值数目相等的单向分类资料组内观察值数目相等的单向分类资料二、二、每处理组合内有多于一个观察值的两向分类资料每处理组合内有多于一个观察值的两向分类资料l两向分类资料两向分类资料(two-wayclassifications)是指那些含有两个可控因素的资料。根据具体的数据结构又分为两种情况:第五节第五节 两向分类资料的方差分析两向分类资料的方差分析一、一、每处理组合内只有一个观察值的两向分类资料每处理组合内只有一个观察值的两向分类资料l在动物学的试验中,由于每一个母本不可能同时与若干个父本交配,所以不
4、能采用交叉式设计的杂交方式,转而使用另一种被称为巢式设计巢式设计(nesteddesign)的杂交方案。巢式设计的杂交方案以及相类似的试验设计所取得到数据资料称为系统分组的系统分组的资料资料(hierarchalclassification)。第六节第六节 系统分类资料的方差分析系统分类资料的方差分析本节介绍对最简单的系统分组的资料的统计分析方法,这类资料为组内又分亚组的单向分类资料组内又分亚组的单向分类资料组内又分亚组的单向分类资料组内又分亚组的单向分类资料l方差分析的三个基本假定:方差分析的三个基本假定:第七节第七节 基本假设和数据转换基本假设和数据转换在结束本章之前,再稍微详细地讨论一下
5、这些假定。数据中的各种效应应该具有“可加性可加性”;所有处理应该具有相同的误差方差误差方差,即具有“同质同质 性性”。误差应该是“随机、独立随机、独立”的,并且具有“平均数为平均数为0、方差为方差为 的正态分布的正态分布”;l方差分析的三个基本假定:第七节第七节 基本假设和数据转换基本假设和数据转换那么,怎么样的数据是可加性的呢?数据中的各种效应应该具有“可加性可加性”;线性可加模型是方差分析的基础,只有当数据具有可只有当数据具有可加性时,总平方和才能分解为各项平方和之和加性时,总平方和才能分解为各项平方和之和;并且,由由于数据具有可加性,又必然导致各项效应之和为于数据具有可加性,又必然导致各
6、项效应之和为0 0,所有,所有误差之和为误差之和为0 0。以单向分类资料为例,因为数学模型为:,因此才有:和,即SST SSt SSe。也因此有。此式左边为0,因此右边自然也应该等于0。于是有和。表表7.63可加性资料与非可加性资料的比较可加性资料与非可加性资料的比较(a)可加性资料可加性资料(b)倍加性资料倍加性资料(c)对倍加性资对倍加性资料取对数后料取对数后处处理理分组分组处处理理分组分组处处理理分组分组121212A1020A1020A1.00 1.30B3040B3060B1.48 1.78l方差分析的三个基本假定:方差分析的三个基本假定:第七节第七节 基本假设和数据转换基本假设和数
7、据转换误差应该是“随机、独立随机、独立”的,并且具有“平均数为平均数为0、方差为 的正态分布正态分布”;首先首先,在数学模型中的误差效应必须是随机的在数学模型中的误差效应必须是随机的,因为数据中的k 个处理仅仅是从所研究的k 个总体中随机抽取出来的k 个样本,而F 测验正是通过样本统计量对总体参数进行判断的手段。其次其次,在观察这个个体时的误差误差误差误差与观察另一个个体时的误差应该是无关误差应该是无关的,即误差彼此之间是相互独立的。前面已讨论过,计算F值的两个方差,所来自的(亚)总体应该是正态正态正态正态分布的。l方差分析的三个基本假定:方差分析的三个基本假定:第七节第七节 基本假设和数据转
8、换基本假设和数据转换 因为在方差分布中将k个样本的“组内平方和”和“组内自由度”合并为整个试验的“组内平方和”和“组内自由度”,并利用它们算出的“组内均方”来估计试验误差,其前提必须是各处理的方差是相等的,不相等不相等不相等不相等怎么能合并呢?怎么能合并呢?怎么能合并呢?怎么能合并呢?资料中各组的方差是否相等可以通过BartlettBartlett卡方测验卡方测验卡方测验卡方测验来检验。所有处理应该具有相同的误差方差,即具有“同质性同质性”。l当试验资料不符合上述假定时要先对数据进行一些适当的处理,然后用经过处理的数据进行方差分析。第七节第七节 基本假设和数据转换基本假设和数据转换常用的数据变
9、换方法有四种,分别适用下述的四种情况:剔除一些表现“特殊”的观察值、处理或重复。用同一个体或小区的重复观察值的平均数进行方差 分析。对需要分析的资料进行研究,了解它们不符合哪个 基本假定,然后针对性地采用下述数据转换方法中 的一种,先对数据进行某种尺度变换,用经变换的 数据进行方差分析(及多重比较),而在对分析结果 进行解释时,再反代换为原来的尺度。第七节第七节 基本假设和数据转换基本假设和数据转换当数据的 时,各观察值的方差近似与其平 均数成比例关系:即平均数越大,方差越大。这时 宜采用平方根转换,即当有部分观察值小于10时,采用公式:或服从泊松分布泊松分布泊松分布泊松分布的计数资料宜采用这
10、种转换。通常认为计数资料,如每一个显微镜视野中的细菌数、每土方中的昆虫幼蛹数等,都服从泊松分布。第七节第七节 基本假设和数据转换基本假设和数据转换服从二项分布的百分数二项分布的百分数二项分布的百分数二项分布的百分数资料宜采用这种变换。例如昆虫死亡率、产品合格率、种子发芽率等都属于这种资料。请注意上式方根号内xijk是百分数,例如当xijk75.5%时,xijk60.33。当数据的时,宜采用反正弦转换,即。有些百分率不是用计数数据换算得到的,而是用度量数据换算得到的,如玉米种子中的蛋白质含量、花生油中的不饱和脂肪酸含量等,不应当作离散性随机变量看待。不必要采用反正弦代换。第七节第七节 基本假设和
11、数据转换基本假设和数据转换当资料不近似服从正态分布或资料不接近于加性模型时,宜采用这种转换。当数据的 时,各观察值的方差近似与其 平均数的平方成比例关系。这种资料宜采用对数转 换。即当有部分数据小于10时,采用公式:第七节第七节 基本假设和数据转换基本假设和数据转换 当数据的 时,各观察值的标准差近似与其 平均数的平方成比例关系。这种资料宜采用倒数转 换,即 ,当有部分数据小于10时,采用公式。第七节第七节 基本假设和数据转换基本假设和数据转换l 如果能事先把您的离散型数据的各处理平均数和方差计算出来,看看它们之间的关系,就可以很容易地决定采用何种尺度变换方法。如果无法决定那种变换更加合适时,
12、可以只变换少数几种处理的数据(这种处理的原数据最好能包括有大、中、小的数字),然后再看看经变换的数据的平均数与方差间有没有上述的关联性,这些关联性最小的那一种变换往往就是最好的变换方法。五个病人在三种不同室温下淋巴细胞玫瑰花簇玫瑰花簇形成率(按200个淋巴细胞计算)如所示。试测验不同室温下这种形成率之间是否有显著差异。黄成达编制黄成达编制31.255.235.415.055.534.5516.065.534.5440.049.034.0336.058.034.0249.048.040.013037oC2025oC46oC室温病人编号表表7.64不同室温下淋巴细胞玫瑰花簇形成率(不同室温下淋巴细
13、胞玫瑰花簇形成率(%)黄成达编制黄成达编制黄成达编制黄成达编制46oC54321病人编号表表7.65经反正弦代换后的数据经反正弦代换后的数据()33.378648.014336.501935.638222.786548.157735.970437.859423.578254.029635.970439.775739.231544.427035.668540.714036.869949.603435.668542.504144.427043.853839.23153037oC2025oC室温黄成达编制黄成达编制黄成达编制黄成达编制1049.223814总变异总变异46.3924371.13918
14、误差误差0.452320.982183.92834病号间病号间8.64914.45906.4036*297.0782594.15642室温间室温间F0.01F0.05FMSSSdf变异变异表表7.66例例7.14的方差分析表的方差分析表黄成达编制15.230314.43835.004.74310.32619.93023.393.262LSR0.01LSR0.05SSR0.01SSR0.05g表表7.67查得的查得的SSR值及各种值及各种LSR值的计算值的计算表表7.687.68 对不同室温的进行比较的梯形表对不同室温的进行比较的梯形表 室温 33.37863037oC3.123336.5019
15、46oC11.5124*14.6357*48.01432025oC平均数黄成达编制人类人类T淋巴细胞表面具有绵羊红细胞淋巴细胞表面具有绵羊红细胞(SRBC)的的受体,故能与受体,故能与SRBC结合形成花环,目前常用结合形成花环,目前常用E花花环;目前常用环;目前常用E花环形成试验来检测花环形成试验来检测T淋巴细胞数淋巴细胞数量,作为了解人体细胞免疫功能状态的指标之一,量,作为了解人体细胞免疫功能状态的指标之一,总总E花环(花环(Et)试验应用最广,反映)试验应用最广,反映T细胞活性的细胞活性的是活性花环试验是活性花环试验(Ea)。E-花环试验作为体外测定细胞免疫方法之一,花环试验作为体外测定细
16、胞免疫方法之一,其形成百分率下降是细胞免疫功能降低的反映,临其形成百分率下降是细胞免疫功能降低的反映,临床上已用于恶性肿瘤、白血病、自身免疫性疾病、床上已用于恶性肿瘤、白血病、自身免疫性疾病、免疫缺陷病、器官移植排斥反应等方面的研究,作免疫缺陷病、器官移植排斥反应等方面的研究,作为了解这些疾病患者机体细胞免疫状态、预后及疗为了解这些疾病患者机体细胞免疫状态、预后及疗效观察的指标。效观察的指标。T淋巴细胞玫瑰花环:淋巴细胞玫瑰花环:左左.(甲紫染色,(甲紫染色,800):可见:可见2个被羊红细胞个被羊红细胞包围而形成玫瑰环的包围而形成玫瑰环的T淋巴细胞;淋巴细胞;右右.(吖啶橙染色):图中可见(
17、吖啶橙染色):图中可见3个染成橙黄色荧光的个染成橙黄色荧光的T淋巴细胞被羊红细胞所包围。淋巴细胞被羊红细胞所包围。淋淋巴巴细细胞胞玫玫瑰瑰花花环环电电镜镜照照片片一、组内观察值数目相等的单向分类资料一、组内观察值数目相等的单向分类资料如果资料中含有如果资料中含有k组数据,每组含组数据,每组含n个观察值,个观察值,全部共有全部共有nk个观察值。那么,此类资料观察值的数个观察值。那么,此类资料观察值的数学模型为:学模型为:(i1,2,k,j1,2,n)因此总变异分解为两大部分:因此总变异分解为两大部分:组间变异组间变异和和组内变异组内变异。方差分析表如表所示。方差分析表如表所示。黄成达编制黄成达编
18、制dfTnk1总变总变异异MSedfek(n1)误误差差FMSt/MSeMStdftk1组间组间随机模型随机模型固定模型固定模型期望均方期望均方(EMS)F值值均方均方平方和平方和自由度自由度变变异异来源来源表表7.14组组内内观观察察值值数目相等的数目相等的单单向分向分类资类资料的方差分析表料的方差分析表事实上,在前几节中所举的例子都是这种资料。事实上,在前几节中所举的例子都是这种资料。这里,我们另举一个例子,并且把整个计算过程系这里,我们另举一个例子,并且把整个计算过程系统地陈述一遍。以后在各种不同试验设计的分析方统地陈述一遍。以后在各种不同试验设计的分析方法中,也都将按这样的方式进行陈述
19、。法中,也都将按这样的方式进行陈述。例例在一个塑料大棚内进行番茄无土栽培试验,全部采用同一品种,5种不同的培养液,每种培养液观察4株。试验指标为单株产量,结果如表所示,如果培养液的效应为固定模型,试对5种培养液的效应进行显著性测验。数据整理:数据整理:黄成达编制黄成达编制黄成达编制265520013898520总总和和20640016228021162221E3115376386812427333331D2812544315411230252730C24921623189626212425B2711664293610826283024A观察值观察值培养液培养液表表7.15番茄无土栽培试验的产量
20、数据番茄无土栽培试验的产量数据平方和及自由度的分解:平方和及自由度的分解:总自由度总自由度dfT观察值总数观察值总数120119处理间自由度处理间自由度dft处理数处理数1514误差自由度误差自由度dfedfTdft19415矫正数矫正数C.T.总和平方观察值总数总和平方观察值总数5202/2013520总平方和总平方和=13898-13520=378总平方和总平方和=各观察值的平方之和各观察值的平方之和C.T.处理间平方和处理间平方和=55200/4-13520=280误差平方和误差平方和37828098误差平方和误差平方和=总平方和总平方和各项已知因素的平方和各项已知因素的平方和将各项自由
21、度和平方和填入方差分析表。将各项自由度和平方和填入方差分析表。黄成达编制37819总变异总变异6.5339815误差误差4.893.0610.72*702804处理间处理间F0.01F0.05F均方均方平方和平方和自由度自由度变异来源变异来源表表7.16例例7.7的方差分析表的方差分析表多重比较(以多重比较(以Duncan法为例):法为例):计算标准误:计算标准误:其中其中MSe为方差分析表中的误差均方;为方差分析表中的误差均方;n 是计算所比较的平均数时用到的观察值数目。是计算所比较的平均数时用到的观察值数目。查表并计算各种LSR值(误差自由度dfe=15):黄成达编制5.854.234.5
22、83.3155.754.154.503.2545.584.044.373.1635.323.854.173.012LSR0.01LSR0.05SSR0.01SSR0.05g表表7.17查得的查得的SSR值及各种值及各种LSR值的计算值的计算3.列梯形表进行比较:列梯形表进行比较:黄成达编制5.854.234.583.3155.754.154.503.2545.584.044.373.1635.323.854.173.012LSR0.01LSR0.05SSR0.01SSR0.05g表表7.17查得的查得的SSR值及计算得到的值及计算得到的LSR值值黄成达编制黄成达编制20E4*24B37*27A
23、148*28C347*11*31D平均数平均数处理处理表表7.18多重比较的梯形表多重比较的梯形表作统计推断:作统计推断:黄成达编制黄成达编制20E4*24B37*27A148*28C347*11*31D平均数平均数处理处理表表7.18多重比较的梯形表多重比较的梯形表培养液培养液D与培养液与培养液E、B之间有显著差异之间有显著差异(=0.01);培养液培养液C、A与培养液与培养液E之间有显著差异之间有显著差异(=0.01);培养液培养液B与培养液与培养液E之间有显著差异之间有显著差异(=0.05);。其余各处理平均数之间没有显著差异。其余各处理平均数之间没有显著差异。二、组内观察值数目不等的单
24、向分类资料二、组内观察值数目不等的单向分类资料如果资料中含有如果资料中含有k组数据,其中第组数据,其中第i组含组含ni个观个观察值,全部共有个观察值。此类资料观察值的数学察值,全部共有个观察值。此类资料观察值的数学模型为:模型为:(i1,2,k,j 1,2,ni)因此总变异分解为两大部分:因此总变异分解为两大部分:组间变异组间变异和和组内变异组内变异。方差分析表如表所示方差分析表如表所示dftk-1黄成达编制黄成达编制黄成达编制SSTdfT总变总变异异MSeSSedfe误误差差FMSt/MSeMStSStdft组间组间随机模型随机模型固定模型固定模型期望均方期望均方(EMS)F值值MSSSdf
25、变变异异来源来源表表7.19组组内内观观察察值值数目不等的数目不等的单单向分向分类资类资料的方差分析表料的方差分析表其中其中为各组样本含量的调和平均数,即为各组样本含量的调和平均数,即但是如果利用随机模型对但是如果利用随机模型对进行估计,即进行估计,即时,可能会出现方差估计值为负的奇怪现象。这时时,可能会出现方差估计值为负的奇怪现象。这时可以使用可以使用代替代替进行计算。进行计算。各组内观察值数目相等的试验资料称为各组内观察值数目相等的试验资料称为平衡资平衡资料料;各组内观察值数目不等的试验资料称为;各组内观察值数目不等的试验资料称为不平不平衡资料衡资料。利用平衡资料所得到的参数估计值是无。利
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析 方差分析 PPT 课件
限制150内