《平均数变异数检验优秀PPT.ppt》由会员分享,可在线阅读,更多相关《平均数变异数检验优秀PPT.ppt(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、平均数变异数检验平均数变异数检验你现在浏览的是第一页,共85页第一节第一节总体与样本总体与样本总体具有共同性质的个体所组成的集团 无限总体 总体有无穷多个个体构成 有限总体-总体由有限个个体构成参数-由总体的全部观察值而算得的总体特征数第二章你现在浏览的是第二页,共85页第一节第一节总体与样本总体与样本样本-从总体中抽取若干个个体的集合 统计数-测定样本中的各个体而得的样本特征数,如平均数等。统计数是总体相应参数的估计值。你现在浏览的是第三页,共85页第二节第二节 平均数平均数 算术平均数算术平均数 中位数中位数 几何平均数几何平均数 第二章你现在浏览的是第四页,共85页一、算术平均数一、算术
2、平均数 Mean 1 1 定义定义 各单项测定值的总和除以测定值的个数,所得的商。2 2 计算方法计算方法(1)如样本较小,即资料包含的观察值个数不多,可直接计算平均数。第二节第二节 平均数平均数 你现在浏览的是第五页,共85页例例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。试计算其平均数。你现在浏览的是第六页,共85页一、算术平均数一、算术平均数 2 2 计算方法计算方法(2)若样本较大,且已进行了分组,可采用加权法计算算术平均数,即用组中点值代表该组出现的观测值以计算平均数,其公式为 第二节第二节 平均数平
3、均数 你现在浏览的是第七页,共85页二、中位数二、中位数(Median)1 定义定义将资料内所有观察值从大到小排序,居中间位置的观察值称为中数,计作Md。2 计算方法计算方法将观察值排序,如观察值个数为奇数,则以中间的观察值为中位数;如观察值个数为偶数,则以中间二个观察值的算术平均数为中位数。第二节第二节 平均数平均数 你现在浏览的是第八页,共85页例例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。试计算其中位数。你现在浏览的是第九页,共85页第二节第二节 平均数平均数三三 几何平均数几何平均数 (Geometr
4、icmean Geomean)1 1 定义定义如有n个观察值,其相乘积开n次方,即为几何平均数,用G代表。2 2 计算方法计算方法你现在浏览的是第十页,共85页例例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。试计算其几何平均数。你现在浏览的是第十一页,共85页 比较甲、乙两个小组(各比较甲、乙两个小组(各5 5人)某门课成绩人)某门课成绩的优劣。的优劣。甲班:甲班:5050、5050、5050、8080、2020 乙班:乙班:100100、0 0、5050、8080、2020第二章你现在浏览的是第十二页,共85
5、页 比较甲、乙两个小组(各比较甲、乙两个小组(各5 5人)某门课成绩人)某门课成绩的优劣。的优劣。甲班:甲班:100100、0 0、5050、8080、2020 乙班:乙班:100100、0 0、5050、7070、3030第二章你现在浏览的是第十三页,共85页 比较甲、乙两个小组(分别为比较甲、乙两个小组(分别为5 5、7 7人)某门人)某门课成绩的优劣。课成绩的优劣。甲班:甲班:100100、0 0、5050、8080、2020 乙班:乙班:100100、0 0、5050、8080、2020、7070、3030第二章你现在浏览的是第十四页,共85页第三节第三节 变异数变异数 变异程度指标变
6、异程度指标 偏差偏差 极差极差 方差方差 标准差标准差 标准误标准误 变异系数变异系数 第二章你现在浏览的是第十五页,共85页第三节第三节 变异数变异数一、偏差一、偏差 (Deviation)定义:测定值与平均值之差。特点:有单位,有正负,个数与样本个数相等 你现在浏览的是第十六页,共85页第三节第三节 变异数变异数二、极差二、极差 (RangeRange)极差,又称全距,记作R,是资料中最大观察值与最小观察值的差数。R=ymax-ymin 特点:有单位,一个值(表述较偏差简单)你现在浏览的是第十七页,共85页例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、8
7、9、108、160、127、86(单位:个)。试计算其极差。你现在浏览的是第十八页,共85页第三节第三节 变异数变异数三、方差三、方差 离差平方和每一个观察值均有一个偏离平均数的度量指标离均差,但各个离均差的总和为0,不能用来度量变异,那么可将各个离均差平方后加起来,求得离均差平方和(简称平方和)SS(sumofsquaresofdeviationsfrommean),定义如下:样本样本 总体总体你现在浏览的是第十九页,共85页第三节第三节 变异数变异数由于各个样本所包含的观察值数目不同,为便于比较起见,用观察值数目来除平方和,得到平均平方和,简称均方或方差(variance)。样本均方(me
8、an square)用s2表示,定义为:你现在浏览的是第二十页,共85页第三节第三节 变异数变异数 它是总体方差()的无偏估计值;此处除数为自由度(n-1)而不用n,其中,N为有限总体所含个体数。均方和方差这两个名称常常通用,但习惯上称样本的s2为均方,总体的 为方差 你现在浏览的是第二十一页,共85页第三节第三节 变异数变异数自由度自由度 Degree of freedom自由度记作df,它的统计意义是指样本内独立而能自由变动的离均差个数。例如一样本为(3,4,5,6,7),平均数为5,前个离差为-2,-1,0和1,则第5个离均差为前4个离均差之和的变号数,即-(-2)=2。一般地,样本自由
9、度等于观察值的个数(n)减去约束条件的个数(k),即df=n-k。你现在浏览的是第二十二页,共85页第三节第三节 变异数变异数 同样,样本标准差是总体标准差的估计值。总体标准差用 表示:你现在浏览的是第二十三页,共85页第三节第三节 变异数变异数 自由度自由度 Degree of freedom 样本标准差不以样本容量n,而以自由度n-1作为除数,这是因为通常所掌握的是样本资料,不知的数值,不得不用样本平均数 代替。与有差异,由算术平均数的性质可知,比 小。因此,由 算出的标准差将偏小。如分母用n-1代替,则可免除偏小的弊病。你现在浏览的是第二十四页,共85页第三节第三节 变异数变异数四、标准
10、差四、标准差 Standard deviation (SD)标准差为方差的正平方根值,用以表示资料的变异度,其单位与观察值的度量单位相同。样本资料计算标准差的公式为:你现在浏览的是第二十五页,共85页第三节第三节 变异数变异数在应用上,小样本一定要用自由度来估计标准差;如为大样本,因n和n-1相差微小,也可不用自由度,而直接用n作除数。但样本大小的界限没有统一规定,所以一般样本资料在估计标准差时,皆用自由度。你现在浏览的是第二十六页,共85页 第三节第三节 变异数变异数标准差的计算方法标准差的计算方法分四个步骤:先求出 ,再求出各个 和各个 ,求和得 ,即可代入下式算得标准差。你现在浏览的是第
11、二十七页,共85页例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。试计算其标准差。你现在浏览的是第二十八页,共85页表达方法表格中:Means SD Means(SD)图中:误差线:正、负、正负你现在浏览的是第二十九页,共85页第三节第三节 变异数变异数五、标准误五、标准误 Standard error(SE)你现在浏览的是第三十页,共85页第三节第三节 变异数变异数Adapted from:Jacobs et al.2005.Relative contribution of initial root and s
12、hoot morphology in predicting field performance of hardwood seedlings.New Forests,30:235-251.你现在浏览的是第三十一页,共85页第三节第三节 变异数变异数Adapted from:Boivin et al.2004.Late-season fertilization of Picea mariana seedlings:intensive loading and outplanting response on greenhouse bioassays.Ann.For.Sci.61:737-745.你现在
13、浏览的是第三十二页,共85页第三节第三节 变异数变异数Adapted from:Rix et al.2012.Paternal and maternal effects on the response of seed germination to high temperatures in Eucalyptus globulus.Ann.For.Sci.69:673-679.你现在浏览的是第三十三页,共85页第三节第三节 变异数变异数Adapted from:Campo et al.2007.Relationship between root growth potential and field
14、 performance in Aleppo pine.Ann.For.Sci.64:541-548.你现在浏览的是第三十四页,共85页第三节第三节 变异数变异数六、六、变变异系数异系数标准差和观察值的单位相同,表示一个样本的变异度。若比较两个样本的变异度,则因单位不同或均数不同,不能用标准差进行直接比较。这时可计算样本的标准差对均数的百分数,称为变异系数。你现在浏览的是第三十五页,共85页例在同一稀释度的10个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、96、127、86(单位:个)。试计算其变异系数。你现在浏览的是第三十六页,共85页第三节第三节 变
15、异数变异数两个小麦品种主茎高度的平均数、标准差和变异系数。你现在浏览的是第三十七页,共85页第三节第三节 变异数变异数 如只从标准差看,品种甲比乙的变异大些;但因两者的均数不同,标准差间不宜直接比较。如果算出变异系数,就可以相互比较,这里乙品种的变异系数为11.3%,甲品种为9.5%,可见乙品种的相对变异程度较大。你现在浏览的是第三十八页,共85页第三节第三节 变异数变异数 但是在使用变异系数时,应该认识到它同时受标准差和平均数的影响。因此,在使用变异系数表示样本变异程度时,宜同时列举平均数和标准差,否则可能会引起误解。你现在浏览的是第三十九页,共85页你现在浏览的是第四十页,共85页你现在浏
16、览的是第四十一页,共85页将变量送入右侧文本框你现在浏览的是第四十二页,共85页选择点击Continue你现在浏览的是第四十三页,共85页点击OkDescriptive StatisticsNRangeMinimumMaximumMeanStd.DeviationStatisticStatisticStatisticStatisticStatisticStd.ErrorStatistic微生物数量107486160115.308.16625.824Valid N(listwise)10你现在浏览的是第四十四页,共85页练习题1:在同一稀释度的10个培养皿中,计算出微生物数量分别为148、92、
17、115、132、89、108、160、96、127、86(单位:个)。利用Excel和SPSS分别计算其变异系数。你现在浏览的是第四十五页,共85页练习题2:见附注课题数表“多组变量与SPSS统计值实现”(1)利用SPSS分别计算其平均值、标准差、标准误(2)利用Sigmaplot作柱形图(含标准误),要求苗高为一张图,地径为另一张图。你现在浏览的是第四十六页,共85页第四节第四节可疑数值的取舍可疑数值的取舍1.1.可疑数据的概念可疑数据的概念 在测量中有时会出现过高或过低的测量值,这种数据称为可疑数据或逸出值(outlier)。2.2.可以数值的取舍(可以数值的取舍(拉依达法拉依达法、肖维纳
18、特法、格拉布斯法、肖维纳特法、格拉布斯法)拉伊达法:当试验次数较多时,可简单地用3倍标准偏差(3s)作为确定可疑数据取舍的标准。当某一测量数据()与其测量结果的算术平均值()之差大于3倍标准偏差时,用公式表示为:则该测量数据应舍弃。先对数据排序,然后对极值按公式取舍第二章你现在浏览的是第四十七页,共85页例例对一批苗木随机抽取10株测定其苗高,测定值分别为24.8、27.0、25.5、25.2、58.0、25.8、25.0、26.0、24.5、10.3cm,试用拉伊达法排除可疑值。你现在浏览的是第四十八页,共85页取3的理由是:根据随机变量的正态分布规律,在多次试验中,测量值落在x-3与x+3
19、之间的概率为99.73,出现在此范围之外的概率仅为0.27%,也就是在近400次试验中才能遇到一次,这种事件为小概率事件,出现的可能性很小,几乎是不可能。因而在实际试验中,一旦出现,就认为该测量数据是不可能的,应将其舍弃。你现在浏览的是第四十九页,共85页第四节第四节可疑数值剔除及正态与方差齐次性判断可疑数值剔除及正态与方差齐次性判断第二章SPSS实现1 建立数表2 Analyze-Descriptive Statistics-Explore3 选择分析变量Dependent、分组变量Factor及标示变量Label cases by4 选择描述统计量Statistics5 剔除可疑值、判断正
20、态性与方差齐次性,选择 Plots菜单6 读取结果你现在浏览的是第五十页,共85页第五节第五节数据标准化数据标准化一、数据标准化的意义一、数据标准化的意义 不同要素的数据往往具有不同的单位和量纲,其数值的变异可能是很大的,这就会对统计结果产生影响。因此,在聚类分析、主成分分析之前,首先要对要素进行数据处理。第二章你现在浏览的是第五十一页,共85页第五节第五节数据标准化数据标准化二、数据标准化的方法二、数据标准化的方法第二章标准差标准化:标准化后各要素平均值为0,标准差为1你现在浏览的是第五十二页,共85页SPSS实现你现在浏览的是第五十三页,共85页你现在浏览的是第五十四页,共85页你现在浏览
21、的是第五十五页,共85页你现在浏览的是第五十六页,共85页第五节第五节数据标准化数据标准化二、数据标准化的方法二、数据标准化的方法极差标准化:标准化后各要素的极大值为1,极小值为0,其余的数值均在0与1之间。你现在浏览的是第五十七页,共85页第五节第五节数据标准化数据标准化二、数据标准化的方法二、数据标准化的方法极大值标准化你现在浏览的是第五十八页,共85页例在同一稀释度的9个培养皿中,计算出微生物数量分别为148、92、115、132、89、108、160、127、86(单位:个)。分别试用标准差法、极差法和最大值法对上述数据进行标准化处理。你现在浏览的是第五十九页,共85页第六节第六节 数
22、据转化数据转化 第二章为什么进行数据转化参数统计分析方法对资料有一定的要求,如t检验和方差分析要求样本来自正态分布总体,并且方差齐同;直线相关(回归)分析要求两变量间呈直线关系。但实际工作中并非所有的统计资料都能满足参数统计分析方法的条件;对于不能满足条件的资料,则不能直接应用参数统计分析方法,否则有可能导致错误的结论。你现在浏览的是第六十页,共85页数据转换的常用方法对数变换(transformation of logarithm)将原始数据X取对数,以其对数值作为分析变量对数变换的用途使服从对数正态分布的资料正态化;使方差不齐且各组的接近的资料达到方差齐的要求;使曲线直线化,常用于曲线拟合
23、。你现在浏览的是第六十一页,共85页数据转换的常用方法平方根变换(square root transformation)将原始数据X的平方根作为分析变量平方根变换的用途:使服从Poisson分布的计数资料,或轻度偏态资料正态化;使方差不齐且各样本的方差与均数间呈正相关的资料达到方差齐的要求。你现在浏览的是第六十二页,共85页数据转换的常用方法平方根反正弦变换(arcsine trasformation of square root)将原始数据X的平方根反正弦作为分析变量平方根反正弦变换的用途:使总体率较小(70%)的二项分布资料达到正态或方差齐的要求。三角函数转换有范围限制,在-1到+1范围之
24、内的数值才能进行转换。如成活率、浓度(小数)、相对生长率(小数)你现在浏览的是第六十三页,共85页SPSSSPSS如何实现数据转化如何实现数据转化 第二章对数 TransformCompute过程 目标变量框(Traget)取要转换后生成的新变量名字 表达式框(Numeric Express)中如下设置:对数:LN(原始变量名)点击OK完成平方根 TransformCompute过程 目标变量框(Traget)取要转换后生成的新变量名字 表达式框(Numeric Express)中如下设置:对数:SQRT(原始变量名)点击OK完成平方根反正弦 TransformCompute过程 目标变量框(
25、Traget)取要转换后生成的新变量名字 表达式框(Numeric Express)中如下设置:反正弦:ARSIN(SQRT(原始变量名)点击OK完成 你现在浏览的是第六十四页,共85页举例你现在浏览的是第六十五页,共85页应用 The relative growth rate(RGR)for each method was calculated from the following expression.RGR=ln(M2)-ln(M1)/(t2-t1)where ln(M2)and ln(M1)denote the mean ln-transformed plant dry mass at
26、 time t1 and t2,respectively.Gonzlez-Rodrguez V,Navarro-Cerrillo RM,and Villar R.2011.Artificial regeneration with Quercus ilex L.and Quercus suber L.by direct seeding and planting in southern Spain.Annals of Forest Science,68:637-646.你现在浏览的是第六十六页,共85页描述Data were analyzed statistically using SPSS v.
27、18(SPSS Inc.,Chicago,IL,USA).The explore function of SPSS was used to examine data for normality,and percent root biomass and percent EMF colonization were arcsine transformed prior to analyses(Kleczewski et al.2012).Kleczewski NM,Herms DA,Bonello P.2012.Nutrient and water availability alter belowgr
28、ound patters of biomass allocation,carbon partitioning,and ectomycorrhizal abundance in Betula nigra.Tree,26:525-533.你现在浏览的是第六十七页,共85页第七节第七节 t t检验检验第二章T检验,亦称,亦称student t检验(Students t test),主要用于),主要用于样本本含量含量较小(例如小(例如n30),),总体体标准差准差未知的未知的正正态分布分布资料。料。t t检验是戈斯特为了观测酿酒质量而发明的。戈斯特在位于都柏林的健力士酿酒厂检验是戈斯特为了观测酿酒质量
29、而发明的。戈斯特在位于都柏林的健力士酿酒厂担任统计学家,基于担任统计学家,基于Claude GuinnessClaude Guinness聘用从牛津大学和剑桥大学出来的最好的聘用从牛津大学和剑桥大学出来的最好的毕业生以将生物化学及统计学应用到健力士工业程序的创新政策。戈斯特于毕业生以将生物化学及统计学应用到健力士工业程序的创新政策。戈斯特于19081908年在年在BiometrikaBiometrika上公布上公布t t检验,但因其老板认为其为商业机密而被迫使用笔名检验,但因其老板认为其为商业机密而被迫使用笔名(学生)。(学生)。你现在浏览的是第六十八页,共85页第七节第七节 t t检验检验第
30、二章t检验前,首先利用前,首先利用explore进行判断数据是否行判断数据是否满足正足正态、方差、方差齐次性条件,次性条件,满足即可足即可进行行t检验;若不;若不满足,足,则需将数据需将数据进行行转换,然后再次利用然后再次利用explore进行判断是否行判断是否满足,足,满足后才能足后才能进行行t检验;如果数据如果数据转换后后实在无法条件,在无法条件,则进行非参数行非参数检验。非参数非参数检验单样本本检验:Wilcoxon符号秩符号秩检验两配两配对样本本检验:Wilcoxon符号秩符号秩检验两独立两独立样本本检验:Mann-Whitney U检验你现在浏览的是第六十九页,共85页第七节第七节
31、t t检验检验第二章单总体单总体t检验:检验一个样本平均数与一个已知的总体平均数的差检验:检验一个样本平均数与一个已知的总体平均数的差异是否显著。异是否显著。:样本平均数 :整体平均数 :样本标准差 :样本数量查t表 判断显著性如:全国大学生英语四级平均成绩为如:全国大学生英语四级平均成绩为6666分,北林分,北林20102010级林学级林学1 1班参加英语四级考班参加英语四级考试的人数为试的人数为2525人,平均成绩为人,平均成绩为7575分,标准差为分,标准差为4.824.82,该班级学生英语成绩是否与,该班级学生英语成绩是否与全国成绩存在显著差异?全国成绩存在显著差异?你现在浏览的是第七
32、十页,共85页第七节第七节 t t检验检验第二章双总体双总体t检验:相关样本(配对)、独立样本。检验:相关样本(配对)、独立样本。相关样本平均数差异的显著性检验:用于检验匹配而成的两组被试获得的相关样本平均数差异的显著性检验:用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的数据或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相关样本。样本即为相关样本。独立样本平均数的显著性检验:各实验处理组之间毫无相关存在,即为独立样本。独立样本平均数的显著性检验:各实验处理组之间毫无相关存在,即为独立样本。该检验用于检验两组非相关样本被试所
33、获得的数据的差异性。该检验用于检验两组非相关样本被试所获得的数据的差异性。你现在浏览的是第七十一页,共85页第七节第七节 t t检验检验(双总体检验双总体检验-配对样本配对样本)第二章为检验人对某品牌酒饮用清晰度的影响,随机选取8个人,分别测定饮用该酒前后的清晰度,数据如下。样本样本12345678饮用前清晰度2325262821282725饮用后清晰度1215161113171417你现在浏览的是第七十二页,共85页第七节第七节 t t检验检验(双总体检验双总体检验-配对样本配对样本)配对样本配对样本t t检验实际上是先求出每对观测值之差值,对差值变量求均检验实际上是先求出每对观测值之差值,
34、对差值变量求均值。检验配对变量均值之间差异是否显著。其实质检验的假设,是值。检验配对变量均值之间差异是否显著。其实质检验的假设,是差值变量的均值与零均值之间差异的显著性。差值变量的均值与零均值之间差异的显著性。如果差值变量为如果差值变量为x x,差值变量的均值为,差值变量的均值为 ,样本观测数为,样本观测数为n n,差值,差值变量的标准差为变量的标准差为S S,差值变量的均值标准误为,差值变量的均值标准误为 ,配对样本,配对样本t t检验的检验的t t值计算公式为值计算公式为 第二章你现在浏览的是第七十三页,共85页第七节第七节 t t检验检验(双总体检验双总体检验-配对样本配对样本)SPSS
35、实现1.建立数据结构:两个变量分别在不同列2.选择菜单Analyze-Compare Means-Paired Samples T Tests3.选择一对或若干对检测变量到Paired Variables4.选择Options 第二章你现在浏览的是第七十四页,共85页第七节第七节 t t检验检验(双总体检验双总体检验-独立样本独立样本)两个平均数差异是否显著:t检验 第二章:参数误差n:样本观测数自由度 d.f.=(n1-1)+(n2-1)查t表 判断显著性你现在浏览的是第七十五页,共85页例例分析耕地与荒地土壤中微生物数量各8次,它们的原始测量值、标准差、平均值分别为:两个处理的平均值是否有
36、显著差异?你现在浏览的是第七十六页,共85页SPSS实现实现Step 1数表结构!你现在浏览的是第七十七页,共85页Step 2你现在浏览的是第七十八页,共85页Step 4点击“Group Variable”点击“Define Groups”Step 3Step 5在Group 1、2中分别输入分类变量点击Continue你现在浏览的是第七十九页,共85页Step 6你现在浏览的是第八十页,共85页Step 7点击 OK你现在浏览的是第八十一页,共85页Robert and Lindgren.2006.Relationships between root form and growth,st
37、ability,and mortality in planted versus naturally regenerated lodgepole pine in north-central British Columbia.Canadian Journal of Forest Research,36:2642-2653.你现在浏览的是第八十二页,共85页你现在浏览的是第八十三页,共85页练习:笔算与练习:笔算与SPSS实现实现分析耕地与荒地土壤中微生物数量分别为8次和10次,它们的原始测量值分别为:(1)两组数据是否存在可疑值,正态性及齐次性判断;(2)计算微生物数量在不同土壤中的变异系数;(3)运用t检验判断两个处理的平均值是否有显著差异;(4)尝试试用标准差法、极差法和最大值法对上述数据进行标准化处理。你现在浏览的是第八十四页,共85页春季将5种规格不同的苗木按照完全随机区组试验进行造林,分为3个区组,10月末待苗木进入休眠后调查苗木高度,见下表。试用t检验分析,判断10月末苗高是否存在显著差异。你现在浏览的是第八十五页,共85页
限制150内