《生物统计附试验设计第三章ppt课件.ppt》由会员分享,可在线阅读,更多相关《生物统计附试验设计第三章ppt课件.ppt(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1第三章第三章 平均数、标准差与变异系数平均数、标准差与变异系数 次数分布表和次数分布图,可以形象、次数分布表和次数分布图,可以形象、直观地表示出资料的两个特征直观地表示出资料的两个特征集中集中性和离散性性和离散性。 为了更简单、精确地描述资料的特征,为了更简单、精确地描述资料的特征,本章介绍三个统计量本章介绍三个统计量平均数、标准平均数、标准差和变异系数差和变异系数。 平均数反应资料的集中性,标准差和平均数反应资料的集中性,标准差和变异系数反应资料的离散性。变异系数反应资料的离散性。 2 第一节第一节 平均数平均数 第二节第二节 标准差标准差 第三节第三节 变异系数变异系数3第一节第一节 平
2、均数平均数 (Mean) 平均数的意义平均数的意义 平均数用来描述资料的平均数用来描述资料的集中性集中性,即指,即指出资料中数据集中较多的中心位置出资料中数据集中较多的中心位置。 平均数的作用平均数的作用 平均数是平均数是资料的代表数资料的代表数 常用于常用于同类性质资料间同类性质资料间的相互比较的相互比较 4 平均数的种类 算术平均数算术平均数(Arithmetic mean)(Arithmetic mean) (应用最为普遍)(应用最为普遍) 几何平均数几何平均数(Geometric mean) 中数(中数(median) 众数众数(Mode) 调和平均数调和平均数(Harmonic Me
3、an)5一、算术平均数一、算术平均数 (一)算术平均数的定义(一)算术平均数的定义 资料中各观察值的总和除以观察值的资料中各观察值的总和除以观察值的个数所得的商,称为个数所得的商,称为算术平均数算术平均数。在统在统计学中,简称为计学中,简称为平均数或均数。平均数或均数。用符号用符号 表示。表示。 (二)计算方法(二)计算方法 1 1、直接法、直接法 对样本含量较小,未对样本含量较小,未分组的资料适用。分组的资料适用。 x6 其中,其中, (Sigma)为总和符号,)为总和符号, 表表示从第一个观察值示从第一个观察值 x1 累加到第累加到第n个观察值个观察值 xn ,若在意义上已明确时,简记为,
4、若在意义上已明确时,简记为 。nxnxxxxniin121xniix17关于总和符号的几个性质关于总和符号的几个性质 常数的总和等于该常数的常数的总和等于该常数的n倍,即倍,即 代数和的总和等于总和的代数和,即代数和的总和等于总和的代数和,即 总和符号内的常数因子可以提取到总和符号总和符号内的常数因子可以提取到总和符号之外,即之外,即nCCni 1其中其中C为常数;注意:在后面一些章节为常数;注意:在后面一些章节经常会遇到经常会遇到C代表一个为常量的式子代表一个为常量的式子iiiiiizyxzyx)( njkiijkinjijxx1111iixaax(a为常数)8 2 2、加权法、加权法 适用
5、于已分组的资料适用于已分组的资料 kkkfffxfxfxfx.212211ffxfxfkiikiii11各组的次数各组的次数 fi 是权衡各是权衡各组中值组中值 xi 在资料中所在资料中所占比重大小的数量,因此占比重大小的数量,因此f被称为是被称为是x的的“权权”(right),加权法加权法也由此而得名。也由此而得名。 xi 各组组中值各组组中值 fi 各组次数各组次数 k 分组数分组数9( (三三) )平均数的基本性质平均数的基本性质 1、样本各个观察值与平均数之差的和为、样本各个观察值与平均数之差的和为零,即零,即离均差之和为零离均差之和为零; 2、样本各观察值与平均数之差的平方和样本各观
6、察值与平均数之差的平方和为最小,即为最小,即离均差的平方和最小离均差的平方和最小。0, 0)(1)(简记为xxxxnii221212)()()()(axxxxaaxxxniinii)(简记为:常数1022)()(axxx)2()2(2222naxaxxnxxx)()(2axxanxax0)()()()2(2xanaxnxanaxxaxnnaxxa)()(11 3 3、统计学已证明,样本平均数、统计学已证明,样本平均数 是总体是总体平均数平均数 的无偏估计值。的无偏估计值。 对总体而言,用对总体而言,用 表示平均数。表示平均数。 对于对于有限总体有限总体 无偏估计:无偏估计:当一个统计量的当一个
7、统计量的数学期望值数学期望值等于相应总体参数时,称该统计量为其总等于相应总体参数时,称该统计量为其总体参数的无偏估计。体参数的无偏估计。NxNii1N有限总体所有限总体所包含的个体数目包含的个体数目x12二、几何平均数二、几何平均数 (一)定义(一)定义 n个观察值乘积的个观察值乘积的n次方根。次方根。即即 (二)适用条件(二)适用条件 主要应用于数据主要应用于数据呈倍数关系呈倍数关系或或不对称不对称分布分布的资料,算术平均数对这类资料的的资料,算术平均数对这类资料的代表性差。代表性差。 (三)计算(三)计算nnnnxxxxxxG1).(.212113 1 1、应用公式计算(实际应用时常取对数
8、)、应用公式计算(实际应用时常取对数)nnxxxG21nxxxnGlglglg1lg21niixn1lg1niixnG11lg1lg14 2、当资料编成次数分布表时、当资料编成次数分布表时,)lg(lg1fxfGi 各组组中值;各组组中值; 各组次数;各组次数; ixif15三、中三、中 数数 (一)定义 将资料中所有观察值从将资料中所有观察值从小到大依次排列,处于中间位置的数。小到大依次排列,处于中间位置的数。以以 表示。表示。 (二)适用条件 资料呈资料呈偏态分布偏态分布或或次数分布类型不明次数分布类型不明,以及,以及一端或两端无一端或两端无确定数值确定数值, ,这种资料用中位数作为代表这
9、种资料用中位数作为代表值比用算术平均数为好。值比用算术平均数为好。dM16 (三)计算方法 先将各观察值由小到大排列先将各观察值由小到大排列 当当n为奇数时,第为奇数时,第 位置的观察值位置的观察值即为中数,即为中数, 即即 当当n为偶数时,为偶数时, 和和 位置的两位置的两个观察值之和的二分之一即为中数,即:个观察值之和的二分之一即为中数,即:2/ ) 1( n2/ )1( ndxM2/ n12/ n2)12/(2/nndxxM17 (一)众数(一)众数 资料中出现次数最多的那个数或次数最资料中出现次数最多的那个数或次数最多一组的组中值,记为多一组的组中值,记为Mo。 (二)调和平均数(二)
10、调和平均数 指资料中各观察值指资料中各观察值倒数的平均数的倒数,用倒数的平均数的倒数,用H表示。主要用表示。主要用于求一个过程中于求一个过程中各部分速率的平均速率各部分速率的平均速率。 inxnxxxnH1)111(1121四、众数和调和平均数四、众数和调和平均数18 对同一资料,几种主要的平均数对同一资料,几种主要的平均数之间的关系之间的关系 算术平均数算术平均数 几何平均数几何平均数 调和平调和平均数均数19第二节第二节 标准差标准差(Standard deviation) 平均数是资料的代表数,平均数是资料的代表数,其代表性强其代表性强弱受资料中各观察值变异程度的影响弱受资料中各观察值变
11、异程度的影响。 因此还应引入一个能说明资料各观察因此还应引入一个能说明资料各观察值变异程度大小的统计量。值变异程度大小的统计量。 极差极差 标准差和方差标准差和方差 变异系数等,其中以变异系数等,其中以方差与标准差方差与标准差应用最广。应用最广。20 一、标准差的引入一、标准差的引入 1、全距(极差)全距(极差):只利用了资料中:只利用了资料中最大值和最小值,不能准确表达资料最大值和最小值,不能准确表达资料中各个观察值的变异程度。中各个观察值的变异程度。 2、方差与标准差的定义、方差与标准差的定义 21)(xx 0)(xx xx它不能表示整个它不能表示整个资料中所有观察资料中所有观察值的总偏离
12、程度值的总偏离程度使用不方便,在统使用不方便,在统计学中未被采用计学中未被采用)(xx 2)(xx2)(xx) 1/()(2nxx) 1/()(2nxxs消除离均消除离均差的负号差的负号离均差的平方之离均差的平方之和(简称和(简称平方和平方和,记为记为SS)称为称为均方均方(缩写为(缩写为MS),又称为),又称为样本样本方差方差,记为,记为S2标准差标准差22) 1/()(22nxxS样本方差(样本方差(S2)/样本均方(样本均方(MS))1/()(2nxxS样本标准差(样本标准差(S)对样本而言对样本而言对有限总体而言对有限总体而言Nx/)(22总体方差(总体方差(2 )Nx/)(2总体标准
13、差(总体标准差( )232)(xxSS)2(22xxxx222xnxxxnxxnxnxnxx2222)()(224 样本方差的分母样本方差的分母(n-1)为样本方差的自为样本方差的自由度,记为由度,记为df 自由度(自由度(df ):样本含量减去):样本含量减去独立约束独立约束条件条件的个数的个数25二、标准差的计算二、标准差的计算 (一)直接法(一)直接法 (二)加权法(二)加权法1/)(22nnxxs1/)(1)(222iiiiiiiiiffxfxffxxfs26 三、标准差的特性 (一)(一)标准差的大小标准差的大小,受资料中每个观,受资料中每个观测值的影响测值的影响; (二)在计算标准
14、差时,在各观测值(二)在计算标准差时,在各观测值加加上或减去上或减去一个常数,其数值不变一个常数,其数值不变; (三)当每个观测值(三)当每个观测值乘以或除以一个常乘以或除以一个常数数a,则所得的标准差是原来标准差的,则所得的标准差是原来标准差的a倍或倍或1/a倍。倍。27 (四)(四)在资料服从正态分布的条件下在资料服从正态分布的条件下,资料中约有资料中约有68.26%的观测值在平均数左的观测值在平均数左右一倍标准差右一倍标准差( S)范围内;约有范围内;约有95.43%的观测值在平均数左右两倍标准的观测值在平均数左右两倍标准差(差( 2S)范围内;约有)范围内;约有99.73%的观的观测值
15、在平均数左右三倍标准差(测值在平均数左右三倍标准差( 3S)范围内。范围内。 即全距近似地等于即全距近似地等于6倍标准差,倍标准差, 可用可用 来粗略估计标准差。来粗略估计标准差。xxx6全距28第三节第三节 变异系数变异系数(Coefficient of variation) (1)变异系数的定义)变异系数的定义 变异系数是标准差相对于平均数的百变异系数是标准差相对于平均数的百分数,记为分数,记为CV。 变异系数同标准差一样是衡量资料变异系数同标准差一样是衡量资料变异程度的统计量。变异系数消除了不变异程度的统计量。变异系数消除了不同单位和平均数的影响,可以用来比较同单位和平均数的影响,可以用来比较不同资料的相对变异程度不同资料的相对变异程度。 (2)计算公式)计算公式%100 xscv29 (3 3)特点和作用)特点和作用 变异系数是一个变异系数是一个无单位的相对数无单位的相对数,用表示;用表示; 变异系数变异系数同时受到平均数和标准同时受到平均数和标准差的影响差的影响。 变异系数变异系数不受单位不同或平均数不受单位不同或平均数不同的影响不同的影响,对于单位不同和平均数,对于单位不同和平均数不同的资料,都可以用变异系数来比不同的资料,都可以用变异系数来比较其变异程度较其变异程度。30 本章涉及的一些重要符号本章涉及的一些重要符号0,MMHGxRddfMSSS,),(,22VC.
限制150内