《第三章平均数、标准差与变异系数.ppt》由会员分享,可在线阅读,更多相关《第三章平均数、标准差与变异系数.ppt(63页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、兽医统计学兽医统计学第三章第三章 平均数、标准差与变异系数平均数、标准差与变异系数 第三章平均数、标准差与变异系数第三章平均数、标准差与变异系数第一节第一节 平均数平均数算术平均数(算术平均数(arithmetic mean)中位数(中位数(median)众数(众数(mode)几何平均数(几何平均数(geometric mean)百分位数(百分位数(percentiles)调和平均数(调和平均数(harmonic mean)第二节第二节 标准差标准差标准差的意义标准差的意义标准差的计算方法标准差的计算方法第三节第三节 变异系数变异系数 第一节第一节 平均数平均数 平均数平均数是统计学中最常用的
2、统计量,用来是统计学中最常用的统计量,用来表明资料中各观测值相对表明资料中各观测值相对集中集中较多的中心位置,较多的中心位置,并且可作为资料的代表而与另一组资料相比较,并且可作为资料的代表而与另一组资料相比较,借以明确二者之间相差借以明确二者之间相差(或者差异或者差异)的情况。的情况。平均数主要包括有:平均数主要包括有:算术平均数(算术平均数(arithmetic mean)中位数(中位数(median)众数(众数(mode)几何平均数(几何平均数(geometric mean)调和平均数(调和平均数(harmonic mean)1 1算术平均数算术平均数算术平均数是指资料中各观测值的算术平均
3、数是指资料中各观测值的总和除以总和除以观测观测值值个数个数所得的商,简称平均数或均数。所得的商,简称平均数或均数。定义定义样本均值记为样本均值记为:总体均值记为总体均值记为:第一节第一节 平均数平均数1 1算术平均数算术平均数 若样本较小若样本较小,即资料包含的观察值个数不多,可,即资料包含的观察值个数不多,可直接计算直接计算平均数。设一个含有平均数。设一个含有n个观察值的样本,个观察值的样本,其各个观察值为其各个观察值为x1、x2、x3、xn,则算术平均,则算术平均数由下式算得。数由下式算得。第一节第一节 平均数平均数例例1 某种公牛站测得某种公牛站测得10头成年公牛的体重分别为头成年公牛的
4、体重分别为500、520、535、560、585、600、480、510、505、490(kg),求其平均数。),求其平均数。第一节第一节 平均数平均数若样本较大若样本较大,且已进行了分组,且已进行了分组(资料经过整理资料经过整理后得到的后得到的次数分布表次数分布表,可采用加权法计算算,可采用加权法计算算术平均数,即用组中点值代表该组出现的观术平均数,即用组中点值代表该组出现的观测值以计算平均数,其公式为:测值以计算平均数,其公式为:第一节第一节 平均数平均数例例2 200头奶牛血镁含量次数分布表头奶牛血镁含量次数分布表 第一节第一节 平均数平均数1 1算术平均数算术平均数 第一节第一节 平均
5、数平均数计算若干个来自同一总体的样本平均数的平均数计算若干个来自同一总体的样本平均数的平均数时,如果样本含量不等,也应采用加权法计算。时,如果样本含量不等,也应采用加权法计算。p 加权法加权法例例3 某牛群有黑白花奶牛某牛群有黑白花奶牛1500头,其平均体重头,其平均体重为为750 kg,而另一牛群有黑白花奶牛,而另一牛群有黑白花奶牛1200头,平头,平均体重为均体重为725 kg,如果将这两个牛群混合在一起,如果将这两个牛群混合在一起,其混合后平均体重为多少?其混合后平均体重为多少?第一节第一节 平均数平均数样样本各本各观观察察值值与其平均数的差数与其平均数的差数(简简称离均差称离均差)的的
6、总总和等于和等于0。p算术平均数的重要特性算术平均数的重要特性 第一节第一节 平均数平均数样样本各本各观观察察值值与其平均数的差数平方的与其平均数的差数平方的总总和,和,较较各个各个观观察察值值与任意其他数与任意其他数值值的差数平方的的差数平方的总总和和为为最小,即最小,即对对任意任意实实数数 a,均有下式成立,当均有下式成立,当且且仅仅当当a取取样样本均本均值时值时,等号成立。,等号成立。p算术平均数的重要特性算术平均数的重要特性 第一节第一节 平均数平均数总体平均数用总体平均数用 来代表,它同样具有算术来代表,它同样具有算术平均数所具有的特性平均数所具有的特性总体平均数总体平均数 第一节第
7、一节 平均数平均数2中位数中位数将资料内所有观测值从小到大依次排列,位于将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为中间的那个观测值,称为中位数,记为Md。当观测值的个数是偶数时,则以中间两个观测当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。当所获得的数据资料呈值的平均数作为中位数。当所获得的数据资料呈偏态分布偏态分布时,时,中位数的代表性优于算术平均数中位数的代表性优于算术平均数。注意:注意:中位数主要用于有序资料中位数主要用于有序资料 第一节第一节 平均数平均数中位数的计算方法因资料是否分组而有所不同。中位数的计算方法因资料是否分组而有所不同。
8、未分组资料中位数的计算方法未分组资料中位数的计算方法 例例4 观察得观察得9只西农莎能奶山羊的妊娠天数为只西农莎能奶山羊的妊娠天数为 144、145、147、149、150、151、153、156、157,求其中位数。,求其中位数。此例此例 n=9,为奇数,为奇数,150为其中位数为其中位数 第一节第一节 平均数平均数例例5 某犬场发生犬瘟热,观察得某犬场发生犬瘟热,观察得10只仔犬发现只仔犬发现症状到死亡分别为症状到死亡分别为7、8、8、9、11、12、12、13、14、14天,求其中位数。天,求其中位数。此例此例 n=10,为偶数,则:,为偶数,则:第一节第一节 平均数平均数已分组资料中位
9、数的计算方法已分组资料中位数的计算方法若资料已分组,编制成次数分布表,则可利用次若资料已分组,编制成次数分布表,则可利用次数分布表来计算中位数,其计算公式为:数分布表来计算中位数,其计算公式为:式中:式中:L 中位数所在组的下限;中位数所在组的下限;i 组距;组距;f 中位数所在组的次数;中位数所在组的次数;n 总次数;总次数;c 小于中数所在组的累加次数。小于中数所在组的累加次数。第一节第一节 平均数平均数f(x)xx0 第一节第一节 平均数平均数例例6 某奶牛场某奶牛场68头健康母牛从分娩到第一次发情间隔头健康母牛从分娩到第一次发情间隔时间时间 整理成次数分布表如表整理成次数分布表如表 2
10、 所示,求中位数。所示,求中位数。68头母牛从分娩到第一次发情间隔时间次数分布表头母牛从分娩到第一次发情间隔时间次数分布表 第一节第一节 平均数平均数68头母牛从分娩到第一次发情间隔时间次数分布表头母牛从分娩到第一次发情间隔时间次数分布表 第一节第一节 平均数平均数众数主要用于描述名义变量中出现频率最高的数众数主要用于描述名义变量中出现频率最高的数3众数众数 资料中出现次数最多的那个观测值或次数最多资料中出现次数最多的那个观测值或次数最多一组的组中值,称为众数一组的组中值,称为众数 例:例:50枚受精种蛋孵化出雏鸡的天数枚受精种蛋孵化出雏鸡的天数50枚受精种蛋出雏天数的次数分布表枚受精种蛋出雏
11、天数的次数分布表 第一节第一节 平均数平均数 在在连续连续性性资资料的次数分布表中,分布次数最多料的次数分布表中,分布次数最多一一组组的的组组中中值值即即为该样为该样本的概本的概约约众数。但在众数。但在实际统实际统计计分析分析过过程中,由于分程中,由于分组组不同,概不同,概约约众数亦不同。众数亦不同。可用可用补补差法差法计计算众数,其准确性高于众数。算众数,其准确性高于众数。第一节第一节 平均数平均数例例 68头母牛从分娩到第一次发情间隔时间次数分布表头母牛从分娩到第一次发情间隔时间次数分布表 第一节第一节 平均数平均数4 4几何平均数几何平均数 n 个观测值相乘之积开个观测值相乘之积开 n
12、次方所得的方根,称次方所得的方根,称为几何平均数,记为为几何平均数,记为G。它主要应用于畜牧业、水。它主要应用于畜牧业、水产业的生产动态分析,畜禽疾病及药物效价的统计产业的生产动态分析,畜禽疾病及药物效价的统计分析分析。如畜禽如畜禽、水产养殖的、水产养殖的 增长率,抗体的滴度,增长率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等,用几何平均数药物的效价,畜禽疾病的潜伏期等,用几何平均数比用算术平均数更能代表其平均水平。比用算术平均数更能代表其平均水平。第一节第一节 平均数平均数为了计算方便,可将各观测值取对数后相加除以为了计算方便,可将各观测值取对数后相加除以 n,得,得lgG,再求,再求lgG
13、的倒数,即得的倒数,即得G值,即值,即 第一节第一节 平均数平均数例例 某波尔山羊群某波尔山羊群19972000年各年度的存栏数见年各年度的存栏数见下表,试求其年平均增长率下表,试求其年平均增长率表表 某波尔山羊群各年度存栏数与增长率某波尔山羊群各年度存栏数与增长率年度年度存栏数(只)存栏数(只)增长率(增长率(x)Lgx199714019982000.429-0.36819992800.400-0.39820003500.250-0.602lgx=-1.368G=lg-1(-0.368-0.3980.602)=lg-1(-0.456)=0.3501 第一节第一节 平均数平均数5调和平均数调和
14、平均数资料中各观测值倒数的算术平均数资料中各观测值倒数的算术平均数 的倒数,称的倒数,称为调和平均数,记为为调和平均数,记为H调和平均数主要用于反映畜群不同阶段的平均增调和平均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模长率或畜群不同规模的平均规模 第一节第一节 平均数平均数例例:某保种牛群不同世代牛群保种的规模分别为:某保种牛群不同世代牛群保种的规模分别为:0世代世代200头,头,1世代世代220头,头,2世代世代210头,头,3世代世代190头,头,4世代世代210头,试求其平均规模。头,试求其平均规模。第一节第一节 平均数平均数 对于同一资料:对于同一资料:算术平均数算
15、术平均数 几何平均数几何平均数 调和平均数调和平均数 上述五种平均数,最常用的是算术平均数。上述五种平均数,最常用的是算术平均数。对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数 均值均值均值均值均值均值数据数据算数平均数算数平均数几何平均数几何平均数调和平均数调
16、和平均数10,10,10,1010.0010.0010.009,10,10,1110.009.979.955,10,10,1510.009.318.571,2,18,1910.005.112.49 第一节第一节 平均数平均数六、百分位数六、百分位数 当研究资料的观测值不呈正态分布,或不能确定当研究资料的观测值不呈正态分布,或不能确定其分布类型,常用百分位数(其分布类型,常用百分位数(percentiles)作为统计)作为统计指标。百分位数就是把观测值按大小顺序排列起来,指标。百分位数就是把观测值按大小顺序排列起来,处在某个百分位上的数值。实际上中位数即为第处在某个百分位上的数值。实际上中位数即
17、为第50百分位数。百分位数。样本含量太小时计算百分位数的意义不大。样本含量太小时计算百分位数的意义不大。第一节第一节 平均数平均数 把把观测值观测值按大小次序排列,把要求的百分按大小次序排列,把要求的百分位数乘以(位数乘以(n+1),即),即为为所求的百分位数所在的所求的百分位数所在的位置。位置。直接法直接法 第一节第一节 平均数平均数 为百分位数所在组的次数,为百分位数所在组的次数,C为小于百分位数所在组的累加次数。为小于百分位数所在组的累加次数。式中:式中:为为百分位数所在百分位数所在组组的下限,的下限,为组为组距,距,n n 为样为样本含量,本含量,频数分布表法频数分布表法 计算百分位数
18、亦可在频数表上进行,其原理与计算百分位数亦可在频数表上进行,其原理与在频数表上计算中位数相同。在频数表上计算中位数相同。第一节第一节 平均数平均数 第二节第二节 标准差标准差一、标准差的意义标准差的意义二、标准差的计算方法二、标准差的计算方法三、标准差的特性三、标准差的特性资料数据的描述方法:资料数据的描述方法:l平均数:描述资料集中趋势的统计量平均数:描述资料集中趋势的统计量l全距(极差)是表示资料中各观测值变异程度全距(极差)是表示资料中各观测值变异程度大小最简便的统计量。但是全距只利用了资料大小最简便的统计量。但是全距只利用了资料中的最大值和最小值,并不能准确表达资料中中的最大值和最小值
19、,并不能准确表达资料中各观测值的变异程度,比较粗略。当资料很多各观测值的变异程度,比较粗略。当资料很多而又要迅速对资料的变异程度作出判断时,可而又要迅速对资料的变异程度作出判断时,可以利用全距这个统计量。以利用全距这个统计量。第二节第二节 标准差标准差 第二节第二节 标准差标准差四分位数间距(四分位数间距(interquartile range)即上四分位数即上四分位数QU和下四分位数和下四分位数QL之差,其之差,其间包括了间包括了50%位次居中的个体观测值位次居中的个体观测值 箱式图:处理箱式图:处理50%50%的数据,受极端值影响小的数据,受极端值影响小编号编号成绩成绩指标指标119529
20、2190891388486784980801075127136956667.5862656远离远离群值群值内篱值内篱值外篱值外篱值近离群值近离群值须须上上四四分分位位下下四四分分位位中中位位数数节节l以平均数为标准,求出各个观测值与平均数的以平均数为标准,求出各个观测值与平均数的离差,(离差,(),称为离均差。,称为离均差。l虽然离均差能表示一个观测值偏离平均数的性虽然离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负质和程度,但因为离均差有正、有负 ,离均,离均差之和为零,即:差之和为零,即:因而不能用离均差之和因而不能用离均差之和 来表示资料中所有观测值的总偏离程度。来表
21、示资料中所有观测值的总偏离程度。第二节第二节 标准差标准差l采用将离均差平方的办法来解决离均差有正、采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。有负,离均差之和为零的问题。先求各个离均差平方:先求各个离均差平方:再求离均差平方和:再求离均差平方和:为为了解决离均差有正、有了解决离均差有正、有负负,离均差之和,离均差之和为为零的零的问问题题,可先求离均差的,可先求离均差的绝对值绝对值并将各离均差并将各离均差绝对值绝对值之之和除以和除以观测值观测值个数个数n求得平均求得平均绝对绝对离差,即离差,即 第二节第二节 标准差标准差细胞计数细胞计数()离均差离均差()绝对离均差绝对
22、离均差()离均差平方离均差平方()6-2248 0005-33910 22411 2249 111变异的观察与计算变异的观察与计算 第二节第二节 标准差标准差 为了消除样本大小的影响,用平方和除以样本为了消除样本大小的影响,用平方和除以样本含量,求出离均差平方和的平均数。含量,求出离均差平方和的平均数。第二节第二节 标准差标准差p在统计学中,求离均差平方和的平均数时,分在统计学中,求离均差平方和的平均数时,分母不用样本含量母不用样本含量n n,而用自由度的,而用自由度的df=ndf=n-1-1,于,于是,我们采用统计量如下公式表示资料的变异是,我们采用统计量如下公式表示资料的变异程度。程度。称
23、为均方,又称样本方差,记为称为均方,又称样本方差,记为 第二节第二节 标准差标准差1.一组数据中可以自由取值的数据的个数一组数据中可以自由取值的数据的个数2.当当样样本本数数据据的的个个数数为为 n 时时,若若样样本本均均值值 x 确确定定后后,只只有有n-1个个数数据据可可以以自自由由取取值值,其其中中必必有有一一个数据则不能自由取值个数据则不能自由取值3.例例如如,样样本本有有3个个数数值值,即即x1=2,x2=4,x3=9,则则 x=5。当当 x=5 确确定定后后,x1,x2和和x3有有两两个个数数据据可可以以自自由由取取值值,另另一一个个则则不不能能自自由由取取值值,比比如如x1=6,
24、x2=7,那那么么x3则则必必然然取取2,而而不不能能取取其他值其他值4.样样本本方方差差用用自自由由度度去去除除,其其原原因因可可从从多多方方面面来来解解释释,从从实实际际应应用用角角度度看看,在在抽抽样样估估计计中中,当当用用样样本本方方差差去去估估计计总总体体方方差差2时时,它它是是2的的无无偏偏估计量估计量自由度的理解自由度的理解p 相应的总体参数叫总体方差相应的总体参数叫总体方差 ,记为,记为2 2。对于有限总体而言,对于有限总体而言,2 2的计算公式为:的计算公式为:第二节第二节 标准差标准差p 由于样本方差带有原观测单位的平方单位,在由于样本方差带有原观测单位的平方单位,在仅表示
25、一个资料中各观测值的变异程度而不作其仅表示一个资料中各观测值的变异程度而不作其它分析时,它分析时,常需要与平均数配合使用,这时应常需要与平均数配合使用,这时应将平方单位还原,即应求出样本方差的平方根。将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差统计学上把样本方差S S2 2 的平方根叫做样本标准差,的平方根叫做样本标准差,记为记为S S,即:,即:第二节第二节 标准差标准差公式变形公式变形 第二节第二节 标准差标准差相应的总体参数叫总体标准差,记为相应的总体参数叫总体标准差,记为。对。对于有限总体而言,于有限总体而言,的计算公式为:的计算公式为:在统计学中,常用样本标准差在统计
26、学中,常用样本标准差 S 估计总体标准差估计总体标准差。第二节第二节 标准差标准差二、标准差的计算方法二、标准差的计算方法(一)直接法(一)直接法对于小样本,按照公式直接计算对于小样本,按照公式直接计算 第二节第二节 标准差标准差测定测定8 8头成年母猪血清球蛋白含量,结果如下:头成年母猪血清球蛋白含量,结果如下:2.32.3,2.42.4,2.42.4,2.72.7,2.92.9,3.03.0,2.92.9,3.23.2计算血清样品中球蛋白含量的标准差计算血清样品中球蛋白含量的标准差 第二节第二节 标准差标准差二、标准差的计算方法二、标准差的计算方法(二)加权法(二)加权法对于已制成次数分布
27、表的对于已制成次数分布表的大样本大样本资料,可利用资料,可利用次数分布表,采用加权法计算标准差,计算公次数分布表,采用加权法计算标准差,计算公式为:式为:式中,式中,f 为各组次数;为各组次数;x 为各组的组中值;为各组的组中值;f=n 为总次数为总次数。第二节第二节 标准差标准差200头奶牛血镁含量次数分布表头奶牛血镁含量次数分布表 第二节第二节 标准差标准差 第二节第二节 标准差标准差二、标准差的特性二、标准差的特性1、标准差的大小,受资料中每个观测值的影响,标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。如观测值间变异大,求得的标准差也大,反之则小。
28、第二节第二节 标准差标准差二、标准差的特性二、标准差的特性2、在计算标准差时,在各观测值加上或减在计算标准差时,在各观测值加上或减去一去一 个常数,其数值不变。个常数,其数值不变。x1、x2、x3、xn样本样本1 1 X1-a、x2-a、x3-a、xn-a样本样本2 2 S1=S2 第二节第二节 标准差标准差二、标准差的特性二、标准差的特性3、当每个观测值乘以或除以一个常数、当每个观测值乘以或除以一个常数a,则所,则所得的标准差是原来标准差的得的标准差是原来标准差的a倍或倍或1/a倍。倍。x1、x2、x3、xn样本样本1 X1a、x2a、x3a、xna样本样本2 aS1=S2 第二节第二节 标
29、准差标准差4、在资料服从正态分布的条件下,资料中约有在资料服从正态分布的条件下,资料中约有68.26%的观测值在平均数左右一倍标准差(的观测值在平均数左右一倍标准差(S)范围内;约有范围内;约有95.43%的观测值在平均数左右两倍的观测值在平均数左右两倍标准差(标准差(2S)范围内;约有)范围内;约有99.73%的观测值在的观测值在平均数左右三倍标准差(平均数左右三倍标准差(3S)范范 围内。全距近围内。全距近似地等于似地等于6倍标准差,可用(全距倍标准差,可用(全距/6)来粗略估计)来粗略估计标准差。标准差。二、标准差的特性二、标准差的特性 第二节第二节 标准差标准差变异系数是衡量资料中各观
30、测值变异程度的另一变异系数是衡量资料中各观测值变异程度的另一个统计量。个统计量。标准差与平均数的比值称为变异系数,记为标准差与平均数的比值称为变异系数,记为CV。变异系数可以消除单位和平均数不同对两个或多变异系数可以消除单位和平均数不同对两个或多个资料变异程度比较的影响。个资料变异程度比较的影响。第三节第三节 变异系数变异系数 第三节第三节 变异系数变异系数 实例实例 已知某良种猪场长白成年母猪平均体重为已知某良种猪场长白成年母猪平均体重为 190kg,标准差为标准差为10.5kg,而大约克成年母猪平,而大约克成年母猪平均体重为均体重为196kg,标准差为,标准差为8.5kg,试问两个品种,试
31、问两个品种的成年母猪,那一个体重变异程度大。的成年母猪,那一个体重变异程度大。长白成年母猪体重的变异系数长白成年母猪体重的变异系数大约克成年母猪体重的变异系数大约克成年母猪体重的变异系数所以,长白成年母猪体重的变异程度大于大约克成年母猪所以,长白成年母猪体重的变异程度大于大约克成年母猪注意:注意:变异系数的大小,同时受平均数和标准差两个统变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表示资料的变计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出。异程度时,最好将平均数和标准差也列出。变异系数也是表示样本变异程度的一个量值,它变异系数也是表示
32、样本变异程度的一个量值,它与标准差不同,标准差是一个绝对值,有单位,与标准差不同,标准差是一个绝对值,有单位,而变异系数是一个相对数,没有单位,故可用于而变异系数是一个相对数,没有单位,故可用于比较不同单位资料的变异程度;比较不同单位资料的变异程度;变异系数不受平均数大小的影响,故变异系数可变异系数不受平均数大小的影响,故变异系数可用来比较不同平均数资料的变异程度。用来比较不同平均数资料的变异程度。第三节第三节 变异系数变异系数第四节第四节 正常值范围的确定正常值范围的确定一、确定正常值范围的意义一、确定正常值范围的意义 正常值范围(正常值范围(normal ranges),又称参考值范围),
33、又称参考值范围(reference ranges),是指绝大多数正常动物的各种),是指绝大多数正常动物的各种生理生化指标或组织,排泄物中各种成份的含量和生理生化指标或组织,排泄物中各种成份的含量和各种组织、器官解剖指标等的范围。各种组织、器官解剖指标等的范围。体重在体重在1.52.5 kg范围内的白色莱航鸡其正常白细范围内的白色莱航鸡其正常白细胞数公鸡为(胞数公鸡为(9.7631.0)103/mm3,母鸡为,母鸡为(9.228.6)103/mm3猪的正常体温为猪的正常体温为3839.5,牛的正常红细胞数为(牛的正常红细胞数为(5.57.0)106/mm3 二、确定正常值范围的原则二、确定正常值
34、范围的原则选定足够数量的正常动物作为调查对象选定足够数量的正常动物作为调查对象测定的方法要统一、准确测定的方法要统一、准确 分类分组要合理分类分组要合理 确定正常值范围取单侧还是双侧范围确定正常值范围取单侧还是双侧范围 选定适当的百分界限选定适当的百分界限 第四节第四节 正常值范围的确定正常值范围的确定 为样为样本平均数,本平均数,s为样为样本本标标准差,准差,u为标为标准正准正态态分布与正常分布与正常值值范范围围相相对应对应的的临临界界值值常数常数 三、估计正常值范围的方法三、估计正常值范围的方法百分位数法百分位数法正态分布法正态分布法 采用正态分布法估计正常值范围仅适用于服从正采用正态分布
35、法估计正常值范围仅适用于服从正态分布或数据经变换服从正态分布的资料,由于态分布或数据经变换服从正态分布的资料,由于它受两端数据影响较小,因此它所估计的结果比它受两端数据影响较小,因此它所估计的结果比百分位数法稳定可靠,资料分布越接近正态,估百分位数法稳定可靠,资料分布越接近正态,估测结果越准确。测结果越准确。将全部观测值由小到大依次排列,编上将全部观测值由小到大依次排列,编上秩次秩次,再把全部秩次分为再把全部秩次分为100等分等分,这时与,这时与x%秩次所对应的秩次所对应的数值即为第数值即为第x百分位数,记为百分位数,记为px。例如求第。例如求第95百分位百分位数,即数,即p95。指标值过大或
36、过小均为异常,用双侧百。指标值过大或过小均为异常,用双侧百分位数确定正常值范围,需求出分位数确定正常值范围,需求出2.5%和和97.5%位数,位数,记为记为p2.5和和p97.5;当指标低限无意义,用单侧确定正;当指标低限无意义,用单侧确定正常值范围,则需求出上限第常值范围,则需求出上限第95百分位数百分位数p95;当指标;当指标高限无意义,则需求出低限第高限无意义,则需求出低限第5百分位数百分位数p5。用百分位数估计正常值范围,要求样本含量大,用百分位数估计正常值范围,要求样本含量大,一般以一般以n200为妥。样本太小计算结果误差较大。为妥。样本太小计算结果误差较大。第四节第四节 正常值范围
37、的确定正常值范围的确定正态分布法正态分布法 估计奶牛血清镁离子的正常值范围估计奶牛血清镁离子的正常值范围试验获得某地试验获得某地200头奶牛血清镁离子的含量平均值头奶牛血清镁离子的含量平均值和标准差分别为:和标准差分别为:附表附表2查得双侧查得双侧95%正常值范围正常值范围u值为值为1.96,代入公,代入公式得:式得:下限:下限:上限:上限:第四节第四节 正常值范围的确定正常值范围的确定参参 考考资料类型资料类型描述集中趋势的描述集中趋势的测量值测量值描述离散趋势的描述离散趋势的测量值测量值名义资料名义资料众数众数离散指数离散指数有序资料有序资料中位数中位数极差极差众数众数四分位间距四分位间距区间资料区间资料均数均数标准差标准差中位数中位数极差极差众数众数四分位间距四分位间距定量资料定量资料均数均数标准差标准差中位数中位数极差极差众数众数四分位间距四分位间距本本 章章 小小 节节l了解和掌握几种平均数的意义、性质、方法及用途了解和掌握几种平均数的意义、性质、方法及用途l理解并掌握方差、标准差、变异系数的意义及算法理解并掌握方差、标准差、变异系数的意义及算法l熟悉正常值制定的意义、原则及方法熟悉正常值制定的意义、原则及方法
限制150内