第一三章基本概念平均数变异数PPT讲稿.ppt

资源ID：50061847 资源大小：1.43MB 全文页数：21页
资源格式： PPT 下载积分：18金币

快捷下载

会员登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要18金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

第一三章基本概念平均数变异数PPT讲稿.ppt

第一三章基本概念平均数变异数第1页，共21页，编辑于2022年，星期一第一章第一章基本概念、平均数、变异数基本概念、平均数、变异数学习要求学习要求通过本次课堂的学习，使同学了解生物统计与试验设计等一些常用名词的基本概念；了解生物统计课程的性质、地位和任务及在生物学领域科学研究中的功用。使学生理解数量性状资料最基本的统计特征数（平均数、标准差和变异数）的含意及特性，掌握它们的计算方法。重点与难点重点与难点重重点点：生物统计、总体、样本、试验误差、准确性与精确性的概念，掌握平均数、标准差和变异数的特性及计算方法难难点点：如何根据本课程及专业上的特点掌握学习的要点第2页，共21页，编辑于2022年，星期一第一节第一节第一节第一节生物统计与试验设计的概念生物统计与试验设计的概念生物统计与试验设计的概念生物统计与试验设计的概念生物统计生物统计(Biometry)是应用概率论和数理统计原理来研究生物界数量变化的学科。任务：任务：根据这些原理和方法，能正确设计科学试验，正确处理试验结果，从而推导出较为客观的结论。地位：地位：是公共的专业基础课、必修课；是当代农业科学研究和生产上必不可少的工具。1、介绍生物统计与试验设计的基本概念。2、阐明生物统计与试验设计之间的关系以及在生产、科研工作中的作用。功用：功用：试验设计试验设计(Experimetal design)是指在试验工作进行前，应用生物统计原理，来制订合理的试验方案，包括抽样设计的最优配置，以及正确选择试验动物等，使我们可以利用较少的人力、物力和时间，获得较多的可靠的信息来进行统计分析，从而得出科学的结论。第3页，共21页，编辑于2022年，星期一常用名词基本概念常用名词基本概念常用名词基本概念常用名词基本概念 1、总体(population)是指被研究对象的全体，是由所有性质相似的个体所组成的集团。2、样本(sample)由总体抽出若干个体所组成的单位称为样本。3、参数(Parameter)由总体计算的数称为参数。4、统计量(statistics)由样本计算的数称为统计量。5、系统误差(systematic error)是由于试验条件所带来的差异。6、随机误差(random error)是指由偶然因素引起的差异。7、错误(error)是指由于工作上的粗心大意、或精神上的疲劳所造成的差错。8、准确性(accuracy)观察值与真值接近的程度称为准确性。9、精确性(precision)同一性状重复观察各观察值彼此接近的程度称为精确性。10、随机抽样法(random sampling)是指总体内每一个体，抽取作样本的机会是均等的。例析常用名词，重点掌握总体、样本、试验误差、准确性与精确性的概念，理解由样本推论总体这一思维逻辑是生物统计学的基本指导思维。重要性：重要性：一切研究工作中，试验设计是研究工作成败的关键。关联性关联性：试验设计需要丰富的生物统计知识作基础，大量的试验数据又为统计方法提了丰富可靠的资料。第4页，共21页，编辑于2022年，星期一第二节第二节第二节第二节平平平平均均均均数数数数一、平均数的意义一、平均数的意义意义：意义：作为资料的代表，用来指出资料中各变数的集中性，并用来与另一资料相比较。种类：种类：1、算算术术平平均均数数一个资料中，各变数的总和被变数个数除所得的商数，称为算术平均数。在统计学中，它是最常用的一种，简称平均数或均数，其符号用表示。2、中中位位数数将资料内所有变数从小到大依次排列，位于中间那个变数，称为中位数，当变数个数是偶数时，则以中间两个变数的平均数作为中位数。数据资料呈偏态分布时多用中位数，这时中位数代表性比平均数为优，其符号用Md表示。若资料已分组，制成次数分布表，则可用下式求得Md。（11）式中：L为中位数所在组的下限；i为组距；f为中位数所在组的次数；n为总次数；c为小于中位数所在组的累加次数。例1某奶牛场68头健康母牛从分娩到第一次发情间隔时间整理成次数分布表如下，求中位数。第5页，共21页，编辑于2022年，星期一 3、众数、众数在资料中某一个变数出现的次数最多，即称该变数为众数。连续性变数资料确定众数需要制成次数分布表，在表内次数出现最多一组的组中值，即为众数。如羊毛纤维检验时，测定羊毛毛丛长度，应用众数计算。表表11 68头母牛从分娩到第一次发情间隔时间次数分布表头母牛从分娩到第一次发情间隔时间次数分布表间隔时间（d）头数（f）累加头数122627414256577172868710110211611712132016122213163652646668由表11可见：i=15，n=68，因而中位数只能在累加次数为36所对应“5771”这一组，于是可确定L=57，f=20，c=16，代入公式（31）得：即奶牛头胎分娩到第一次发情间隔时间的中位数为70.5d。（12）4、几何平均数、几何平均数如有n个变数，其相乘积开n次方所得的方根，即为几何平均数。生物群体的数量变化呈几何级数的资料，应用几何平均数，其符号用G表示。第6页，共21页，编辑于2022年，星期一几何平均数在畜牧生产中可用来求家畜的平均增殖率。例2某羊场各年度的存栏数，见表12。试求其年平均增长率。表表12 某羊场各年度的存栏数与增长率某羊场各年度的存栏数与增长率（13）代入公式（13）：年度存栏数（只）增长率（x）lgx1997199819992000140200280350 0.4290.4000.250 0.3680.3980.602lgx=1.368 即年平均增长率为0.3501或35.01%。又如，在池内作蓝藻培育试验，水体中蓝藻的初始浓度为281.4，24小时后浓度为540.5，求试验开始后12小时的浓度。设每小时的增长率为r，初始生物量为N0，则在时刻t的生物量为 Nt=N0rt 第7页，共21页，编辑于2022年，星期一于是有 N24=N0r24，r24=N24/N0 从而得上式表明12小时后的初始浓度与24小时后浓度的几何平均数，将试验数据代入兽医学上，如食物中毒的潜伏期、抗体的滴度及血清的效价等资料常用到几何平均数。关于速度一类资料，如反映畜群不同阶段的平均增长率等，常用调和平均数。例3仔猪断奶后肥育增重试验，在原体重基础上净增150kg时结束试验。由于各期增重速度不同，求全期每天平均增重须用调和平均数计算。经测定第一个50kg的每天增重速度为0.3kg，第二个50kg的每天增重速度为0.4kg，第三个50kg的每天增重速度为0.6kg。代入公式（14）：5、调和平均数、调和平均数调和平均数的定义为各变数倒数的平均数的倒数。其符号用H表示。第8页，共21页，编辑于2022年，星期一平均增重为每天0.4kg，因此猪体重净增到150kg时所需要天数为1500.4=375天。在第一个50kg时，饲养天数为50/0.3天；第二个50kg时，饲养天数为50/0.4天；第三个50kg时，饲养天数为 500.6天，因此猪体重净增到150kg时。所需天数为（500.3）（500.4）（500.6）=375天。用调和平均数求出的平均增重与实际相符。用算术平均数求出的平均增重为（0.30.40.6）30.433kg每天，如猪体重净增到150kg时则需346.5天，显然与事实不符。同一个资料，求出的算术平均数大于几何平均数，而几何平均数又大于调和平均数。上述五种平均数中，算术平均数、几何平均数是最常用的平均数。二、平均数的计算方法二、平均数的计算方法平均数的计算方法可根据样本的大小和分组情况而采用不同的计算方法。1、直接法、直接法样本一般在30个变数以下未经分组的资料可用此法计算平均数。设有一个含n个变数的小样本，用x代表任何一个变数，则第一个变数至n个变数可用x1、x2、x3xn表示。平均数用表示，可用下列公式计算：第9页，共21页，编辑于2022年，星期一因此公式可简写成：=x/n （15）上式中，x为变数，x表示从第一个变数xl一直加到第n个变数xn，n为变数的个数。例4某品种鸡一年中各月产蛋量记录：18、20、21、22、23、23、24、25、25、25、26、26，求一年当中月平均产蛋数。x18+20+21+22+23+23+24+25+25+25+26+26=278 代入公式（15）：=x/n=178/12=13.17（枚）例5两个基因频率不同的群体混合，当代的基因频率是这两个群体的基因频率以其各自群体大小为权的加权平均数。譬如一个有1000个个体的群体，某一基因的频率为0.6，另一个400个个体的群体，同一基因的频率为0.3，这两个群体混合在一起，整个混合群体的这个基因的频率为：（0.61000+0.3400）/1400=0.5131 2、加权法、加权法如变数x1、x2、x3xn，其比重占得大的对平均数的影响大，比重占得小的对平均数的影响小。因此，不能平等地来看待这些变数，所以用一种权衡轻重的方法，计算时先将各个变数x乘上它自己的权数，再经过总和后除以权数的总和；这就称之为加权平均数。第10页，共21页，编辑于2022年，星期一如在分组资料中，以组中值代替每组内的变数，以“f”表示每组内变数出现的次数，次数f表示变数x在整个资料中所占的比重，亦可称为权数，这就可采用加权法求平均数。计算时，将各组的组中值分别乘以该组的次数，乘积相加再除以总次数，就可得出平均数，其公式为：=fx/n （16）例6从200头大白母猪的仔猪一月窝重的次数分布中，求加权平均数。表表13 200 头大白母猪的仔猪一月窝重的次数分布表头大白母猪的仔猪一月窝重的次数分布表组别组中值(x)次数(f)fxfx2816243240485664728088961041121220283644526068768492100108116469101317263528211684348120252360572884156023802128176414728004323485762400705612960251684596893600161840161728148176135424800004665640368总和20013120961920第11页，共21页，编辑于2022年，星期一2、样本各变数与平均数的差的平方和比各个变数与其他数的差的平方和为小，即离均差的平方和为最小。由于离均差平方和为最小，所以平均数与各变数是最接近的一个数值。因此，它能代表这个样本的集中趋势，这一特性，证明如下：a为任何数值，可能比大或比小，但不等于，用算式表示：a=（读delta）表示与a的差数。(xa)2=(x )2=(x )2=(x )22(x )+n2已知(x )=0，由此2(x )亦等于零。移项 (x )2=(xa)2n(a)2 n(a)20 (x )2(xa)2代入公式（16）：=fx/n=13120/200=65.60（kg）三、平均数的特性三、平均数的特性1、样本各变数与平均数的差之和等于零。即离均差总和为零。(xi )=0，可证明如下：第12页，共21页，编辑于2022年，星期一第二节第二节第二节第二节标准差标准差标准差标准差一、标准差的意义一、标准差的意义意意义义：用来指出资料中各变数的变异程度(离散性)，并用来衡量样本平均数的代表性。若各个变数相同没有变异，则平均数完全可以代表整个样本；如各变异数间变异较大，则平均数代表性就小。为了正确地评定样本的代表性，就有必要度量其变异程度。因此，单靠平均数不能使我们了解样本中各个变数间的变异程度和平均数作为整个样本的代表程度。因为有时两个样本的两个平均数可能相同，但这两个样本所包含的变数其变异程度可能是不相同的。例7有甲和乙两个猪种，经分别测定10头母猪的产仔数，其结果如下：表表14 甲、乙两品种母猎的产仔数甲、乙两品种母猎的产仔数猪号产仔数甲品种乙品种1234567891084161222176146514811911121014138总和110110平均产仔数1111第13页，共21页，编辑于2022年，星期一由上表看出，甲和乙两品种的平均产仔数是相同的，都是11头，看不出差异情况，似乎没有优劣之分。但进一步研究，可知两个样本的变异程度并不相同。如甲品种产仔数最少的为4头，最多的为22头。全距是18；而乙品种产仔数最少的为8头，最多的为14头，全距是6。实际上甲品种产仔数的变异程度大于乙品种，因此仅有平均数是不够的。由于两个样本的变异程度不同反映出所得的平均数代表性也不同。因此，研究生物的性状和特性时，除计算平均数之外还应测定其变异程度。测定样本的变异程度最简单的方法，是应用全距来表示。全距仅由两个极端数差的大小来衡量，它不能代表样本各变数间的变异程度。目前广泛被应用的是以标准差来度量样本内各个变数的变异程度和表明平均数的代表情况。应用标准差表示样本的变异程度比全距要好得多，因它考虑了每个变数与平均数的离差。每个变数与平均数相差愈小，则样本变异程度小，反之则愈大。如每个变数与平均数之差为零，这时表示每个变数与平均数没有差异。所以标准差是从各变数与平均数差的大小来观察变异程度的一个统计量。二、标准差的计算方法二、标准差的计算方法测定某一样本的变异程度时，先以每个变数与其平均数相减求出离均差。但由于离均差之和等于零，故不能直接算出离均差的平均数。为了合理地算出平均差异，可利用离均差平方的办法来消除正负号。离均差平方相加所得的总和，称为平方和，常用符号SS表示。然后求平方和的平均数，第14页，共21页，编辑于2022年，星期一称为样本方差或均方，以消除变数个数多少的影响。由于各个离均差经过平方使原来度量的单位都变为平方单位，所以最后还需开平方，使之还原。用这种方法表示数据的变异程度，在统计学中称为标准差。通常用符号S表示。标准差公式来源：离均差=(x )离均差之和(x )=0离均差平方和SS=(x )2 样本均方样本标准差总体方差总体标准差其中为总体平均数，=x/N，N为总体中所包含的变数的个数。第15页，共21页，编辑于2022年，星期一1、未分组资料的计算方法、未分组资料的计算方法未分组资料，一般指小样本而言，其公式如下：（17）公式中，n1为自由度，n为样本含量，小样本应用自由度计算标准差的目的，在于纠正由于样本小而发生的取样误差影响。如一个样本含有n个变数，从理论上说，n个变数都同样用以计算标准差，n个变数与相减有n个离均差。表面上虽有n个比较，但实质上仅有n1个可以自由变动，最后一个离均差受到(x )=0这个条件的限制。所以不能自由。例如，有5个变数，其4个离均差为2、1、1、2，则第5个离均差必等于0，如4个离均差为1、0、1、2时，则第5个离均差必等于2，这样才能使离均差的总和等于0。这5个离均差中，因受离均差之和等于0的限制，所以只有4个能自由变动。这时的自由度就是n1。自由度等于样本变数的总个数减去计算过程中使用的条件数。在计算标准差时，条件就是一个，即(x )=0，故自由度为n1。如计算样本某一个统计数应用2个条件，其自由度则为n 2，应用k个条件，则自由度为 nk。小样本常用自由度来计算标准差或其他统计数。因小样本的全距较群体为小，若为大样本当与群体较接近时，可不用自由度，直接用n亦可。自由度的符号以“df”表示。标准差是测定离中性的统计量，因此用原数据的单位表示。根据样本数据的多少，标准差的计算方法有以下两种。例8计算10头考力代绵羊产毛量的标准差。第16页，共21页，编辑于2022年，星期一表表15 10头考力代绵羊产毛量的资料头考力代绵羊产毛量的资料单位：单位：kg剪毛量（x）(x )(x )2x24.54.55.05.05.55.55.56.06.06.5-0.9-0.9-0.4-0.40.10.10.10.60.61.10.810.810.160.160.010.010.010.360.361.2120.2520.2525.0025.0030.2530.2530.2536.0036.0042.25x=54(x)=0(x)2=3.9x2=295.5将表15中，有关总和数值代入公式中：第17页，共21页，编辑于2022年，星期一标准差公式中标准差公式中(x)(x)2 2，因使用函数型电子计算器计算不方便，现在一般常，因使用函数型电子计算器计算不方便，现在一般常用下列公式。公式推导：因：2、分组资料的计算方法、分组资料的计算方法当数据很大时，一般超过30个变数以上的大样本，须先分组制成次数分布表，然后计算标准差。分组资料计算标准差方法采用加权法，即：次数分布表中各组的组中值与其平均数的离差再平方，乘上次数，总和后被n1除，再开方，即得标准差，其公式：第18页，共21页，编辑于2022年，星期一（18）因：上式中，f为各组次数，x为各组的组中值，根据公式推导，可将公式38化简为：（19）例9用表13，200头大白母猪的仔猪一月窝重的资料计算标准差将表13中各项总和代入公式（19）中：用以上方法算出标准差后，可以测定样本内变数的分布情况。当标准差小，则说明样本内变数的分布集中于平均数两侧；如标准差大，则说明变数的分布愈分散。因此，标准差的大小可以衡量样本平均数的代表性，当标准差小，则说明平均数的代表性强，而标准差大，说明平均数的代表性弱。第19页，共21页，编辑于2022年，星期一三、标准差的特性三、标准差的特性1、标准差的大小，受每个变数值的影响，如变数与变数间变异大，其离均差亦大，用此求得的标准差必然也大，反之则小。2、计算标准差时，在各变数上加或减一个常数，标准差仍不改变。这种特性说明。虽然每一个变数都增或减了同一数值，但其变异程度还是一样。3、当每个变数乘或除以一个常数a，所得的标准差即扩大了a倍或缩小了a倍。4、在正态分布情况下，样本变数的分布情况如下：在平均数左右一倍标准差范围内1的变数个数约为变数总个数的68.27。在平均数左右两倍标准差范围内2的变数个数约为变数总个数的95.45。在平均数左右三倍标准差范围内3的变数个数约为变数总个数的99.73，几乎等于变数个数之总和。即相当于变异数列的全距。第三节第三节变异系数变异系数一、变异系数的意义一、变异系数的意义变异系数也是衡量数据变异程度的一个统计量。当两个或多个资料相互比较其变异程度时，单以标准差是不能满足要求的。当利用标准差进行比较两个或多个样本的变异情况时，只限于单位相同，同时还需要在各平均数彼此相近似的情况下才能应用。如单位不同的样本或平均数差异很大时，欲比较其变异程度就不能采用标准差。而须用标准差与平均数的比值（即相对值）来比较。这个比值称为变异系数，用符号CV表示。第20页，共21页，编辑于2022年，星期一二、变异系数的计算方法二、变异系数的计算方法变异系数计算公式如下：公式中：CV为变异系数，s为标准差，为平均数。（110）例10100头成年母猪的平均体重为180kg，标准差为10.2kg，而50头育成母猪的平均体重为90kg。标淮差为8.6kg，试问两种不同年龄的母猪，其体重哪种变异程度大？将两种猪的平均数、标准差数值代入公式（110）中：育成母猪体重的变异系数：成年母猪体重的变异系数：两种母猪的比较，育成母猪体重的变异系数大于成年母猪体重的变异系数。说明。育成母猪体重的变异程度比成年母猪体重大。三、变异系数的特性三、变异系数的特性1、变异系数也是表示样本变异程度的一种数值，它与标准差不同，标准差是一个绝对值，它有单位，而变异系数是一个相对值，用表示。2、变异系数不受单位不同和平均数不同的影响。单位不同和平均数不同的数据，都可以应用变异系数来比较其变异程度的大小。3、变异系数的大小。同时受标准差与平均数两个指标的影响。第21页，共21页，编辑于2022年，星期一

注意事项

本文（第一三章基本概念平均数变异数PPT讲稿.ppt）为本站会员（石***）主动上传，淘文阁 - 分享文档赚钱的网站仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知淘文阁 - 分享文档赚钱的网站（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。