生物统计学-第二章-试验资料的整理与资料特征数的计算ppt课件.ppt
-
资源ID:70663423
资源大小:3.29MB
全文页数:113页
- 资源格式: PPT
下载积分:20金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
生物统计学-第二章-试验资料的整理与资料特征数的计算ppt课件.ppt
病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程试验资料的整理特征数的计算与第二章XYZ华中师范大学生命科学学院病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程一、总体与样本一、总体与样本一、总体与样本一、总体与样本二、参数与统计数二、参数与统计数二、参数与统计数二、参数与统计数三、变量与资料三、变量与资料三、变量与资料三、变量与资料四、因素与水平四、因素与水平四、因素与水平四、因素与水平五、处理与重复五、处理与重复五、处理与重复五、处理与重复六、效应与互作六、效应与互作六、效应与互作六、效应与互作七、误差与错误七、误差与错误七、误差与错误七、误差与错误八、准确性与精确性八、准确性与精确性八、准确性与精确性八、准确性与精确性回顾:第一章 绪论病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程在生物学试验及调查中,通过对某种具体事物或现在生物学试验及调查中,通过对某种具体事物或现象观察获得的结果称为象观察获得的结果称为资料(资料(datadata)。原原始始数数据据无序无序有序有序统统计计分分析析揭示事物本质揭示事物本质病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程第一节:试验资料的搜集与整理一、试验资料的类型一、试验资料的类型二、试验资料的搜集二、试验资料的搜集三、试验资料的整理三、试验资料的整理病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程对试验资料进行分类是统计归纳的基础。对试验资料进行分类是统计归纳的基础。数量性状资料数量性状资料质量性状资料质量性状资料计数资料计数资料(非连续变量资料)(非连续变量资料)计量资料计量资料(连续变量资料)(连续变量资料)变量变量定量变量定量变量定性变量定性变量连续变量连续变量非连续变量非连续变量资料资料对资料进行分类整理是,必须坚持“同质”的原则。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程 数量性状数量性状(quantitative character)(quantitative character)是指能够以计是指能够以计数和测量或度量的方式表示其特征的性状。观察测数和测量或度量的方式表示其特征的性状。观察测定数量性状而获得的数据就是定数量性状而获得的数据就是数量性状资料数量性状资料 (data(data of quantitative character)of quantitative character)。数量性状资料的获。数量性状资料的获得有得有计数计数和和测量测量两种方式,因而数量性状资料又分两种方式,因而数量性状资料又分为为计数资料计数资料和和计量资料计量资料两种。两种。一、数量性状资料一、数量性状资料病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程指用指用计数方式计数方式获得的数量性状资料。在这类资料中,获得的数量性状资料。在这类资料中,它的各个观察值只能以它的各个观察值只能以整数整数表示,在两个相邻整数间表示,在两个相邻整数间不得有任何带小数的数值出现,因此各观察值是不连不得有任何带小数的数值出现,因此各观察值是不连续的,所以该类资料也称为续的,所以该类资料也称为非连续变量资料非连续变量资料或或间断变间断变量资料量资料或或离散变量资料离散变量资料。例如,鱼的尾数只可能是例如,鱼的尾数只可能是1,2,3,4,n1,2,3,4,n1 1、计数资料(、计数资料(enumeration dataenumeration data)病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程指用指用测量或度量法测量或度量法获得的数量性状资料,即用度、量、衡等获得的数量性状资料,即用度、量、衡等计量工具直接测定获得的数据资料。其数据是用长度、重量、计量工具直接测定获得的数据资料。其数据是用长度、重量、容积、温度、浓度等来表示,容积、温度、浓度等来表示,要带单位要带单位。这种资料的各个观测。这种资料的各个观测值不一定是整数,值不一定是整数,两个相邻的整数间可以有带小数的任何数值两个相邻的整数间可以有带小数的任何数值出现出现,其小数位数的多少由度量工具的精确度而定,其小数位数的多少由度量工具的精确度而定,它们之它们之间的变异是连续性的,因此计量资料也称为间的变异是连续性的,因此计量资料也称为连续变量资料连续变量资料。例如,小麦的株高是例如,小麦的株高是8080 95cm95cm,可以是,可以是86.5cm86.5cm或或86.54cm86.54cm。2 2、计量资料(、计量资料(measurement datameasurement data)病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程 质量性状质量性状(qualitativecharacter)是指能观察到而是指能观察到而不不能直接测量能直接测量的性状。观察质量性状而获得的数据就是的性状。观察质量性状而获得的数据就是质量性状资料质量性状资料(dataofqualitativecharacter),也称为),也称为属性性状属性性状资料。这类性状本身不能直接用数值表示,资料。这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量要获得这类性状的数据资料,须对其观察结果作数量化处理,其方法有以下两种:化处理,其方法有以下两种:1.1.统计次数法;统计次数法;2.2.评分法评分法 二、质量性状资料二、质量性状资料病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程 1 1、统计次数法(、统计次数法(frequency countingfrequency counting)株数频率红花26626.6%紫花49449.4%白花24024.0%总计1000100.0%这种由质量性状数量化得来的资料又叫这种由质量性状数量化得来的资料又叫次数资料次数资料。在一定的总体或样本中,根据某一质量性状的类别在一定的总体或样本中,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。例如,在统计其次数,以次数作为质量性状的数据。例如,在研究豌豆的花色遗传时,红花与白花杂交,子二代中研究豌豆的花色遗传时,红花与白花杂交,子二代中红花、紫花和白花的株数分类统计如下表。红花、紫花和白花的株数分类统计如下表。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程对某一质量性状分成不同级别,对不同级别进行评对某一质量性状分成不同级别,对不同级别进行评分来表示其性状差异的方法。从而将质量性状进行数分来表示其性状差异的方法。从而将质量性状进行数量化,以便统计分析。量化,以便统计分析。例如,小麦感染锈病的严重程度可划分为例如,小麦感染锈病的严重程度可划分为0 0级(免级(免疫)、疫)、1 1级(高度抵抗)、级(高度抵抗)、2 2级(中度抵抗)、级(中度抵抗)、3 3级级(感染)。(感染)。2 2、评分法(、评分法(point systempoint system)病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程 两种不同类型的资料相互间是有区别的,但两种不同类型的资料相互间是有区别的,但有时可有时可根据研究的目的和统计方法的要求将一种类型资料转根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资料化成另一种类型的资料。例如,兽医临床化验动物的白细胞总数得到的资料例如,兽医临床化验动物的白细胞总数得到的资料属于计数资料,根据化验的目的,可按白细胞总数过属于计数资料,根据化验的目的,可按白细胞总数过高、正常或过低分为三组,清点各组的次数,计数资高、正常或过低分为三组,清点各组的次数,计数资料就转化为质量性状次数资料。料就转化为质量性状次数资料。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程第一节:试验资料的搜集与整理一、试验资料的类型一、试验资料的类型二、试验资料的搜集二、试验资料的搜集三、试验资料的整理三、试验资料的整理病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程样本资料的搜集(collection)是统计分析的第一步,也是全部统计工作的基础。没有数据,就没有发言权。调 查试 验资料搜集的方法普查抽样调查随机抽样简单随机抽样分层随机抽样整 体 抽 样双 重 抽 样顺序抽样典型抽样二、试验资料的搜集二、试验资料的搜集病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程调查调查是对已经存在的事情的资料按某种方案进行收集的方法。如地质调查、水样调查、河南省内的昆虫调查等等。资料的调查又可以分为两种:普查和抽样调查。1、普查(普查(censuscensus)是对研究对象的每一个个体逐一进行调查的方法。普查一般要求在一定的时间或范围进行,要求准确和全面。如人口普查、土壤普查等等。普查可以为制定行业政策提供理论依据。消耗大量的人力、物力和时间一、调查(一、调查(surveysurvey)病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程人口普查在国家统一规定的时间内,按照统一的方法、统一的项目、统一的调查表和统一的标准时点,对全国人口普遍地、逐户逐人地进行的一次性调查登记。人口普查工作包括对人口普查资料的搜集、数据汇总、资料评价、分析研究、编辑出版等全部过程,它是当今世界各国广泛采用的搜集人口资料的一种最基本的科学方法,是提供全国基本人口数据的主要来源。从1949年至今,中国分别在1953年、1964年、1982年、1990年、2000年与2010年进行过六次全国性人口普查。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程抽抽样样调调查查是是根根据据一一定定的的原原则则从从研研究究对对象象中中抽抽取取一一部部分分具具有有代代表表性性的的个个体体进进行行调调查查的的方方法法。通通过过抽抽样样将将获获得得的的样样本本资资料料进进行行统统计计处处理理,然然后后利利用用样样本本的的特特征征数数对对总总体体进进行行推推断断。生生物物学学研研究中,进行普查的情况究中,进行普查的情况极少极少,多数情况下还是进行抽样调查。,多数情况下还是进行抽样调查。2 2、抽样调查(、抽样调查(sampling surveysampling survey)“你不必吃完整一头牛,才知道它的肉是咬不动的。你不必吃完整一头牛,才知道它的肉是咬不动的。”Samel Johnson病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程抽抽样样的的方方法法有有多多种种,主主要要有有:随随机机抽抽样样法法、顺顺序序抽抽样样法法和和典型抽样法,一般情况下在统计学中常常采用随机抽样的方法。典型抽样法,一般情况下在统计学中常常采用随机抽样的方法。要要使使样样本本无无偏偏差差地地估估计计总总体体,除除了了样样本本容容量量要要足足够够大大之之外外,重重要要的的是是采采用用科科学学的的抽抽样样方方法法,抽抽取取有有代代表表性性的的样样本本,取取得得完完整而准确的数据资料。整而准确的数据资料。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程 背景背景u法兰克罗斯福总统争取连任、肯萨斯州州长兰登为共和党总法兰克罗斯福总统争取连任、肯萨斯州州长兰登为共和党总统候选人统候选人u美国经济正由大萧条中逐渐恢复美国经济正由大萧条中逐渐恢复u 九百万人失业,于九百万人失业,于1929年至年至1933年间实际所得降低三分之年间实际所得降低三分之一一u宣称一:宣称一:文学文摘文学文摘认为兰登将以认为兰登将以57%对对43%赢此选战。赢此选战。此数字基于二百四十万人之民意调查结果。此数字基于二百四十万人之民意调查结果。u宣称二:盖洛普宣称二:盖洛普民意测验民意测验所采用所采用分层抽样分层抽样调查调查了了3000人人,预,预测罗斯福测罗斯福将当选为美国的新一任将当选为美国的新一任总统。总统。选举结果选举结果 罗斯福以罗斯福以62%对对38%赢此选战。为什么?赢此选战。为什么?抽样的广泛应用缘于大选前的民意测验抽样的广泛应用缘于大选前的民意测验病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程文学文摘文学文摘的取样办法的取样办法:通过登记的电话簿发放问卷通过登记的电话簿发放问卷l在当时仅有一千一百万个部宅用电话,而全国人口超在当时仅有一千一百万个部宅用电话,而全国人口超过过1.2亿。亿。可能问题的所在可能问题的所在l取样偏差取样偏差:Digest杂志的取样中包含过多的富人,杂志的取样中包含过多的富人,而该年贫富间选举倾向相距极大而该年贫富间选举倾向相距极大 怎样才能预测准?怎样才能预测准?-样本要有代表性。样本要有代表性。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程)随机抽样(random sampling)又被称为概率抽样(又被称为概率抽样(probability samplingprobability sampling),必须),必须满足满足2 2个条件:一是总体中每个个体被抽中的个条件:一是总体中每个个体被抽中的机会是均等机会是均等的;二是总体中任意一个个体是的;二是总体中任意一个个体是相互独立的相互独立的,是否被抽中,是否被抽中不受其他个体的影响。不受其他个体的影响。(1 1)简单随机抽样)简单随机抽样纯随机抽样,是指从总体纯随机抽样,是指从总体N N个单位中任意抽取个单位中任意抽取n n个单个单位作为样本位作为样本,使每个可能的样本被抽中的概率相等的一使每个可能的样本被抽中的概率相等的一种抽样方式。种抽样方式。N病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程方法:将总体内所有抽样单位全部编号,采用随机方法确定被抽单位编号,这些编号所对应的抽样单位抽出来放在一起就构成一个随机样本。适用对象:个体间差异较小、所需抽取的样本单位较少的情况。例2.1病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程(2)分层随机抽样(stratifiedrandomsampling)分层随机抽样是一种混合抽样。其特点是将总体按变异原因或程度划分成若干区层,然后再用简单随机抽样方法,从各区层按一定的抽样分数抽选抽样单位。抽样分数(samplingfraction):一个样本所包括抽样单位数与其总体所包括的抽样单位数的比值。方法:()将总体变异原因与程度划分成若干区层,使得区层内变异尽可能小或变异原因相同,而区层间变异比较大或变异原因不明。()在每一个区层按一定的抽样分数独立随机抽样。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程相等配置比例配置最优配置如果各区层抽样单位数相等,可采用相等配置如果各区层抽样单位数不等,可按相应的抽样分数,将欲抽取的抽样单位总数分配到各区层根据各区层抽样单位数、抽样误差和抽样费用,确定各区层应抽取的抽样单位。在变异范围较大的区层,抽样分数应大一些;在抽样费用较高的区层,抽样分数应小一些。分层抽样的抽样单位数目配置方法病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程()若总体内各抽样单位间的差异比较明显,那么就可以把总体分为几个比较同质的区层,从而提高抽样的准确度;()分层随机抽样既运用了随机原理,也运用了局部控制原理,这样不仅可以降低抽样误差,也可以运用统计方法来估算抽样误差;例2.2 现有一块麦田,其长势呈单向趋向式变化,欲抽样估产,如何进行抽样?好坏长 势病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程(3)整体抽样(clustersampling)整体随机抽样是把总体分成若干群,以群为单位,进行随机抽样,对抽到的样本进行全面调查。如果总体内主要变异来源明显来自不同区层间,且每一区层均较大,则应采用分层抽样;若主要变异来源明显来自区层内各单位间,且每一区层所占面积较小,则宜用整体随机抽样。例如,估计麦田的害虫啃食率,钢材的合格率等;病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程优点由于一个整体只要一个编号,因而减少了抽样单位编号数,且因调查单位数减少,工作方便;与简单随机抽样相比较,它常提供较为准确的总体估计值。只要各群抽选单位数相等,整体抽样也可提供总体平均数的无偏估计。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程(4)双重抽样(doublesampling)变量变量简单变量复杂变量p如果所研究的性状是不容易观察测定的,或必须有较多费用,或要求有精密设备、复杂计算过程与耗费较多调查时间的,或必须进行破坏性测定才能获得观察结果的,由于上述种种原因,直接调查研究这一类型性状是有困难的。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程首先,抽取一个初步样本(样本量较小),并搜取一些简单项目以获得有关总体的信息:做一次随机抽样,调查y(复杂)和x(简单)两种性状,从中求出y 依x 的回归方程。这个样本容量n 不一定很大,但希望x 和y 有较大的幅度。然后,在此基础上再进行深入抽样。p双重抽其具体步骤p双重抽样的优点:1.对于复杂性状的调查研究可以通过仅测定少量抽样单位而获得相应于大量抽样单位的精确度;2.当复杂性状必须通过破坏性测定才能调查时,则仅有这种双重抽样方法可用。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程2)顺序抽样(ordinalsampling)p顺序抽样又称为系统抽样、机械抽样、等距抽样p它是按某种既定顺序从总体(有限总体)中抽取一定数量的个体构成样本。p这种抽样方法可避免人们主观偏见的影响,且使用简便p如果总体内存在周期性变异,则可能会得到一个偏差很大的样本,这种现象在统计上称为系统误差。p由顺序抽样得到的样本不能计算抽样误差,估计总体值。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程首先,先将总体从1N相继编号,计算抽样距离K=N/n。式中N为总体单位总数,n为样本容量;然后,然后在1K中抽一随机数k1,作为样本的第一个单位,接着取k1+K,k1+2K,直至抽够n个单位为止。p顺序抽其的基本做法是:将总体中的各单元先按一定的顺序排列、编号,然后决定一个间隔,并在此间隔基础上选择被调查的单位个体u例如:欲求100匹马的体重,你抽取20匹马作为样本来称重。1,K=100/20=5;2,15中随机选择3,接着抽取8(3+5),13(8+5),98为止。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程3)典型抽样(typicalsampling)根据初步资料或经验判断,有意识、有目的的选取一个典型群体作为代表(样本)进行调查,以估计整个总体,这种抽样方法就称为典型抽样。典型样本代表着总体的绝大多数,如果选择合适,可得到可靠的结果,尤其从容量很大的总体中选取较小数量的抽样单位时,往往采用这种抽样方法。这种抽样多用于大规模社会经济调查,而在总体相对较小或要求估算抽样误差时,一般不采用这种方法。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程试验试验是通过处理获得样本资料的方法。采用合理的试验设计能够以较少的投入获得较大的收获,起到“事半功倍”的效果。常见的试验设计方法有:对比设计、随机区组设计、平衡不完全区组设计、裂区设计、拉丁方设计、正交设计、正交旋转设计等等。试验设计须遵循的三大原则是:随机、重复和局随机、重复和局部控制部控制。二、试验(二、试验(experimentexperiment)病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程第一节:试验资料的搜集与整理一、试验资料的类型一、试验资料的类型二、试验资料的搜集二、试验资料的搜集三、试验资料的整理三、试验资料的整理病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程三、资料的整理三、资料的整理(一)原始资料(一)原始资料(raw dataraw data)的检查与核对)的检查与核对调查调查试验试验原始原始数据数据核对:数据本身是否有错误核对:数据本身是否有错误检查:取样是否有差错检查:取样是否有差错订正:不合理数据的订正订正:不合理数据的订正病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程l检查和核对原始资料的目的:确保原始资料的完整性和正确性。完整性:是指原始资料无遗缺或重复。正确性:是指原始资料的测量和记载无差错或未进行不合理的归并。检查中要特别注意特大、特小和异常数据(可结合专业知识作出判断)。对于有重复、异常或遗漏的资料 ,应予以删除或补齐;对有错误、相互矛盾的资料应进行更正,必要时进行复查或重新试验。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程不必分组不必分组直接进行统计分析直接进行统计分析小样本小样本n30n500 500 500 500 15 15 15 15 30303030表表表表2-62-62-62-6样本容量与分组数的关系样本容量与分组数的关系样本容量与分组数的关系样本容量与分组数的关系组距的确定组距的确定即每组内的上下限范围。即每组内的上下限范围。组距全距组距全距/组数组数484810104.84.81010组组5 5cmcmcmcm病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程(3)确定组限(class limit)和组中值(class midvalue)组限组限 是指每个组变量值的起止界限。上限下限组中值组中值 是两个组限的中间值。组中值组中值下限上限下限上限 2 2组距组距2 2下限下限 组距组距2 2上限上限 第一组的组中第一组的组中值最好接近于值最好接近于资料的最小值资料的最小值病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程表2-5150尾鲢鱼体长(cm)56 49 62 78 41 47 65 45 58 55 59 65 69 62 7352 52 60 51 62 78 66 45 58 58 60 57 52 51 4856 46 58 70 72 76 77 56 66 58 58 55 53 50 6563 57 65 8585 59 58 54 62 48 63 46 61 62 57 3858 52 54 55 66 52 48 56 75 72 57 3737 46 76 5663 75 65 48 52 55 54 62 71 48 62 58 46 57 3854 53 65 42 83 66 48 53 58 46 46 26 36 76 5560 54 58 49 52 56 82 63 65 54 75 65 86 46 7770 69 40 56 58 61 54 53 52 43 52 64 58 58 5478 52 56 61 59 54 59 64 68 51 59 68 63 52 63最小一组的下限必须最小一组的下限必须小于资料中的最小值,小于资料中的最小值,最大一组的上限必须最大一组的上限必须大于资料中的最大值;大于资料中的最大值;组限取到组限取到1010分位或分位或5 5分位上,分位上,计算方便;计算方便;临界值临界值就高不就低就高不就低。3535,4040,4545,8585。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程(4 4)归组归组确定好组数和各组上下限后,可按原始资料中各观测确定好组数和各组上下限后,可按原始资料中各观测值的次序,将各个数值归于各组,计算各组的观测数值的次序,将各个数值归于各组,计算各组的观测数次数、频率、累积频率,制成一个次数分布表。次数、频率、累积频率,制成一个次数分布表。计数的方法计数的方法卡片法卡片法唱票法唱票法画画“正正”字字画画 ”病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程表表2-6 2-6 150150尾鲢鱼体长的次数分布表尾鲢鱼体长的次数分布表 组限 组中值 次数 频率 累积频率 Frequency Percent Cumulative Percent 35 37.5 3 0.0200 0.0200 40 42.5 4 0.0267 0.0467 45 47.5 17 0.1133 0.1600 50 52.5 28 0.1867 0.3467 5555 57.5 4040 0.26660.2666 0.6133 60 62.5 25 0.1667 0.7800 65 67.5 17 0.1133 0.8973 70 72.5 6 0.0400 0.9333 75 77.5 7 0.0467 0.9800 80 82.5 2 0.0133 0.9933 85 87.5 1 0.0067 1.0000病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程(三)次数分布图和频率分布图(三)次数分布图和频率分布图定义:定义:把次数(频率)分布资料画成统计图形。把次数(频率)分布资料画成统计图形。特点:特点:直观、形象直观、形象包括:包括:条形图、饼图、直方图、多边形图和散点图条形图、饼图、直方图、多边形图和散点图病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程统计图绘制的基本要求:统计图绘制的基本要求:统计图绘制的基本要求:统计图绘制的基本要求:(1 1)标题简明扼要)标题简明扼要,列于图的下方列于图的下方;(2 2)纵、横两轴应有刻度,注明单位;)纵、横两轴应有刻度,注明单位;(3 3)横轴由左至右,纵轴由下而上,数值由小到大;图)横轴由左至右,纵轴由下而上,数值由小到大;图形长宽比例约形长宽比例约5 5:4 4或或6 6:5 5;(4 4)图中需用不同颜色或线条代表不同事物时,应有图)图中需用不同颜色或线条代表不同事物时,应有图例说明。例说明。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程图图2.2 2.2 月产蛋数次数分布柱形图月产蛋数次数分布柱形图图图2.2 2.2 月产蛋数频率分月产蛋数频率分布柱形图布柱形图1条形图(条形图(bar chart),又称柱形图又称柱形图计数资料计数资料计数资料计数资料特点:特点:柱形之间要间隔一定的距离柱形之间要间隔一定的距离 属性资料属性资料属性资料属性资料病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程2 2 饼图饼图(pie chart)(pie chart)图图2-3 2-3 来亨鸡月产蛋次数分布图来亨鸡月产蛋次数分布图计数资料计数资料属性资料属性资料病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程图图2.3 2.3 鲢鱼体长次数分布图鲢鱼体长次数分布图3 3 直方图直方图 (histogram)(histogram),又称矩形图,又称矩形图计量资料计量资料354045505560657075808590特点:特点:各组之间没有距离各组之间没有距离 组中值组中值病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程4 4 多边形图多边形图(polygon)(polygon),又称折线图,又称折线图(broken-line chart)(broken-line chart)计量资料计量资料图图2.3 2.3 鲢鱼体长次数分布图鲢鱼体长次数分布图组中值组中值病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程5 5 散点图散点图(scatter)(scatter)来亨鸡月产蛋数次数分布散点图计数资料计数资料计数资料计数资料病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程5 5 散点图散点图(scatter)(scatter)计量资料计量资料图图2.3 2.3 鲢鱼体长次数分布散点图鲢鱼体长次数分布散点图病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程学会函数:max,min,sum,countif,countifs等;Excel中次数分布图表的制作病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程Previousreview原原始始数数据据无序无序有序有序统统计计分分析析调 查试 验资料搜集的方法数量性状资料数量性状资料质量性状资料质量性状资料计数资料计数资料(非连续变量资料)(非连续变量资料)计量资料计量资料(连续变量资料)(连续变量资料)变量变量定量变量定量变量定性变量定性变量连续变量连续变量非连续变量非连续变量资料资料病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程不必分组不必分组直接进行统计分析直接进行统计分析小样本小样本n30n30将数据分成若干组将数据分成若干组以便统计分析以便统计分析大样本大样本n 30n 30次数分布表次数分布表次数分布图次数分布图统计分析统计分析样本大小样本大小离散数据:单项式分组法连续数据:组距分组法Previousreview病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程第二节试验资料特征数的计算集中性集中性 是变量在趋势上有着向某一中心聚是变量在趋势上有着向某一中心聚集,集,或者说以某一数值为中心而分布的性质。或者说以某一数值为中心而分布的性质。离散性离散性 是变量有着离中分散变是变量有着离中分散变 异的性质。异的性质。变量的分布具有两种明显的基本特征:变量的分布具有两种明显的基本特征:集中性和离散性集中性和离散性。病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程集中性集中性离散性离散性平均数平均数变异数变异数算算术术平平均均数数中中位位数数众众数数几几何何平平均均数数极极差差方方差差标标准准差差变变异异系系数数调调和和平平均均数数病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程一、平均数一、平均数p平均数是统计学中最常用的统计量,是计量资料的代表值,表示资料中观测数的中心位置中心位置,并且可作为资料的代表与另一组相比较,以确定二者的差异情况。(一)平均数的种类(一)平均数的种类:算术平均数算术平均数中位数中位数众数众数几何平均数几何平均数病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程1.算术平均数算术平均数 (arithmetic mean)定义:总体或样本资料中所有观测数的总和除以观测定义:总体或样本资料中所有观测数的总和除以观测数的个数所得的商,简称平均数、均数或均值。数的个数所得的商,简称平均数、均数或均值。总体:总体:样本:样本:病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程样本统计量的样本统计量的抽样分布抽样分布Sampling distributionSimmental如果抽样是随机如果抽样是随机的,样本平均数的,样本平均数也是随机变量也是随机变量第二节试验资料特征数的计算病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程总体总体样本样本1样本样本2样本样本m平均数的抽样分布n 统计量统计量?样本平均数平均数的分布病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程总体总体样本样本1样本样本2样本样本mn 统计量统计量?正态总体样本标准差差的分布标准差的抽样分布病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程2.中位数中位数(median)p资料中所有观测数依大小顺序排列,居于中资料中所有观测数依大小顺序排列,居于中间位置的观测数称为中位数或中数。间位置的观测数称为中位数或中数。p中位数将该组数值分为两半,理论上有中位数将该组数值分为两半,理论上有50的变量小于的变量小于md,有有50的变量值大于的变量值大于 md,故又故又称百分之五十位数,记为称百分之五十位数,记为P50。Md病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程 1、当观测值个数、当观测值个数n为奇数时,为奇数时,(n+1)/2位置的观测值,位置的观测值,即即x(n+1)/2为中位数:为中位数:Md=2、当观测值个数为偶当观测值个数为偶 数数 时,时,n/2和和(n/2)+1位置的位置的两个观测值之和的两个观测值之和的1/2为中位数,即:为中位数,即:病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程高平常测验平常测验:0.20.25招生考试或水平考试招生考试或水平考试:0.30.4m1mdm2区分度区分度m1Tm2Tm2-m1T试卷区分度试卷区分度试卷区分度试卷区分度病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程3.众数众数(mode)p资料中出现次数最多的那个观测值或次数最多一组资料中出现次数最多的那个观测值或次数最多一组的组中值或中点值。的组中值或中点值。注意:注意:(1)对于某些数据而言,如均匀分布,并不存在)对于某些数据而言,如均匀