第二章 试验资料的整理与特征数的计算修.ppt
《第二章 试验资料的整理与特征数的计算修.ppt》由会员分享,可在线阅读,更多相关《第二章 试验资料的整理与特征数的计算修.ppt(95页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章 试验资料的整理与特试验资料的整理与特征数的计算征数的计算本章内容第一节 试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集三、试验资料的整理第二节 试验资料特征数的计算一、平均数二、变异数第一节 试验资料的搜集与整理一、试验资料的类型一、试验资料的类型二、试验资料的搜集三、试验资料的整理对试验资料进行分类是统计归纳的基础对试验资料进行分类是统计归纳的基础试试验验资资料料类类型型数量性状资料数量性状资料质量性状资料属性性状资料质量性状资料属性性状资料计数资料非连续变量资料计数资料非连续变量资料计量资料连续变量资料计量资料连续变量资料 数量性状数量性状数量性状数量性状是指能够以
2、计数和测量或度量的方式是指能够以计数和测量或度量的方式是指能够以计数和测量或度量的方式是指能够以计数和测量或度量的方式表示其特征的性状。观察测定数量性状而获得的数表示其特征的性状。观察测定数量性状而获得的数表示其特征的性状。观察测定数量性状而获得的数表示其特征的性状。观察测定数量性状而获得的数据就是据就是据就是据就是数量性状资料数量性状资料数量性状资料数量性状资料 。数量性状资料的获得有计数和测量两种方式,因数量性状资料的获得有计数和测量两种方式,因数量性状资料的获得有计数和测量两种方式,因数量性状资料的获得有计数和测量两种方式,因而数量性状资料又分为计数资料和计量资料两种。而数量性状资料又分
3、为计数资料和计量资料两种。而数量性状资料又分为计数资料和计量资料两种。而数量性状资料又分为计数资料和计量资料两种。一、数量性状资料一、数量性状资料 1 1、计数资料、计数资料、计数资料、计数资料 指用计数方式获得的数量性状资料。指用计数方式获得的数量性状资料。指用计数方式获得的数量性状资料。指用计数方式获得的数量性状资料。在这类资料中,它的各个观察值只能以整数表示,在这类资料中,它的各个观察值只能以整数表示,在这类资料中,它的各个观察值只能以整数表示,在这类资料中,它的各个观察值只能以整数表示,在两个相邻整数间不得有任何带小数的数值出现,因在两个相邻整数间不得有任何带小数的数值出现,因在两个相
4、邻整数间不得有任何带小数的数值出现,因在两个相邻整数间不得有任何带小数的数值出现,因此各观察值是不连续的,所以该类资料也称为此各观察值是不连续的,所以该类资料也称为此各观察值是不连续的,所以该类资料也称为此各观察值是不连续的,所以该类资料也称为非连续非连续非连续非连续变量资料变量资料变量资料变量资料或或或或间断变量资料间断变量资料间断变量资料间断变量资料或或或或离散变量资料离散变量资料离散变量资料离散变量资料。2 2、计量资料、计量资料、计量资料、计量资料 指用测量或度量法获得的数量性状资料指用测量或度量法获得的数量性状资料指用测量或度量法获得的数量性状资料指用测量或度量法获得的数量性状资料。
5、其数据是用长度、重量、容积、温度、浓度等来其数据是用长度、重量、容积、温度、浓度等来其数据是用长度、重量、容积、温度、浓度等来其数据是用长度、重量、容积、温度、浓度等来表示,要带单位。这种资料的各个观测值不一定是整表示,要带单位。这种资料的各个观测值不一定是整表示,要带单位。这种资料的各个观测值不一定是整表示,要带单位。这种资料的各个观测值不一定是整数,两个相邻的整数间可以有带小数的任何数值出现,数,两个相邻的整数间可以有带小数的任何数值出现,数,两个相邻的整数间可以有带小数的任何数值出现,数,两个相邻的整数间可以有带小数的任何数值出现,它们之间的变异是连续性的,因此计量资料也称为它们之间的变
6、异是连续性的,因此计量资料也称为它们之间的变异是连续性的,因此计量资料也称为它们之间的变异是连续性的,因此计量资料也称为连连连连续变量资料续变量资料续变量资料续变量资料。二、质量性状资料二、质量性状资料 质量性状质量性状质量性状质量性状是指能观察到而不能直接测量的性状。是指能观察到而不能直接测量的性状。是指能观察到而不能直接测量的性状。是指能观察到而不能直接测量的性状。观察质量性状而获得的数据就是观察质量性状而获得的数据就是观察质量性状而获得的数据就是观察质量性状而获得的数据就是质量性状资料质量性状资料质量性状资料质量性状资料,也称,也称,也称,也称为属性性状资料。为属性性状资料。为属性性状资
7、料。为属性性状资料。这类性状本身不能直接用数值表示,要获得这类这类性状本身不能直接用数值表示,要获得这类这类性状本身不能直接用数值表示,要获得这类这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理,其性状的数据资料,须对其观察结果作数量化处理,其性状的数据资料,须对其观察结果作数量化处理,其性状的数据资料,须对其观察结果作数量化处理,其方法有以下两种:方法有以下两种:方法有以下两种:方法有以下两种:1 1、统计次数法、统计次数法、统计次数法、统计次数法 在一定的总体或样本中,根据某一质量性状的类别统计在一定的总体或样本中,根据某一质量性状的类别统计在一定的总体
8、或样本中,根据某一质量性状的类别统计在一定的总体或样本中,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。例如,在研究豌豆的其次数,以次数作为质量性状的数据。例如,在研究豌豆的其次数,以次数作为质量性状的数据。例如,在研究豌豆的其次数,以次数作为质量性状的数据。例如,在研究豌豆的花色遗传时,红花与白花杂交,子二代中红花、紫花和白花花色遗传时,红花与白花杂交,子二代中红花、紫花和白花花色遗传时,红花与白花杂交,子二代中红花、紫花和白花花色遗传时,红花与白花杂交,子二代中红花、紫花和白花的株数分类统计如下表。的株数分类统计如下表。的株数分类统计如下表。的株数分类统计如下表。株数频率红花
9、26626.6%紫花49449.4%白花24024.0%总计1000100.0%这种由质量性状数量化得来的资料又叫次数资料这种由质量性状数量化得来的资料又叫次数资料这种由质量性状数量化得来的资料又叫次数资料这种由质量性状数量化得来的资料又叫次数资料。2 2、评分法评分法评分法评分法 对某一质量性状分成不同级别,对不同级别进行对某一质量性状分成不同级别,对不同级别进行对某一质量性状分成不同级别,对不同级别进行对某一质量性状分成不同级别,对不同级别进行评分来表示其性状差异的方法。从而将质量性状进行评分来表示其性状差异的方法。从而将质量性状进行评分来表示其性状差异的方法。从而将质量性状进行评分来表示
10、其性状差异的方法。从而将质量性状进行数量化,以便统计分析。数量化,以便统计分析。数量化,以便统计分析。数量化,以便统计分析。如,小麦感染锈病的严重程度可划分为如,小麦感染锈病的严重程度可划分为如,小麦感染锈病的严重程度可划分为如,小麦感染锈病的严重程度可划分为0 0(免疫)、(免疫)、(免疫)、(免疫)、1 1(高度抵抗)、(高度抵抗)、(高度抵抗)、(高度抵抗)、2 2(中度抵抗)、(中度抵抗)、(中度抵抗)、(中度抵抗)、3 3(感染)级(感染)级(感染)级(感染)级第一节 试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集二、试验资料的搜集三、试验资料的整理调 查试试 验验资料搜集
11、的方法资料搜集的方法一、调查一、调查 调查调查是对已经存在的事情的资料按某种方案进行收集的方法。资料的调查又可以分为两种:普查和抽样调查。1、普查普查 是对研究对象的全部个体逐一进行调查的方法。普查一般要求在一定的时间或范围进行,要求准确和全面。2、抽样调查、抽样调查 是根据一定的原则从研究对象中抽取一部分具有代表性的个体进行调查的方法。通过抽样将获得的样本资料进行统计处理,然后利用样本的特征数对总体进行推断。随机抽样必须满足随机抽样必须满足2个条件:一是总体中每个个体被抽中的个条件:一是总体中每个个体被抽中的机会是均等的;二是总体中任意一个个体是相互独立的,是否机会是均等的;二是总体中任意一
12、个个体是相互独立的,是否被抽中不受其他个体的影响。被抽中不受其他个体的影响。生物学研究中,进行普查的情况较少,多数情况下还是进生物学研究中,进行普查的情况较少,多数情况下还是进行抽样调查。行抽样调查。二、试验二、试验 试验试验是对已有的或没有的事物加以处理的方法。是对已有的或没有的事物加以处理的方法。常见的试验设计方法有:对比设计、随机区组设常见的试验设计方法有:对比设计、随机区组设计、平衡不完全区组设计、裂区设计、拉丁方设计、计、平衡不完全区组设计、裂区设计、拉丁方设计、正交设计、正交旋转设计等等。正交设计、正交旋转设计等等。试验设计须遵循的三大原则是:试验设计须遵循的三大原则是:随机、重复
13、和局随机、重复和局部控制。部控制。第一节:试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集三、试验资料的整理三、试验资料的整理三、试验资料的整理(一)原始资料的检查与核对(一)原始资料的检查与核对调查调查试验试验原始数据核对检查订正 检查和核对原始资料的目的:检查和核对原始资料的目的:确保原始资料的完确保原始资料的完整性和正确性。整性和正确性。(二)次数(频数)分布表(二)次数(频数)分布表统计表的结构和要求统计表的结构和要求统计表的结构和要求统计表的结构和要求:结构简单,层次分明,安排合理,重点突出,数据准确。结构简单,层次分明,安排合理,重点突出,数据准确。结构简单,层次分明,安排
14、合理,重点突出,数据准确。结构简单,层次分明,安排合理,重点突出,数据准确。总横标目(或空白)总横标目(或空白)纵标目纵标目1纵标目纵标目2横标目横标目1横标目横标目2数字资料数字资料表号表号 标题标题1 1、标题、标题、标题、标题 简明扼要、准确地说明表的内容,有时须注明时间、地点。简明扼要、准确地说明表的内容,有时须注明时间、地点。简明扼要、准确地说明表的内容,有时须注明时间、地点。简明扼要、准确地说明表的内容,有时须注明时间、地点。2 2、标目、标目、标目、标目 标目分横标目和纵标目两项。横标目列在表的左侧标目分横标目和纵标目两项。横标目列在表的左侧标目分横标目和纵标目两项。横标目列在表
15、的左侧标目分横标目和纵标目两项。横标目列在表的左侧 ,纵标目,纵标目,纵标目,纵标目列在表的上端,标目需列在表的上端,标目需列在表的上端,标目需列在表的上端,标目需 注注注注 明计算单位,如、明计算单位,如、明计算单位,如、明计算单位,如、kgkg、cmcm等等。等等。等等。等等。3 3、数字、数字、数字、数字 一律用阿拉伯数字,数字以小数点对齐,小数位数一致,一律用阿拉伯数字,数字以小数点对齐,小数位数一致,一律用阿拉伯数字,数字以小数点对齐,小数位数一致,一律用阿拉伯数字,数字以小数点对齐,小数位数一致,无数字的无数字的无数字的无数字的用用用用“”表示,数字是表示,数字是表示,数字是表示,
16、数字是“0 0”的,则填写的,则填写的,则填写的,则填写“0 0”。4 4、线条、线条、线条、线条 多用三线表,上下两条边线略粗。多用三线表,上下两条边线略粗。多用三线表,上下两条边线略粗。多用三线表,上下两条边线略粗。1 计数资料的整理计数资料基本上采用单项式分组法进行整理。特点:用样本变量自然值进行分组,每组用一个或几个变量值来表示。1517 12 14 13 14 12 11 14 13 16 14 14 13 17 15 14 14 16 1414 15 15 14 14 14 11 13 12 1413 14 13 15 14 13 15 14 13 1415 16 16 14 13
17、 14 15 13 15 1315 15 15 14 14 16 14 15 17 1316 14 16 15 13 14 14 14 14 1612 13 12 14 12 15 16 15 16 1413 15 17 14 13 14 12 17 14 15表2-1 100只来亨鸡每月的产蛋数1117来亨鸡每月产蛋数变动范围:分为7组统计各组次数计算频率和累积频率制表每月产蛋数 次数 频率 累积频率 Frequency Percent Cumulative Percent 11 2 0.02 0.02 12 7 0.07 0.09 13 19 0.19 0.28 14 35 0.35 0.
18、63 15 21 0.21 0.84 16 11 0.11 0.95 17 5 0.05 1.00表2-2 100只来亨鸡每月产蛋数次数分布表累累积频率积频率:按某种标志对数据进行分组后,分布在各组内的数据个数称为频数或次数,各组频数与全部频数之和的比值称为频率或比重。为了统计分析的需要,观察某一数值以下或某一数值以上的频率之和,叫做累积频率,或叫做对频率的累计。从变量值小的一方向变量值大的一方累加,称为向上累积,反之为向下累积。频率的最终累积值为100%。每月产蛋数 次数 频率 累积频率 Frequency Percent Cumulative Percent 11 2 0.02 0.02
19、12 7 0.07 0.09 13 19 0.19 0.28 14 35 0.35 0.63 15 21 0.21 0.84 16 11 0.11 0.95 17 5 0.05 1.00表2-2 100只来亨鸡每月产蛋数次数分布表1 自然值进行分组,最大值17,最小值11。2 数据主要集中在14,向两侧分布逐渐减少。表2-3 小麦品种300个麦穗穗粒数的次数分布表每穗粒数 次数 频率 累积频率 Frequency Percent Cumulative Percent 18-22 3 0.0100 0.0100 23-27 18 0.0600 0.0700 28-32 38 0.1267 0.1
20、967 33-37 51 0.1700 0.3667 38-42 68 0.2267 0.5934 43-47 53 0.1766 0.7700 48-52 41 0.1367 0.9067 53-57 22 0.0733 0.9800 58-62 6 0.0200 1.0000 45组组?9 组组2、计量资料的整理计量资料一般采用组距式分组法。全距组数组距组限归组制表表2-4150尾鲢鱼体长(cm)56 49 62 78 41 47 65 45 58 55 59 65 69 62 7352 52 60 51 62 78 66 45 58 58 60 57 52 51 4856 46 58 7
21、0 72 76 77 56 66 58 58 55 53 50 6563 57 65 85 59 58 54 62 48 63 46 61 62 57 3858 52 54 55 66 52 48 56 75 72 57 37 46 76 5663 75 65 48 52 55 54 62 71 48 62 58 46 57 3854 53 65 42 83 66 48 53 58 46 46 56 46 76 5560 54 58 49 52 56 82 63 65 54 75 65 86 46 7770 69 40 56 58 61 54 53 52 43 52 64 58 58 5478
22、 52 56 61 59 54 59 64 68 51 59 68 63 52 63(1)求全距,求全距,又称极差又称极差 (range):R=Xmax-Xmin =85-37 =48(cm)(2)确定组数和组距(确定组数和组距(class boundary)组数是根据样本观测数的多少及组距的大小来组数是根据样本观测数的多少及组距的大小来确定的,同时考虑到对资料要求的精确度以及进一确定的,同时考虑到对资料要求的精确度以及进一步计算是否方便。步计算是否方便。组数组距多小统计数精确,计算不方便少大统计数不精确,计算方便组数的确定样本容量样本容量样本容量样本容量 分组数分组数分组数分组数 30306
23、0 60 5 5 8 8 60 60 100 100 7 7 1010100 100 200 200 9 9 1212200 200 500 500 10 10 1818 500 500 15 15 3030表表表表2-52-5样本容量与分组数的关系样本容量与分组数的关系样本容量与分组数的关系样本容量与分组数的关系组距的确定即每组内的上下限范围。组距全距/组数48104.810组组5cmcm(3)确定组限(class limit)和组中值(class midvalue)组限组限组限组限 是指每个组变量值的起止界限。上限下限组中值组中值组中值组中值 是两个组限的中间值。组中值下限上限 2组距2下
24、限组距2上限表2-4150尾鲢鱼体长(cm)56 49 62 78 41 47 65 45 58 55 59 65 69 62 7352 52 60 51 62 78 66 45 58 58 60 57 52 51 4856 46 58 70 72 76 77 56 66 58 58 55 53 50 6563 57 65 85 59 58 54 62 48 63 46 61 62 57 3858 52 54 55 66 52 48 56 75 72 57 37 46 76 5663 75 65 48 52 55 54 62 71 48 62 58 46 57 3854 53 65 42 83
25、 66 48 53 58 46 46 56 46 76 5560 54 58 49 52 56 82 63 65 54 75 65 86 46 7770 69 40 56 58 61 54 53 52 43 52 64 58 58 5478 52 56 61 59 54 59 64 68 51 59 68 63 52 63最小一组的下最小一组的下最小一组的下最小一组的下限必须小于资限必须小于资限必须小于资限必须小于资料中的最小值,料中的最小值,料中的最小值,料中的最小值,最大一组的上最大一组的上最大一组的上最大一组的上限必须大于资限必须大于资限必须大于资限必须大于资料中的最大值;料中的最大值;
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二章 试验资料的整理与特征数的计算修 第二 试验 资料 整理 特征 计算
限制150内