田间试验统计第二章资料的整理与描述优秀PPT.ppt
《田间试验统计第二章资料的整理与描述优秀PPT.ppt》由会员分享,可在线阅读,更多相关《田间试验统计第二章资料的整理与描述优秀PPT.ppt(99页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、其次章其次章 资料的整理资料的整理与描述与描述 在试验探讨中,通过视察、测量和记载,在试验探讨中,通过视察、测量和记载,可获得大量的原始数据资料。这些资料往往是可获得大量的原始数据资料。这些资料往往是零乱的,无规律性可循。零乱的,无规律性可循。通过对资料的整理,才能发觉其内部联系通过对资料的整理,才能发觉其内部联系和规律性;和规律性;利用平均数、标准差和变异系数三个统计利用平均数、标准差和变异系数三个统计数来描述资料的特征特性,以便对资料作进一数来描述资料的特征特性,以便对资料作进一步的统计分析。步的统计分析。退退 出出 第一节第一节 资料的整理资料的整理一、资料的分类一、资料的分类 在田间试
2、验中,由视察、测在田间试验中,由视察、测量所得的资料,按其性质的不同,量所得的资料,按其性质的不同,一般可分为两大类一般可分为两大类:(一)数量性状资料(一)数量性状资料 (二)质量性状资料(二)质量性状资料下一张下一张 主主 页页 退退 出出 上一张上一张 (一)数量性状资料(一)数量性状资料 数量性状是指能够以量测或计数的数量性状是指能够以量测或计数的方式表示其特征的性状。视察测定数量方式表示其特征的性状。视察测定数量性状而获得的数据就是数量性状资料。性状而获得的数据就是数量性状资料。数量性状资料的获得有量测和计数数量性状资料的获得有量测和计数两种方式,因而数量性状资料又分为以两种方式,因
3、而数量性状资料又分为以下两种下两种:1 1、计量资料、计量资料 2 2、计数资料、计数资料下一张下一张 主主 页页 退退 出出 上一张上一张 1 1、计量资料、计量资料 指用量测方式获得的数量性状资料,即指用量测方式获得的数量性状资料,即用度、量、衡等计量工具干脆测定而获得的用度、量、衡等计量工具干脆测定而获得的数量性状资料。其数据是用长度、重量、容数量性状资料。其数据是用长度、重量、容积等来表示。积等来表示。计量资料的观测值不确定是整数,两个计量资料的观测值不确定是整数,两个相邻整数间允许有带小数的任何数值出现,相邻整数间允许有带小数的任何数值出现,其小数位数多少由度量工具的精度而定。数其小
4、数位数多少由度量工具的精度而定。数据间的变异是连续的。因此,计量资料也称据间的变异是连续的。因此,计量资料也称为连续性变异资料。为连续性变异资料。下一张下一张 主主 页页 退退 出出 上一张上一张 2 2、计数资料、计数资料 指用计数方法获得的数量性状资料。计指用计数方法获得的数量性状资料。计数资料的视察值只能以整数表示,在两个相数资料的视察值只能以整数表示,在两个相邻整数间不允许有任何带小数的数值出现。邻整数间不允许有任何带小数的数值出现。这些视察值只能以整数来表示,各个视这些视察值只能以整数来表示,各个视察值是不连续的。因此,计数资料也称为不察值是不连续的。因此,计数资料也称为不连续性变量
5、资料或间断性变量资料。连续性变量资料或间断性变量资料。下一张下一张 主主 页页 退退 出出 上一张上一张 (二)质量性状资料(二)质量性状资料 质量性状又称属性性状,是指能视察到质量性状又称属性性状,是指能视察到而不能干脆测量的性状。而不能干脆测量的性状。这类性状本身不能干脆用数值表示,要这类性状本身不能干脆用数值表示,要获得这类性状的数据资料,须对其视察结果获得这类性状的数据资料,须对其视察结果作数量化处理,方法有以下两种:作数量化处理,方法有以下两种:1 1、统计次数法、统计次数法 2 2、评分法、评分法 下一张下一张 主主 页页 退退 出出 上一张上一张 1 1、统计次数法、统计次数法
6、在确定的总体或样本内,依据某一质量在确定的总体或样本内,依据某一质量性状的类别统计其次数,以次数作为质量性性状的类别统计其次数,以次数作为质量性状的数据。状的数据。例如,红花豌豆与白花豌豆杂交,统计例如,红花豌豆与白花豌豆杂交,统计F2F2不同花色的植株时,在不同花色的植株时,在10001000株植株中,有株植株中,有红花红花266266株、紫花株、紫花494494株、白花株、白花240240株。株。这种利用统计次数法对质量性状数量化这种利用统计次数法对质量性状数量化得来的资料又叫次数资料。得来的资料又叫次数资料。下一张下一张 主主 页页 退退 出出 上一张上一张 2 2、评分法、评分法 这种
7、方法是用数字级别表示某种现象在表这种方法是用数字级别表示某种现象在表现程度上的差别。现程度上的差别。例如,小麦感染锈病的严峻程度可划分为例如,小麦感染锈病的严峻程度可划分为0 0(免疫)、(免疫)、1 1(高度反抗)、(高度反抗)、2 2(中度反抗)、(中度反抗)、3 3(感染)级。又如,视察施用某种农药后害虫(感染)级。又如,视察施用某种农药后害虫的死亡状况,记的死亡状况,记“死死”为为0 0,记,记“活活”为为1 1等。等。下一张下一张 主主 页页 退退 出出 上一张上一张 二、资料的检查与核对二、资料的检查与核对 检查、核对原始资料是为了确保原始检查、核对原始资料是为了确保原始资料的资料
8、的完整性完整性和和正确性正确性。完整性完整性指原始资料无缺失或重复。指原始资料无缺失或重复。正确性正确性指原始资料的测量和记载无差指原始资料的测量和记载无差错,或未进行不合理的归并。错,或未进行不合理的归并。下一张下一张 主主 页页 退退 出出 上一张上一张 要特殊留意特大、特小的异样数据要特殊留意特大、特小的异样数据(结合专业学问推断)。对重复、异样(结合专业学问推断)。对重复、异样或遗漏的资料,应予以删除或补齐;对或遗漏的资料,应予以删除或补齐;对错误、相互冲突的资料应更正,必要时错误、相互冲突的资料应更正,必要时复查或重新试验。复查或重新试验。三、资料整理的方法三、资料整理的方法 试验资
9、料经检查核对后,依据样本试验资料经检查核对后,依据样本大小确定是否分组。大小确定是否分组。对小样本(对小样本(n30n30)资料不必分组,)资料不必分组,干脆进行统计分析。干脆进行统计分析。当样本较大(当样本较大(n n3030)时,宜将观)时,宜将观测值分成若干组,制成次数分布表,以测值分成若干组,制成次数分布表,以了解资料集中与分散的状况。了解资料集中与分散的状况。不同类型的资料,整理方法不同。不同类型的资料,整理方法不同。下一张下一张 主主 页页 退退 出出 上一张上一张 1 1、计数资料的整理、计数资料的整理 对于视察值不多、变异范围不大的计对于视察值不多、变异范围不大的计数资料,以每
10、一视察值为一组进行分组,数资料,以每一视察值为一组进行分组,然后制成次数分布表。然后制成次数分布表。例如,随机调查例如,随机调查100100个麦穗,计数每穗个麦穗,计数每穗小穗数,原始数据列于表小穗数,原始数据列于表2-12-1。下一张下一张 主主 页页 退退 出出 上一张上一张 表表2-1 1002-1 100个麦穗的每穗小穗数个麦穗的每穗小穗数下一张下一张 主主 页页 退退 出出 上一张上一张 18 15 17 19 16 15 20 18 19 17 17 18 17 16 18 20 19 17 16 1817 16 17 19 18 18 17 17 17 1818 15 16 18
11、 18 18 17 20 19 1817 19 15 17 17 17 16 17 18 1817 19 19 17 19 17 18 16 18 1717 19 16 16 17 17 17 15 17 1618 19 18 18 19 19 20 17 16 1918 17 18 20 19 16 18 19 17 1615 16 18 17 18 17 17 16 19 17 上述上述 100 个麦穗的每穗小穗数在个麦穗的每穗小穗数在1520范围内变动,变异范围不大。以范围内变动,变异范围不大。以每一个视察值为一组,共分为每一个视察值为一组,共分为6组。把全组。把全部视察值按每穗小穗数予
12、以归组,可得表部视察值按每穗小穗数予以归组,可得表2-2形式的次数分布表。形式的次数分布表。下一张下一张 主主 页页 退退 出出 上一张上一张 每穗小穗数(每穗小穗数(x x)划线计数划线计数 次数(次数()15 616 1517 3218 2519 1720 5 总总次次数数 100表表2-2 1002-2 100个麦穗每穗小穗数的次数分布表个麦穗每穗小穗数的次数分布表 有些计数资料,视察值较多,变异范有些计数资料,视察值较多,变异范围较大,若以每一视察值为一组,则组数围较大,若以每一视察值为一组,则组数太多而每组所包含的视察值太少,资料的太多而每组所包含的视察值太少,资料的规律性显示不出来
13、。规律性显示不出来。对于这样的资料,可扩大为几个相邻对于这样的资料,可扩大为几个相邻的视察值为一组的视察值为一组 ,适当削减组数,分组适当削减组数,分组后,资料的规律性就较明显。后,资料的规律性就较明显。如:探讨某早稻品种的每穗粒数,共如:探讨某早稻品种的每穗粒数,共视察视察200个稻穗,每穗粒数的变异幅度为个稻穗,每穗粒数的变异幅度为27 83 粒。粒。假如按每一视察值分为一假如按每一视察值分为一组,须要分组,须要分57组,每组所包含的视察值太组,每组所包含的视察值太少,资料的规律性显示不出来少,资料的规律性显示不出来;如以如以5粒粒为一组,共分为为一组,共分为12组,则资料的规律性较组,则
14、资料的规律性较明显,如表明显,如表2-3所示。所示。每穗粒数(每穗粒数(每穗粒数(每穗粒数(x x x x)次数(次数(次数(次数()26 2630 130 1 31 3135 335 3 36 3640 1040 10 41 4145 2145 21 46 4650 3250 32 51 5155 4155 41 56 5660 3860 38 61 6165 2565 25 66 6670 1670 16 71 7175 875 8 76 7680 380 3 81 8185 285 2 合合合合 计计计计 200 200 表表表表2-3 2002-3 2002-3 2002-3 200个
15、稻穗每穗粒数的次数分布个稻穗每穗粒数的次数分布个稻穗每穗粒数的次数分布个稻穗每穗粒数的次数分布 2 2、计量资料的整理、计量资料的整理 计量资料在分组前须要确定全距、组计量资料在分组前须要确定全距、组数、组距、组中值及组限,然后将全部观数、组距、组中值及组限,然后将全部观测值划线计数归组制成次数分布表。测值划线计数归组制成次数分布表。以表以表2-42-4中中140140行水稻产量为例,说明行水稻产量为例,说明计量资料整理的方法与步骤。计量资料整理的方法与步骤。下一张下一张 主主 页页 退退 出出 上一张上一张 表表2-4 1402-4 140行水稻产量行水稻产量 (单位:(单位:g)177 2
16、15 197 97 123 159 245 119 119 131 149 152 167 104 177 215 197 97 123 159 245 119 119 131 149 152 167 104 177 215 197 97 123 159 245 119 119 131 149 152 167 104 177 215 197 97 123 159 245 119 119 131 149 152 167 104 161 214 125 175 219 118 192 176 175 95 136 199 116 165161 214 125 175 219 118 192 176
17、 175 95 136 199 116 165161 214 125 175 219 118 192 176 175 95 136 199 116 165161 214 125 175 219 118 192 176 175 95 136 199 116 165214 95 158 83 137 80 138 151 187 126 196 134 206 137214 95 158 83 137 80 138 151 187 126 196 134 206 137214 95 158 83 137 80 138 151 187 126 196 134 206 137214 95 158 83
18、 137 80 138 151 187 126 196 134 206 137 98 97 129 143 179 174 159 165 136 108 101 141 148 168 98 97 129 143 179 174 159 165 136 108 101 141 148 168 98 97 129 143 179 174 159 165 136 108 101 141 148 168 98 97 129 143 179 174 159 165 136 108 101 141 148 168163 176 102 194 145 173 163 176 102 194 145 1
19、73 163 176 102 194 145 173 163 176 102 194 145 173 75757575 130 149 150 161 155 111 158 130 149 150 161 155 111 158 130 149 150 161 155 111 158 130 149 150 161 155 111 158131 189 91 142 140 154 152 163 123 205 149 155 131 209131 189 91 142 140 154 152 163 123 205 149 155 131 209131 189 91 142 140 15
20、4 152 163 123 205 149 155 131 209131 189 91 142 140 154 152 163 123 205 149 155 131 209183 97 119 181 149 187 131 215 111 186 118 150 155 197183 97 119 181 149 187 131 215 111 186 118 150 155 197183 97 119 181 149 187 131 215 111 186 118 150 155 197183 97 119 181 149 187 131 215 111 186 118 150 155
21、197116 116 116 116 254254254254 239 160 172 179 151 198 124 179 135 184 168 169 239 160 172 179 151 198 124 179 135 184 168 169 239 160 172 179 151 198 124 179 135 184 168 169 239 160 172 179 151 198 124 179 135 184 168 169173 181 188 211 197 175 122 151 171 166 175 143 190 213173 181 188 211 197 17
22、5 122 151 171 166 175 143 190 213173 181 188 211 197 175 122 151 171 166 175 143 190 213173 181 188 211 197 175 122 151 171 166 175 143 190 213192 231 163 159 158 159 177 147 194 227 141 169 124 159192 231 163 159 158 159 177 147 194 227 141 169 124 159192 231 163 159 158 159 177 147 194 227 141 169
23、 124 159192 231 163 159 158 159 177 147 194 227 141 169 124 159 (1)求全距求全距 全距全距是资料中最大值与最小值之差,是资料中最大值与最小值之差,又称为又称为极差极差,用,用R表示,即表示,即 R=Max(x)-Min(x)表表2-4中,水稻产量最大观测值为中,水稻产量最大观测值为254g,最小观测值为,最小观测值为75g,全距为:,全距为:R=254 75=179(g)下一张下一张 主主 页页 退退 出出 上一张上一张 (2)(2)确定组数和组距确定组数和组距 组数的多少视样本容量及资料全距的大组数的多少视样本容量及资料全距的
24、大小而定,一般以达到既简化资料又不影响反小而定,一般以达到既简化资料又不影响反映资料的规律性为原则。映资料的规律性为原则。组数要适当,不宜过多,亦不宜过少。组数要适当,不宜过多,亦不宜过少。分组越多所求得的统计数越精确,但增大了分组越多所求得的统计数越精确,但增大了运算量;若分组过少,资料的规律性就反映运算量;若分组过少,资料的规律性就反映不出来,计算出的统计数的精确性也较差。不出来,计算出的统计数的精确性也较差。下一张下一张 主主 页页 退退 出出 上一张上一张 表表2-5 2-5 样本容量与组数样本容量与组数 样本容量样本容量 组组 数数 3060 5 8 3060 5 8 60100 8
25、 10 60100 8 10 100200 1012 100200 1012 200500 1218 200500 1218 500 500以上以上 1830 1830下一张下一张 主主 页页 退退 出出 上一张上一张 组组距距指指每每组组的的最最大大值值与与最最小小值值之之差差,记为记为i i。分组时要求各组的。分组时要求各组的组距相等组距相等。组距(组距(i i)=全距全距/组数组数 表表2-42-4中中的的观观测测值值个个数数即即样样本本含含量量为为140140,查表,查表2-52-5,取组数为,取组数为1212,则组距为:,则组距为:组距(组距(i i)=179/12=14.9=179
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 田间试验 统计 第二 资料 整理 描述 优秀 PPT
限制150内