2-试验资料的整理与特征数的计算课件.ppt
《2-试验资料的整理与特征数的计算课件.ppt》由会员分享,可在线阅读,更多相关《2-试验资料的整理与特征数的计算课件.ppt(114页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 l试验资料试验资料在生物学试验及调查中,能在生物学试验及调查中,能够获得大量的原始数据,这是在一定条件够获得大量的原始数据,这是在一定条件下,对某种具体事物或现象观察的结果,下,对某种具体事物或现象观察的结果,称之为试验资料。称之为试验资料。 l特点特点:未整理前是分散的、零星的、孤立:未整理前是分散的、零星的、孤立的,是一堆无序的数字。整理分析后,可的,是一堆无序的数字。整理分析后,可对其进行归类,使其系统化,可列成统计对其进行归类,使其系统化,可列成统计表,绘出统计图,计算出平均数、变异数表,绘出统计图,计算出平均数、变异数等特征数。等特征数。l对试验资料进行分类整理时,必对试验资料进行
2、分类整理时,必须坚持须坚持“同质同质”的原则。只有同的原则。只有同质的试验数据,才能根据科学原质的试验数据,才能根据科学原理来分类,使试验资料正确反映理来分类,使试验资料正确反映事物的本质和规律。事物的本质和规律。 计数资料计量资料数量性状资料统计次数法计分法质量性状资料质量性状资料试验资料试验资料l计数资料计数资料由计数法得到的数据,是一种由计数法得到的数据,是一种非连续变量资料。非连续变量资料。 如鱼的尾数、玉米果穗上籽粒行数、种群内的个如鱼的尾数、玉米果穗上籽粒行数、种群内的个体数、人的红细胞数等。计数资料的变量以正整数体数、人的红细胞数等。计数资料的变量以正整数出现,不可能带有小数出现
3、,不可能带有小数l计量资料计量资料由测量或度量所得的数据,也由测量或度量所得的数据,也是一种连续变量资料,通常用长度、重量、是一种连续变量资料,通常用长度、重量、体积等单位表示。体积等单位表示。 如人的身高、玉米果穗的重量、仔猪的体重、如人的身高、玉米果穗的重量、仔猪的体重、奶牛的产奶量等。因此,计量资料不一定是整数,奶牛的产奶量等。因此,计量资料不一定是整数,在相邻值之间有微小差异的数值存在。在相邻值之间有微小差异的数值存在。l也称为也称为属性性状资料属性性状资料,是指对某种现象,是指对某种现象只只能观察能观察而而不能测量不能测量的资料。如的资料。如花的花的颜色、小颜色、小麦芒的有无、茸毛的
4、有无;果蝇的红眼与白麦芒的有无、茸毛的有无;果蝇的红眼与白眼;人的血型(眼;人的血型(A, B, AB, OA, B, AB, O型);动物的型);动物的雌雄等雌雄等。 l在一定总体内,根据某一质量性状的类在一定总体内,根据某一质量性状的类别统计其出现的次数,以次数来作为质别统计其出现的次数,以次数来作为质量性状的数据。量性状的数据。l在分组统计时可按质量性状的类别进行在分组统计时可按质量性状的类别进行分组,然后统计各组出现的次数,因此,分组,然后统计各组出现的次数,因此,这类资料也称为这类资料也称为次数资料次数资料。 l例:例: 豌豆豌豆红花红花 X X 在在10001000株株F2F2代植
5、株中,不同颜色出代植株中,不同颜色出现的次数百分率分别为现的次数百分率分别为红花红花26.626.6(266266株),株),紫花紫花49.449.4(494494),),24.024.0(240240)l用数字级别表示某现象在表现程度用数字级别表示某现象在表现程度上的差别上的差别。 如小麦感染锈病后的严重程度可划如小麦感染锈病后的严重程度可划分为分为0 0(免疫)、(免疫)、1 1(高抗)、(高抗)、2 2(中(中抗)、抗)、3 3(感)级。这实际上是把质(感)级。这实际上是把质量性状资料数量化,便于统计分析。量性状资料数量化,便于统计分析。 l普查普查是指对研究对象的每个个体都是指对研究对
6、象的每个个体都进行测量或度量的一种进行测量或度量的一种全面全面调查。如人调查。如人口普查、土壤普查等。口普查、土壤普查等。l抽样调查抽样调查是一种是一种非全面非全面调查,它是调查,它是根据一定的原则对研究对象抽取一部分根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到的数据资个体进行测量或度量,把得到的数据资料作为样本进行统计处理,然后利用样料作为样本进行统计处理,然后利用样本特征数对总体进行推断。本特征数对总体进行推断。 l注意:注意:以概率论和数理统计的原理为依以概率论和数理统计的原理为依据,据,用来推断总体的样本必须是用来推断总体的样本必须是随机样本(随机样本(random s
7、ample)random sample),就,就是用随机抽样方法所得到的样本,是用随机抽样方法所得到的样本,只有这种样本才能正确估计出抽样只有这种样本才能正确估计出抽样误差,才能用来准确地推断总体。误差,才能用来准确地推断总体。l在生物学研究中,对于一些理论性的在生物学研究中,对于一些理论性的无限总体,一般需要通过设置各种类无限总体,一般需要通过设置各种类型的试验来获取样本资料,型的试验来获取样本资料,设置这些设置这些试验时,要遵循随机、重复和局部试验时,要遵循随机、重复和局部控制三项基本原则。控制三项基本原则。l无论是调查还是试验,统计学对无论是调查还是试验,统计学对原始原始资料的要求资料的
8、要求都是要都是要完整、准确完整、准确。 1 1)总体中每个个体被抽中的机会是均等总体中每个个体被抽中的机会是均等的;的;2 2)总体中任意一个体是否被抽中是相互总体中任意一个体是否被抽中是相互独立的,即个体是否被抽中不受其他独立的,即个体是否被抽中不受其他个体的影响。个体的影响。l对原始资料进行检查与核对应从对原始资料进行检查与核对应从数据数据本身是否有错误、取样是否有差错本身是否有错误、取样是否有差错和不合理数据的订正和不合理数据的订正三方面进行,以三方面进行,以保证数据资料的保证数据资料的完整、真实和可靠完整、真实和可靠,对这样的数据进行统计分析才能真实地对这样的数据进行统计分析才能真实地
9、反 映 出 调 查 或 试 验 的 客 观 情 况 。反 映 出 调 查 或 试 验 的 客 观 情 况 。 l一般样本容量在一般样本容量在3030以下的小样本以下的小样本不必分组不必分组,在,在进行统计分析。进行统计分析。经过分组归类后,制成有规则的经过分组归类后,制成有规则的次数分布表和次数分布图。次数分布表和次数分布图。l单项式分组法单项式分组法:用样本自然值进行分组,每:用样本自然值进行分组,每组均用一个或几个变量值来表示。组均用一个或几个变量值来表示。分组时,可将数据资料中每个变量分组时,可将数据资料中每个变量分别归入相应的组内,然后制成次分别归入相应的组内,然后制成次数分布表。数分
10、布表。:100100个观测值按每月产蛋个观测值按每月产蛋数进行归类,共分数进行归类,共分7 7组,统计各组,统计各组次数,计算出各组的频率和累组次数,计算出各组的频率和累积频率,得积频率,得次数分布表次数分布表:每月产蛋每月产蛋数数频率频率111213141415161727193535211150.020.070.190.350.350.210.110.050.020.090.280.630.840.951.001.00l从上表可以看出,一堆杂乱无章的原始从上表可以看出,一堆杂乱无章的原始数据资料,经初步整理后,就可了解这数据资料,经初步整理后,就可了解这些资料的大概情况,其中以每月产蛋数些
11、资料的大概情况,其中以每月产蛋数为为1414的最多。的最多。 l对于对于变量较多而变异范围较大变量较多而变异范围较大的计数资的计数资料,则不宜按每一个变量值划分为一组,料,则不宜按每一个变量值划分为一组,而而应将几个变量分为一组应将几个变量分为一组。否则,会因。否则,会因组数太多而每组变量数目太少,看不出组数太多而每组变量数目太少,看不出数据分布的规律性。数据分布的规律性。每穗粒数每穗粒数次数(次数(f f)l共分为共分为9 9个组,可以明显地表示个组,可以明显地表示出其分布情况,大部分麦穗的粒出其分布情况,大部分麦穗的粒数在数在28522852之间。之间。组距式组距式:全距、组数、组距、各组
12、上:全距、组数、组距、各组上下限下限然后然后按客观值的大小按客观值的大小来归组来归组l(1 1) 求全距(极差求全距(极差)最大观察值与最小观察最大观察值与最小观察值的差值的差l最大观察值最大观察值- -最小观察值最小观察值= =全距全距lR R(2) (2) 确定组数和组距确定组数和组距组数确定组数确定样本观测数的多少(样本容量);样本观测数的多少(样本容量);组距的大小来确定;组距的大小来确定;能反映出资料的真实面貌;能反映出资料的真实面貌;要考虑到对资料要求的精确度和计算方便。要考虑到对资料要求的精确度和计算方便。 统计数精确,不统计数精确,不便于计算;便于计算;,统计数精确度较差,统计
13、数精确度较差,计算方便。计算方便。 样本容量样本容量30 30 606060 60 100100100 100 200200200 200 500500500500以上以上5 5 8 87 7 10109 9 121210 10 181815 15 3030l组距的确定组距的确定:组距是指组距是指每组内的每组内的上下限范围,上下限范围,分组时要求各组的分组时要求各组的距离相同。距离相同。组距组距= =极差极差/ /组数组数组距组距= =179/12=14.9179/12=14.9,取,取整数整数15 15 g g作为组距。作为组距。l组限组限(class limit)(class limit)
14、是指每个组变是指每个组变量的起止界限,即每个组的上限与下限。量的起止界限,即每个组的上限与下限。l上限必须大于最大值,下限必须小于最上限必须大于最大值,下限必须小于最小值。为了计算方便,组限可取到小值。为了计算方便,组限可取到1010分分位或位或5 5分位数上。为了各组界限明确,分位数上。为了各组界限明确,避免重叠,目前在写法上,每组只写下避免重叠,目前在写法上,每组只写下限,不写上限。如表限,不写上限。如表3.63.6资料分组分别资料分组分别写成写成67.567.5,82.5 82.5 ,247.5 247.5 l组中值组中值( (组值,组值,class value)class value)
15、一组的上限和下限的中间值。一组的上限和下限的中间值。l在分组时,为了避免第一组中观测数在分组时,为了避免第一组中观测数过多,一般过多,一般第一组第一组的的组中值组中值最好接最好接近或等于资料中的近或等于资料中的最小值最小值。l组中值组中值= =( (上限上限+ +下限)下限)/ /2 2或或 l组中值组中值= =下限下限+1/2 +1/2 组距组距 l以表以表3.63.6中中140140行水稻产量为例,选定行水稻产量为例,选定第一组的中点值为第一组的中点值为75g75g,与最小观察,与最小观察值值75g75g相等;相等;l则第二组的中点值为则第二组的中点值为75+1575+1590g90g,余
16、类推。各组的中点值选定后,就可余类推。各组的中点值选定后,就可以求得各组组限。以求得各组组限。l每组有两个组限,数值小的称为下限每组有两个组限,数值小的称为下限( (lower limitlower limit) ),数值大的称为上限,数值大的称为上限( (upper limitupper limit) )。l上述资料中,第一组的上述资料中,第一组的下限下限为为该组中该组中值减去值减去1 12 2组距组距,即,即75 - (1575 - (152)2)67.5867.58,上限上限为中点值为中点值加加1 12 2组距组距,即,即82.5g82.5gl属性变数的资料,也可以用类似次数分属性变数的
17、资料,也可以用类似次数分布的方法来整理布的方法来整理先把资料按各种质量性状进行分先把资料按各种质量性状进行分类,分类数等于组数;类,分类数等于组数;根据各个体在质量属性上的具体根据各个体在质量属性上的具体表现,分别归入相应的组中,即可得到表现,分别归入相应的组中,即可得到属性分布的规律性认识。属性分布的规律性认识。l例如,某水稻杂种第二代植株米粒性状例如,某水稻杂种第二代植株米粒性状的分离情况,归于表的分离情况,归于表37。班班级级20052005一一二二三三四四五五总分总分1 1(4 4)2 2(6 6)合合1 12 2合合1 12 23 3合合满分满分30.00 30.00 10.00 1
18、0.00 4.00 4.00 6.00 6.00 10.00 10.00 5.00 5.00 5.00 5.00 10.00 10.00 10.00 10.00 10.00 10.00 20.00 20.00 50.00 50.00 100.0 100.0 1 1 AveragAverage e24.05 24.05 7.33 7.33 1.27 1.27 5.09 5.09 6.36 6.36 3.48 3.48 2.45 2.45 5.94 5.94 7.67 7.67 6.39 6.39 9.09 9.09 23.15 23.15 66.83 66.83 得分率得分率%0.80 0.80
19、 0.73 0.73 0.32 0.32 0.85 0.85 0.64 0.64 0.70 0.70 0.49 0.49 0.59 0.59 0.77 0.77 0.64 0.64 0.45 0.45 0.46 0.46 0.67 0.67 2 2 AveragAverage e23.07 23.07 6.50 6.50 1.09 1.09 4.41 4.41 5.50 5.50 2.74 2.74 2.97 2.97 5.71 5.71 7.71 7.71 5.35 5.35 9.67 9.67 22.44 22.44 63.22 63.22 得分率得分率%0.77 0.77 0.65 0.
20、65 0.27 0.27 0.74 0.74 0.55 0.55 0.55 0.55 0.59 0.59 0.57 0.57 0.77 0.77 0.54 0.54 0.48 0.48 0.45 0.45 0.63 0.63 3 3 AveragAverage e22.66 22.66 6.80 6.80 1.16 1.16 4.41 4.41 5.56 5.56 3.91 3.91 4.13 4.13 8.03 8.03 8.03 8.03 6.44 6.44 10.34 10.34 24.81 24.81 67.86 67.86 得分率得分率%0.76 0.76 0.68 0.68 0.2
21、9 0.29 0.73 0.73 0.56 0.56 0.78 0.78 0.83 0.83 0.80 0.80 0.80 0.80 0.64 0.64 0.52 0.52 0.50 0.50 0.68 0.68 4 4 AveragAverage e22.24 22.24 6.28 6.28 1.03 1.03 4.76 4.76 5.79 5.79 3.38 3.38 3.90 3.90 7.28 7.28 8.21 8.21 8.24 8.24 10.48 10.48 26.93 26.93 68.52 68.52 得分率得分率%0.74 0.74 0.63 0.63 0.26 0.26
22、 0.79 0.79 0.58 0.58 0.68 0.68 0.78 0.78 0.73 0.73 0.82 0.82 0.82 0.82 0.52 0.52 0.54 0.54 0.69 0.69 5 5 AveragAverage e23.71 23.71 6.71 6.71 1.65 1.65 5.23 5.23 6.87 6.87 3.87 3.87 3.55 3.55 7.42 7.42 7.87 7.87 6.74 6.74 9.94 9.94 24.55 24.55 69.26 69.26 得分率得分率%0.79 0.79 0.67 0.67 0.41 0.41 0.87 0.
23、87 0.69 0.69 0.77 0.77 0.71 0.71 0.74 0.74 0.79 0.79 0.67 0.67 0.50 0.50 0.49 0.49 0.69 0.69 6 6 AveragAverage e21.65 21.65 6.73 6.73 0.87 0.87 5.07 5.07 5.93 5.93 3.80 3.80 3.70 3.70 7.50 7.50 6.97 6.97 6.43 6.43 9.73 9.73 23.10 23.10 64.92 64.92 得分率得分率%0.72 0.72 0.67 0.67 0.22 0.22 0.84 0.84 0.59
24、0.59 0.76 0.76 0.74 0.74 0.75 0.75 0.70 0.70 0.64 0.64 0.49 0.49 0.46 0.46 0.65 0.65 20032003级植级植科科班级班级一一二二三(10=4+6)四(10=5+5)五(40=10+10+20)30.00 30.00 10.00 10.00 1(4)2(6)合合12合合123合合1 1 24.05 24.05 7.33 7.33 1.27 5.09 6.36 6.36 3.48 2.45 5.94 5.94 7.67 6.39 9.09 23.15 23.15 66.83 66.83 2 2 23.07 23.
25、07 6.50 6.50 1.09 4.41 5.50 5.50 2.74 2.97 5.71 5.71 7.71 5.35 9.67 22.44 22.44 63.22 63.22 3 3 22.66 22.66 6.80 6.80 1.16 4.41 5.56 5.56 3.91 4.13 8.03 8.03 8.03 6.44 10.34 24.81 24.81 67.86 67.86 4 4 22.24 22.24 6.28 6.28 1.03 4.76 5.79 5.79 3.38 3.90 7.28 7.28 8.21 8.24 10.48 26.93 26.93 68.52 68
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 试验 资料 整理 特征 计算 课件
限制150内