【教学课件】第2章数据的组织与表达.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《【教学课件】第2章数据的组织与表达.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第2章数据的组织与表达.ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第2章 数据的组织与表达Arrangement and Presentation of DataSection 2.1Data and Data Type数据与数据类型 一、原始数据的组织资料以电子表格(spreadsheet)方式记录。包括个体(Individual):一笔数据所描述的对象(object)。电子表格中输入在一行。及变量(Variable):描述任何一个个体的特征,一个变量对不同的个体取不同的数值(value)。电子表格中输入在一列。(一一)数量性状资料数量性状资料 数量性状数量性状(quantitative trait)的度量有计数和量测两的度量有计数和量测两种方式,其所得变
2、数不同。种方式,其所得变数不同。1.不连续性或间断性变数不连续性或间断性变数(discontinuous or discrete(discontinuous or discrete variable)variable)指用计数方法获得的数据指用计数方法获得的数据。2.连续性变数连续性变数(continuous variable)(continuous variable)指称量、度量或测指称量、度量或测量方法所得到的数据,其各个观察值并不限于整数,在两个量方法所得到的数据,其各个观察值并不限于整数,在两个数值之间可以有微量数值差异的第三个数值存在。数值之间可以有微量数值差异的第三个数值存在。二、
3、试验资料的性质与分类二、试验资料的性质与分类(二二)质量性状资料质量性状资料 质量性状质量性状(qualitative trait)(qualitative trait)指能观察而不能量测的状即指能观察而不能量测的状即属性性状,如花药、子粒、颖壳等器官的颜色、芒的有属性性状,如花药、子粒、颖壳等器官的颜色、芒的有无、绒毛的有无等。要从这类性状获得数量资料,可采无、绒毛的有无等。要从这类性状获得数量资料,可采用下列两种方法:用下列两种方法:1.统计次数法统计次数法 于一定总体或样本内,统计其具有某个性于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别计其状的个体数目
4、及具有不同性状的个体数目,按类别计其次数或相对次数。次数或相对次数。2.给分法给分法 给予每类性状以相对数量的方法给予每类性状以相对数量的方法二、试验资料的性质与分类二、试验资料的性质与分类Section 2.2次数分布表 表1 100个麦穗的每穗小穗数18151719161520181917171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717151716181918181919201716191817182019161
5、819171615161817181717161917一、一、间断性变数资料的整理间断性变数资料的整理每穗小穗数每穗小穗数(y)次数次数(f)1561615173218251917205总总次数次数(n)100表表2 100个麦穗每穗小个麦穗每穗小穗数的次数分布表穗数的次数分布表 从表从表2中看到,一堆杂乱的原中看到,一堆杂乱的原始资料表,经初步整理后,就可了始资料表,经初步整理后,就可了解资料的大致情况,另外,经过整解资料的大致情况,另外,经过整理的资料也便于进一步的分析。理的资料也便于进一步的分析。每穗小穗数在每穗小穗数在1520的范围内变动,的范围内变动,把所有观察值按每穗小穗数多少加把
6、所有观察值按每穗小穗数多少加以归类,共分为以归类,共分为6组,组与组间相差组,组与组间相差为为1小穗,称为小穗,称为组距组距。这样可得表。这样可得表2形式的次数分布表。形式的次数分布表。一、一、间断性变数资料的整理间断性变数资料的整理二、二、连续性变数资料的整理连续性变数资料的整理177215197 97123159245119119131149152167104161214125175219118192176175 95136199116165214 9515883137 80138151187126196134206137 98 971291431791741591651361081011
7、41148168163176102194145173 75130149150161155111158131189 91142140154152163123205149155131209183 97119181149187131215111186118150155197116254239160172179151198124179135184168169173181188211197175122151171166175143190213192231163159158159177147194227141169124159表表3 140行水稻产量行水稻产量(单位:克单位:克)具体步骤:具体步骤:1.数
8、据排序数据排序(sort)(sort)首先对数据按从小到大排列首先对数据按从小到大排列(升升序序)或从大到小排列或从大到小排列(降序降序)。2.求极差求极差(range)(range)所有数据中的最大观察值和最小所有数据中的最大观察值和最小观察值的差数,称为观察值的差数,称为极差极差,亦即整个样本的变异幅度。,亦即整个样本的变异幅度。从表从表3中查到最大观察值为中查到最大观察值为254g,最小观察值为,最小观察值为75g,极差为极差为25475=179g。二、二、连续性变数资料的整理连续性变数资料的整理 3.确定组数和组距确定组数和组距(class interval)(class interv
9、al)根据极差分为若根据极差分为若干组,每组的距离相等,称为干组,每组的距离相等,称为组距组距。在确定组数和组距在确定组数和组距时应考虑:时应考虑:(1)观察值个数的多少;观察值个数的多少;(2)极差的大小;极差的大小;(3)便于计算;便于计算;(4)能反映出资料的真实面貌等方面。能反映出资料的真实面貌等方面。样本大小样本大小(即样本内包含观察值的个数的多少即样本内包含观察值的个数的多少)与组与组数多少的关系可参照表数多少的关系可参照表4来确定。来确定。二、二、连续性变数资料的整理连续性变数资料的整理表4样本容量与组数多少的关系样本内观察值的个数分组时的组数50 510100 81620010
10、203001224500153010002040 组数确定后,还须组数确定后,还须确定组距。组距确定组距。组距=极差极差/组数。以表组数。以表3中中140行行水稻产量为例,样本内水稻产量为例,样本内观察值的个数为观察值的个数为140,查表查表4可分为可分为816组,组,假定分为假定分为12组,组,则组距为则组距为179/12=14.9g,为分组方便起见,可以,为分组方便起见,可以15g作为组距。作为组距。二、二、连续性变数资料的整理连续性变数资料的整理 4.选定组限选定组限(class limit)(class limit)和组中点值和组中点值(组值,组值,class value class
11、value)以表以表3中中140行水稻产量为例,选定第一组的中点值行水稻产量为例,选定第一组的中点值为为75g,与最小观察值,与最小观察值75g相等;则第二组的中点值为相等;则第二组的中点值为75+15=90g,余类推。,余类推。各组的中点值选定后,就可以求得各组组限。每组有各组的中点值选定后,就可以求得各组组限。每组有两个组限,数值小的称为两个组限,数值小的称为下限下限(lower limit)(lower limit),数值大的称,数值大的称为为上限上限(upper limit)(upper limit)。上述资料中,第一组的下限为该组。上述资料中,第一组的下限为该组中点值减去中点值减去1
12、/2组距,即组距,即75(15/2)=67.5g,上限为中点,上限为中点值加值加1/2组距,即组距,即75+(15/2)=82.5g。故第一组的组限为。故第一组的组限为67.582.5g。按照此法计算其余各组的组限。按照此法计算其余各组的组限。二、二、连续性变数资料的整理连续性变数资料的整理 5.把原始资料的各个观察值按分组数列的各组组限归组把原始资料的各个观察值按分组数列的各组组限归组 可按原始资料中各观察值的次序,逐个把数值归于各可按原始资料中各观察值的次序,逐个把数值归于各组。组。待全部观察值归组后,即可求得各组的次数,制成一待全部观察值归组后,即可求得各组的次数,制成一个次数分布表。个
13、次数分布表。例如表例如表3中第一个观察值中第一个观察值177应归于表应归于表5中第中第8组,组限组,组限为为172.5187.5;第二个观察值;第二个观察值149应归于第应归于第6组,组限为组,组限为142.5157.5;。依次把。依次把140个观察值都进行归组,个观察值都进行归组,即可制成即可制成140行水稻产量的次数分布表行水稻产量的次数分布表(表表5)。二、二、连续性变数资料的整理连续性变数资料的整理表5 140行水稻的次数分布组组 限限中点中点值值(y)次数次数(f)67.5 82.5752 82.5 97.5907 97.5112.51057112.5127.512013127.51
14、42.513517142.5157.515020157.5172.516525172.5187.518021187.5202.519513202.5217.52109217.5232.52253232.5247.52402247.5262.52551合合计计(n)140 注注:前面提到分为前面提到分为12组,组,但由于第一组的中点值接近但由于第一组的中点值接近于最小观察值,故第一组的于最小观察值,故第一组的下限小于最小观察值,实际下限小于最小观察值,实际上差不多增加了上差不多增加了1/2组;这样组;这样也使最后一组的中点值接近也使最后一组的中点值接近于最大值,又增加了于最大值,又增加了1/2组
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 数据 组织 表达
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内