【教学课件】第二章资料的整理.ppt
《【教学课件】第二章资料的整理.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第二章资料的整理.ppt(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章 资料的整理资料的整理第一节第一节 资料的分类资料的分类 下一张下一张 主主 页页 退退 出出 上一张上一张 正确地进行资料的分类是资料整理的前正确地进行资料的分类是资料整理的前提。在调查或试验中,由观察、测量所得的提。在调查或试验中,由观察、测量所得的数据按其性质的不同,一般可以分为数据按其性质的不同,一般可以分为数量性数量性状资料状资料 、质量性状资料和半定量(等级)质量性状资料和半定量(等级)资料资料三大类。三大类。一、数量性状资料一、数量性状资料下一张下一张 主主 页页 退退 出出 上一张上一张 数量性状数量性状(quantitative character)是是 指能够以
2、量测或计数的方式表示其特征的性指能够以量测或计数的方式表示其特征的性状状。观察测定数量性状而获得的数据就是。观察测定数量性状而获得的数据就是数数量性状资料量性状资料 (data of quantitative characteristics)。数量性状资料的获得有。数量性状资料的获得有量测和计数两种方式量测和计数两种方式,因而数量性状资料,因而数量性状资料 又又分为计量资料和计数资料两种。分为计量资料和计数资料两种。下一张下一张 主主 页页 退退 出出 上一张上一张 (一)计量资料(一)计量资料 指用量测方式获得的数指用量测方式获得的数量性状资料,即用度、量、衡等计量工具直接量性状资料,即用度
3、、量、衡等计量工具直接测定获得的数量性状资料。其数据是用长度、测定获得的数量性状资料。其数据是用长度、容积、重量等来表示。这种资料的各个观测值容积、重量等来表示。这种资料的各个观测值不一定是整数,两个相邻的整数间可以有带小不一定是整数,两个相邻的整数间可以有带小数的任何数值出现,其小数位数的多少由度量数的任何数值出现,其小数位数的多少由度量工具的精度而定工具的精度而定 ,它们之间的变异是连续性它们之间的变异是连续性的。因此,计量资料也称为的。因此,计量资料也称为连续性变异资料连续性变异资料。下一张下一张 主主 页页 退退 出出 上一张上一张 (二)计数资料(二)计数资料 指用计数方式获得的数指
4、用计数方式获得的数量性状资料。在这类资料中,它的各个观察值量性状资料。在这类资料中,它的各个观察值只能以整数表示,在两个相邻整数间不得有任只能以整数表示,在两个相邻整数间不得有任何带小数的数值出现。这些观察值只能以整数何带小数的数值出现。这些观察值只能以整数来表示,各观察值是不连续的,因此该类资料来表示,各观察值是不连续的,因此该类资料也称为也称为不连续性变异资料不连续性变异资料或或间断性变异资料间断性变异资料。下一张下一张 主主 页页 退退 出出 上一张上一张 二、质量性状资料二、质量性状资料 质量性状质量性状(qualitative character)是指是指能观察到而不能直接测量的性状
5、,如颜色、能观察到而不能直接测量的性状,如颜色、性性别、生死等。这类性状本身不能直接用数值表别、生死等。这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察示,要获得这类性状的数据资料,须对其观察结果作数量化处理,其方法有以下两种:结果作数量化处理,其方法有以下两种:下一张下一张 主主 页页 退退 出出 上一张上一张 (一)统计次数法(一)统计次数法 在一定的总体或样本中,根据某一质量在一定的总体或样本中,根据某一质量性状的类别统计其次数,以次数作为质量性性状的类别统计其次数,以次数作为质量性状的数据。例如,在研究猪的毛色遗传时,状的数据。例如,在研究猪的毛色遗传时,白猪与黑猪
6、杂交,子二代中白猪、黑猪和花白猪与黑猪杂交,子二代中白猪、黑猪和花猪的头数分类统计如下表。猪的头数分类统计如下表。下一张下一张 主主 页页 退退 出出 上一张上一张 表表2-1 白猪和黑猪子二代的毛色分离情况白猪和黑猪子二代的毛色分离情况 下一张 主 页 退 出 上一张 这种由质量性状数量化得来的资这种由质量性状数量化得来的资料又叫料又叫 次数资料次数资料。(二)评分法(二)评分法 对某一质量性状对某一质量性状 ,因其类别不因其类别不同,分别给予评分。例如,在研究猪同,分别给予评分。例如,在研究猪的肉色遗传时,常用的方法是将屠宰的肉色遗传时,常用的方法是将屠宰后后 2小时的猪眼肌横切面与标准图
7、谱小时的猪眼肌横切面与标准图谱对比,由浅到深分别给予对比,由浅到深分别给予 15 分的分的评分,以便统计分析。评分,以便统计分析。下一张下一张 主主 页页 退退 出出 上一张上一张 三、半定量(等级)资料三、半定量(等级)资料 半半 定定 量量 或或 等等 级级 资资 料料 (semi-quantitative or ranked data)是指将是指将观察单位按所考察的性状或指标的等级顺序观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得的分组,然后清点各组观察单位的次数而得的资料。这类资料既有次数资料的特点,又有资料。这类资料既有次数资料的特点,又有程度或量的不同。
8、程度或量的不同。如粪便潜血试验的阳性反应是在涂有粪便如粪便潜血试验的阳性反应是在涂有粪便的棉签上加试剂后观察颜色出现的快慢及深浅的棉签上加试剂后观察颜色出现的快慢及深浅程度分为六个等级;又如用某种药物治疗畜禽程度分为六个等级;又如用某种药物治疗畜禽的某种疾病,疗效分为的某种疾病,疗效分为“无效无效”、“好转好转”、“显效显效”和和“控制控制”四个级别四个级别;然后统计各级;然后统计各级别的供试畜禽数。别的供试畜禽数。半定量资料在兽医研究中是常见的。半定量资料在兽医研究中是常见的。下一张 主 页 退 出 上一张 三种不同类型的资料相互间是有区别的,三种不同类型的资料相互间是有区别的,但有时可根据
9、研究的目的和统计方法的要求将但有时可根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资料。一种类型资料转化成另一种类型的资料。例如,兽医临床化验动物的白细胞总数得例如,兽医临床化验动物的白细胞总数得到的资料属于计数资料,根据化验的目的,可到的资料属于计数资料,根据化验的目的,可按白细胞总数正常或不正常分为两组,清点各按白细胞总数正常或不正常分为两组,清点各组的次数,计数资料就转化为质量性状次数资组的次数,计数资料就转化为质量性状次数资料;如果按白细胞总数过高、正常、过低分为料;如果按白细胞总数过高、正常、过低分为三组三组,清点各组次数,清点各组次数 ,就转化成了半定量资,就转化成
10、了半定量资料料。下一张下一张 主主 页页 退退 出出 上一张上一张 第二节第二节 资料的整理资料的整理 一、资料的检查与核对一、资料的检查与核对一、资料的检查与核对一、资料的检查与核对 检查和核对原始资料的目的在于确保原始资料的检查和核对原始资料的目的在于确保原始资料的检查和核对原始资料的目的在于确保原始资料的检查和核对原始资料的目的在于确保原始资料的完整性完整性完整性完整性和和和和正确性正确性正确性正确性。所谓所谓所谓所谓完整性完整性完整性完整性是指原始资料无遗缺或重复。是指原始资料无遗缺或重复。是指原始资料无遗缺或重复。是指原始资料无遗缺或重复。所谓所谓所谓所谓正确性正确性正确性正确性是指
11、原始资料的测量和记载无差错或是指原始资料的测量和记载无差错或是指原始资料的测量和记载无差错或是指原始资料的测量和记载无差错或未进行不合理的归并。检查中要特别注意特大、特小未进行不合理的归并。检查中要特别注意特大、特小未进行不合理的归并。检查中要特别注意特大、特小未进行不合理的归并。检查中要特别注意特大、特小和异常数据(可结合专业知识作出判断)。对于有重和异常数据(可结合专业知识作出判断)。对于有重和异常数据(可结合专业知识作出判断)。对于有重和异常数据(可结合专业知识作出判断)。对于有重复、异常或遗漏的资料复、异常或遗漏的资料复、异常或遗漏的资料复、异常或遗漏的资料 ,应予以删除或补齐,应予以
12、删除或补齐,应予以删除或补齐,应予以删除或补齐 ;对有;对有;对有;对有错误、相互矛盾的资料应进行更正,必要时进行复查错误、相互矛盾的资料应进行更正,必要时进行复查错误、相互矛盾的资料应进行更正,必要时进行复查错误、相互矛盾的资料应进行更正,必要时进行复查或重新试验。或重新试验。或重新试验。或重新试验。下一张下一张 主主 页页 退退 出出 上一张上一张 二、资料的整理方法二、资料的整理方法二、资料的整理方法二、资料的整理方法 当观测值不多当观测值不多当观测值不多当观测值不多(n30n30)时,不必分组,直接进行时,不必分组,直接进行时,不必分组,直接进行时,不必分组,直接进行统计分析。统计分析
13、。统计分析。统计分析。当观测值较多当观测值较多当观测值较多当观测值较多(n30n30)时,宜将观测值分成若干组,时,宜将观测值分成若干组,时,宜将观测值分成若干组,时,宜将观测值分成若干组,以便统计分析。将观测值分组后,制成次数分布表,以便统计分析。将观测值分组后,制成次数分布表,以便统计分析。将观测值分组后,制成次数分布表,以便统计分析。将观测值分组后,制成次数分布表,即可看到资料的集中和变异情况。即可看到资料的集中和变异情况。即可看到资料的集中和变异情况。即可看到资料的集中和变异情况。(一)计数资料的整理(一)计数资料的整理(一)计数资料的整理(一)计数资料的整理 现以现以现以现以5050
14、枚受精种蛋孵化枚受精种蛋孵化枚受精种蛋孵化枚受精种蛋孵化出雏鸡的天数为例,说明计数料的整理。出雏鸡的天数为例,说明计数料的整理。出雏鸡的天数为例,说明计数料的整理。出雏鸡的天数为例,说明计数料的整理。下一张下一张 主主 页页 退退 出出 上一张上一张 表表2-2 50枚受精种蛋孵化出雏鸡的天数枚受精种蛋孵化出雏鸡的天数 小鸡出壳天数在小鸡出壳天数在1924天范围内变动天范围内变动,有有6个不同的观察值。用各个不同观察值进行个不同的观察值。用各个不同观察值进行分组,共分为分组,共分为6组,可得表组,可得表2-3形式的次数分形式的次数分布表。布表。下一张下一张 主主 页页 退退 出出 上一张上一张
15、 表表2-3 50枚受精种蛋出雏天数的次数分布表枚受精种蛋出雏天数的次数分布表下一张下一张 主主 页页 退退 出出 上一张上一张 有些计数资料,观察值较多,变异范围较有些计数资料,观察值较多,变异范围较大,若以每一观察值为一组,则组数太多,而大,若以每一观察值为一组,则组数太多,而每组内包含的观察值太少,资料的规律性显示每组内包含的观察值太少,资料的规律性显示不出来。对于这样的资料,可扩大为以几个相不出来。对于这样的资料,可扩大为以几个相邻观察值为一组,适当减少组数,这样资料的邻观察值为一组,适当减少组数,这样资料的规律性就较明显,对资料进一步计算分析也比规律性就较明显,对资料进一步计算分析也
16、比较方便。例如观测某品种较方便。例如观测某品种100只蛋鸡每年每只只蛋鸡每年每只下一张下一张 主主 页页 退退 出出 上一张上一张 鸡产蛋数鸡产蛋数(原始资料略)(原始资料略),其变异范围为其变异范围为200299枚。这样的资料如以每个观察值为枚。这样的资料如以每个观察值为一组,一组,则组数太多则组数太多(该资料最多可分为(该资料最多可分为100组),如间隔组),如间隔10枚为一组,则可使组数适当枚为一组,则可使组数适当减少。经初步整理后分为减少。经初步整理后分为10组,资料的规律组,资料的规律性就比较明显,见表性就比较明显,见表2-4。下一张下一张 主主 页页 退退 出出 上一张上一张 表表
17、2-4 100只蛋鸡每年产蛋数的次数分布表只蛋鸡每年产蛋数的次数分布表 下一张下一张 主主 页页 退退 出出 上一张上一张 (二二)计量资料的整理计量资料的整理 计量资料在分组前需要确定计量资料在分组前需要确定全距、组数、全距、组数、组距、组中值及组限组距、组中值及组限,然后将,然后将全部观测值划线全部观测值划线计数归组计数归组。【例【例2.1】将将126头基础母羊的体重资头基础母羊的体重资料料(见表见表2-5)整理成次数分布表。整理成次数分布表。下一张下一张 主主 页页 退退 出出 上一张上一张 1、求全距、求全距 全距全距是资料中最大值与最小值之差,又是资料中最大值与最小值之差,又称为称为
18、极差极差(range),用,用R表示,即表示,即 R=Max(x)-Min(x)本例本例 R=65.0-37.0=28.0(kg)下一张下一张 主主 页页 退退 出出 上一张上一张 2、确定组数、确定组数 组数的多少视样本含量及资料的变动范围组数的多少视样本含量及资料的变动范围大小而定,一般以达到既简化资料又不影响反大小而定,一般以达到既简化资料又不影响反映资料的规律性为原则。组数要适当,不宜过映资料的规律性为原则。组数要适当,不宜过多,亦不宜过少。分组越多所求得的统计量越多,亦不宜过少。分组越多所求得的统计量越精确,但增大了运算量;若分组过少,资料的精确,但增大了运算量;若分组过少,资料的规
19、律性就反映不出来,计算出的统计量的精确规律性就反映不出来,计算出的统计量的精确性也较差。一般组数的确定,可参考表性也较差。一般组数的确定,可参考表2-6。下一张下一张 主主 页页 退退 出出 上一张上一张 表表2-5 126头基础母羊的体重资料头基础母羊的体重资料 单位:单位:单位:单位:kgkg下一张下一张 主主 页页 退退 出出 上一张上一张 表表2-6 样本含量与组数样本含量与组数 本例中,本例中,n126,根据表,根据表2-6,初步确,初步确定组数为定组数为10组。组。下一张下一张 主主 页页 退退 出出 上一张上一张 3、确定组距、确定组距 每组最大值与最小值之差称为组距,记为每组最
20、大值与最小值之差称为组距,记为 i。分组时要求各组的组距相等。组距的计算公式分组时要求各组的组距相等。组距的计算公式为:为:组距组距(i)全距组数全距组数 本例本例 i28.0103.0 下一张下一张 主主 页页 退退 出出 上一张上一张 4、确定组限及组中值、确定组限及组中值 各组的最大值与最小值称为各组的最大值与最小值称为组限组限。最小值。最小值称为称为下限下限,最大值称为最大值称为上限上限。每一组的中点。每一组的中点值称为值称为组中值组中值,它是该组的代表值。组中值与,它是该组的代表值。组中值与组限、组距的关系如下:组限、组距的关系如下:组中值组中值(组下限组上限组下限组上限)/2组下限
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 第二 资料 整理
限制150内