资料的来源及整理教程文件.ppt
《资料的来源及整理教程文件.ppt》由会员分享,可在线阅读,更多相关《资料的来源及整理教程文件.ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、资料的来源及整理第一节第一节 资料的分类资料的分类 正确地进行资料的分类是资料整理的前提。正确地进行资料的分类是资料整理的前提。在调查或试验中,由观察、测量所得的数据按在调查或试验中,由观察、测量所得的数据按其性质的不同,一般可以分为数量性状资料、其性质的不同,一般可以分为数量性状资料、质量性状资料和半定量(等级)资料三大类。质量性状资料和半定量(等级)资料三大类。2 2资料的分类资料的分类第一节第一节 资料的分类资料的分类数量性状资料数量性状资料2资料的分类资料的分类半定量资料半定量资料质量性状资料质量性状资料能够以量测或计数的方式表示其特征能够以量测或计数的方式表示其特征的性状的一类资料就
2、是数量性状资料。的性状的一类资料就是数量性状资料。数量性状资料的获得有量测和计数两数量性状资料的获得有量测和计数两种方式种方式 ,因而数量性状资料,因而数量性状资料 又分为又分为计量资料和计数资料两种。计量资料和计数资料两种。计量资料计量资料(连续性资料连续性资料)指用量测指用量测方式获得的数量性状资料,即用度、方式获得的数量性状资料,即用度、量、衡等计量工具直接测定获得的数量、衡等计量工具直接测定获得的数量性状资料。量性状资料。计数资料计数资料(间断性资料间断性资料)指用计数指用计数方式获得的数量性状资料方式获得的数量性状资料。动物的体高、体重、产奶量、各种生理生动物的体高、体重、产奶量、各
3、种生理生化指标、药动力学指标等化指标、药动力学指标等发病数、治愈数、死亡数、呼吸次数、细发病数、治愈数、死亡数、呼吸次数、细菌数、产仔数、产蛋数等菌数、产仔数、产蛋数等第一节第一节 资料的分类资料的分类数量性状资料数量性状资料资料的分类资料的分类半定量资料半定量资料质量性状资料质量性状资料质量性状质量性状是指能观察到而不能直接测量是指能观察到而不能直接测量的性状,如颜色、的性状,如颜色、性别、生死等。这类性别、生死等。这类性状本身不能直接用数值表示,要获得性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果这类性状的数据资料,须对其观察结果作数量化处理,其方法有以下两种:作数量
4、化处理,其方法有以下两种:统计次数法统计次数法 在一定的总体或样本中,在一定的总体或样本中,根据某一质量性状的类别统计其次数,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。以次数作为质量性状的数据。评分法评分法 对某一质量性状对某一质量性状 ,因其类别不因其类别不同,分别给予评分。同,分别给予评分。死亡原因死亡原因次数次数频率(频率(%)鸡白痢病鸡白痢病16032法氏囊病法氏囊病8717.4啄肛死亡啄肛死亡15831.6拥挤死亡拥挤死亡387.6其它原因其它原因5711.4研究猪的肉色遗传时,将屠宰后研究猪的肉色遗传时,将屠宰后2h的猪眼肌面积切的猪眼肌面积切面的颜色与标准图谱进
5、行对比,由浅到深评分(面的颜色与标准图谱进行对比,由浅到深评分(1-5分)分)第一节第一节 资料的分类资料的分类数量性状资料数量性状资料2资料的分类资料的分类半定量资料半定量资料质量性状资料质量性状资料指指既既有有数数量量性性状状资资料料的的特特点点,又又有有质质量量性性状状资资料料特特征征的的一一类类资资料料。将将观观察察单单位位按按所所考考察察的的性性状状或或指指标标的的等等级级顺顺序序分分组组,然然后后清清点点各各组组观观察察单单位位的的次次数数而得的资料。而得的资料。粪便潜血试验的阳性反应是在涂有粪便的棉签粪便潜血试验的阳性反应是在涂有粪便的棉签上加试剂后观察颜色出现的快慢及深浅程度分
6、上加试剂后观察颜色出现的快慢及深浅程度分为为6个等级,统计各等级的次数等资料。个等级,统计各等级的次数等资料。三种不同类型的资料相互间是有区别的,三种不同类型的资料相互间是有区别的,但有时可根据研究的目的和统计方法的要求将但有时可根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资料。例如,一种类型资料转化成另一种类型的资料。例如,兽医临床化验动物的白细胞总数得到的资料属兽医临床化验动物的白细胞总数得到的资料属于计数资料,根据化验的目的,可按白细胞总于计数资料,根据化验的目的,可按白细胞总数正常或不正常分为两组,清点各组的次数,数正常或不正常分为两组,清点各组的次数,计数资料就转化
7、为质量性状次数资料;如果按计数资料就转化为质量性状次数资料;如果按白细胞总数过高、正常、过低分为三组,清点白细胞总数过高、正常、过低分为三组,清点各组次数,就转化成了半定量资料各组次数,就转化成了半定量资料 。第一节第一节 资料的分类资料的分类第一节第一节 资料的分类资料的分类国外关于资料的分类国外关于资料的分类变量类型变量类型假假 设设名义变量名义变量名义分类名义分类有序变量有序变量在名义变量的前提下加有序分类在名义变量的前提下加有序分类区间变量区间变量在有序变量的前提下加等间距在有序变量的前提下加等间距定量变量定量变量在区间变量的前提下加有意义的起始值在区间变量的前提下加有意义的起始值第二
8、节第二节 资料的整理资料的整理1资料的检查与核对资料的检查与核对完整性完整性 是指原始资料无遗缺或重复。是指原始资料无遗缺或重复。正确性正确性 是指原始资料的测量和记载无差错是指原始资料的测量和记载无差错,未进行不合未进行不合理的归并。检查中要特别注意特大、特小和异常数据理的归并。检查中要特别注意特大、特小和异常数据(可结合专业知识作出判断)。对于有重复、异常或(可结合专业知识作出判断)。对于有重复、异常或遗漏的资料遗漏的资料 ,应予以删除或补齐,应予以删除或补齐;对有错误、相互矛;对有错误、相互矛盾的资料应进行更正,必要时进行复查或重新试验。盾的资料应进行更正,必要时进行复查或重新试验。代表
9、性代表性 原始资料要能充分的反映它所代表总体的特征。原始资料要能充分的反映它所代表总体的特征。第二节第二节 资料的整理资料的整理2资料的整理方法资料的整理方法p 当观测样本个体数不多当观测样本个体数不多(n30)时,不必分组,时,不必分组,直接进行统计分析。直接进行统计分析。p 当观测个体数较多当观测个体数较多(n30)时,宜将各观测值分时,宜将各观测值分成若干组,以便统计分析。将观测值分组后,制成若干组,以便统计分析。将观测值分组后,制成次数分布表,即可看到资料的集中和变异情况。成次数分布表,即可看到资料的集中和变异情况。第二节第二节 资料的整理资料的整理(一一)计数资料的整理计数资料的整理
10、现以现以5050枚受精种蛋孵化出雏鸡的天数为例,说明枚受精种蛋孵化出雏鸡的天数为例,说明计数料的整理。计数料的整理。表表1 501 50枚受精种蛋孵化出雏鸡的天数枚受精种蛋孵化出雏鸡的天数2120202123222222212220232223221922232422192221212122222422212122222322222122222322232222222323222122范围:范围:19-24第二节第二节 资料的整理资料的整理 小鸡出壳天数在小鸡出壳天数在19241924天范围内变动天范围内变动 ,有,有6 6个不同的观察值。用各个不同观察值进行分组,个不同的观察值。用各个不同观
11、察值进行分组,共分为共分为6 6组,可得表组,可得表2 2形式的次数分布表。形式的次数分布表。表表2 50枚受精种蛋出雏天数的次数分布表枚受精种蛋出雏天数的次数分布表正正 正正ND-HI 滴度滴度划划 线线 记记 数数次次 数数110120140180 1160 1320 1640|卌 卌 卌|卌 卌 卌 卌 卌 卌 卌 卌 卌 卌|卌 卌 卌 卌 卌 卌 卌 卌 卌 卌 卌 卌 卌|卌 卌 卌 卌 卌 卌 卌|卌 卌 卌卌|418546736156合合 计计200表表2-1 鸡新城疫血球凝集抑制滴度分布表鸡新城疫血球凝集抑制滴度分布表第二节第二节 资料的整理资料的整理第二节第二节 资料的整理
12、资料的整理有些计数资料,观察值较多,有些计数资料,观察值较多,变异范围较大变异范围较大,若以每,若以每一观察值为一组,则组数太多,而每组内包含的观察一观察值为一组,则组数太多,而每组内包含的观察值太少,资料的规律性显示不出来。对于这样的资料,值太少,资料的规律性显示不出来。对于这样的资料,可扩大为以可扩大为以几个相邻观察值为一组几个相邻观察值为一组,适当减少组数,适当减少组数,这样资料的规律性就较明显,对资料进一步计算分析这样资料的规律性就较明显,对资料进一步计算分析也比较方便。也比较方便。第二节第二节 资料的整理资料的整理表表2-2 100例血液涂片病变红细胞数的次数分布表例血液涂片病变红细
13、胞数的次数分布表第二节第二节 资料的整理资料的整理(二二)计量资料的整理计量资料的整理计量资料:组距式分组法计量资料:组距式分组法 在分组前需要确定在分组前需要确定 全距全距、组数组数、组距组距、组组中值中值及及组限组限,然后将全部观测值然后将全部观测值划线计数归组划线计数归组。第二节第二节 资料的整理资料的整理200头奶牛血液镁离子含量(头奶牛血液镁离子含量(mg)资料见表)资料见表2-3,对该资料进行整理分组。对该资料进行整理分组。表表2-3 200头奶牛血液镁离子含量头奶牛血液镁离子含量 单位单位 mg2.52.91.72.13.32.42.22.32.31.12.82.42.22.21
14、.91.22.01.91.72.72.52.42.62.22.51.83.01.92.82.32.51.61.82.12.22.12.32.32.32.12.21.42.82.82.01.92.32.12.12.02.02.12.92.32.51.92.72.21.62.22.72.12.62.22.42.91.92.22.32.22.31.72.52.61.92.52.92.31.93.02.42.01.92.01.62.02.31.71.93.03.12.02.52.22.12.21.81.62.31.82.12.42.01.63.11.62.12.32.62.02.31.82.62.31
15、.62.72.41.71.51.81.91.32.22.42.11.41.42.32.22.82.12.21.92.32.11.42.02.02.61.11.82.02.72.32.71.81.51.51.82.02.41.32.31.62.12.21.82.42.62.53.03.21.91.91.91.92.01.71.02.32.11.82.62.22.62.51.82.21.42.82.12.32.12.42.12.01.72.42.12.01.62.12.11.52.12.61.82.12.52.0第二节第二节 资料的整理资料的整理第一步:求全距第一步:求全距(极差极差)第二步:第二
16、步:确定组数(确定组数(12),参考下表),参考下表样本内观察值的个数样本内观察值的个数分组时的组数分组时的组数50 510100 81620010203001224500153010002040样本容量与组数多少的关系样本容量与组数多少的关系R=3.3-1.0=2.3(mg)第二节第二节 资料的整理资料的整理第三步:计算组距第三步:计算组距 第四步:计算各组的组下限、组上限以及组中值第四步:计算各组的组下限、组上限以及组中值 分组时要使第一组的下限小于资料的最小值,最后分组时要使第一组的下限小于资料的最小值,最后一组的上限大于资料的最大值。一组的上限大于资料的最大值。本例第一组的下限为本例第
17、一组的下限为1.0(1/2)0.20.9 组中值组中值(组下限组上限组下限组上限)/2 组下限组下限1/2组距组上限组距组上限-1/2组距组距本例第一组的组中值为(本例第一组的组中值为(0.91.1)/21.0第二节第二节 资料的整理资料的整理第五步:第五步:以表格方式写出各组的下限、上限与组中值以表格方式写出各组的下限、上限与组中值 第六步:第六步:统计汇总,得到每组中出现的次数统计汇总,得到每组中出现的次数 第二节第二节 资料的整理资料的整理(二二)计量资料的整理计量资料的整理表表2-5 200头奶牛血镁含量次数分布表头奶牛血镁含量次数分布表第二节第二节 资料的整理资料的整理(三三)质量性
18、状资料、半定量资料的整理质量性状资料、半定量资料的整理 按照质量性状类别或等级进行分组,分别按照质量性状类别或等级进行分组,分别统计各组的次数,绘制次数分布表。统计各组的次数,绘制次数分布表。角角次次 数(数(f)频率(频率(%)无 角8772.50有 角3327.50合合 计计120100.00表表2-8 F2代山羊的有角无角分离情况代山羊的有角无角分离情况第二节第二节 资料的整理资料的整理仔猪死亡情况仔猪死亡情况死亡原因死亡原因死亡数死亡数频率(频率(%)冻冻 死死1519.23发育不良发育不良2025.46肺肺 炎炎1316.67白白 痢痢1012.82寄生虫寄生虫2025.64合合 计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 资料 来源 整理 教程 文件
限制150内