统计资料的整理与分析.ppt

资源ID：68609906 资源大小：549.51KB 全文页数：90页
资源格式： PPT 下载积分：30金币

快捷下载

会员登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要30金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

统计资料的整理与分析.ppt

第第2 2章章统计资料的整理与分析统计资料的整理与分析1 数理统计中的常用术语数理统计中的常用术语 1.1 1.1 总体与样本总体与样本总体总体：根据研究目的确定的研究对象的全体称为总：根据研究目的确定的研究对象的全体称为总体体(population)；个体：个体：总体中的每一个研究单位称为个体总体中的每一个研究单位称为个体(individual)；样本样本：依据一定方法由总体中抽取部分个体所组成依据一定方法由总体中抽取部分个体所组成的集合称为样本的集合称为样本(sample)；有限总体：含有有限个个体的总体称为有限总体；有限总体：含有有限个个体的总体称为有限总体；无限总体：包含有无限多个个体的总体称为无限总无限总体：包含有无限多个个体的总体称为无限总体；体；下一张下一张主主页页退退出出上一张上一张样本容量样本容量：样本中所包含的个体数目叫样：样本中所包含的个体数目叫样本容量或大小本容量或大小(sample size)，样本容量常记为样本容量常记为n。通常把通常把n30的样本叫的样本叫小样本小样本，n 30的样的样本叫本叫大样本大样本。试验研究的目的：了解总体，然而能观试验研究的目的：了解总体，然而能观测到的却是样本，通过样本来推断总体是统测到的却是样本，通过样本来推断总体是统计分析的基本特点。计分析的基本特点。下一张下一张主主页页退退出出上一张上一张为了能可靠地从样本来推断总体，要求样本具为了能可靠地从样本来推断总体，要求样本具有一定的含量和代表性。有一定的含量和代表性。如何获取有代表性的样本？采用随机抽取。如何获取有代表性的样本？采用随机抽取。所谓所谓随机抽取随机抽取(random sampling)(random sampling)是指总体是指总体中的每一个个体都有同等的机会被抽取到样本中。中的每一个个体都有同等的机会被抽取到样本中。样本毕竟只是总体的一部分，尽管样本具有样本毕竟只是总体的一部分，尽管样本具有一定的含量也具有代表性，通过样本来推断总体一定的含量也具有代表性，通过样本来推断总体也不可能是百分之百的正确。有很大的可靠性但也不可能是百分之百的正确。有很大的可靠性但有一定的错误率这是统计分析的特点。有一定的错误率这是统计分析的特点。下一张下一张主主页页退退出出上一张上一张 1.2 1.2 参数与统计量参数与统计量为了表示总体和样本的数量特征，需要计算特征为了表示总体和样本的数量特征，需要计算特征数。数。参数参数：由总体计算的特征数叫参数：由总体计算的特征数叫参数(parameter)；常用希腊字母表示参数，例如用常用希腊字母表示参数，例如用表示总体平均数，表示总体平均数，用用表示总体标准差；表示总体标准差；统计量统计量：由样本计算的特征数叫统计量：由样本计算的特征数叫统计量(staistic)。常用拉丁字母表示统计量，例如用常用拉丁字母表示统计量，例如用表表示样本平均数，用示样本平均数，用s表示样本标准差，用表示样本标准差，用R表示极差。表示极差。下一张下一张主主页页退退出出上一张上一张总体总体总体总体样本样本样本样本参数参数参数参数统计量统计量统计量统计量s s2 2方方差差s s2 2标准差标准差平均数平均数R极极差差抽样抽样抽样抽样推断、估计推断、估计推断、估计推断、估计为了了解总体分布、特征为了了解总体分布、特征构构造造总体参数由相应的统计量来估计，例如用总体参数由相应的统计量来估计，例如用估计估计，用，用S S估计估计等。等。1.3 1.3 准确性与精确性准确性与精确性准确性准确性(accuracy)(accuracy)也叫准确度也叫准确度，指观指观测值与其真值的接近程度。测值与其真值的接近程度。设某一试验指标或设某一试验指标或性状的真值为性状的真值为，观测值为观测值为 x x，若若 x x与与相差相差的绝对值的绝对值|x x|越小，越小，则观测值则观测值x x的准确性的准确性越高；越高；反之则低。反之则低。下一张下一张主主页页退退出出上一张上一张精确精确性性(precision)也叫精确度也叫精确度，指同一试验指指同一试验指标或性状的重复观测值彼此接近的程度。标或性状的重复观测值彼此接近的程度。若观测值若观测值彼此接近，即任意二个观测值彼此接近，即任意二个观测值xi、xj 相差的绝对值相差的绝对值|xi xj|越小，则观测值精确性越高；反之则低。准确越小，则观测值精确性越高；反之则低。准确性、精确性的意义见图性、精确性的意义见图2-1。下一张下一张主主页页退退出出上一张上一张图图2-1 准确性与精确性的关系示意图准确性与精确性的关系示意图随机误差随机误差也叫也叫抽样误差抽样误差 (sampling error)，是由于许多无法控制的内在和外在的偶然因素是由于许多无法控制的内在和外在的偶然因素所造成的所造成的。随机误差带有偶然性质，在试验中，。随机误差带有偶然性质，在试验中，即使十分小心的进行试验操作也难以消除。随机即使十分小心的进行试验操作也难以消除。随机误差不可避免，但可减少。误差不可避免，但可减少。随机误差影响试验的精确性。随机误差影响试验的精确性。下一张下一张主主页页退退出出上一张上一张 1.4 随机误差随机误差(random error)与系统误差与系统误差(systematic error)统计上的试验误差是指随机误差。这种误统计上的试验误差是指随机误差。这种误差愈小，试验的精确性愈高。差愈小，试验的精确性愈高。系统误差系统误差也叫也叫片面误差片面误差 (lopsided error)，这是这是由于试验对象相差较大，测量的由于试验对象相差较大，测量的仪器不准仪器不准、标准试剂未经校正，以及观测、标准试剂未经校正，以及观测、记载、抄录、计算中的错误等等所引起。记载、抄录、计算中的错误等等所引起。系系统误差可以通过改进方法、正确试验设计来统误差可以通过改进方法、正确试验设计来避免、消除。避免、消除。系统误差影响试验的准确性。系统误差影响试验的准确性。下一张下一张主主页页退退出出上一张上一张正确地进行试验数据资料的分类是统计正确地进行试验数据资料的分类是统计资料整理的前提。在调查或试验中，由观察、资料整理的前提。在调查或试验中，由观察、测量所得的数据资料按其性质的不同，一般测量所得的数据资料按其性质的不同，一般可以分为可以分为数量性状资料、数量性状资料、质量性状资料和质量性状资料和半定量（等级）资料半定量（等级）资料三大类。三大类。下一张下一张主主页页退退出出上一张上一张 2 2 统计资料的分类统计资料的分类数量性状数量性状(quantitative character)是指能够以是指能够以测量、计量或计数的方式表示其特征的性状测量、计量或计数的方式表示其特征的性状。观察。观察测定数量性状而获得的数据就是测定数量性状而获得的数据就是数量性状资料数量性状资料数量性状资料的获得有数量性状资料的获得有测量测量和和计数计数两种方式两种方式，因而数量性状资料因而数量性状资料又分为又分为计量资料和计数资料计量资料和计数资料两种。两种。下一张下一张主主页页退退出出上一张上一张 2.1 2.1 数量性状资料数量性状资料用测量方式获得的数量性状资料，即用度、量、用测量方式获得的数量性状资料，即用度、量、衡等计量工具直接测定获得的数量性状资料。其数衡等计量工具直接测定获得的数量性状资料。其数据是用长度、容积、重量等来表示。这种资料的各据是用长度、容积、重量等来表示。这种资料的各个观测值不一定是整数，两个相邻的整数间可以有个观测值不一定是整数，两个相邻的整数间可以有带小数的任何数值出现，其小数位数的多少由度量带小数的任何数值出现，其小数位数的多少由度量工具的精度而定工具的精度而定，它们之间的变异是连续性的。它们之间的变异是连续性的。因此，计量资料也称为因此，计量资料也称为连续性变异资料连续性变异资料。下一张下一张主主页页退退出出上一张上一张 2.1.1 2.1.1 计量资料计量资料 2.1.2 2.1.2 计数资料计数资料指用计数方式获得的数量性状资指用计数方式获得的数量性状资料。在这类资料中，它的各个观察值料。在这类资料中，它的各个观察值只能以整数表示，在两个相邻整数间只能以整数表示，在两个相邻整数间不得有任何带小数的数值出现。这些不得有任何带小数的数值出现。这些观察值只能以整数来表示，各观察值观察值只能以整数来表示，各观察值是不连续的，因此该类资料也称为是不连续的，因此该类资料也称为不不连续性变异资料或间断性变异资料连续性变异资料或间断性变异资料。下一张下一张主主页页退退出出上一张上一张 2.2 质量性状资料质量性状资料质量性状质量性状(qualitative character)是指能观察是指能观察到而不能直接测量的，只能用文字来描述其特征到而不能直接测量的，只能用文字来描述其特征的性状，如食品颜色、的性状，如食品颜色、风味等等。这类性状本身风味等等。这类性状本身不能直接用数值表示，要获得这类性状的数据资不能直接用数值表示，要获得这类性状的数据资料，须对其观察结果作数量化处理，其方法有以料，须对其观察结果作数量化处理，其方法有以下两种：下两种：下一张下一张主主页页退退出出上一张上一张 2.2.1 2.2.1 统计次数法统计次数法在一定的总体或样本中，根据某一质量性状在一定的总体或样本中，根据某一质量性状的类别统计其次数，以次数作为质量性状的数据。的类别统计其次数，以次数作为质量性状的数据。例如，苹果中全红果个数与半红果个数。例如，苹果中全红果个数与半红果个数。由质量性状数量化而得来的资料又叫由质量性状数量化而得来的资料又叫次数资次数资料。料。2.2.2 2.2.2 评分法评分法对某一质量性状，因其类别不同，分别给予对某一质量性状，因其类别不同，分别给予对某一质量性状，因其类别不同，分别给予对某一质量性状，因其类别不同，分别给予评分。例如，分析面包的质量，可以按照国际面评分。例如，分析面包的质量，可以按照国际面评分。例如，分析面包的质量，可以按照国际面评分。例如，分析面包的质量，可以按照国际面包评分细则进行打分，综合评价面包质量。新产包评分细则进行打分，综合评价面包质量。新产包评分细则进行打分，综合评价面包质量。新产包评分细则进行打分，综合评价面包质量。新产品开发中的评价打分等等。品开发中的评价打分等等。品开发中的评价打分等等。品开发中的评价打分等等。2.3 半定量（等级）资料半定量（等级）资料半定量或等级资料半定量或等级资料半定量或等级资料半定量或等级资料(semi-quantitative(semi-quantitative or ranked data)or ranked data)是指将观察单位按所考察是指将观察单位按所考察是指将观察单位按所考察是指将观察单位按所考察的性状或指标的等级顺序分组，然后清点各组的性状或指标的等级顺序分组，然后清点各组的性状或指标的等级顺序分组，然后清点各组的性状或指标的等级顺序分组，然后清点各组观察单位的次数而得的资料。这类资料既有次观察单位的次数而得的资料。这类资料既有次观察单位的次数而得的资料。这类资料既有次观察单位的次数而得的资料。这类资料既有次数资料的特点，又有程度或量的不同。如某种数资料的特点，又有程度或量的不同。如某种数资料的特点，又有程度或量的不同。如某种数资料的特点，又有程度或量的不同。如某种果实的褐变程度是视果实变色面积将其分组，果实的褐变程度是视果实变色面积将其分组，果实的褐变程度是视果实变色面积将其分组，果实的褐变程度是视果实变色面积将其分组，然后统计各级别果数。然后统计各级别果数。然后统计各级别果数。然后统计各级别果数。三种不同类型的资料相互间是有区别的，三种不同类型的资料相互间是有区别的，但有时可根据研究的目的和统计方法的要求将但有时可根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资料。一种类型资料转化成另一种类型的资料。例如，酸奶中的乳杆菌总数得到的资料属例如，酸奶中的乳杆菌总数得到的资料属于计数资料，根据化验的目的，可按乳杆菌总于计数资料，根据化验的目的，可按乳杆菌总数正常或不正常分为两组，清点各组的次数，数正常或不正常分为两组，清点各组的次数，计数资料就转化为质量性状次数资料；如果按计数资料就转化为质量性状次数资料；如果按乳杆菌总数过高、正常、过低分为三组乳杆菌总数过高、正常、过低分为三组，清点，清点各组次数各组次数，就转化成了半定量资料，就转化成了半定量资料。下一张下一张主主页页退退出出上一张上一张 3 数据资料的整理数据资料的整理 3.1 数据资料的检查与核对数据资料的检查与核对目的：在于确保原始资料的完整性和正确性。目的：在于确保原始资料的完整性和正确性。所谓所谓完整性完整性是指原始资料无遗缺或重复。是指原始资料无遗缺或重复。所谓所谓正确性正确性是指原始资料的测量和记载无差错或是指原始资料的测量和记载无差错或未进行不合理的归并。检查中要特别注意特大、特未进行不合理的归并。检查中要特别注意特大、特小和异常数据（可结合专业知识作出判断）。对于小和异常数据（可结合专业知识作出判断）。对于有重复、异常或遗漏的资料有重复、异常或遗漏的资料，应予以删除或补齐，应予以删除或补齐；对有错误、相互矛盾的资料应进行更正，必要时；对有错误、相互矛盾的资料应进行更正，必要时进行复查或重新试验。进行复查或重新试验。下一张下一张主主页页退退出出上一张上一张未整理的资料为原始资料，是零星的、孤立的和杂乱无章，无规律可循，未整理的资料为原始资料，是零星的、孤立的和杂乱无章，无规律可循，未整理的资料为原始资料，是零星的、孤立的和杂乱无章，无规律可循，未整理的资料为原始资料，是零星的、孤立的和杂乱无章，无规律可循，通过科学的整理和分析，可发现其规律性，揭示事物内在本质通过科学的整理和分析，可发现其规律性，揭示事物内在本质通过科学的整理和分析，可发现其规律性，揭示事物内在本质通过科学的整理和分析，可发现其规律性，揭示事物内在本质。3.2 数据资料的整理方法数据资料的整理方法当观测值不多当观测值不多(n30)时，不必分组，可时，不必分组，可直接进行统计分析。直接进行统计分析。当观测值较多当观测值较多(n30)时，宜将观测值分时，宜将观测值分成若干组，以便统计分析。将观测值分组后，成若干组，以便统计分析。将观测值分组后，制成次数分布表，即可看到资料的集中和变制成次数分布表，即可看到资料的集中和变异情况。异情况。下一张下一张主主页页退退出出上一张上一张 3.2 连续性资料（计量资料）的整理连续性资料（计量资料）的整理连续性资料的整理，需要先确定连续性资料的整理，需要先确定全距、全距、组数、组距、组中值及组限组数、组距、组中值及组限，然后将全部观，然后将全部观测值计数归组。测值计数归组。【例例2.1】为了分析某生产厂的罐头质量，为了分析某生产厂的罐头质量，现随机抽取现随机抽取100听罐头样品，分别称取其净听罐头样品，分别称取其净重，数据资料见表重，数据资料见表2-1。下一张下一张主主页页退退出出上一张上一张 342.1342.1340.7340.7348.4348.4346.0346.0343.4343.4342.7342.7346.0346.0341.1341.1344.0344.0348.0348.0346.3346.3346.0346.0340.3340.3344.2344.2342.2342.2344.1344.1345.0345.0340.5340.5344.2344.2344.0344.0343.5343.5344.2344.2342.6342.6343.7343.7345.5345.5339.3339.3350.2350.2337.3337.3345.3345.3358.2358.2344.2344.2345.8345.8331.2331.2342.1342.1342.4342.4340.5340.5350.0350.0343.2343.2347.0347.0340.2340.2344.0344.0353.3353.3340.2340.2336.3336.3348.9348.9340.2340.2356.1356.1346.0346.0345.6345.6346.2346.2340.6340.6339.7339.7342.3342.3352.8352.8342.6342.6350.3350.3348.5348.5344.0344.0350.0350.0335.1335.1340.3340.3338.2338.2345.5345.5345.6345.6349.0349.0336.7336.7342.0342.0338.4338.4343.9343.9343.7343.7341.1341.1347.1347.1342.5342.5350.0350.0343.5343.5345.6345.6345.0345.0348.6348.6344.2344.2341.1341.1346.8346.8350.2350.2339.9339.9346.6346.6339.9339.9344.3344.3346.2346.2338.0338.0341.1341.1347.3347.3347.2347.2339.8339.8344.4344.4347.2347.2341.0341.0341.0341.0343.3343.3342.3342.3339.5339.5343.0343.0表表表表2 21 1001 100听罐头样品的净重听罐头样品的净重听罐头样品的净重听罐头样品的净重 g g 1、求全距、求全距 R 全距全距是数据资料中的最大值与最小值之差，是数据资料中的最大值与最小值之差，又称为又称为极差极差(range)，用，用R表示。即表示。即 R=Max(xi)-Min(xi)xi为为观测值观测值本例本例 Max=358.2 Min=331.2 R=358.2-331.2=27.0下一张下一张主主页页退退出出上一张上一张 2、确定组数、确定组数 k 组数的多少视样本含量及资料的变动范围组数的多少视样本含量及资料的变动范围大小而定，一般以达到既简化资料又不影响反大小而定，一般以达到既简化资料又不影响反映资料的规律性为原则。组数要适当，不宜过映资料的规律性为原则。组数要适当，不宜过多，亦不宜过少。分组越多所求得的统计量越多，亦不宜过少。分组越多所求得的统计量越精确，但增大了运算量；若分组过少，资料的精确，但增大了运算量；若分组过少，资料的规律性就反映不出来，计算出的统计量的精确规律性就反映不出来，计算出的统计量的精确性也较差。一般组数的确定，可参考表性也较差。一般组数的确定，可参考表2-2。下一张下一张主主页页退退出出上一张上一张下一张下一张主主页页退退出出上一张上一张样本含量（n）组数601007101002009122005001217500以上1730本例中，本例中，n100，初步确定组数为，初步确定组数为9组。组。表表2-2 样本含量与组数样本含量与组数 3、确定组距、确定组距 i 每一组中的最大值与最小值之差称为组距每一组中的最大值与最小值之差称为组距（Class interval），），记为记为 i。分组时一般要求分组时一般要求各组的组距相等。各组的组距相等。组距组距(i)全距全距R组数组数k 本例 i279=3下一张下一张主主页页退退出出上一张上一张 4、确定组限及组中值、确定组限及组中值各组的最大值与最小值称为各组的最大值与最小值称为组限组限。最小值称为。最小值称为下限下限，最大最大值称为值称为上限上限。每一组的中点值称为。每一组的中点值称为组中值组中值，它是该组的代表值。，它是该组的代表值。组中值与组限、组距的关系如下：组中值与组限、组距的关系如下：组中值组中值(组下限组上限组下限组上限)/2组下限组下限1/2组距组上限组距组上限1/2组距组距下一张下一张主主页页退退出出上一张上一张组距确定后，组距确定后，组距确定后，组距确定后，首先要选定第一组的组中值。在首先要选定第一组的组中值。在首先要选定第一组的组中值。在首先要选定第一组的组中值。在分组时为了避免第一组中观察值过多，一般第一组的分组时为了避免第一组中观察值过多，一般第一组的分组时为了避免第一组中观察值过多，一般第一组的分组时为了避免第一组中观察值过多，一般第一组的组中值以接近或等于资料中的最小值为好。第一组组组中值以接近或等于资料中的最小值为好。第一组组组中值以接近或等于资料中的最小值为好。第一组组组中值以接近或等于资料中的最小值为好。第一组组中值确定后，该组组限即可确定，其余各组的组中值中值确定后，该组组限即可确定，其余各组的组中值中值确定后，该组组限即可确定，其余各组的组中值中值确定后，该组组限即可确定，其余各组的组中值和组限也可相继确定。和组限也可相继确定。和组限也可相继确定。和组限也可相继确定。注意：最末一组的上限应大于资料中的最大值。注意：最末一组的上限应大于资料中的最大值。注意：最末一组的上限应大于资料中的最大值。注意：最末一组的上限应大于资料中的最大值。表表2-1中，中，最小值为最小值为331.2，第一组的组中值取，第一组的组中值取331.0，因组距为，因组距为3.0，因此，因此第一组的下限应为：第一组的下限应为：331.0-(1/2)3.0329.5；第一组的上限也就是第二组的下限应为：第一组的上限也就是第二组的下限应为：329.5+3.0=332.5；第二组的上限也就是第三组的下限为：第二组的上限也就是第三组的下限为：332.5+3.0=335.5，依此类推，一直到某一组的上限大于资料中的最依此类推，一直到某一组的上限大于资料中的最大值为止。大值为止。依次类推分组为：依次类推分组为：329.5-332.5，332.5-335.5，下一张下一张主主页页退退出出上一张上一张将正好等于前一组上限和后一组下限的数据，一将正好等于前一组上限和后一组下限的数据，一般约定将其归入后一组。般约定将其归入后一组。通常将上限略去不写。通常将上限略去不写。第一组记为第一组记为36.0 ，第二组记为第二组记为39.0 ，5、制作次数分布表、制作次数分布表分组结束后，将资料中的每一观测值逐一归组分组结束后，将资料中的每一观测值逐一归组,统统计每组内所包含的观测值个数，制作次数分布表。计每组内所包含的观测值个数，制作次数分布表。下一张下一张主主页页退退出出上一张上一张表表2-3 100听罐头净重的次数分布听罐头净重的次数分布下一张下一张主主页页退退出出上一张上一张组限组限组中值（组中值（x)x)次数（次数（f f）329.5-329.5-331.0 331.0 332.5-332.5-334.0 334.0 335.5-335.5-337.0 337.0 338.5-338.5-340.0 340.0 341.5-341.5-343.0 343.0 344.5-344.5-346.0 346.0 347.5-347.5-349.0 349.0 350.5-350.5-352.0 352.0 353.5-353.5-355.0 355.0 356.5-356.5-358.0 358.0 11621322312211 100听罐头的单听净重多数集中在听罐头的单听净重多数集中在343g，约占观测值总个数的，约占观测值总个数的1/3，用它来描述罐，用它来描述罐头单听净重的平均水平，有较强的代表性。头单听净重的平均水平，有较强的代表性。由次数分布表可以看出，每听罐头净重由次数分布表可以看出，每听罐头净重小于小于332.5g及大于及大于356.5g的为极少数。的为极少数。100听罐头净重分布基本以听罐头净重分布基本以343.0g为中心，为中心，向两边做递减对称分布。向两边做递减对称分布。表表2-4 100盒鲜枣每盒检出不合格枣数盒鲜枣每盒检出不合格枣数下一张下一张主主页页退退出出上一张上一张 3.3 间断性资料（计数资料）的整理间断性资料（计数资料）的整理以以以以100100盒鲜枣每盒检出不合格枣数为例，说明间断性盒鲜枣每盒检出不合格枣数为例，说明间断性盒鲜枣每盒检出不合格枣数为例，说明间断性盒鲜枣每盒检出不合格枣数为例，说明间断性资料的整理。资料的整理。资料的整理。资料的整理。18291924221924222220232021232126222324222324252422242324222523252623222523202225262526262526242321262123222424212324242122232022232623242224262824272324222623202625252625252625242225262524252625252728 计数资料观察值较多时，变异范围较大，若计数资料观察值较多时，变异范围较大，若以每一观察值为一组，则组数太多，而每组内以每一观察值为一组，则组数太多，而每组内包含的观察值太少，资料的规律性显示不出来。包含的观察值太少，资料的规律性显示不出来。对于这样的资料，可扩大为以几个相邻观察值对于这样的资料，可扩大为以几个相邻观察值为一组，适当减少组数，这样资料的规律性就为一组，适当减少组数，这样资料的规律性就较明显，对资料进一步计算分析也比较方便。较明显，对资料进一步计算分析也比较方便。下一张下一张主主页页退退出出上一张上一张表表2-5 100盒鲜枣每盒检出不合格枣数次数分布表盒鲜枣每盒检出不合格枣数次数分布表下一张下一张主主页页退退出出上一张上一张不合格枣数不合格枣数次数（次数（f f）18-1918-193 320-2120-21111122-2322-23313124-2524-25353526-2726-27171728-2928-293 33.4质量性状资料、半定量（等级）资料的整质量性状资料、半定量（等级）资料的整理理对于质量性状资料对于质量性状资料、半定量（等级）资半定量（等级）资料，可按性状或等级进行分组，分别统计各料，可按性状或等级进行分组，分别统计各组的次数，然后制成次数分布表。组的次数，然后制成次数分布表。下一张下一张主主页页退退出出上一张上一张 3.5 常用统计表与统计图常用统计表与统计图 3.5.1 统计表统计表（1）统计表的结构和要求）统计表的结构和要求统计表由标题、横标目、纵标目、线条、统计表由标题、横标目、纵标目、线条、数字及合计构成，其基本格式如下表数字及合计构成，其基本格式如下表:下一张下一张主主页页退退出出上一张上一张表号表号标题标题编制统计表的总原则：结构简单，层次分明，编制统计表的总原则：结构简单，层次分明，内容安排合理，重点突出，数据准确，便于理内容安排合理，重点突出，数据准确，便于理解和比较分析。解和比较分析。下一张下一张主主页页退退出出上一张上一张统计表编制具体要求如下：统计表编制具体要求如下：标题标题标题要简明扼要、准确地说明表的内容，有时须注明时间、标题要简明扼要、准确地说明表的内容，有时须注明时间、地点。地点。标目标目标目分横标目和纵标目两项。横标目列在表的左侧标目分横标目和纵标目两项。横标目列在表的左侧，用以，用以表示被说明事物的主要标志；纵标目列在表的上端，说明横标目各表示被说明事物的主要标志；纵标目列在表的上端，说明横标目各统计指标内容，统计指标内容，并注明计算单位，如、并注明计算单位，如、kg、cm等等。等等。数字数字一律用阿拉伯数字，数字以小数点对齐，小数位数一致，一律用阿拉伯数字，数字以小数点对齐，小数位数一致，无数字的用无数字的用“”表示，数字是表示，数字是“0”的，则填写的，则填写“0”。线条线条表的上下两条边线略粗，纵、横标目间及合计用细线分开，表的上下两条边线略粗，纵、横标目间及合计用细线分开，表的左右边线可省去，表的左上角一般不用斜线。表的左右边线可省去，表的左上角一般不用斜线。下一张下一张主主页页退退出出上一张上一张 (2)统计表的种类统计表的种类统计表可根据纵、横标目是否有分组分为统计表可根据纵、横标目是否有分组分为简单表和复合表两类。简单表和复合表两类。简单表简单表由一组横标目和一组纵标目组成，由一组横标目和一组纵标目组成，纵横标目都未分组纵横标目都未分组。此类表适于简单资料的此类表适于简单资料的统计，如表统计，如表2-6。下一张下一张主主页页退退出出上一张上一张复合表复合表由两组或两组以上的横标目与一组纵标目结合而成，或由由两组或两组以上的横标目与一组纵标目结合而成，或由一组横标目与两组或两组以上的纵标目结合而成，或由两组或两组一组横标目与两组或两组以上的纵标目结合而成，或由两组或两组以上的横、纵标目结合而成。此类表适用于复杂资料的统计，如表以上的横、纵标目结合而成。此类表适用于复杂资料的统计，如表2-11。下一张下一张主主页页退退出出上一张上一张表表表表2-11 2-11 几种动物性食品的营养成分几种动物性食品的营养成分几种动物性食品的营养成分几种动物性食品的营养成分3.5.2 统计图统计图常用的统计图有长条图常用的统计图有长条图 (bar chart)、圆饼图、圆饼图(pie chart)、线图线图(linear chart)、直方图直方图(histogram)和和折线图折线图(broken-line chart)等等。一一般情况下般情况下，计量资料采用直方图和折线图，计数资，计量资料采用直方图和折线图，计数资料料、质量性状资料、半定量、质量性状资料、半定量（等级）资料常用长条（等级）资料常用长条图图、线图或园饼图。线图或园饼图。下一张下一张主主页页退退出出上一张上一张统计图绘制的基本要求统计图绘制的基本要求 1、标题简明扼要，列于图的下方。、标题简明扼要，列于图的下方。2、纵、横两轴应有刻度，注明单位。、纵、横两轴应有刻度，注明单位。3、横轴由左至右、纵轴由下而上，数值由、横轴由左至右、纵轴由下而上，数值由小到大；小到大；图形长宽比例约图形长宽比例约5：4或或6：5。4、图中需用不同颜色或线条代表不同处理、图中需用不同颜色或线条代表不同处理、样品等时，应有图例说明。样品等时，应有图例说明。下一张下一张主主页页退退出出上一张上一张 Excel软件应用软件应用工具工具-加载宏加载宏-分析数据库分析数据库数据分析数据分析方差分析方差分析回归分析回归分析统计假设检验统计假设检验直方图直方图描述统计描述统计4.1 描述中心趋势的统计量描述中心趋势的统计量平均数平均数（mean，average)下一张下一张主主页页退退出出上一张上一张 4 统计资料的特征数统计资料的特征数平均数是统计学中最常用的统计量，反映数据平均数是统计学中最常用的统计量，反映数据平均数是统计学中最常用的统计量，反映数据平均数是统计学中最常用的统计量，反映数据资料的相对集中位置。平均数主要包括有：资料的相对集中位置。平均数主要包括有：资料的相对集中位置。平均数主要包括有：资料的相对集中位置。平均数主要包括有：算术平均数（算术平均数（算术平均数（算术平均数（arithmetic meanarithmetic mean）中位数（中位数（中位数（中位数（medianmedian）众数（众数（众数（众数（modemode）几何平均数（几何平均数（几何平均数（几何平均数（geometric meangeometric mean）调和平均数（调和平均数（调和平均数（调和平均数（harmonic meanharmonic mean）4.1.1 算术平均数（算术平均数（arithmetic mean)算术平均数算术平均数是指资料中各观测值的总和除是指资料中各观测值的总和除以观测值个数所得的商，简称以观测值个数所得的商，简称平均数或均数平均数或均数，记为记为。算术平均数可根据样本大小及分组情况而算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。采用直接法或加权法计算。1.直接法直接法主要用于样本含量主要用于样本含量n30以下、未经分组资以下、未经分组资料平均数的计算。料平均数的计算。下一张下一张主主页页退退出出上一张上一张设某一资料包含设某一资料包含n个观测值：个观测值：x1、x2、xn，则样本平均数可通过下式计算：则样本平均数可通过下式计算：（2-1）其中，其中，为总和符号；为总和符号；表示从第一个观测值表示从第一个观测值x1累加到第累加到第n个观测个观测值值xn。当当在意义上已明确时，在意义上已明确时，可简写为可简写为x，（，（3-1）式可改写为：式可改写为：下一张下一张主主页页退退出出上一张上一张例：对例：对10位同学的体重进行测定，测定结果分别为位同学的体重进行测定，测定结果分别为50.0、52.0、53.5、56.0、58.5、60.0、48.0、51.0、50.5、49.0（kg），），求其平均数。求其平均数。由于由于 x=50.0+52.0+53.5+56.0+58.5 +60.0+48.0+51.0+50.5+49.0 =528.5，n=10 下一张主页退出上一张那么那么 10位同学的平均体重为位同学的平均体重为52.85 kg。2.加权法加权法对于样本含量对于样本含量 n30 以上且已分组的资料，以上且已分组的资料，可以在次数分布表的基础上采用加权法计算平可以在次数分布表的基础上采用加权法计算平均数，计算公式为：均数，计算公式为：（2-2）下一张下一张主主页页退退出出上一张上一张式中：式中：第第i组的组中值；组的组中值；第第i组的次数；组的次数；分组数分组数第第i组的次数组的次数fi是权衡第是权衡第i组组中值组组中值xi在资料中在资料中所占的比重大小，因此所占的比重大小，因此将将fi 称为是称为是xi的的“权权”，加权法也由此而得名。，加权法也由此而得名。【例例】100听罐头净重（单位：听罐头净重（单位：kg）资料资料整理成次数分布表如下，求其加权数平均数。整理成次数分布表如下，求其加权数平均数。下一张下一张主主页页退退出出上一张上一张表表2-3 100听罐头净重的次数分布听罐头净重的次数分布下一张下一张主主页页退退出出上一张上一张组限组限组中值（组中值（x)x)次数（次数（f f）329.5-329.5-331.0 331.0 1 1332.5-332.5-334.0 334.0 3 3335.5-335.5-337.0 337.0 1010338.5-338.5-340.0 340.0 2626341.5-341.5-343.0 343.0 3131344.5-344.5-346.0 346.0 1717347.5-347.5-349.0 349.0 8 8350.5-350.5-352.0 352.0 2 2353.5-353.5-355.0 355.0 1 1356.5-356.5-358.0 358.0 1 1 利用加权法计算平均数公式计算：利用加权法计算平均数公式计算：100听罐头每听净重的加权平均数为听罐头每听净重的加权平均数为342.67 g。注意：注意：计算若干个来自同一总体的样本平均数计算若干个来自同一总体的样本平均数的平均数时，如果样本含量不等，也应采用加的平均数时，如果样本含量不等，也应采用加权法计算。权法计算。下一张下一张主主页页退退出出上一张上一张【例例】某牛群有黑白花奶牛某牛群有黑白花奶牛 1500头，其平均头，其平均体重为体重为750 kg，而另一牛群有黑白花奶牛而另一牛群有

注意事项

本文（统计资料的整理与分析.ppt）为本站会员（赵**）主动上传，淘文阁 - 分享文档赚钱的网站仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知淘文阁 - 分享文档赚钱的网站（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。