(精品)第三章 统计整理.ppt
《(精品)第三章 统计整理.ppt》由会员分享,可在线阅读,更多相关《(精品)第三章 统计整理.ppt(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章 统计数据的整理与显示第一节第一节数据的预处理数据的预处理n一、数据的审核与筛选一、数据的审核与筛选n1.原始数据的审核:原始数据的审核:n(1)完整性)完整性(2)准确性)准确性n2.二手数据的审核:二手数据的审核:n(1)完整性)完整性n(2)准确性)准确性n n(3)适用性和实效性)适用性和实效性n二、数据的排序:升序、降序二、数据的排序:升序、降序第二节 品质数据的整理与显示例:一家评估机构为调查不同品牌例:一家评估机构为调查不同品牌饮料的市场占有率,对随机抽取饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员的一家超市进行了调查。调查员在某天对照在某天对照50名顾客购买饮
2、料的名顾客购买饮料的品牌进行了记录,如果一个顾客品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一购买某一品牌的饮料,就将这一饮料的品牌名字记录一次。下面饮料的品牌名字记录一次。下面的表的表31是记录的原始数据是记录的原始数据。顾客购买饮料的品牌名称 表3-1n旭日升旭日升露露露露旭日升旭日升可口可乐可口可乐百事可乐百事可乐可口可乐可口可乐汇源果汁汇源果汁可口可乐可口可乐露露露露可口可乐可口可乐 可口可乐可口可乐旭日升旭日升可口可乐可口可乐百事可乐百事可乐露露露露旭日升旭日升旭日升旭日升百事可乐百事可乐可口可乐可口可乐旭日升旭日升旭日升旭日升可口可乐可口可乐可口可乐可口可乐旭日升旭日升露
3、露露露旭日升旭日升可口可乐可口可乐露露露露百事可乐百事可乐百事可乐百事可乐汇源果汁汇源果汁露露露露百事可乐百事可乐可口可乐可口可乐百事可乐百事可乐汇源果汁汇源果汁可口可乐可口可乐汇源果汁汇源果汁可口可乐可口可乐汇源果汁汇源果汁露露露露可口可乐可口可乐旭日升旭日升百事可乐百事可乐露露露露汇源果汁汇源果汁可口可乐可口可乐百事可乐百事可乐露露露露旭日升旭日升购买饮料的频数分布 表32饮料名称饮料名称频数频数(人次人次)可口可乐可口可乐旭日升冰茶旭日升冰茶百事可乐百事可乐露露露露汇源果汁汇源果汁其其他他15119960合合计计50品质标志品质标志品质数据的图示n条形图n圆形图条形图是用宽度相同的条形的
4、高条形图是用宽度相同的条形的高度或长短来描述已概括成频数、相对度或长短来描述已概括成频数、相对频数或百分比频数分布的品质数据。频数或百分比频数分布的品质数据。条形图可以横置或纵置,纵置时也称条形图可以横置或纵置,纵置时也称为柱形图。图为柱形图。图31是是50名顾客购买饮料名顾客购买饮料的频数分布的条形图(柱形图),图的频数分布的条形图(柱形图),图形非常直观地显示了可口可乐和旭日形非常直观地显示了可口可乐和旭日升冰茶是顾客的偏好。升冰茶是顾客的偏好。购买饮料数据的条形图 图3-1旭日升旭日升露露露露饼图也称圆形图,是用圆形及圆饼图也称圆形图,是用圆形及圆内扇形的面积来表示数值大小的图形。内扇形
5、的面积来表示数值大小的图形。圆形图主要用于表示总体中各组成部圆形图主要用于表示总体中各组成部分所占的比例,对于研究结构性问题分所占的比例,对于研究结构性问题十分有用。绘制一个饼图,首先画一十分有用。绘制一个饼图,首先画一个圆圈,然后利用相对频数将圆圈划个圆圈,然后利用相对频数将圆圈划分成几个部分,每一部分对应一个组分成几个部分,每一部分对应一个组的相对频数。的相对频数。购买饮料数据饼图 第三节第三节数量数据的整理与显示数量数据的整理与显示一、统计分组与变量数列的编制一、统计分组与变量数列的编制例例:某生产车间某生产车间50名工人日加工零件数如下名工人日加工零件数如下(单位单位:个个)n1171
6、22124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121统计分组的关键是统计分组的关键是正确选择分组标正确选择分组标志和准确划分各组界限。志和准确划分各组界限。第一步,对统计数据进行排序n1071081081101121131141151171171171181181181191201201211221221221221231231231231241241241
7、25125125126126127127127128128129130131133133134134135137139139第二步,确定变量数列的形式按按数量标志进行分组的方法主数量标志进行分组的方法主要有两种:要有两种:一、单项式分组(即一个变量一、单项式分组(即一个变量值为一组)值为一组)二、组距式分组二、组距式分组(一)单项式分组(一)单项式分组这种方法通常只适用于离散型变量且变量值较这种方法通常只适用于离散型变量且变量值较少的情况。对例题中的数据进行分组的结果如下:少的情况。对例题中的数据进行分组的结果如下:零件数零件数频数频数零件数零件数频数频数零件数零件数频数频数107108110
8、112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112(二)组距式分组(二)组距式分组n第一步、确定全距第一步、确定全距RR=最大值最大值-最小值最小值=139-107=32n第二步、确定组数第二步、确定组数k=1+3.322lgn=6.64n第三步、确定组距第三步、确定组距组距(组距(i)=全距(全距(R)/组数组数(k)=4.82n第四步、确定组限第四步、确定组限n第五步、计量各组单位数,并整理成表格形式第五步、计量各组单位数,并整理成表格形式某车
9、间某车间50名工人日加工零件分组表名工人日加工零件分组表表表3-3按按零件数分组零件数分组频数(人)频数(人)频率(频率(%)组中值组中值105110110115115120120125125130130135135140358141064610162820128107.5112.5117.5122.5127.5132.5137.5合计合计50100上限上限下限下限组距组距i=上限上限-下限下限ff/fx组距分组时要注意的问题组距分组时要注意的问题:一定要遵循“不重不漏不重不漏”的原则。1.“不重不重”指一项数据只能分在其中的某一组,指一项数据只能分在其中的某一组,不能在其他组中重复出现。习惯
10、上规定不能在其他组中重复出现。习惯上规定“上上限不在本组内,应归入到下一组限不在本组内,应归入到下一组”的原的原则进行处理;则进行处理;2.“不漏不漏”即所有数据都能分在其中的某一组,即所有数据都能分在其中的某一组,不能遗漏。因此,如果数据中的最大值和最小不能遗漏。因此,如果数据中的最大值和最小值与其他数据相差悬殊,可采用值与其他数据相差悬殊,可采用“*以下以下”及及“*以上以上”。例、例、87户居民户的人均拥有住宅面积数据的分布户居民户的人均拥有住宅面积数据的分布二、列表法显示统计数据二、列表法显示统计数据次数(频率)密度次数(频率)密度=次数(频率)次数(频率)/组组距距尤其适用于异距分组
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精品第三章 统计整理 精品 第三 统计 整理
限制150内