统计数据的整理与显(1).ppt





《统计数据的整理与显(1).ppt》由会员分享,可在线阅读,更多相关《统计数据的整理与显(1).ppt(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章 统计数据的整理和显示1第一节 数据整理的内容与程序数据整理的内容与程序数据整理的内容与程序数据整理的内容与程序第二节 统计分组统计分组统计分组统计分组第三节 次数分配次数分配次数分配次数分配第四节第四节第四节第四节 统计表与统计图统计表与统计图统计表与统计图统计表与统计图第一节 数据整理的内容与程序数据整理的内容与程序(一)统计数据整理的内容1.1.根据研究目的设计整理的汇总方案。包括确定如何统根据研究目的设计整理的汇总方案。包括确定如何统计分组和明确说明总体的统计指标。计分组和明确说明总体的统计指标。2.2.根据汇总方案,对各个调查项目的资料进行汇总,通根据汇总方案,对各个调查项目的
2、资料进行汇总,通过汇总计算各项指标。过汇总计算各项指标。3.3.通过统计表或统计图的形式,描述整理的结果。通过统计表或统计图的形式,描述整理的结果。第一节 数据整理的内容与程数据整理的内容与程序序(二)数据整理的程序1.统计资料的审核。逻辑检查和计算检查统计资料的审核。逻辑检查和计算检查2.资料的分组和汇总。资料的分组和汇总。3.编制统计表或绘制统计图。编制统计表或绘制统计图。4.统计资料的积累、保管和公布。统计资料的积累、保管和公布。第二节 统计分组4统计分组的概念统计分组的原则统计分组的关键统计分组的方法一、统计分组的概念5统计分组:根据统计研究的目的和客观现象的内在特点,按某个标志(或几
3、个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。二、统计分组的原则6 互斥原则:在特定的分组标志下,总体中的任互斥原则:在特定的分组标志下,总体中的任何一个单位的只能归属于某一组,而不能同时何一个单位的只能归属于某一组,而不能同时或可能归属于几个组。或可能归属于几个组。穷尽原则:使总体中的每一个单位都应有组可穷尽原则:使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的归,或者说各分组的空间足以容纳总体所有的单位。单位。三、统计分组的方法7按品质标志分组按数量标志分组1、品质分组的方法 单项式分组(一个取值一个组)例性别人数男女3020合计508品质标志品质标志
4、1、品质分组单项式分组2、数量分组的方法。1 1)按离散变量分组)按离散变量分组A A、变量值取值不多、变量值取值不多单项式分组单项式分组例例年龄年龄学生人数学生人数1818191920205 515152020合计合计40409离散变量离散变量1、品质分组的方法单项式分组2、数量分组的方法。1 1)按离散变量分组)按离散变量分组A A、变量值取值不多、变量值取值不多单项式分组单项式分组B B、变量值取值较多、变量值取值较多组距式分组(一个区间一个组)组距式分组(一个区间一个组)例例班级人数(人)班级人数(人)班级数班级数2020以下以下2 20-290-2930-30-49495050及及5
5、050以上以上1 16 619194 4合计合计303010离散变量离散变量1、品质分组的方法单项式分组2、数量分组的方法。1 1)按离散变量分组)按离散变量分组A A、变量值取值不多、变量值取值不多单项式分组单项式分组B B、变量值取值较多、变量值取值较多组距式分组(一个区间一个组)组距式分组(一个区间一个组)2 2)按连续变量分组)按连续变量分组组距式分组组距式分组例例身高(米)身高(米)学生人数学生人数1.50-1.601.50-1.601.60-1.701.60-1.701.70-1.801.70-1.80101011119 9合合 计计303011连续变量连续变量三、统计分组的方法(
6、总结)1、品质分组的方法单项式分组2、数量分组的方法。1 1)按离散变量分组)按离散变量分组A A、变量值取值不多、变量值取值不多单项式分组单项式分组B B、变量值取值较多、变量值取值较多组距式分组组距式分组2 2)按连续变量分组)按连续变量分组组距式分组组距式分组12四、组距式分组中的几个概念1、组限 区间两端的数值区间两端的数值下限:区间最小值下限:区间最小值上限:区间最大值上限:区间最大值 开口组和闭口组开口组和闭口组开口组:统计分组中缺上限开口组:统计分组中缺上限或缺下限的组或缺下限的组闭口组:统计分组中上、下闭口组:统计分组中上、下限均齐全的组限均齐全的组 组限的写法:组限的写法:间
7、断式写法间断式写法连续式写法:连续式写法:“上限不在内上限不在内”按班级人数分组(人)按班级人数分组(人)班级数班级数2020以下以下2 20-290-2930-3930-394040及及4040以上以上1 16 619194 4合计合计3030按身高分组(米)按身高分组(米)学生人数学生人数1.50-1.601.50-1.601.60-1.701.60-1.701.70-1.801.70-1.80101011119 9合合 计计3030132、组距:区间的距离(连续式写法)(连续式写法)组距组距=上限上限下限下限(间断式写法)(间断式写法)组距组距=本组上限本组上限-前组上限前组上限 或或=
8、本组下限本组下限-前组下限前组下限 或或=本组上限本组上限-本组下限本组下限+1+1(分组标志为离散变量)(分组标志为离散变量)等距分组和异距分组等距分组和异距分组 按身高分组(米)按身高分组(米)组距组距1.50-1.601.50-1.601.60-1.701.60-1.701.70-1.801.70-1.800.10.10.10.10.10.1合合 计计按班级人数分组(人)按班级人数分组(人)组距组距2020以下以下2 20-290-2930-30-49495050及及5050以上以上-10102020-合计合计14等距分组:在组距式分组中,每个组的组距均相等。一般在现象性质差异的变动比较
9、均衡条件下使一般在现象性质差异的变动比较均衡条件下使用。用。优点:易于掌握次数分布的特征;各组次数可优点:易于掌握次数分布的特征;各组次数可以直接比较。以直接比较。按身高分组(米)按身高分组(米)学生人数学生人数1.50-1.601.50-1.601.60-1.701.60-1.701.70-1.801.70-1.80101011119 9合合 计计303015异距分组:在组距式分组中,各组组距不尽相等。异距分组:在组距式分组中,各组组距不尽相等。一般在现象性质差异的变动非均衡的条件下使用。一般在现象性质差异的变动非均衡的条件下使用。优点:能够准确地描述偏态分布;能将性质相同的总体单位归为优点
10、:能够准确地描述偏态分布;能将性质相同的总体单位归为一组。一组。缺点:由于各组的组距不同,各组次数直接比较是没有意义的。缺点:由于各组的组距不同,各组次数直接比较是没有意义的。按班级人数分组(人)按班级人数分组(人)班级数班级数2020以下以下2 20-290-2930-30-49495050及及5050以上以上1 16 619194 4合计合计303016173、组数原则:原则:要尽量能反映总体单位的分布情况及总体单位的集要尽量能反映总体单位的分布情况及总体单位的集中趋势。中趋势。要尽可能区分出组与组性质上的差异。要尽可能区分出组与组性质上的差异。经验公式:经验公式:.Lg NLg N第三节
11、 频数分布18(一)频数分布的概念(一)频数分布的概念 在统计分组的基础上,将总体所有的单位按某一标志进行归类排在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,称为频数分布,或次数分布。列,称为频数分布,或次数分布。品质分布数列、变量分布数列品质分布数列、变量分布数列(二)分布数列的两个要素(二)分布数列的两个要素 统计分组统计分组 各组所出现的单位数。各组所出现的单位数。(三)编制步骤(三)编制步骤1 1、确定组数、确定组数2 2、确定组距、确定组距3 3、根据分组整理频数分布表、根据分组整理频数分布表4 4、绘制频数分布图、绘制频数分布图 例:某单位30名职工工资资料如下:19
12、1060 840 1100 910 1090 910 1110 1070 990 940 1060 840 1100 910 1090 910 1110 1070 990 940 1190 870 1050 950 1060 1180 970 1030 1060 850 1190 870 1050 950 1060 1180 970 1030 1060 850 1060 1010 1050 960 1050 1070 1210 1280 1110 1010 1060 1010 1050 960 1050 1070 1210 1280 1110 1010 试分析该单位职工工资分布情况分析20排序
13、:排序:84840 8501210 12800 8501210 1280组数:组数:m=1+3.3lgN=1+3.3lg30=6m=1+3.3lgN=1+3.3lg30=6假设采用等距闭口组:假设采用等距闭口组:组距组距=R/m=(xR/m=(xmaxmax-x-xminmin)/m)/m =(1300-800)/5=100 =(1300-800)/5=100最大值比真实值大一些;最小值比真实值小一些;最大值比真实值大一些;最小值比真实值小一些;职工工资分布表月工资(元)800-900 900-10001000-11001100-12001200-1300合计21(四)指标频数:各组单位数频数
14、:各组单位数频率:频率:各组单位数占总体单位数的比重各组单位数占总体单位数的比重 月工资(元)月工资(元)职工人数职工人数(频数)(频数)频率(频率(%)80 800-9000-900 90 900-10000-10001001000-11000-11001101100-12000-12001201200-13000-13003 37 713135 52 210.010.023.323.343.343.316.716.76.76.7合计合计3030100.0100.022(四)指标 频数、频率频数、频率 组中值组中值 (闭口组)组中值(上限下限)(连续式写法)(闭口组)组中值(上限下限)(连续
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计数据 整理

限制150内