《(精品)2-统计与统计整理.ppt》由会员分享,可在线阅读,更多相关《(精品)2-统计与统计整理.ppt(77页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2 统计调查与统计整理统计学2 统计调查与统计整理 统计调查统计整理统计资料的显示2.1 统计调查统计调查 统计数据的来源统计数据的来源 调查方案调查方案 调查误差调查误差2.1.1统计调查的分类n调查范围全面非全面n调查时间的连续性经常性一次性n组织方式统计报表专门调查n取得方法取得方法 直观直观采访采访报告报告q问卷调查问卷调查q网上调查网上调查n确定调查目的确定调查目的n确定调查对象、调查单位和报告单位确定调查对象、调查单位和报告单位n设计调查项目和调查表设计调查项目和调查表n调查方法和实施计划调查方法和实施计划2.1.2 统计调查方案调查目的调查要达到的具体目标回答“为什么调查?”调查
2、之前必须明确调查对象和调查单位调查对象:调查对象:调查研究的总体或调查范围调查单位:调查单位:进行登记的标志承担者报告单位报告单位:提供资料的单位调查对象,调查单位,报告单位举例:要调查所有工业企业职工的基本情况举例:要调查所有工业企业职工的基本情况调查对象调查对象:工业企业全体职工工业企业全体职工 调查单位调查单位:工业企业的每一个职工工业企业的每一个职工报告单位报告单位:每个工业企业每个工业企业 调查项目和调查表调查项目:调查的具体内容调查表:表现调查项目的表格或问卷回答“调查什么?”Q Q1 1 Q Q2 2 Q Q3 3 Q Q4 4 方案设计中的其他问题明确调查所采用的方法确定调查资
3、料的所属时间和调查工作的期限调查的组织与实施细则2.1.3 统计调查方式统计调查方式普查(概念要点)为特定目的专门组织的一次性全面调查通常是一次性或周期性的一般需要规定统一的标准调查时间特点是工作量大,时间性强主要作用是搜集重要的国情国力和资源状况的全面资料,为政府制定政策提供依据.总体总体关于普查的基本常识自2004年开始,我国实行新的普查制度。将工业、第三产业、基本单位三项普查合在一起,再加上建筑业普查的内容,统称为经济普查,2004年开展了第一次经济普查,以后在逢3,逢8的年份开展,其间隔期限为5年,标准时点为普查年份的月日。继续保留人口普查和农业普查,分别在逢0和逢6的年份进行,这两项
4、普查的间隔均为10年。统计报表(概念要点)统计调查方式之一过去曾经是我国主要的数据搜集方式按照国家有关法规的规定、自上而下地统一布置、自下而上地逐级提供基本统计数据有各种各样的类型抽样调查(概念要点)从总体中随机抽取一部分单位(样本)进行调查总体总体总体总体随机样本随机样本随机样本随机样本 具有经济性、时效性强、适应面广、准确性高等特点 目的是推断总体的未知数字特征 最常用的调查方式重点调查和典型调查(概念要点)n n典型调查典型调查典型调查典型调查l l从调查对象的全部单位中选从调查对象的全部单位中选择少数择少数典型单位典型单位进行调查进行调查l l调查结果不能用于推断总体调查结果不能用于推
5、断总体n重点调查重点调查重点调查重点调查从调查对象的全部单位中选择少数从调查对象的全部单位中选择少数重点单位重点单位进行调查进行调查调查结果不能用于推断总体调查结果不能用于推断总体重点调查和典型调查(举例)某市工商银行要了解三季度全市储蓄金额的基本情况,调查了储蓄金额最高的几个储蓄所,这属于()有意识的选择三个农村点调查农民收入情况,这属于()统计数据的间接来源 二手资料公公开开出出版版物物:中国统计年鉴、中国统计摘要、中国社会统计年鉴、中国工业经济统计年鉴、中国农村统计年鉴、中国人口统计年鉴、中国市场统计年鉴、世界经济年鉴、国外经济统计资料、世界发展报告InternetInternet 网络
6、网络中国统计中国统计中国统计中国统计年鉴年鉴年鉴年鉴20012001中中中中国国国国人人人人口口口口统统统统计计计计年年年年鉴鉴鉴鉴中中中中国国国国市市市市场场场场统统统统计计计计年年年年鉴鉴鉴鉴世世世世界界界界发发发发展展展展报报报报告告告告世世世世界界界界经经经经济济济济年年年年检检检检工工工工业业业业普普普普查查查查数数数数据据据据中国统计出版社2.1.4 统计误差统计数据的误差n统计数据与客观现实之间的差距n有登记性误差和代表性误差两类登记性误差代表性误差2.2 统计整理统计整理统计整理117 122 124 129 139 107 117 130 122 125108 131 125
7、 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121【例例例例2.12.1】为为了了解解某某生生产产车车间间5050名名工工人人日日加加工工零零件件情情况况,搜搜集集资资料料如如下下(单位:个)(单位:个)统计整理过程为使上述资料能够反映这五十个工人的综合特征,需要对其进行整理,整理过程为:审核分组汇总 编制统计表或绘制统计图数据的审核、筛选数据的审核发现数据
8、中的错误数据的筛选找出符合条件的数据统计整理统计分组频数分布结果显示2.2.1 统计分组统计分组统计分组(含义)统计分组就是根据统计研究的需要,将统计总体按照一定的分组标志区分为若干部分的一种统计方法,总体的各个组成部分称为“组”统计分组的关键关键在于确定分组标志和划定分组界限,达到“组内同质,组间差异组内同质,组间差异”编制频数分布表(实例)117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 12
9、7 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121【例例例例 2.22.2】某某生生 产产 车车 间间 5050名名 工工 人人 日日 加加工工 零零 件件 数数 如如下下(单单 位位:个个)。试试 对对数数 据据 进进 行行 分分组。组。统计整理 统计分组 频数分布 分布数列表表2-1 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)比率(比率(%)10510911011411511912012412512913013413513935814106
10、4610162820128合计合计50100统计分组(作用)n将总体现象进行划分n研究总体现象的结构和比例关系 例:上海市按例:上海市按GDP计算的三次产业结构(计算的三次产业结构(%)1980年年 1990年年 1996年年 1997年年 第一产业第一产业3.2 4.3 2.5 2.3 第二产业第二产业75.7 63.8 54.5 52.2 第三产业第三产业21.1 31.9 43.0 45.5 GDP 100 100 100 100 统计分组(作用)n研究现象之间的依存关系例:中国农民家庭按收入分组的恩格尔系数(例:中国农民家庭按收入分组的恩格尔系数(1984年)年)按收入分组(元)按收入
11、分组(元)200 300 400 500 600 800 1000恩格尔系数(恩格尔系数(%)64.9 60.2 56.7 54.4 50.5 49.9 43.6n编制频数分布数列,用于统计研究2.2.2 频数分布频数分布频数分布 频数分布 频数 频率 分布数列 品质数列和变量数列 累计频数分布频数分布(概念)n频数分布:将总体按某标志分组,并将总 体中的所有单位按组归类整理,形成总体中各个单位数在各组间的分布n频数:各组的单位数n频率:各组频数与总频数的比率n分布数列:将各组按大小顺序排列起来,并列出各组在该标志上的总体单位数,所形成的数列表表2-1 某车间某车间50名工人日加工零件数分组表
12、名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)105109110114115119120124125129130134135139358141064610162820128合计合计50100分布数列n品质数列品质数列 按品质标志分组形成的分布数列n变量数列变量数列 按数量标志分组形成的分布数列 分布数列-品质数列 100.0 126583 合计 48.4 61228 女性 51.6 65355 男性 比率(%)人口数(万人)性别我国大陆人口的性别分布我国大陆人口的性别分布我国大陆人口的性别分布我国大陆人口的性别分布(2000(2000年年年年1111月月月
13、月1 1日零时日零时日零时日零时)品质数列品质数列按品质标志分组形成的分布数列按品质标志分组形成的分布数列分布数列-变量数列变量数列:按数量标志分组形成的分布数列 表表2-1 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)105109110114115119120124125129130134135139358141064610162820128合计合计50100分布数列的分组方法等距分组等距分组不等距分组不等距分组单项式分组(要点)将一个变量值作为一组适合于离散变量和变量值较少的情况 单项式分组表(实例)表表2-2
14、 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112组距式分组(要点)将变量值的一个区间作为一组适合于连续变量和变量值较多的离散型变量必须遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组 组距式分组表表表2-1 某车间某车间50名工人日加工零件数分组表名
15、工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)比率(比率(%)105109110114115119120124125129130134135139358141064610162820128合计合计50100编制组距式分布表的步骤确确定定组组数数编制频数分编制频数分布表的步骤布表的步骤确确定定组组距距计计算算频频数数编编制制表表格格组距分组(步骤)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按 Sturges 提出的经验公式来确定组数K,其中n为数据的个数 确确定定各各组组的的组组距距:组组距距(Class(Class Width)Width
16、)是是一一个个组组的的上上限限与与下下限限之之差差,可可根根据据全全部部数数据据的的最最大大值值和和最最小小值值及及所分的组数来确定,即所分的组数来确定,即 组距组距组距组距(最大值最大值最大值最大值 -最小值)最小值)最小值)最小值)组数组数组数组数 根据分组整理成频数分布表根据分组整理成频数分布表 组距分组(几个概念)下下 限:限:一个组的最小值上上 限:限:一个组的最大值组组 距:距:上限与下限之差组中值:组中值:下限与上限之间的中点值下限值下限值+上限值上限值2组中值组中值等距分组与不等距分组(在表现频数分布上的差异)n等距分组各组频数的分布不受组距大小的影响可直接根据频数来观察频数分
17、布的特征和规律组距分组与不等距分组组距分组与不等距分组(在表现频数分布上的差异)(在表现频数分布上的差异)n不等距分组 各组频数的分布受组距大小不同的影响各组频数的分布受组距大小不同的影响 各各组组频频数数的的多多少少不不能能反反映映频频数数分分布布的的实实际际状状况况需需要要用用频频数数密密度度(频频数数密密度度频频数数/组组距距)反反映频数分布的实际状况映频数分布的实际状况等距分组表(上下组限间断)表表2-4 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)10510911011411511912012412512
18、9130134135139358141064610162820128合计合计50100等距分组表(上下组限重叠)表表2-3 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)105110110115115120120125125130130135135140358141064610162820128合计合计50100等距分组表(使用开口组)表表2-5 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)110以下以下11011411511912012
19、4125129130134135以上以上358141064610162820128合计合计50100频数分布图n直方图n折线图n曲线图直方图(直方图的绘制)我一眼就看出来了,大多数人的日加工零件数在120125之间!频频频频频频数数数数数数(人人人人人人)151512129 96 63 3105105 110110 115115 120120 125125130130 135135 140140日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数(个个个个个个)图图图图 2-1 2-1 某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图某车间工人日加工零件数的直方
20、图某车间工人日加工零件数的直方图分组数据直方图(直方图的制作)在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图(Histogram)用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积面积来表示各组的频率分布151512129 96 63 3105105 110110 115115 120120 125125 130130 135135 140140日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数(个个个个个个)频频频频频频数数数数数数(人人人人人人)分组数据折线图(折线图的绘制)图图图图 2-2 2-2 某车间工
21、人日加工零件数的折线图某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图分组数据折线图(折线图的制作)n折线图也称频数多边形图n是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉n折线图的两个终点要与横轴相交,具体做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的频数分布的类型正正正J J J型分布型分布型分布反反反J J J型分布型分布型分布U UU型分布型分布型分布图图图图2-3 2-
22、3 几种常见的频数分布几种常见的频数分布几种常见的频数分布几种常见的频数分布累计频数分布累计频数分布(实例(实例)【例例2.3】在一项城市住房问题的研究中,研究人员在甲城市抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1非常不满意;2不满意;3一般;4满意;5非常满意。表表2-6 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数(户户)百分比百分比(%)向上累计向上累计 向下累计向下累计 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非
23、常满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计合计300100.0累计频数分布(实例)按定额完成程度按定额完成程度分组分组/%工人数工人数/人人比率比率/%向上累计向上累计向下累计向下累计工人数工人数/人人比率比率/%工人数工人数/人人比率比率/%809090100100110110120120130261354720431713合计合计30100-表表2-7 工人生产定额完成程度累计频数分布表工人生产定额完成程度累计频数分布表职工家庭每人年收入职工家庭每人年收入
24、/元元人口比重人口比重/%收入比重收入比重/%240以下以下300360360420420480480600600720720840840960960以上以上2.214.098.7012.7928.2121.6611.585.765.000.982.275.689.5625.2923.5314.878.549.28合计100.00100.00累计频数分布(实例)表表2-8 1984年我国职工收入分布表年我国职工收入分布表累计频数分布洛伦兹曲线基尼系数洛伦兹曲线洛伦兹曲线是一种具有特殊作用的累计曲线图,通过计算比较累计人数及其相应的累积收入,来分析判断一个国家或地区收入分配的平等程度。Loren
25、z曲线100%收入百分数100%人口百分数0绝对平等线不平等面积基尼系数 以不平等面积与三角形面积的比值(G)来反映收入分配不平等的指标称为基尼系数利用基尼系数判断收入分配平等性的一般标准为:G0.2,高度平等;0.2G0.3,相对平等;0.3G0.4,差距相对合理;G0.4,差距偏大 基尼系数=不平等面积/三角形面积100%收入百分数100%人口百分数0绝对平等线不平等面积2.2.3 茎叶图茎叶图树茎树茎树茎树茎 树叶树叶树叶树叶7887880223477788890223477788890012222333344466777889001222233334446677788901334457
26、9901334457991010111112121313数据个数数据个数数据个数数据个数3 3131324241010茎叶图类似横置茎叶图类似横置的直方图的直方图未分组数据茎叶图(茎叶图的制作)图图图图2-4 2-4 某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图2.2.3 茎叶图茎叶图将分组标志视为树茎,将观察值视为树叶,每个树叶按照分组要求长在应长的树茎上,各树茎上的叶子数是各组的频数与编制组距数列再绘制直方图比较,茎叶图将分组与绘图两步一次完成,并且保留了数据的原始信息。在对连续型数据分组时,利用茎叶图还可以避免重
27、复分组问题,因而不必规定“上组限不在内原则”2.3 统计资料的显示统计表统计图2.3.1 统计表统计表的结构统计表编制的原则教材P26-272.3.2 统计图ExcelSTATISTICASTATISTICA以下图形均以下图形均以下图形均以下图形均由计算机绘由计算机绘由计算机绘由计算机绘制制制制!线形图(由 Excel 绘制的线形图)条形图(由 Excel 绘制的条形图)人数(人)人数(人)5191610211204080120 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告广广告告类类型型 图图2-14 2-14 某城市居民关注不同类型广告的人数分布某城市居民关注不同类型广告的人数分布圆形图(由 Excel 绘制的圆形图)其他广告1.0%房地产广告8.0%商品广告56.0%金融广告4.5%服务广告25.5%招生招聘广告5.8%图图2-15 2-15 某城市居民关注不同类型广告的人数构成某城市居民关注不同类型广告的人数构成
限制150内