《《统计学》第3章统计数据的整理和显示ppt课件.ppt》由会员分享,可在线阅读,更多相关《《统计学》第3章统计数据的整理和显示ppt课件.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、二、数据整理的程序例例“九五九五”期间我国国内生产总值构成(期间我国国内生产总值构成(% %)年份年份19961997199819992000第一产业第一产业 20.4 19.1 18.6 17.6 15.9第二产业第二产业 49.5 50.0 49.3 49.4 50.9第三产业第三产业 30.1 30.9 32.1 33.0 33.2合计合计100.0 100.0 100.0 100.0 100.0例例耕作深度分组耕作深度分组(cm)地块数地块数平均收获率平均收获率(公斤公斤/亩亩)10-12 740012-141046014-161654016-1818-2012 5620680某乡某种
2、农作物的耕作深度与收获率的关系某乡某种农作物的耕作深度与收获率的关系二、统计分组的方法:一、选择适当的分组标志。二、合理划分各组之间的界限。1、根据研究的目的确定2、选择最具有代表性的 标志3、根据具体的历史条件确定(上限不在内原则)日产量(件)人数20 821102225233024 725 2按 成 绩 分 组 人 数 60分以下2 60709 708015 809011 90分以上3 合 计40按年龄分组组距不满周岁13岁246岁2712岁56064岁46579岁148099岁9100岁以上1982年第三次人口普查年龄的异距分组品质标志分组数量标志分组单项式分组组距式分组等距式分组异距式
3、分组统计分组全距组数组距上限:一组中的较大值。下限:一组中的较小值2下限上限组中值例例 某班学生的性别构成情况某班学生的性别构成情况 按按性别分性别分组组人数(人人数(人)比重比重(%)男男30 75女女10 25合计合计40100品品质数列质数列按考试成绩分组按考试成绩分组人数人数 f频率(频率(%)60以下2460-70102070-80122480-90163290以上1020合计50100某班50名学生“统计学”考试成绩次数分布统计表某班50名学生“统计学”考试成绩累计次数分布统计表按考试按考试成绩分成绩分组组人数人数 频率(频率(%)向上累计向上累计向下累计向下累计人数频率人数频率6
4、0以下24245010060-7010201224489670-8012242448387680-9016324080265290以上1020501001020合计50100- U 型分布的特征: 两头大,中间小。即靠近中间的变量值分布的次数少,靠近两边的变量值分布的次数多。 正J型分布的特征: 次数随着变量的增大而增多。例:投资额按利润率的大小分布。 反J型分布的特征: 次数随着变量的增大而减少。例:产品产量的增加,产品单位成本下降。例例分组分组总产值总产值(万元万元)职工人数职工人数(人人)劳动生产率劳动生产率(元元/人人)P123大型大型中型中型小型小型合计合计 20062006年某月某
5、公司各企业劳动生产率统计表年某月某公司各企业劳动生产率统计表 (单位)单位) 横横行行标标题题 主词主词宾词宾词总标题总标题纵栏标题纵栏标题数据资料数据资料( (指标数值指标数值) )1、按用途分类:(1)、调查表(2)、整理表或汇总表(3)、分析表2、按主词的结构 分类:(1)、简单表(2)、分组表(3)、复合表3、按宾词设计 分类:(1)、简单排列表(2)、分组排列表(3)、分组层叠排列表指标总量指标(Aggregate Indicators)19901995 1996 1997 1998 1999 2000国内生产总值298.411009.471179.091350.101429.261
6、479.711589.34第一产业99.58261.52284.89304.51298.67284.28283.00第二产业118.53427.19493.21563.40585.38604.39657.51第三产业80.30320.76400.99482.19545.21591.04648.83重庆市重庆市19901990年年20002000年国内生产总值统计表年国内生产总值统计表 单位:亿元重庆市人民物质文化生活提高情况表(重庆市人民物质文化生活提高情况表(1999199920002000)指标计量单位1999年2000年发展速度(%)(甲)(乙)(1)(2)(3)=(2)(1)每人每年生
7、活消费 (现价)元23362466105.6食用植物油公斤6.56.4799.5城镇住房面积平方米9.5110.72112.7农村住房面积平方米26.6729.58110.9每万人拥有电话部9111390152.6平均每人储蓄存款余额元29593522119.0城镇居民平均每户就业人数人1.771.7297.2年 份客运量(万人)客运周转量(万人公里)货运量(万吨)货运周转量(万吨公里)1952 82.00 134.00 315311962 964.56 12619 807.51 1473901975 3602.03 40180 3225.71 2763371980 7845.54 41702
8、5 4468.631106294199020332.00106877515545.512452448199539731.00210427022795.703359847199849772.00247618126494.003291566199953290.00255800026390.003379000200057667.00270446027889.083543587重庆市主要年份客、货运量及周转量统计表重庆市主要年份客、货运量及周转量统计表n2. 2. 条形图条形图折线图折线图( (次数分配曲线图次数分配曲线图) )04812考分次数0102030比率(%)4050607080901001
9、10折折线图还可用来表示累计次数分布:线图还可用来表示累计次数分布:曲线图是组数趋向于无限多时折线图的极限曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线。描绘,是一种理论曲线。向下累计向下累计向上累计向上累计 4. 4. 曲线图曲线图重庆市2000年城镇经济单位新增就业人员的构成(%)5. 饼图饼图6. 茎叶图(stem-and-leaf display)直方图可观察一组数据的分布状况,但没有直方图可观察一组数据的分布状况,但没有给出具体的数值给出具体的数值茎叶图既能给出数据的分布状况,又能给出茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息每一个原始数值
10、,保留了原始数据的信息茎叶图(例题分析)本章重点和难点本章重点和难点一、单项选择一、单项选择 题题1 1、下列分组中哪个是按品质标志分组()。、下列分组中哪个是按品质标志分组()。A A企业按年生产能力分组企业按年生产能力分组B B产品按品种分组产品按品种分组C C家庭按年收入水平分组家庭按年收入水平分组D D人口按年龄分组人口按年龄分组2 2简单分组和复合分组的区别在于()。简单分组和复合分组的区别在于()。A.A.选择的分组标志性质不同选择的分组标志性质不同B.B.选择的分组标志多少不同选择的分组标志多少不同C.C.组数的多少不同组数的多少不同D.D.组距的大小不同组距的大小不同3 3在组
11、距分组时,对于连续型变量,相邻两组的组限在组距分组时,对于连续型变量,相邻两组的组限()()。 A A必须是重叠的必须是重叠的 B B必须是间断的必须是间断的 C C可以是重叠的,也可以是间断的可以是重叠的,也可以是间断的 D D必须取整数必须取整数4 4次数分配数列是()。次数分配数列是()。A.A.按数量标志分组形成的数列按数量标志分组形成的数列B.B.按品质标志分组形成的数列按品质标志分组形成的数列C.C.按统计指标分组形成的数列按统计指标分组形成的数列D.D.按数量标志和品质标志分组形成的数列按数量标志和品质标志分组形成的数列5 5有一个学生考试成绩为有一个学生考试成绩为7070分,在
12、统计分组中,这个变量值应分,在统计分组中,这个变量值应归入归入( ( ) )。 A A60607070分这一组分这一组 B B70708080分这一组分这一组 C C60607070或或70708080两组都可以两组都可以 D D作为上限的那一组作为上限的那一组6 6某连续变量数列,其末组为开口组,下限为某连续变量数列,其末组为开口组,下限为200200,又知其邻组,又知其邻组的组中值为的组中值为170170,则末组组中值为,则末组组中值为( )( ) A260 B 215 C 230 D 185 A260 B 215 C 230 D 185 7 7用组中值代表各组内的一般水平的假定条件是用组
13、中值代表各组内的一般水平的假定条件是( )( )A A各组的次数均相等各组的次数均相等 B B各组的组距均相等各组的组距均相等 C C各组的变量值均相等各组的变量值均相等 D D各组次数在本组内呈均匀分布各组次数在本组内呈均匀分布8 8统计分组的关键问题是统计分组的关键问题是( )( ) A A确定分组标志和划分各组界限确定分组标志和划分各组界限 B B确定组距和组数确定组距和组数 C C确定组距和组中值确定组距和组中值 D D确定全距和组距确定全距和组距二、多项选择二、多项选择 题题1 1统计分组的作用在于统计分组的作用在于( )( )A A区分现象的类型区分现象的类型 B B反映现象总体的
14、内部结构变化反映现象总体的内部结构变化 C C比较现象间的一般水平比较现象间的一般水平 D D分析现象的变化关系分析现象的变化关系 E E研究现象之间数量的依存关系研究现象之间数量的依存关系2 2某单位某单位100100名职工按工资额分为名职工按工资额分为300300以下、以下、300-400300-400、400-400-600600、600-800600-800、800800以上等五个组。这一分组以上等五个组。这一分组( )( ) A A是等距分组是等距分组 B B分组标志是连续型变量分组标志是连续型变量 C C末组组中值为末组组中值为800 D800 D相邻的组限是重叠的相邻的组限是重叠
15、的 E E某职工工资某职工工资600600元,应计在元,应计在600-800600-800元组内元组内3 3变量数列中频率应满足的条件是变量数列中频率应满足的条件是( )( ) A A各组频率大于各组频率大于1 B1 B各组频率大于各组频率大于0 0 C C各组频率之和等于各组频率之和等于1 D1 D各组频率之和小于各组频率之和小于1 1 E E各组频率之和大于各组频率之和大于0 0三、判三、判 断断 题题1 1、 能够对统计总体进行分组,是由统计总体中各个单能够对统计总体进行分组,是由统计总体中各个单位所具有的差异性特点决定的位所具有的差异性特点决定的( )( )。2 2、统计分组的关键是正确选择分组标志和划分各组的界限、统计分组的关键是正确选择分组标志和划分各组的界限( )( )。3 3、简单分组涉及总体的某一个标志,复合分组则涉及总、简单分组涉及总体的某一个标志,复合分组则涉及总体两个以上标志,因此,将两个简单分组排列起来,就是体两个以上标志,因此,将两个简单分组排列起来,就是复合分组复合分组( )( )。4 4单项式频数分布的组数等于变量所包含的变量值的种数单项式频数分布的组数等于变量所包含的变量值的种数( )( )。5 5统计表是表达统计数据整理结果的唯一形式统计表是表达统计数据整理结果的唯一形式( )( )。第三章结束了第三章结束了! !
限制150内