第三章-统计整理ppt课件(全).ppt
《第三章-统计整理ppt课件(全).ppt》由会员分享,可在线阅读,更多相关《第三章-统计整理ppt课件(全).ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 统计整理第一节第一节 统计整理的基本问题统计整理的基本问题第二节第二节 统计分组统计分组第三节第三节 分布数列分布数列第四节第四节 统计图统计图第五节第五节 统计表统计表不同原因引起的寿命损失不同原因引起的寿命损失统计研究表明,某种原因会使寿命减少。统计研究表明,某种原因会使寿命减少。我们可以用三种不同的方式来描述这个我们可以用三种不同的方式来描述这个现象。现象。第一种方式是用文字来描述。比如,未第一种方式是用文字来描述。比如,未婚男性会使寿命减少婚男性会使寿命减少3500天,女性则减天,女性则减少少1600天;吸烟男性会使寿命较少天;吸烟男性会使寿命较少2250天,女性则减少天
2、,女性则减少800天;天;案例1第二种方式是用统计表来表示,结果如下第二种方式是用统计表来表示,结果如下原因原因寿命减少寿命减少的天数的天数原因原因寿命减少寿命减少的天数的天数未婚(男性)未婚(男性)3500危险工作,事故危险工作,事故300惯用左手惯用左手3285交通事故交通事故200吸烟(男性)吸烟(男性)2250饮酒饮酒130未婚(女性)未婚(女性)1600滥用药物滥用药物9030%超重超重1300一般工作,事故一般工作,事故7420%超重超重900自然放射性自然放射性8吸烟(女性)吸烟(女性)800喝咖啡喝咖啡6抽雪茄抽雪茄300医疗医疗x-射线射线6第三种方式是用统计图来表示,结果如
3、下第三种方式是用统计图来表示,结果如下第一节第一节 统计整理的基本问题统计整理的基本问题一、统计整理的概念一、统计整理的概念统计整理是对统计调查所搜集到的各种数据统计整理是对统计调查所搜集到的各种数据进行分类和汇总,使之进行分类和汇总,使之条理化、系统化条理化、系统化的过的过程。程。例:某单位例:某单位30名职工的月工资额为:名职工的月工资额为:1060、840、1100、1090、910、1050、1110、1060、1110、2070、990、1190、870、1050、940、2380、970、1030、1280、1060、850、1060、1010、910、1010、960、1050、
4、1070、1210、950二、统计整理的步骤二、统计整理的步骤1、对调查资料进行预处理、对调查资料进行预处理数据审核数据审核(完整性、准确性)(完整性、准确性)2、统计分组、统计分组3、统计汇总、统计汇总4、编制统计图表、编制统计图表姓名姓名性性别别年年龄龄与被调与被调查者的查者的关系关系工作工作单位单位参加工参加工作年月作年月职务职务级级别别张华张华男男 26本人本人新华厂新华厂 1954.7干部干部20陈玉芳陈玉芳 男男 53针织厂针织厂 1957.3工人工人5张丽英张丽英 女女 20长女长女待业待业1990.4无无6张志平张志平 男男 18长子长子医学院医学院 1992.1学生学生无无女
5、女5656妻子妻子无无无无无无对某单位职工家庭基本情况进行调查,其对某单位职工家庭基本情况进行调查,其中一户家庭的相关数据如下:中一户家庭的相关数据如下:第二节第二节 统计分组统计分组1.1.概概念:将总体按照某个标志(或几个标念:将总体按照某个标志(或几个标志)划分成为若干个不同性质的志)划分成为若干个不同性质的组成部分。组成部分。一、一、统计分组的概念统计分组的概念分组的实质:对总体来说是分,分组的实质:对总体来说是分,对个体来说是合。对个体来说是合。1、穷尽原则穷尽原则:总体中的每一个单位都:总体中的每一个单位都应有组可归。应有组可归。2、互斥原则互斥原则:总体中的任何一个单位:总体中的
6、任何一个单位只能归属于某一组,不能同时或可能归只能归属于某一组,不能同时或可能归属于几个组。属于几个组。二、二、统计分组的原则统计分组的原则1 1.按分组标志的多少分按分组标志的多少分 :简简单分组单分组 按一个标志对总体进行分组按一个标志对总体进行分组复复合分组合分组 按两个或两个以上标志分组按两个或两个以上标志分组 三、统计分组的种类三、统计分组的种类高校学生高校学生理科理科文科文科女女男男专科专科本科本科女女男男女女男男专科专科本科本科女女男男高校学生高校学生女生女生男生男生简单分组简单分组复合分组复合分组品品质分组质分组 反映事物属性差异反映事物属性差异 2.2.按标志的性质不同分为按
7、标志的性质不同分为 :数数量分组量分组 反映事物数量差异反映事物数量差异划分社会经济现象的类型,反映各类型的特点。划分社会经济现象的类型,反映各类型的特点。(1)(1)类型分组类型分组 3 3.按分组标志的作用分按分组标志的作用分 :例例单位:亿元单位:亿元210871.0 82972.0 103162.0 24737.0 2006246619.096328.0121381.028910.02007183867.9 73432.9 87364.6 23070.4 2005159878.3 135822.8 合计合计64561.3 56004.7 第三产业第三产业73904.3 62436.3
8、第二产业第二产业21412.7 17381.7 第一产业第一产业20042003类型类型分产业我国国内生产总值分产业我国国内生产总值说明社会经济现象的内部结构。说明社会经济现象的内部结构。(2)(2)结构分组结构分组 年份年份20032004200520062007第一产业第一产业12.8 13.4 12.5 11.7 11.7 第二产业第二产业46.0 46.2 47.5 48.9 49.2 第三产业第三产业41.2 40.4 40.0 39.4 39.1 合计合计100.0100.0100.0100.0100.0例例我国国内生产总值构成(我国国内生产总值构成(%)研究经济现象之间的依存关系
9、。研究经济现象之间的依存关系。(3)(3)分析分组分析分组 耕作深度分组耕作深度分组(cm)地块数地块数平均收获率平均收获率(斤斤/亩亩)10-12 740012-141046014-161654016-1818-2012 5620680例例某乡某种农作物的耕作深度与收获率的关系某乡某种农作物的耕作深度与收获率的关系四、统计分组应注意的问题四、统计分组应注意的问题1、分组标志选择、分组标志选择统计分组的关键是统计分组的关键是选择分组标志选择分组标志2、分组界限的确定、分组界限的确定品质分组:品质分组:自然形成自然形成数量分组:数量分组:反映质的差别,最好是反映质的差别,最好是5或或10的的倍数
10、倍数第三节第三节 分配数列(分布数列)分配数列(分布数列)一一 分配数列的概念和种类分配数列的概念和种类 在统计分组的基础上把总体所有的单在统计分组的基础上把总体所有的单位按组排列,列出各组对应的位按组排列,列出各组对应的单位数单位数,并按一定得顺序排列,形成总体单位并按一定得顺序排列,形成总体单位数在数在各个组的分布各个组的分布,称,称分布数列,又分布数列,又可称分配数列或次数分布。可称分配数列或次数分布。1.1.概念概念 例例成绩成绩人数(人)人数(人)比重(比重(%)60分以下分以下21060-7052570-8084080-9031590以上以上210合计合计20100 组别组别(变量
11、变量)次数次数(频数频数)频率频率(比率、比重比率、比重)分配数列的两个基本要素分配数列的两个基本要素次数次数组别组别2.2.种类种类以分组标志特征不同分为:以分组标志特征不同分为:品质分配数列品质分配数列变量分配数列变量分配数列例例 某班学生的性别构成情况某班学生的性别构成情况 按性别分组按性别分组人数人数比重比重(%)男男30 75女女10 25合计合计40100 组别组别 次数次数 频率频率 品品质分配数列质分配数列 变变量分配数列量分配数列 单单项数列项数列组组距数列距数列分类一:开口数列、闭口数列分类一:开口数列、闭口数列分类二:等距数列,异距数列分类二:等距数列,异距数列分类三:间
12、断组距数列、连续组距数列分类三:间断组距数列、连续组距数列某大学学生年看电影次数情况某大学学生年看电影次数情况按年看电影次数分组按年看电影次数分组(次)(次)人数人数(人)(人)0200150021500320004300合计合计4500单项数列单项数列成绩成绩人数(人)人数(人)比重(比重(%)50-6021060-7052570-8084080-9031590-100210合计合计20100某班学习成绩分布数列某班学习成绩分布数列等距分组数列等距分组数列连续组距数列连续组距数列闭口数列闭口数列我国人口的年龄分布我国人口的年龄分布按年龄分组(岁)按年龄分组(岁)人数(万人)人数(万人)0-1
13、428 97915-6488 79365及以上及以上8 811合计合计126 583异距分组数列异距分组数列间断组距数列间断组距数列开口数列开口数列下限下限一一个组的最小值个组的最小值 上限上限一一个组的最大值个组的最大值 组限组限组组距两端的数值。分为上限和下限。距两端的数值。分为上限和下限。组距组距上上限与下限之差限与下限之差二二 组距数列的编制组距数列的编制(一)组距数列的基本概念(一)组距数列的基本概念全距全距所所有数据中的最大值与最小值之差。有数据中的最大值与最小值之差。二二 组距数列的编制组距数列的编制组中值组中值组组的上限和下限的中间值。的上限和下限的中间值。按数列两端组限形式不
14、同分:按数列两端组限形式不同分:开口式组距开口式组距:成绩:成绩6060分以下,分以下,9090分以上。分以上。闭口式组距闭口式组距:40-6040-60分,分,90-10090-100分。分。作用作用:它可以作为各组变量取值的代表值,:它可以作为各组变量取值的代表值,但只是一个近似值但只是一个近似值 组中值的计算组中值的计算闭口式分组的组中值求法:闭口式分组的组中值求法:开口式分组的组中值求法:开口式分组的组中值求法:组中值的计算组中值的计算某班某班20人的学生成绩分布人的学生成绩分布1001015402510比重(比重(%)75870-8085380-90-20合计合计95290分以上分以
15、上65560-7055260分以下分以下组中值组中值人数(人)人数(人)成绩成绩离散型变量:看电影次数离散型变量:看电影次数0-2,3-5连续性变量:成绩连续性变量:成绩60-70,70-80,“上上组限不在内原则组限不在内原则”当出现异常值时设立当出现异常值时设立开口组开口组第一组的下限应低于最小值,最后一组第一组的下限应低于最小值,最后一组的上限应高于最大值的上限应高于最大值分组时注意分组时注意1、将原始数据按由小到大顺序排列、将原始数据按由小到大顺序排列2、计算全距、计算全距 全距全距=最大值最大值-最小值最小值3、确定组距与组数、确定组距与组数组距:为便于计算,组距一般取组距:为便于计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 统计 整理 ppt 课件
限制150内