统计学第三章统计数据的整理与显.ppt
《统计学第三章统计数据的整理与显.ppt》由会员分享,可在线阅读,更多相关《统计学第三章统计数据的整理与显.ppt(78页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统统计计整整理理统统计计调调查查统计研究的程序统计研究的程序统计研究目的统计研究目的统计设计统计设计推推断断分分析析描描述述分分析析统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示STAT统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示 第三章第三章 统计数据的整理与显示统计数据的整理与显示3.1 3.1 统计整理与统计分组统计整理与统计分组3.2 3.2 分布数列的编制分布数列的编制3.3 3.3 统计图表统计图表STAT统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示3.1 3.1 统计整理与统计分组统计整理与统计分组 一、统计整理的意
2、义和步骤一、统计整理的意义和步骤二、统计整理的基本方法二、统计整理的基本方法 统计分组统计分组统计整理统计整理将将统计调查得到的原始资料进行统计调查得到的原始资料进行科学的分组和汇总形成综合统计科学的分组和汇总形成综合统计资料的工作过程资料的工作过程(对调查资料去伪对调查资料去伪存真、去粗取精、科学分类、浓缩简化)存真、去粗取精、科学分类、浓缩简化)是统计调查的继续,统计分析的是统计调查的继续,统计分析的前提和基础前提和基础地位地位统计数据的处理:统计数据的处理:统计资料的分组、汇总及制表统计资料的分组、汇总及制表统计数据的管理:统计数据的管理:数据的传输、贮存、更新及输出数据的传输、贮存、更
3、新及输出内内容容统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示STAT统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示统计整理统计整理主要任务主要任务资料审核、分组、资料审核、分组、汇总、制表、制图等。汇总、制表、制图等。分组分组频数分布频数分布统计表统计表统计图统计图STAT统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示分组分组分组前分组前分组前分组前分组后分组后分组后分组后253342如:划分现象类型如:划分现象类型作用:作用:例:例:按所有制性质划分,我国现有按所有制性质划分,我国现有8种经济类型:种经济类型:国有经济;集体经济;
4、私营经济;个体经济国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港联营经济;股份制经济;外商投资经济;港澳台投资经济澳台投资经济 制定统计整理方案制定统计整理方案对原始资料进行审核对原始资料进行审核数数 据据 处处 理理制作统计表或统计图制作统计表或统计图统计整理的步骤统计整理的步骤统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示STAT统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示 (一)数据的审核与筛选(一)数据的审核与筛选 1、审核、审核:对 第一手资料第一手资料(直接调查或试验取得):审核其完整性完整性与准确性准确性 完
5、整性完整性审核:应调查的单位或个体是否有遗漏;所调查的项目是否填齐全。准确性准确性审核:内容是否符合实际;计算是否正确。如:如:文化程度:小学 职业:大学教师STAT统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示 2、筛选:、筛选:筛选筛选包括:剔除不符合要求的数据或有明显错误的数据;剔除不符合要求的数据或有明显错误的数据;将符合特定条件的数据筛选出来。将符合特定条件的数据筛选出来。对第二手资料第二手资料(获取他人的资料):审核其完整性完整性、准确性、适用性、时效性准确性、适用性、时效性STAT统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示3.1 3.1
6、 统计整理与统计分组统计整理与统计分组 一、统计整理的意义和步骤一、统计整理的意义和步骤二、统计整理的基本方法二、统计整理的基本方法 统计分组统计分组将总体中所有单位按一定的标志分将总体中所有单位按一定的标志分为性质不同但又有联系的若干部分为性质不同但又有联系的若干部分的过程的过程统计分组统计分组统计分组的作用统计分组的作用:总体经过分组,能够突出组与组之间的差异总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。得条理化,便于进一步分析研究。统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理
7、与显示qq划分社会经济现象的类型划分社会经济现象的类型qq反映社会经济现象的内部结构和比例关系反映社会经济现象的内部结构和比例关系qq揭示社会经济现象之间的相互依存关系揭示社会经济现象之间的相互依存关系选择分选择分组标志组标志确定分确定分组体系组体系总体单总体单位归类位归类科学性科学性:组间差异组间差异大,组内大,组内差异小。差异小。完备性和互斥完备性和互斥性性:每个单位每个单位均能且只能归均能且只能归到某个组中。到某个组中。统计分组的程序与原则统计分组的程序与原则第三章第三章 统计数据的整理与显示统计数据的整理与显示对大学生月生活对大学生月生活费支出情况进行费支出情况进行分组研究:分组研究:
8、按家庭收入水平按家庭收入水平分组;分组;按城乡分组;按城乡分组;按性别分组;按性别分组;按年龄分组。按年龄分组。?统计分组的程序与原则统计分组的程序与原则对父母亲下岗情对父母亲下岗情况进行分组研究:况进行分组研究:单亲下岗;单亲下岗;双亲下岗;双双亲下岗;双亲在岗。亲在岗。不符合不符合科学性科学性不符合不符合完备性和互斥性完备性和互斥性城乡区别城乡区别离退休离退休是否健在是否健在?第三章第三章 统计数据的整理与显示统计数据的整理与显示统计分组的程序与原则统计分组的程序与原则分组体系分组体系指同时使用两个以上标志分指同时使用两个以上标志分组时,分组标志的组合形式。组时,分组标志的组合形式。各分组
9、标志并列使用各分组标志并列使用各分组标志交叉结合使用各分组标志交叉结合使用平行分组体系平行分组体系交叉分组体系交叉分组体系第三章第三章 统计数据的整理与显示统计数据的整理与显示平行分组体系平行分组体系对教师对教师的分类的分类按性别分类按性别分类男性男性女性女性按职称分类按职称分类按年龄分类按年龄分类高级高级中级中级初级初级青年青年中年中年共计共计7组组 2+3+2统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示交叉分组体系交叉分组体系按性别按性别分类分类按职称按职称分类分类按年龄按年龄分类分类男男女女高级高级中级中级初级初级青年青年中年中年共计共计12组组232统计学统计学第
10、三章第三章 统计数据的整理与显示统计数据的整理与显示对教师对教师的分类的分类STAT统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示 第三章第三章 统计数据的整理与显示统计数据的整理与显示3.1 3.1 统计整理与统计分组统计整理与统计分组3.2 3.2 分布数列的编制分布数列的编制3.3 3.3 统计图表统计图表STAT统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示3.2 3.2 分布数列的编制分布数列的编制一、分布数列的定义及种类一、分布数列的定义及种类二、变量数列的编制二、变量数列的编制三、累计次数与累计频率三、累计次数与累计频率变量数列变量数列品质
11、数列品质数列将总体各单位按某个标志分成若干将总体各单位按某个标志分成若干组,列出各组的总体单位数或各组组,列出各组的总体单位数或各组在总体中所占的比重而形成的数列在总体中所占的比重而形成的数列分布数列分布数列分分类类分组标志的具体表现分组标志的具体表现各组的次数或频率各组的次数或频率构成要素构成要素异距数列异距数列等距数列等距数列组距数列组距数列单值数列单值数列统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示获获金牌项目金牌项目金牌数金牌数 占总数比占总数比例例跳水枚跳水枚 0.1786举重枚举重枚 0.1786乒乓球枚乒乓球枚 0.1429羽毛球枚羽毛球枚 0.1429体操
12、枚体操枚 0.1071射击枚射击枚 0.1071柔道枚柔道枚 0.0714田径枚田径枚 0.0357跆拳道枚跆拳道枚 0.0357中国体育代表团在悉尼奥运会上获金牌的项目中国体育代表团在悉尼奥运会上获金牌的项目统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示品质数列品质数列STAT统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示3.2 3.2 分布数列的编制分布数列的编制一、分布数列的定义及种类一、分布数列的定义及种类二、变量数列的编制二、变量数列的编制三、累计次数与累计频率三、累计次数与累计频率单值数列单值数列指每个组值只用一个具体的指每个组值只用一个具体
13、的变量值表现的数列变量值表现的数列同时同时同时同时具备具备具备具备变量数列的编制变量数列的编制变量是离散变量变量是离散变量变量的不同取值个数较少变量的不同取值个数较少编制条件编制条件:【例例例例】己知某车间有己知某车间有24名工人,他们的日产量(件)名工人,他们的日产量(件)分别是:分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。要求根据以上资料编制变量数列。统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示日产量(件)日产量(件)日产量(件)日
14、产量(件)X X工人数(人工人数(人工人数(人工人数(人)f20202121222223232424252526263 35 56 64 43 32 21 1合计合计合计合计2424编制结果如下:编制结果如下:统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示组距数列组距数列指每个组的变量值用一个区指每个组的变量值用一个区间来表现的变量数列间来表现的变量数列变量数列的编制变量数列的编制变量是连续变量;变量是连续变量;或:或:总体单位数较多变量不同取总体单位数较多变量不同取值个数也较多的离散变量。值个数也较多的离散变量。编制条件编制条件:变量值变动区间的长度相等变量值变动区间的长
15、度相等变量值变动区间的长度不完全相等变量值变动区间的长度不完全相等等距数列等距数列异距数列异距数列统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示相关概念相关概念指每指每组组两端表示各组界限的变量值,两端表示各组界限的变量值,各组的最小值为各组的最小值为下限下限,最大值为,最大值为上限上限组限组限每组每组变量值变动区间的长度,为上变量值变动区间的长度,为上下限之差下限之差组距组距每组每组变量取值范围的中点数值变量取值范围的中点数值 组中值组中值统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示组中值=某某地区地区100个百货商店个百货商店月销售额与流通费用情况
16、月销售额与流通费用情况销售额销售额(万元)(万元)商店数商店数(个)(个)每百元每百元商品销商品销售额中支付的售额中支付的流通费(元)流通费(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5上组限上组限U下组限下组限L如:组距如:组距d=U-L=100-50=50(万元万元)如:组中值如:组中值x=(U+L)/2 =(100+200)/2=150(万元)(万元)统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示编制等距数列编制等距数列适用于总体单位的标志值适用于总体单位的标志值变动比较均匀的情况变动比较均匀
17、的情况实例实例己知某地区某年己知某地区某年己知某地区某年己知某地区某年5050个商店商品销售额的资料如下(单个商店商品销售额的资料如下(单个商店商品销售额的资料如下(单个商店商品销售额的资料如下(单位:百万元):位:百万元):位:百万元):位:百万元):7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 18.7 15.5 12.8 26.0 17.3 8.3 14.
18、7 12.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.021.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.0要求编
19、制组距数列。要求编制组距数列。统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示编制步骤:编制步骤:求变异全距求变异全距确定组距及组数确定组距及组数确定组距的原则:确定组距的原则:q要能要能区分各组的性质差异区分各组的性质差异q要能反映总体资料的分布特征要能反映总体资料的分布特征q为方便计算,尽可能为为方便计算,尽可能为5 5或或1010的整数倍的整数倍R组距组距(d)组数(组数(m)编制等距数列编制等距数列统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示计算组数(组数不宜过多,也不宜太少)计算组数(组数不宜过多,也不宜太少)上例上例中,取中,取d=5d=5,
20、则有则有编制等距数列编制等距数列(当(当 的结果为整数时)的结果为整数时)(当(当 的结果为小数时)的结果为小数时)统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示STAT统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示 注:注:确定组数确定组数(Number of classes)。组数的确定一般视数据本身的特点及数据的多少而定。经验上经验上以520之间为好,尤其注意不要确定太多的组数,使得每组包含的数据太少。实际分组实际分组时常按斯特格斯(Sturges)提出的经验公式来确定组数K:其中N为数据的个数(总体单位数或样本数),一般对结果取整数。例:例:K=
21、1+lg20/lg2=1+4.32=5.32 5STAT统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示 确定组距确定组距(Width of classes):组距组距是一个组的是一个组的上限与下限之差上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定:组距组距=(最大值(最大值-最小值)最小值)/组数组数 例,组距例,组距=(33-12)/5=4.2,可取整数,可取整数5为最后选为最后选定的组距。定的组距。确定组限确定组限q对于离散变量,相邻组组限可以对于离散变量,相邻组组限可以间断间断,也,也可可重叠重叠;q对于连续变量,相邻组组限对于连续变量,相邻组组限必
22、须重叠必须重叠;q符合符合“上组限不计入上组限不计入”原则;原则;q在最大值和最小值与其他数据相差悬殊时,在最大值和最小值与其他数据相差悬殊时,为避免空白组出现为避免空白组出现,首末两组可使用首末两组可使用“以下以下”及及“以上以上”的开口组。的开口组。组限的表示方法组限的表示方法编制等距数列编制等距数列统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示STAT统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示计算次数计算次数编制等距数列编制等距数列编制编制结果:结果:销售额销售额(百万元)(百万元)组中值组中值 商店数商店数5以下以下5101015152020
23、2525以上以上2.57.512.517.522.527.5410161343合计合计50分组划记法分组划记法茎叶图法茎叶图法统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示(5+(5-5))/2=2.5(25+(25+5))/2=27.5STAT统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示统计学统计学第三章第三章 统计数据的整理与显示统计数据的整理与显示茎叶表示茎叶表示 Stem-and-Leaf Display将每一观测值分解为茎值和叶值(用直线隔开)垂直线左边的数字称为“茎”,确定组别垂直线右边的数字“叶”,确定频数(计数)XiSTAT统计学统计学
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 第三 统计数据 整理
限制150内