第3章 数据整理课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第3章 数据整理课件.ppt》由会员分享,可在线阅读,更多相关《第3章 数据整理课件.ppt(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第3章 数据整理ppt课件(全)1第第3 3章章 数据整理数据整理第3章 数据整理ppt课件(全)2描述统计描述统计统计数据统计数据的收集的收集数据分布特征数据分布特征的测度的测度统计数据统计数据的整理的整理第3章 数据整理ppt课件(全)3 主要内容和学习目标主要内容和学习目标 3.1 3.1 数据的整理数据的整理( (掌握掌握) )3.2 3.2 数据整理结果的描述:数据整理结果的描述: 统计指标(统计指标(掌握掌握)3.3 3.3 数据整理结果的描述:数据整理结果的描述: 统计表和统计图(统计表和统计图(掌握掌握)第3章 数据整理ppt课件(全)43.1.1 3.1.1 数据整理的步骤数
2、据整理的步骤3.1.2 3.1.2 数据分组数据分组3.1.3 3.1.3 数据汇总数据汇总 3.1 3.1 数据的整理数据的整理 第3章 数据整理ppt课件(全)5 数据整理数据整理:根据统计研究的目的,根据统计研究的目的,对收集到的大量原始数据对收集到的大量原始数据( (包括次级数包括次级数据据) ),用科学的方法进行加工整理,使之,用科学的方法进行加工整理,使之条理化、系统化,为统计分析做好准备。条理化、系统化,为统计分析做好准备。 第3章 数据整理ppt课件(全)6原始数据整理的主要步骤是原始数据整理的主要步骤是: :第一步第一步, , 对原始数据进行审核和订正。对原始数据进行审核和订
3、正。 审核它们是否审核它们是否准确、及时、完整准确、及时、完整第二步第二步, ,对原始数据进行分组。对原始数据进行分组。 数据分组的恰当与否直接关系到整理结果所显现出数据分组的恰当与否直接关系到整理结果所显现出的的“总体数量分布特征总体数量分布特征”能否显示现象的根本特征。能否显示现象的根本特征。第三步第三步, ,对各项指标进行汇总和计算。对各项指标进行汇总和计算。 计算各组的总数和合计总数,各组指标和综合指标等。计算各组的总数和合计总数,各组指标和综合指标等。第四步第四步, ,编制统计表与绘制统计图。编制统计表与绘制统计图。3.1.1 3.1.1 数据整理的步骤数据整理的步骤数据整理也叫分组
4、整理数据整理也叫分组整理包括数据的分组、汇总、包括数据的分组、汇总、计算。可见,统计整理中统计分组是关键。计算。可见,统计整理中统计分组是关键。第3章 数据整理ppt课件(全)7 统计数据的审核是统计整理的首要环节。审统计数据的审核是统计整理的首要环节。审核的内容包括四个方面,即:核的内容包括四个方面,即:和和。 数据是否符合实际;检查数据登记是否有错误、计算是否正确。数据是否符合实际;检查数据登记是否有错误、计算是否正确。 逻辑检查逻辑检查准确性审核的方法准确性审核的方法 计算检查计算检查 数据的审核数据的审核 第3章 数据整理ppt课件(全)81 1原始数据的审核原始数据的审核: : 完整
5、性完整性 准确性准确性 2 2次级数据的审核次级数据的审核: : 完整性完整性 准确性准确性 适用性适用性 时效性时效性 经过对统计数据的完整性、准确性、适用性和及经过对统计数据的完整性、准确性、适用性和及时性的审核之后,确认符合调查分析研究的需要,就可时性的审核之后,确认符合调查分析研究的需要,就可以对所搜集到的数据进行加工整理。以对所搜集到的数据进行加工整理。 第3章 数据整理ppt课件(全)93.1.2 3.1.2 数据分组数据分组 1 1、分组的意义、分组的意义 2 2、分组的标志的选择、分组的标志的选择 3 3、分组的形式、分组的形式 4 4、分组体系、分组体系 第3章 数据整理pp
6、t课件(全)10 1 1、分组的意义、分组的意义 分组的概念:分组的概念: 分组分组是根据统计研究的需要,将统计总体按照一定是根据统计研究的需要,将统计总体按照一定的的标志标志区分为若干组或部分的一种统计方法。区分为若干组或部分的一种统计方法。分组的核心:分组的核心:选择分组标志选择分组标志分组的作用:分组的作用: 数据分组数据分组是贯穿于整个统计工作过程的重要方法,是贯穿于整个统计工作过程的重要方法,它的主要作用有以下几个方面:它的主要作用有以下几个方面:(1) (1) 划分现象的类型;划分现象的类型;(2) (2) 研究现象的内部结构;研究现象的内部结构;(3) (3) 分析现象之间的依存
7、关系。分析现象之间的依存关系。第3章 数据整理ppt课件(全)11 2 2、分组标志的选择、分组标志的选择 当选择某一分组标志时就突出了现象在这方面的当选择某一分组标志时就突出了现象在这方面的差异,掩盖了现象在其他方面的差异,从而可能得出差异,掩盖了现象在其他方面的差异,从而可能得出不同的结论。只有选择最恰当的分组标志,才能使分不同的结论。只有选择最恰当的分组标志,才能使分组的结果正确反映现象的本质特征。组的结果正确反映现象的本质特征。 统计分组的结果:统计分组的结果: 组内具有同质性组内具有同质性 组间具有差异性组间具有差异性第3章 数据整理ppt课件(全)12分组标志的多少:分组标志的多少
8、:简单分组:简单分组:总体按一个标志进行分组总体按一个标志进行分组 。复合分组复合分组:总体用两个或两个以上的标志层叠分组:总体用两个或两个以上的标志层叠分组 3 3、分组的形式、分组的形式 4 4、分组体系、分组体系 采用一系列相互联系、相互补充的标志对现象进采用一系列相互联系、相互补充的标志对现象进行多种分组,形成分组体系。行多种分组,形成分组体系。 分组体系:分组体系:平行分组体系:平行分组体系:对同一总体选择两个或两个以上标志分对同一总体选择两个或两个以上标志分 别别进行简单分组形成的体系。进行简单分组形成的体系。 复合分组体系:复合分组体系:复合分组形成的分组体系复合分组形成的分组体
9、系 第3章 数据整理ppt课件(全)13 简单分组和平行分组体系简单分组和平行分组体系按年龄分组:按年龄分组:按文化程度分组:按文化程度分组:2020岁及岁及2020岁以下岁以下大专及大专以上大专及大专以上21213535岁岁中专、技工中专、技工36365050岁岁高中高中51515555岁岁初中初中56566060岁岁小学、识字不多或文盲小学、识字不多或文盲按分组标志的多少观察统计分组类型按分组标志的多少观察统计分组类型第3章 数据整理ppt课件(全)14 复合分组和复合分组体系复合分组和复合分组体系按经济类型分组按经济类型分组按投资规模分组按投资规模分组国有经济投资:国有经济投资:大型大型
10、中型中型小型小型集体经济投资:集体经济投资:大型大型中型中型小型小型外商经济投资:外商经济投资:大型大型中型中型小型小型其他经济投资:其他经济投资:大型大型中型中型小型小型第3章 数据整理ppt课件(全)153.1.3 3.1.3 数据汇总数据汇总 1 1、数据汇总的组织与技术数据汇总的组织与技术 2 2、次数分配次数分配第3章 数据整理ppt课件(全)16数据汇总的组织:数据汇总的组织:在一定的统计管理体制下,将原始在一定的统计管理体制下,将原始数据采用何种纵向汇总方式进行汇总的问题,是采用数据采用何种纵向汇总方式进行汇总的问题,是采用逐级汇总还是集中汇总,还是两者结合的综合汇总。逐级汇总还
11、是集中汇总,还是两者结合的综合汇总。 1 1、数据汇总的组织与技术数据汇总的组织与技术 统计汇总技术:统计汇总技术:将同级单位将同级单位( (横向横向) )的统计调查数据进的统计调查数据进行汇总的方法,也称横向汇总法。行汇总的方法,也称横向汇总法。 1 、设 计 汇 总方案 2 、 汇总 前 的 审 核与处理 数据 录入 汇总后的 审核 归集资料 并汇总 设计汇总 方案 汇总前的 审核与处理 第3章 数据整理ppt课件(全)17 2 2、次数分配次数分配次数分配的概念与种类:次数分配的概念与种类:次数分配次数分配总体中的所有单位按一定标志分组整理,总体中的所有单位按一定标志分组整理,并将各组按
12、一定顺序排列,形成总体中各个单位在并将各组按一定顺序排列,形成总体中各个单位在各组间的分布各组间的分布. .由总体分由总体分组组和各组相和各组相对应的分配次数对应的分配次数两个要素构成。两个要素构成。按照分组标志的不同按照分组标志的不同次数分配次数分配: :品质型分配数列品质型分配数列 数量型分配数列数量型分配数列 第3章 数据整理ppt课件(全)18编制次数分配的步骤编制次数分配的步骤 第一步:对数据进行分组第一步:对数据进行分组第二步:计算各组的频数、频率、第二步:计算各组的频数、频率、 c 累积频数和累积频率累积频数和累积频率第三步:编制频数分布表第三步:编制频数分布表第3章 数据整理p
13、pt课件(全)19统计分组的原则:统计分组的原则:穷尽原则:穷尽原则:使总体中的每一个单位都有组可归使总体中的每一个单位都有组可归互斥原则:互斥原则:使总体中的每一个单位只有一组可归使总体中的每一个单位只有一组可归 第3章 数据整理ppt课件(全)20频数频数(FrequencyFrequency,亦称为次数亦称为次数)是指落入各组中的数据的个数或次数是指落入各组中的数据的个数或次数频率频率(Relative frequencyRelative frequency,亦称比重或百分比),亦称比重或百分比)是指各组中的数据个数或次数占全部数据总数的比例是指各组中的数据个数或次数占全部数据总数的比例
14、累积频数累积频数(Cumulative frequenciesCumulative frequencies)是将各有序类别或组的频数逐级累加起来是将各有序类别或组的频数逐级累加起来累积方法:向上累积、向下累积累积方法:向上累积、向下累积 累积频率累积频率(Cumulative percentagesCumulative percentages)是将各有序类别或组的频率逐级累加起来是将各有序类别或组的频率逐级累加起来累积方法:向上累积、向下累积累积方法:向上累积、向下累积第3章 数据整理ppt课件(全)21频数分布表频数分布表是各组及其相应的频数(还可包括频率、累积频数是各组及其相应的频数(还可
15、包括频率、累积频数和累积频率)依一定的次序排列而成的表格和累积频率)依一定的次序排列而成的表格分组分组频数频数频率()频率()合合 计计100100 XXX频数分布表频数分布表第3章 数据整理ppt课件(全)22 品质型数据的分组整理品质型数据的分组整理品质型数据的分组方法:品质型数据的分组方法:把每一个变量值作为一组把每一个变量值作为一组分类数据分类数据的频数分布表可以包括:分组、频数和频率。的频数分布表可以包括:分组、频数和频率。如,例如,例3.13.1顺序数据顺序数据的频数分布表可以包括:分组、频数、频率、的频数分布表可以包括:分组、频数、频率、累积频数和累积频率。累积频数和累积频率。第
16、3章 数据整理ppt课件(全)23【例【例3.13.1】坐落于杭州西湖西山路的一家饭店使用】坐落于杭州西湖西山路的一家饭店使用一种调查问卷,用来询问顾客对饭店的服务、食一种调查问卷,用来询问顾客对饭店的服务、食物质量、价格与气氛的看法。每一个属性分别以物质量、价格与气氛的看法。每一个属性分别以极好极好(1)(1)、非常好、非常好(2)(2)、良好、良好(3)(3)、一般、一般(4)(4)和较差和较差(5)(5)的标准来评价。的标准来评价。6060份饭店食物质量状况的问卷份饭店食物质量状况的问卷结果如表结果如表3-23-2所示。所示。3123412123211222421221321242233
17、32121213211231224142124122122表表3-2 3-2 饭店食物质量状况调查的样本数据饭店食物质量状况调查的样本数据第3章 数据整理ppt课件(全)24表表3-3 3-3 饭店食物质量状况的频数分布饭店食物质量状况的频数分布饭店食物质量饭店食物质量频频 数(人)数(人)频率频率( () )极好1830非常好2745良好915一般610较差00合计60100第3章 数据整理ppt课件(全)25 数值型数据的分组整理数值型数据的分组整理数值型的频数分布表可以包括:数值型的频数分布表可以包括:分组、频数、频率、累积频数和累积频率。如,例分组、频数、频率、累积频数和累积频率。如,
18、例3.23.2数值型数据的分组方法:数值型数据的分组方法: l单项式分组:单项式分组:把每一个具体的变量值作为一组把每一个具体的变量值作为一组适用于变量值较少的离散变量的情况适用于变量值较少的离散变量的情况 ,l组距式分组:组距式分组:将全部变量值依次划分为若干个将全部变量值依次划分为若干个 数值区间,每一个数值区间作为一个组。数值区间,每一个数值区间作为一个组。适合于变量值较多的离散变量和连续变量的情况适合于变量值较多的离散变量和连续变量的情况 第3章 数据整理ppt课件(全)26例如,例如,某生产车间某生产车间5050名工人日加工零件数原始资料名工人日加工零件数原始资料(单位(单位: :个
19、)个)119119107107124124109109129129104104137137130130122122125125108108130130125125148148120120132132127127140140119119108108110110118118135135148148132132135135127127123123118118110110113113135135107107123123119119113113140140123123124124115115137137114114120120128128129129115115137137128128114114123
20、123第3章 数据整理ppt课件(全)27表表2 2 某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表 零件数零件数(个)(个) 频数频数(人)(人)零件数零件数(个)(个)频数频数(人)(人)零件数零件数(个)(个)频数频数(人)(人)1041041071071081081091091101101131131141141151151 12 22 21 12 22 22 22 21181181191191201201221221231231241241251251271272 23 32 21 14 42 22 22 2128128129129130130132132135
21、1351371371401401481482 22 22 22 23 33 32 22 2第3章 数据整理ppt课件(全)28表表3 3 某车间某车间5050名工人日产零件数分组名工人日产零件数分组按零件数分组按零件数分组 频数(人)频数(人)频率()频率()100-110100-1106 61212110110120120131326261201201301301717343413013014014010102020140140以上以上4 48 8合计合计5050100100第3章 数据整理ppt课件(全)29例例3.23.2,90家中国家中国A股房地产上市公司股房地产上市公司2010年财务
22、负年财务负责人年薪数据。责人年薪数据。(单位:万元单位:万元)3201331007155443733292620201917151412102401309665544336312825202018161514121020012986625442353028242020181514131271781208160504134302824222018151413116135118795649403330272222191715141311520102010年年9090家中国家中国A A股房地产上市公司财务负责人年薪数据排序表股房地产上市公司财务负责人年薪数据排序表 确定数量型数据频数分布组的步骤:确
23、定数量型数据频数分布组的步骤:第一步,确定组数。确定互不重叠的组的个数。第一步,确定组数。确定互不重叠的组的个数。第二步,确定组距。确定每一组的宽度。第二步,确定组距。确定每一组的宽度。第三步,确定组限。确定每组变量值两端的界限。第三步,确定组限。确定每组变量值两端的界限。第3章 数据整理ppt课件(全)30原始数据分布比较均匀、对称时,原始数据分布比较均匀、对称时,分组的步骤:分组的步骤:(1 1)计算全距)计算全距R R: 或或 RR最大值组的上限最小值组的下限最大值组的上限最小值组的下限 (2 2)确定组数)确定组数K K:组数的多少以能显示数据分布的特征组数的多少以能显示数据分布的特征
24、 和规律为宜。和规律为宜。 经验公式:经验公式: 13.322 lgKnminmaxxxR第3章 数据整理ppt课件(全)31 (3 3)确定组距)确定组距d d:一个组的上限与下限之差一个组的上限与下限之差 NxxKRdlg3.31minmax(4 4)确定组限:)确定组限:应遵循应遵循“不重不漏不重不漏”原则原则 为便于计算,组距宜取为便于计算,组距宜取5 5或或1010的倍数的倍数 首先确定最小值组的下限,然后利用首先确定最小值组的下限,然后利用组限和组距的关系依次确定其他组限。组限和组距的关系依次确定其他组限。(5 5)编制频数分布表)编制频数分布表 第3章 数据整理ppt课件(全)3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第3章 数据整理课件 数据 整理 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内