欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    统计数据的收集与整理幻灯片.ppt

    • 资源ID:87617616       资源大小:6.59MB        全文页数:142页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计数据的收集与整理幻灯片.ppt

    统计数据的收集与整理第1页,共142页,编辑于2022年,星期二第一节第一节 统计调查方案设计统计调查方案设计一、明确调查目的和任务一、明确调查目的和任务 明确调查目的和任务是设计统计调查方案最根本的问题,它决定着调查工作明确调查目的和任务是设计统计调查方案最根本的问题,它决定着调查工作的内容、范围、方法和组织。的内容、范围、方法和组织。二、确定调查对象和调查单位二、确定调查对象和调查单位 确定调查对象确定调查对象 调查对象是指根据调查目的、任务确定的由那些性质上相同的众多调查单位调查对象是指根据调查目的、任务确定的由那些性质上相同的众多调查单位所组成的总体。即统计总体。所组成的总体。即统计总体。确定调查单位确定调查单位 调查单位就是构成调查总体的每一个单位,调查总体中的个体,也就是在调调查单位就是构成调查总体的每一个单位,调查总体中的个体,也就是在调查过程中应该登记其标志的那些具体单位。查过程中应该登记其标志的那些具体单位。第2页,共142页,编辑于2022年,星期二第一节第一节 统计调查方案设计统计调查方案设计三、确定调查项目、设计调查表或问卷三、确定调查项目、设计调查表或问卷确定调查项目确定调查项目 调查项目是指对调查单位所要调查的具体内容属性,这些属调查项目是指对调查单位所要调查的具体内容属性,这些属性在统计上又称标志。它是由调查对象的性质、调查目的和任务所性在统计上又称标志。它是由调查对象的性质、调查目的和任务所决定的,包括一系列品质属性和数量属性。决定的,包括一系列品质属性和数量属性。设计调查表或问卷设计调查表或问卷 调查项目一般采用调查表或调查问卷的形式。将调查项目科调查项目一般采用调查表或调查问卷的形式。将调查项目科学地分类、排列,就构成调查表或调查问卷。学地分类、排列,就构成调查表或调查问卷。(举例举例)第3页,共142页,编辑于2022年,星期二第一节第一节 统计调查方案设计统计调查方案设计四、确定调查时间、调查地点和调查方式方法四、确定调查时间、调查地点和调查方式方法 调查时间调查时间 调查时间是指调查资料所属的时点或时期。调查时间包括三方面内容:调查资料所属的调查时间是指调查资料所属的时点或时期。调查时间包括三方面内容:调查资料所属的时间、调查期限和调查工作进行的时间。时间、调查期限和调查工作进行的时间。调查地点调查地点 调查地点是指调查单位的空间位置。确定调查地点,就是规定在什么地方进行调查。调查地点是指调查单位的空间位置。确定调查地点,就是规定在什么地方进行调查。调查方式方法调查方式方法 调查方式方法是指调查工作的组织方式方法,这主要取决于调查的目的、内容和调查调查方式方法是指调查工作的组织方式方法,这主要取决于调查的目的、内容和调查的对象。的对象。统计调查的方式多种多样。按其组织形式不同,可分为统计报表制度和专门组织的统计调查;专门统计调查的方式多种多样。按其组织形式不同,可分为统计报表制度和专门组织的统计调查;专门组织的调查有普查、重点调查、典型调查和抽样调查等方式。统计调查的方法有直接观测法、实验法、报告组织的调查有普查、重点调查、典型调查和抽样调查等方式。统计调查的方法有直接观测法、实验法、报告法、采访法和网上调查法等。法、采访法和网上调查法等。第4页,共142页,编辑于2022年,星期二 五、制定调查的组织实施计划五、制定调查的组织实施计划 调查的组织计划,是指为确保实施调查的具体工作计划。调查的组调查的组织计划,是指为确保实施调查的具体工作计划。调查的组织实施计划应包括以下内容:织实施计划应包括以下内容:建立调查工作的组织领导机构,做好人员的配备与分工;建立调查工作的组织领导机构,做好人员的配备与分工;做好调查前的准备工作。如宣传教育、人员培训、文件资料的印发、方案的传达布置、做好调查前的准备工作。如宣传教育、人员培训、文件资料的印发、方案的传达布置、经费的筹措等;经费的筹措等;制定调查工作的检查、监督方法;制定调查工作的检查、监督方法;调查成果的公布及工作后的总结等。调查成果的公布及工作后的总结等。第一节第一节 统计调查方案设计统计调查方案设计第5页,共142页,编辑于2022年,星期二第二节第二节 统计数据收集统计数据收集一、收集资科的方式一、收集资科的方式 取得统计数据有多种途径,但概括起来不外乎是直接方式和间接方式。取得统计数据有多种途径,但概括起来不外乎是直接方式和间接方式。(一)统计资料的直接收集(一)统计资料的直接收集 直接获取第一手统计资料的主要方法包括:统计调查和试验设计。直接获取第一手统计资料的主要方法包括:统计调查和试验设计。统计调查的方式主要有统计调查的方式主要有普查普查抽样调查抽样调查重点调查重点调查统计报表制度统计报表制度。第6页,共142页,编辑于2022年,星期二普查普查普查是专门组织的一次性的全面调查,用来调查属于普查是专门组织的一次性的全面调查,用来调查属于定时点上或时期内定时点上或时期内的社会经济现象的总量。的社会经济现象的总量。抽样调查抽样调查 抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。进行观测研究,以抽样样本的指标去推算总体指标的一种调查。重点调查重点调查 重点调查的组织方式有两种:一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一重点调查的组织方式有两种:一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。些重点单位进行调查。统计报表制度统计报表制度 统计报表制度是根据国家有关统计法的规定,依据自上而下统一规定的表格统计报表制度是根据国家有关统计法的规定,依据自上而下统一规定的表格形式、项目及其指标、报送时间与程序布置调查要求和任务,自下而上逐级汇总形式、项目及其指标、报送时间与程序布置调查要求和任务,自下而上逐级汇总上报的统计报表制度。上报的统计报表制度。(一)统计资料的直接收集(一)统计资料的直接收集第7页,共142页,编辑于2022年,星期二试验设计试验设计 科学试验是进行科学研究的重要手段,在许多学科中几科学试验是进行科学研究的重要手段,在许多学科中几乎都起着积极的作用。统计中的试验设计是科学试验研究的组乎都起着积极的作用。统计中的试验设计是科学试验研究的组成部分之一成部分之一 。试验设计,包括五个相互关联的环节,分别是:试验设计,包括五个相互关联的环节,分别是:方案设计方案设计方案实施方案实施数据采集数据采集数据分析数据分析优化生产优化生产(一)统计资料的直接收集(一)统计资料的直接收集第8页,共142页,编辑于2022年,星期二凡不是通过直接的统计调查和试验,而是从其他各种渠道凡不是通过直接的统计调查和试验,而是从其他各种渠道搜集的搜集的第二手资料第二手资料,我们把它总称为统计资料的间接收集。,我们把它总称为统计资料的间接收集。间接资料的来源大体包括:统计年鉴、统计摘要、统计资料间接资料的来源大体包括:统计年鉴、统计摘要、统计资料汇编、统计台账、统计公告、报纸、杂志、网上资料等。汇编、统计台账、统计公告、报纸、杂志、网上资料等。(一)统计资料的间接收集(一)统计资料的间接收集第9页,共142页,编辑于2022年,星期二统计年鉴 示例第10页,共142页,编辑于2022年,星期二二、收集资料的方法二、收集资料的方法 数据资料的收集方法可以分为初级资料收集方法和次级资数据资料的收集方法可以分为初级资料收集方法和次级资料收集方法或称文案资料。料收集方法或称文案资料。初级资料收集方法初级资料收集方法搜集资料的方法观测法报告法访问法第11页,共142页,编辑于2022年,星期二二、收集资料的方法二、收集资料的方法访问法访问法 访问法是按所拟调查事项,有计划地通过访谈询问访问法是按所拟调查事项,有计划地通过访谈询问方式向被调查者提出问题,通过他们的回答来获得有关方式向被调查者提出问题,通过他们的回答来获得有关信息资料的方法。信息资料的方法。按访问内容的传递方式不同,可分为按访问内容的传递方式不同,可分为:面谈调查、电话调查、邮寄调查、留置调查、日记面谈调查、电话调查、邮寄调查、留置调查、日记调查和网上调查等方法。调查和网上调查等方法。第12页,共142页,编辑于2022年,星期二二、收集资料的方法二、收集资料的方法观测法观测法 观测法是指调查者通过直接观测、跟踪和记录观测法是指调查者通过直接观测、跟踪和记录被调查者的情况来收集资料的一种调查方法。被调查者的情况来收集资料的一种调查方法。举例:试销新产品举例:试销新产品报告法报告法 报告法是由报告单位根据原始记录和核算资料,报告法是由报告单位根据原始记录和核算资料,按照统计机关颁发的统一的表格和要求,按一定按照统计机关颁发的统一的表格和要求,按一定的报送程序提供资料的方法。的报送程序提供资料的方法。第13页,共142页,编辑于2022年,星期二次级资料的收集方法次级资料的收集方法u1 1、根究研究项目的内容判别所需资料的类型、根究研究项目的内容判别所需资料的类型u2 2、寻找资料的来源、寻找资料的来源u3 3、对次级资料的查找、对次级资料的查找u4 4、对查找的资料进行清理、补充、对查找的资料进行清理、补充第14页,共142页,编辑于2022年,星期二 统计的整个工作过程就是对数据的加工过程,统计的整个工作过程就是对数据的加工过程,从原始数据的收集开始,经过整理、显示、样本信从原始数据的收集开始,经过整理、显示、样本信息的获取到总体数量规律性的科学推断,都有一个息的获取到总体数量规律性的科学推断,都有一个减少误差、提高数据质量的问题。也就是说,减少误差、提高数据质量的问题。也就是说,统计统计数据的质量控制问题是贯穿于统计全过程的重要问数据的质量控制问题是贯穿于统计全过程的重要问题,题,因此,加强统计数据质量的管理要体现在统计因此,加强统计数据质量的管理要体现在统计研究的全过程。研究的全过程。统计数据质量的最大特征在于它的相对性。统计数据质量的最大特征在于它的相对性。三、统计数据的质量问题三、统计数据的质量问题第15页,共142页,编辑于2022年,星期二统计数据的分类统计数据的分类统计数据的分类统计数据的分类按计量层次按计量层次分分分分类类类类的的的的数数数数据据据据顺顺顺顺序序序序的的的的数数数数据据据据数数数数值值值值型型型型数数数数据据据据按时间状况按时间状况截截截截面面面面的的的的数数数数据据据据时时时时序序序序的的的的数数数数据据据据按收集方法按收集方法观观观观察察察察的的的的数数数数据据据据试试试试验验验验的的的的数数数数据据据据第16页,共142页,编辑于2022年,星期二数据的计量尺度数据的计量尺度计量尺度计量尺度计量或测度的程度计量或测度的程度按照对事物计量的按照对事物计量的精确程度精确程度,可分可分定类尺度定类尺度(列名尺度列名尺度)-)-按照事物的某种属性进行平行的分类按照事物的某种属性进行平行的分类或分组或分组定序尺度定序尺度(顺序尺度顺序尺度)-)-对事物之间等级差或顺序差别的测度对事物之间等级差或顺序差别的测度定距尺度定距尺度(间隔尺度间隔尺度)-)-度量事物类别或次序之间的间距度量事物类别或次序之间的间距定比尺度定比尺度(比率尺度比率尺度)-)-计算两个测度值之间的比值计算两个测度值之间的比值第17页,共142页,编辑于2022年,星期二统计数据的分类统计数据的分类 (按计量尺度分按计量尺度分)1.1.分类数据分类数据(categorical data)(categorical data)对事物进行分类的结果对事物进行分类的结果数据表现为类别,用文字来表述数据表现为类别,用文字来表述例如,人口按性别分为男、女两类例如,人口按性别分为男、女两类 顺序数据顺序数据(rank data)(rank data)对事物类别顺序的测度对事物类别顺序的测度数据表现为类别,用文字来表述数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等例如,产品分为一等品、二等品、三等品、次品等 数值型数据数值型数据(metric data)(metric data)1.1.对事物的精确测度对事物的精确测度2.2.结果表现为具体的数值结果表现为具体的数值3.3.例如:身高为例如:身高为175cm175cm、168cm168cm、183cm183cm第18页,共142页,编辑于2022年,星期二统计数据的分类统计数据的分类(按收集方法分按收集方法分)1.1.观测的数据观测的数据(observational data)(observational data)通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据试验的数据试验的数据(experimental data)(experimental data)在试验中控制试验对象而收集到的数据比如,对一种新药疗效的试验,对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数据第19页,共142页,编辑于2022年,星期二统计数据的分类统计数据的分类(按时间状况分按时间状况分)1.截面数据(cross-sectional data)(cross-sectional data)在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况比如,2002年我国各地区的国内生产总值数据时间序列数据(time series data)(time series data)在不同时间上收集到的数据描述现象随时间变化的情况比如,1996年至2002年国内生产总值数据第20页,共142页,编辑于2022年,星期二主要任务主要任务资料审核、分组、资料审核、分组、汇总、制表、制图等。汇总、制表、制图等。分组分组频数分布频数分布统计表统计表统计图统计图第三节第三节 统计数据整理统计数据整理 第21页,共142页,编辑于2022年,星期二录取中有无歧视?录取中有无歧视?某高校两个系(财经系、工程系)的报考及录取情况某高校两个系(财经系、工程系)的报考及录取情况男生男生女生女生录取录取350200未录取未录取450400报考人数报考人数800600 录取比率:录取比率:男生:男生:350/800=44%女生:女生:200/600=33%男生成绩好?性别歧视?男生成绩好?性别歧视?第22页,共142页,编辑于2022年,星期二两个系的报考及录取情况两个系的报考及录取情况工程系工程系财经系财经系男生男生女生女生男生男生女生女生录取录取30010050100未录取未录取300100150300报考人数报考人数600200200400工程系:男女录取比率工程系:男女录取比率50%,财经系:男女录取比率,财经系:男女录取比率25%。说明的问题:对数据说明的问题:对数据 1.1.要从不同的角度进行分析;要从不同的角度进行分析;2.2.要注意结构或是权数的影响。要注意结构或是权数的影响。第23页,共142页,编辑于2022年,星期二统计整理统计整理将统计调查得到的原始资料将统计调查得到的原始资料或已经加工或已经加工的综合资料的综合资料进行科学的分组和汇总形成进行科学的分组和汇总形成综合统计资料的工作过程综合统计资料的工作过程是统计调查的继续,统计分析的前提是统计调查的继续,统计分析的前提和基础和基础地位地位使数据系统化、条理化,反映事物的总体特使数据系统化、条理化,反映事物的总体特征,并在建立数据库的基础上达到一源多用征,并在建立数据库的基础上达到一源多用作用作用统计整理的概念和作用统计整理的概念和作用第24页,共142页,编辑于2022年,星期二(一一)统计分组统计分组 统计分组是根据统计研究目的,将总体按一定标志区统计分组是根据统计研究目的,将总体按一定标志区分为不同类型或不同性质的组,使组与组之间有比较分为不同类型或不同性质的组,使组与组之间有比较明显的差别,而在同一组内的单位具有相对的同质性,明显的差别,而在同一组内的单位具有相对的同质性,即同一组内各单位之间具有某些共同的特征。即同一组内各单位之间具有某些共同的特征。(一一)统计分组原则统计分组原则根据统计研究的目的选择分组标志根据统计研究的目的选择分组标志选择能够反映现象总体本质特征的标志选择能够反映现象总体本质特征的标志 考虑现象所处的具体时间、地点、条件来分组考虑现象所处的具体时间、地点、条件来分组 满足完备性、互斥性及一致性满足完备性、互斥性及一致性 第25页,共142页,编辑于2022年,星期二分组分组分组前分组前分组前分组前分组后分组后253342第26页,共142页,编辑于2022年,星期二统计分组的作用统计分组的作用 发现现象的特点与规律。发现现象的特点与规律。(1)划分现象的类型。)划分现象的类型。例如:例如:将工业企业按生产要素组合特征划分为将工业企业按生产要素组合特征划分为:资金密集型资金密集型;技术密集型技术密集型;劳动密集型。劳动密集型。第27页,共142页,编辑于2022年,星期二(2)研究总体的结构。)研究总体的结构。例如:按照年龄将人口总体分组,说明人口的年龄结构,以此判断例如:按照年龄将人口总体分组,说明人口的年龄结构,以此判断人口总体属于增长型、稳定型还是减少型。人口总体属于增长型、稳定型还是减少型。例:上海市按例:上海市按GDP计算的三次产业结构(计算的三次产业结构(%)1980年年1990年年 1996年年1997年年 GDP100 100 100 100 第一产业第一产业3.2 4.32.5 2.3 第二产业第二产业75.7 63.854.5 52.2 第三产业第三产业21.1 31.943.0 45.5第28页,共142页,编辑于2022年,星期二(3)研究现象之间的依存关系。分组后,计算有关指标,来观察)研究现象之间的依存关系。分组后,计算有关指标,来观察指标间的联系。指标间的联系。例:中国农民家庭按收入分组的恩格尔系数(例:中国农民家庭按收入分组的恩格尔系数(1984年)年)按收入分组(元)按收入分组(元)200 300 400 500 600 800 1000恩格尔系数(恩格尔系数(%)64.9 60.2 56.7 54.4 50.5 49.9 43.6 第29页,共142页,编辑于2022年,星期二 (二二)统计分组的方法统计分组的方法 按标志的特征分组按标志的特征分组 总体单位的各个标志按分组标志的特征分组总体单位的各个标志按分组标志的特征分组区分为品质标志和数量标志。区分为品质标志和数量标志。第三节第三节 统计数据整理统计数据整理 第30页,共142页,编辑于2022年,星期二 学生按性别分组学生按性别分组性别性别人数(频数)人数(频数)频率(频率(%)男生男生30306060女生女生20204040合计合计5050100100按品质标志分组按品质标志分组第31页,共142页,编辑于2022年,星期二按数量标志分组按数量标志分组年龄年龄人数人数频率频率%191230201537.5211332.5合计合计40100某班学生按年龄频数分布某班学生按年龄频数分布第32页,共142页,编辑于2022年,星期二按分组标志数量分组按分组标志数量分组 统计分组按分组标志多少不同,可分为简单分统计分组按分组标志多少不同,可分为简单分组和复合分组。组和复合分组。简单分组简单分组 简单分组是对研究对象按照一个标志进行的分组。简单分组是对研究对象按照一个标志进行的分组。例如某高校职工按照性别或者职称进行的分组,如表例如某高校职工按照性别或者职称进行的分组,如表2.3.12.3.1、2.3.22.3.2所示。所示。第33页,共142页,编辑于2022年,星期二第三节第三节 统计数据整理统计数据整理复合分组复合分组 复合分组是对研究对象按两个或两个以上的标志层叠起来进行的分复合分组是对研究对象按两个或两个以上的标志层叠起来进行的分组。即先按一个标志进行分组,然后再按另一个标志在已分好的各个组内划组。即先按一个标志进行分组,然后再按另一个标志在已分好的各个组内划分成若干个小组。例如企业职工按性别分组后,在每组内再按年龄分组,如分成若干个小组。例如企业职工按性别分组后,在每组内再按年龄分组,如表表2.3.32.3.3所示所示 。第34页,共142页,编辑于2022年,星期二第三节第三节 统计数据整理统计数据整理(三三)统计分组体系统计分组体系统计分组体系有两种:平行分组体系和复合分组体系,如图统计分组体系有两种:平行分组体系和复合分组体系,如图2.3.12.3.1、2.3.22.3.2所示。所示。第35页,共142页,编辑于2022年,星期二(三三)统计分组体系统计分组体系第36页,共142页,编辑于2022年,星期二二、分配数列二、分配数列 将统计总体按某一标志分组后,用来反映总将统计总体按某一标志分组后,用来反映总体单位在各组中分配情况的数列叫分配数列。分体单位在各组中分配情况的数列叫分配数列。分配在各组的总体单位数叫次数或频数。各组次数配在各组的总体单位数叫次数或频数。各组次数与总次数的比值称为频率。与总次数的比值称为频率。(一)分布数列的分类(一)分布数列的分类 根据分组标志的不同,分配数列可以分为品根据分组标志的不同,分配数列可以分为品质分配数列和变量分配数列两种。质分配数列和变量分配数列两种。第37页,共142页,编辑于2022年,星期二(一)分布数列的分类(一)分布数列的分类品质数列品质数列按品质标志分组所形成的分配数列称品质分配数列按品质标志分组所形成的分配数列称品质分配数列或属性分配数列,简称品质数列。它是由总体各组名称或属性分配数列,简称品质数列。它是由总体各组名称及各组总体单位数及各组总体单位数(次数次数)组成,如表组成,如表2.3.42.3.4所示。所示。第38页,共142页,编辑于2022年,星期二(一)分布数列的分类(一)分布数列的分类 变量数列变量数列 按数量标志分组形成的分配数列,称为变量分配数列,简称按数量标志分组形成的分配数列,称为变量分配数列,简称变量数列。它由各组变量值及各组总体单位数变量数列。它由各组变量值及各组总体单位数(次数次数)组成。组成。变量数列按照用以分组的变量的表现形式,可分为单项数变量数列按照用以分组的变量的表现形式,可分为单项数列和组距数列两种。单项数列就是指以一个变量值代表一组而列和组距数列两种。单项数列就是指以一个变量值代表一组而编制的变量数列,如表编制的变量数列,如表2.3.52.3.5所示。所示。第39页,共142页,编辑于2022年,星期二 组距数列的分类:组距数列的分类:等距分组等距分组 异距分组异距分组 等距分组等距分组即各组组距相等的分组。即各组组距相等的分组。异距分组异距分组即即各组组距不相等的分组。在标志值变动比较均匀的条各组组距不相等的分组。在标志值变动比较均匀的条件下,可采用等距分组。当标志值变动很不均匀,如件下,可采用等距分组。当标志值变动很不均匀,如急剧的增大、下降,变动幅度大时,可采用异距分组。急剧的增大、下降,变动幅度大时,可采用异距分组。(二)分布数列的编制(二)分布数列的编制第40页,共142页,编辑于2022年,星期二等距分组步骤等距分组步骤1)确确定定组组数数:组组数数的的确确定定应应以以能能够够显显示示数数据据的的分分布布特特征征和和规规律律为为目目的的。一一般情况下,组数不应少于般情况下,组数不应少于5组,也不应多于组,也不应多于15组。组。在在实实际际分分组组时时,可可以以按按 Sturges 提提出出的的经经验验公公式式来来确确定定组组数数K(四四舍舍五五入取整)入取整)例如例如2-12-1的数据:的数据:第41页,共142页,编辑于2022年,星期二 2 2)确定各组的组距:组距确定各组的组距:组距确定各组的组距:组距确定各组的组距:组距(Class Width)(Class Width)是一个组的上限与下限之差,可是一个组的上限与下限之差,可是一个组的上限与下限之差,可是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即根据全部数据的最大值和最小值及所分的组数来确定,即根据全部数据的最大值和最小值及所分的组数来确定,即根据全部数据的最大值和最小值及所分的组数来确定,即 组距组距组距组距(最大值最大值最大值最大值-最小值)最小值)最小值)最小值)组数组数组数组数 例例2.1的数据,最大值为的数据,最大值为128,最小值为,最小值为84,则,则 组距组距(128-84)/67.3。组距宜取组距宜取5或或10的倍数;(近似值)的倍数;(近似值)在实践中,组数和组距要通过反复的实验确定,最终确定出最有在实践中,组数和组距要通过反复的实验确定,最终确定出最有意义的组数和组距的组合。意义的组数和组距的组合。第42页,共142页,编辑于2022年,星期二3)确定组限:组限是分组的数量界限,是表明每组界限的两头数值。)确定组限:组限是分组的数量界限,是表明每组界限的两头数值。下下 限限(low limit):一个组的最小值:一个组的最小值 上上 限限(upper limit):一个组的最大值:一个组的最大值组限的具体形式有:重合组限和间断组限;闭口组限和开口组限。组限的具体形式有:重合组限和间断组限;闭口组限和开口组限。确定组限的原则确定组限的原则1:最小一组的下限必须包含数列中最小变量值;最大组的上:最小一组的下限必须包含数列中最小变量值;最大组的上限必须包含数列中最大变量值。限必须包含数列中最大变量值。确定组限的原则确定组限的原则2:遵循不重不漏的原则。:遵循不重不漏的原则。“不重不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现;是指一项数据只能分在其中的某一组,不能在其他组中重复出现;“不漏不漏”是指组别能够穷尽,即在所分的全部组别中每项数据都能分是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。在其中的某一组,不能遗漏。第43页,共142页,编辑于2022年,星期二4)根据分组计算频数,整理成频数分布表:将原始数据按照各自的大小分根据分组计算频数,整理成频数分布表:将原始数据按照各自的大小分配到各组中。配到各组中。按周加工零件数分组按周加工零件数分组次数(频数)次数(频数)频率(频率(%)809031090100723.331001101343.33110120516.6712013026.67合计合计30100本例可以得到如下频数分布表本例可以得到如下频数分布表重合组限、闭口组限重合组限、闭口组限第44页,共142页,编辑于2022年,星期二 对于重合组限的形式,为解决对于重合组限的形式,为解决“不重不重”的问题,的问题,统计分组时习惯上规定统计分组时习惯上规定“上组限不在内上组限不在内”,即当,即当相邻两组的上下限重叠时,恰好等于其一组上限相邻两组的上下限重叠时,恰好等于其一组上限的变量值不算在本组内,而计算在下一组内。的变量值不算在本组内,而计算在下一组内。重合组限既适用于连续型变量分组也适用于离重合组限既适用于连续型变量分组也适用于离散型变量分组,应用非常广泛。散型变量分组,应用非常广泛。第45页,共142页,编辑于2022年,星期二对于离散变量,可以采用相邻两组组限间断的办法(间断组限)解决对于离散变量,可以采用相邻两组组限间断的办法(间断组限)解决“不重不重”的问题。的问题。按周加工零件数分组按周加工零件数分组次数(频数)次数(频数)80893909971001091311011951201292合计合计30第46页,共142页,编辑于2022年,星期二如果全部数据中的最大值和最小值与其他数据相差悬殊,为避如果全部数据中的最大值和最小值与其他数据相差悬殊,为避免出现空白组或个别极端值被漏掉,第一组和最后一组可以采免出现空白组或个别极端值被漏掉,第一组和最后一组可以采取取“x x以下以下”及及“x x以上以上”这样的开口组。这样的开口组。开口组通常以相邻组的组距作为其组距。开口组通常以相邻组的组距作为其组距。例如,在例例如,在例21的的30个数据中,假定将最小值改为个数据中,假定将最小值改为64,最大值改为最大值改为160,采用上面的分组就会出现,采用上面的分组就会出现“空白组空白组”,这时可采用这时可采用“开口组开口组”,如,如80以下;以下;130以上。以上。开口组限:缺少上限或者下限的组限设置。开口组限:缺少上限或者下限的组限设置。第47页,共142页,编辑于2022年,星期二按周加工零件数分组按周加工零件数分组次数(频数)次数(频数)80以下以下1809029010071001101311012051201301130以上以上1合计合计30开口组开口组第48页,共142页,编辑于2022年,星期二q对于离散变量,相邻组组限可以对于离散变量,相邻组组限可以间断间断,也,也可可重叠重叠;q对于连续变量,相邻组组限对于连续变量,相邻组组限必须重叠必须重叠;q符合符合“上组限不在内上组限不在内”原则;原则;q首末两组可使用首末两组可使用“以下以下”及及“以以上上”的开口组。的开口组。组限的表示方法组限的表示方法第49页,共142页,编辑于2022年,星期二编制频数分布表的步骤编制频数分布表的步骤确确定定组组数数编制频数分布表编制频数分布表的步骤的步骤确确定定组组距距确确定定组组限限编编制制表表格格计计算算频频数数第50页,共142页,编辑于2022年,星期二 在研究分析次数分布时,还需要计算:累计频数和累计频率在研究分析次数分布时,还需要计算:累计频数和累计频率1.1.累计频数:将各类别的频数逐级累加。累计频数:将各类别的频数逐级累加。有两种方法:有两种方法:一是可以从最小组一方向最大组的一方累加频数,称为向上累一是可以从最小组一方向最大组的一方累加频数,称为向上累积;积;二是可以从最大组的一方向最小组的一方累加频数,称为向下累二是可以从最大组的一方向最小组的一方累加频数,称为向下累积。积。2.2.累计频率:将各类别的频率累计频率:将各类别的频率(百分比百分比)逐级累加逐级累加第51页,共142页,编辑于2022年,星期二表表 某车间工人周零件数的频数分布表某车间工人周零件数的频数分布表按周加工按周加工零件数分组零件数分组人数人数(次数次数)频率频率(%)向上累积向上累积 向下累积向下累积 累计累计频数频数(次数)(次数)累计累计频率频率(%)累计累计频数频数(次数次数)累计累计频率频率(%)80-90 90-100 100-110 110-120 120-1303713521023.3343.3316.676.673 102328301033.3376.6693.33100302720721009066.6723.346.67合计合计30100.0例:累计频数和累计频率的计算例:累计频数和累计频率的计算第52页,共142页,编辑于2022年,星期二 在根据组距数列进行统计计算时,需要确定组中值,作为各组变量值的在根据组距数列进行统计计算时,需要确定组中值,作为各组变量值的代表值。代表值。组中值组中值(class midpoint):下限与上限之间的中点值。:下限与上限之间的中点值。下限值下限值+上限值上限值2组中值组中值概念:组中值概念:组中值组中值这种代表有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组组中值这种代表有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组距中值两侧呈对称分布。距中值两侧呈对称分布。如实际数据的分布不符合这一假定,用组中值作为一组数据的代表值会有一定的如实际数据的分布不符合这一假定,用组中值作为一组数据的代表值会有一定的误差。误差。第53页,共142页,编辑于2022年,星期二例:组中值计算例:组中值计算按周加工零件数分按周加工零件数分组组组中值组中值次数次数(频数)(频数)频率(频率(%)8090853109010095723.331001101051343.33110120115516.6712013012526.67合计合计30100第54页,共142页,编辑于2022年,星期二在开口组中,组中值的计算以邻近组组距为依据在开口组中,组中值的计算以邻近组组距为依据 可见,开口组的组中值既假定变量值是均匀分布或可见,开口组的组中值既假定变量值是均匀分布或对称分布,又假定组距与邻近组组距相等。对称分布,又假定组距与邻近组组距相等。第55页,共142页,编辑于2022年,星期二例:组中值计算例:组中值计算按周加工零件数分按周加工零件数分组组组中值组中值次数次数(频数)(频数)频率(频率(%)80以下以下7513.3380908526.679010095723.331001101051343.33110120115516.6712013012513.33130以上以上13513.33合计合计30100第56页,共142页,编辑于2022年,星期二第四节第四节 统计数据表现形式统计数据表现形式第57页,共142页,编辑于2022年,星期二第四节第四节 统计数据表现形式统计数据表现形式一、统计表一、统计表(一一)统计表的结构统计表的结构从形式上看,统计表的结构是由表题、横行标题、纵栏标题和从形式上看,统计表的结构是由表题、横行标题、纵栏标题和指标数值等要素构成,统计表结构的一般形式如图指标数值等要素构成,统计表结构的一般形式如图2.4.1所示。所示。第58页,共142页,编辑于2022年,星期二(一一)统计表的结构统计表的结构例:例:20012001年我国工业增加值的一个统计表示如表年我国工业增加值的一个统计表示如表2.4.12.4.1所示。所示。第59页,共142页,编辑于2022年,星期二按照统计表的主词是否分组和分组的程度,分为简单表,按照统计表的主词是否分组和分组的程度,分为简单表,分组表和复合表三种。分组表和复合表三种。简单表简单表 简单表是统计表的主词未经任何分组的统计表。简单表是统计表的主词未经任何分组的统计表。分组表分组表分组表指统计表的主词按某一标志进行分组。分组表指统计表的主词按某一标志进行分组。复合表复合表 复合表指统计表的主词按两个或两个以上标志进行复合分组复合表指统计表的主词按两个或两个以上标志进行复合分组 (二二)统计表的种类统计表的种类第60页,共142页,编辑于2022年,星期二科学、实用、简练、美观科学、实用、简练、美观 首先,要合理安排统计表的结构。首先,要合理安排统计表的结构。其次,表头一般应包括表号、总标题和表中数据的单位等内容。其次,表头一般应包括表号、总标题和表中数据的单位等内容。再次,表中的上下两条横线一般用粗线,中间的其他线要用细线,这样使人看起来清楚,再次,表中的上下两条横线一般用粗线,中间的其他线要用细线,这样使人看起来清楚,醒目。醒目。最后,在实用统计表时,必要时可在表的下方加上注释,特别要注意注明资料最后,在实用统计表时,必要时可在表的下方加上注释,特别要注意注明资料来源,备读者查询使用。来源,备读者查询使用。(三三)统计表的设计要求统计表的设计要求第61页,共142页,编辑于2022年,星期二(四)(四)不良统计表的修改举例不良统计表的修改举例第62页,共142页,编辑于2022年,星期二二、统计图二、统计图条形图(条形图(Bar chartBar chart)条形图常用于描述离散型数据的情况,是我们经常见到的一种图形,它是用宽度相条形图常用于描述离散型数据的情况,是我们经常见到的一种图形,它是用宽度相等而高度为频数等而高度为频数(率率)来表示各类数据的大小。来表示各类数据的大小。例例2.4.1 某高校某高校2005年各院教师在国内核心杂志上发表论文情况,如表年各院教师在国内核心杂志上发表论文情况,如表2.4.2所示所示 第63页,共142页,编辑于2022年,星期二 条形图(条形图(Bar chartBar chart)解:由表解:由表2.

    注意事项

    本文(统计数据的收集与整理幻灯片.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开