欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    统计学原理3.ppt

    • 资源ID:70745468       资源大小:406.50KB        全文页数:61页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计学原理3.ppt

    第三章、统计整理第三章、统计整理 通过本章学习,要了解统计整理的具体步骤,以及统计数列的各种形式,为统计分析奠定基础。难点:统计表的设计与运用。第一节第一节 统计整理的概念和内容统计整理的概念和内容一、统计资料整理的概念一、统计资料整理的概念 根据统计研究的目的和任务,将调查取得的大量原始资料进行科学的分类和汇总,为统计分析提供系统化和条理化的综合统计资料的工作过程,称为统计资料的整理,简称统计整理。对已经整理过的统计资料(即次级资料)进行再加工,以满足统计分析的要求,也属于统计整理工作的范围。重要性一是因为统计调查取得的大量原始资料,只能反映总体单位个体特征,是分散的、不系统的,属于反映事物表面现象和外部联系的感性材料。二是因为搜集的原始资料即使是十分丰富、正确和详尽的,如果不按科学的原则和方法进行加工整理,或者整理不当,可能使丰富的材料失去其价值,也不可能进行科学的统计分析。由此可见,统计整理是统计调查的必然继续,也是统计分析的基础和前提条件,起着承前启后的作用 二、统计整理的步骤:(一)制定统计整理纲要:1、选择分组标志,即选择分组的标准或依据。2、确定用那些指标来说明总体及其分组的特征。3、决定用何种汇总方式。4、需编制那些统计图表。5、规定所需数字的精确程度、计量单位。(二)对资料进行审核:主要审核资料是否准确、及时和完整(三)对资料进行统计整理。一般包括三个步骤:1、统计分组:是统计整理的基础。2、统计汇总:是统计整理的中心内容 3、编制统计表:是统计整理的有效表 现形式。第二节第二节 统计分组统计分组 一、统计分组的意义和作用 统计分组就是根据统计研究的目的和任务,按照选定的变异标志将总体划分为若干部分或组别,使组与组之间具有差别性,而同一组内的单位保持相对的同质性。统计分组的作用(一)区分社会经济现象的类型,亦称类型分组 (二)研究现象的内部结构,亦称结构分组(三)分析现象之间的依存关系,亦称分析分组 1952年1965年1975年1980年1990年 农 业轻工业重工业56.927.815.3 37.332.330.4 28.231.640.227.234.338.5 24.337.338.3 二、统计分组的方法(一)分组标志的选择。分组标志就是划分总体单位为各个性质不同的组的标准或根据。必须遵循以下的基本原则:第一,根据统计研究的具体任务和目的,选择统计分组标志。国际上确定人口发展类型的标准国际上确定人口发展类型的标准(%)年轻型成年型老年型老年人口4%以下4-7%7%以上少儿人口40%以下30%-40%30%以下年龄中位数20以下20-3030以上第二,在对被研究对象进行理论分析的基础上,从中选择具有本质性的重要标志作为分组标志。地主、富农 8%占有土地 80%中农、贫农、雇农 81%占有土地 20%第三,结合研究对象所处的具体历史条件或社会经济发展的条件,选择分组标志(二)如何划分各组界限1、按品质标志分组:品质标志是以事物的性质属性来表现的标志。2、按数量标志分组:数量标志就是以数量的多少来表现的标志。三、统计分组的形式 简单分组:对总体只按一个标志进行的分组称为简单分组。简单分组只能说明总体在某一方面的差别情况。复合分组:对同一个总体采用两个或两个以上的标志结合起来进行的分组。例:本科本科 文科 男 女 理科 男 女 专科专科 文科 男 女 理科 男 女平行分组体系:如果对同一总体选择多个标志分别进行简单分组,这几个简单分组就形成平行分组体系例:民族 性别 学科 学历 汉 男 文科 本科 满 女 理科 专科这四个简单分组是相互联系、相互补充的,形成一个平行分组体系。第三节、统计汇总第三节、统计汇总 一、统计汇总的组织形式(一)逐级汇总 是按照一定的统计管理体制,自下而上地逐级进行统计资料的汇总。优点:能满足各地区、各部门对统计资料的需要;同时便于检查订正资料。缺点:费时长,易出错。(二)集中汇总将全部的调查资料集中汇总到组织调查的最高一级机关一次性汇总。优点:可缩短汇总时间,减少出错机会缺点:如有差错,无从查起;不能满足各地区、各部门对统计资料的需要二、统计汇总的技术以手工汇总为例 1、划记法:在汇总表上用划“正”的方法进行分组和计数;亩产(公斤)划 记小 计300350350400400450450500正正正正正正正5151052、过录法现将调查资料过录到预先设计好的汇总表上,然后再计算出各组的总体单位数和标志值之和。亩产(公斤)划记小记过录300-350350-400400-450450-500正正正正正正正515105312,306,311,345,3273、折叠法:将调查表中所需的汇总项目和数值折在边上,在将调查表重叠起来进行计数。4、卡片法:将每一调查单位的资料分别摘录到每张卡片上,再按需要进行计数。第四节、分布数列第四节、分布数列 一、分布数列的概念和种类 (一)分布数列的概念 次次数数分分布布:在统计分组的基础上,将总体中的所有单位按组归类整理,并按一定的顺序排序形成总体单位在各组间的分布,称之为次数分布或频数分布次数分布或频数分布。次数:次数:分布在各组的总体单位数称次数或频数次数或频数。频率:频率:各组次数与总次数之比称频率频率。次次数数分分布布数数列列:将分组标志的具体表现和次数对应排列而形成的数列称为次数分布数列次数分布数列,简称分布数列。分 数人 数比 率(%)60以下6070708080909010027111285.017.527.530.020.0合计40100(二)分布数列的种类 1、品质分布数列:按品质标志将总体分组而形成的分布数列称品质分布数列,简称品质数列。所有的品质数列都有两个要素组成:各组的组别和各组的次数。2、变量分布数列:按数量标志将总体分组而形成的分布数列称变量分布数列,简称变量数列。所有的变量数列也都有两个要素组成:各组的变量值和各组的单位数。离散型变量数列离散型变量数列,就是用离散变量作为分组标志对总体进行分组后形成的数列;连续型变量数列连续型变量数列,则是用连续变量作为分组标志对总体分组后所形成的数列。单项式变量数列单项式变量数列,就是数列中的每个组只用一个变量值来表示,单项变量数列,适合于总体单位数量标志值变动范围不大的情况。组距变量数列组距变量数列,就是数列中的每个组用两个反映一定变动范围的变量值所表示,二、变量数列的编制 250 456 228 248 293 140 174 265 185 150 232 255 214 269 323 340 310 257 285 219 236 410 390 168 205 330 435 242 287 300 500 290 273 275 282 200 224 275 263 300 编制组距数列的基本步骤如下:1、确定全距 全距就是原始数据的最大变量值与最小变量值之差,也就是标志值的变动幅度或变动范围。全距=最大变量值最小变量值 全距=500140=360 2、确定组数和组距 编制组距数列的最基本的原则:既能明显的反映出总体分布的规律和特征,又能最大限度地保存资料的真实性。当变量值的变动较为均匀时,采用等距数列较为适宜。组距=全距/组数。当变量值的变动较很不均匀,波动幅度大时,则需采用异距数列。分组次数频率(%)1002002003003004004005005247412.560.017.510.0合计40100.0当采用异距数列时,由于组距大小不同对次数分布有直接影响,为消除不同组距的影响,一般采用次数密度反映总体的分布状况。次数密度=次数/组距 完成定额百分比 工人人数次数密度7080809090100100120120140 140170 23536123 0.20.30.51.80.60.1 合合 计计 613、确定组限与组中值 组限是指组距数列中每组两端的标志值,上限:最大值称为上限。下限:最小值称为下限。组中值:上限与下限的中点称为组中值。组中值=上限下限/2需注意:(1)以组中值来代表各组的一般水平,是假设变量值在组内是均匀分布的,因此,依据组中值计算的结果具有近似的性质;(2)组限的划分要注意将性质不同的部分区分开;(3)对于连续变量,划分组限时,相邻的组限必须重叠,并遵循“上限不在组内”的原则。(4)当出现极少数极端值时,可采用开口组的形式。即以上,或以下。以避免空白组的出现或无组可归的现象。三、次数分布的类型(一)次数分布的类型 钟型分布 U型分布 J型分布 正J型 反 J型(二)次数分布图的绘制条形图:条形图是用宽度相同的条条形图是用宽度相同的条形的高度或长短来描述已概括成频形的高度或长短来描述已概括成频数、相对频数或百分比频数分布的数、相对频数或百分比频数分布的品质数据。条形图可以横置或纵置,品质数据。条形图可以横置或纵置,纵置时也称为柱形图。纵置时也称为柱形图。圆形图,是用圆形及圆内扇形圆形图,是用圆形及圆内扇形的面积来表示数值大小的图形。圆的面积来表示数值大小的图形。圆形图主要用于表示总体中各组成部形图主要用于表示总体中各组成部分所占的比例,对于研究结构性问分所占的比例,对于研究结构性问题十分有用。绘制一个饼图,首先题十分有用。绘制一个饼图,首先画一个圆圈,然后利用相对频数将画一个圆圈,然后利用相对频数将圆圈划分成几个部分,每一部分对圆圈划分成几个部分,每一部分对应一个组的相对频数。应一个组的相对频数。:一家评估机构为调查不同品牌饮一家评估机构为调查不同品牌饮料的市场占有率,对随机抽取的一家料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对照超市进行了调查。调查员在某天对照50名顾客购买饮料的品牌进行了记录,名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次。就将这一饮料的品牌名字记录一次。下面的表是记录的原始数据下面的表是记录的原始数据。顾客购买饮料的品牌名称统一统一露露露露统一统一可口可乐可口可乐百事可乐百事可乐可口可乐可口可乐汇源果汁汇源果汁可口可乐可口可乐露露露露可口可乐可口可乐 可口可乐可口可乐统一统一可口可乐可口可乐百事可乐百事可乐露露露露统一统一统一统一百事可乐百事可乐可口可乐可口可乐统一统一 统一统一可口可乐可口可乐可口可乐可口可乐统一统一露露露露统一统一可口可乐可口可乐露露露露百事可乐百事可乐百事可乐百事可乐 汇源果汁汇源果汁露露露露百事可乐百事可乐可口可乐可口可乐百事可乐百事可乐汇源果汁汇源果汁可口可乐可口可乐汇源果汁汇源果汁可口可乐可口可乐汇源果汁汇源果汁 露露露露可口可乐可口可乐统一统一百事可乐百事可乐露露露露汇源果汁汇源果汁可口可乐可口可乐百事可乐百事可乐露露露露统一统一 购买饮料的频数分布饮料名称饮料名称频数频数可口可乐可口可乐 统一冰茶统一冰茶百事可乐百事可乐露露 露露汇源果汁汇源果汁合合 计计151199650购买饮料数据的条形图购买饮料数据圆形图例:某班统计学考试成绩分布如下:分数人数比率(%)50606070708080909010027111285.017.527.530.020.0合计40100.0直方图50 60 70 80 90 100累计次数分布图分数人数向上累计向上累计向下累计向下累计506060707080809090100271112829203240403831208合 计40第四节第四节 统计表统计表 一、统计表的概念和作用一、统计表的概念和作用(一一)概概念念:统统计计表表是是用用纵纵横横交交叉叉的的线线条条所所绘制的表格来表现统计资料的一种形式。绘制的表格来表现统计资料的一种形式。广广义义的的统统计计表表包包括括统统计计工工作作个个阶阶段段所所用用的的一一切切表表格格,如如调调查查表表、汇汇总总表表、计计算算表表等等等等;狭狭义义的的统统计计表表主主要要是是指指表表现现统统计计整整理理结结果果的的表格。本节侧重于狭义统计表的设计。表格。本节侧重于狭义统计表的设计。(二)作用:(二)作用:1 1、能能使使大大量量的的统统计计资资料料系系统统化化、条条理理化化,因因而而能更清晰地表述统计资料的内容。能更清晰地表述统计资料的内容。2 2、利利用用统统计计表表便便于于比比较较各各项项目目(指指标标)之之间间的的关关系系,而而且且也也便便于于计计算算(如如有有些些计计算算表表比比用用公公式式更更简易、明了。简易、明了。3 3、采采用用统统计计表表格格表表述述统统计计资资料料比比用用叙叙述述的的方方法法表表述述统统计计资资料料显显得得紧紧凑凑、简简明明、醒醒目目,使使人人一目了然。一目了然。4 4、利用统计表易于检查数字的完整性、利用统计表易于检查数字的完整性(是否有是否有遗漏遗漏)和正确性。和正确性。二、统计表的结构二、统计表的结构(一一)从从形形式式上上看看,统统计计表表由由总总标标题题、横横行行标题、纵栏标题和指标数字四部分组成。标题、纵栏标题和指标数字四部分组成。总总标标题题是是统统计计表表的的名名称称,用用来来概概括括说说明明统统计计表表中中全全部统计资料的内容,位于表的顶端中央。部统计资料的内容,位于表的顶端中央。横横行行标标题题在在统统计计表表中中通通常常用用来来表表示示各各组组的的名名称称以以及及统计表所要说明的对象,一般写在表的左方。统计表所要说明的对象,一般写在表的左方。纵纵行行标标题题是是纵纵栏栏的的名名称称,它它通通常常用用来来表表示示统统计计指指标标的名称,一般写在表的上方。的名称,一般写在表的上方。指指标标数数字字是是说说明明总总体体数数量量特特征征的的各各项项数数值值,它它是是统统计表的核心部分。如下表所示。计表的核心部分。如下表所示。某班学生统计学成绩统计表某班学生统计学成绩统计表分 数人 数比 率(%)60以下6070708080909010027111285.017.527.530.020.0合计40100(二)从内容来看,统计表可分为两(二)从内容来看,统计表可分为两部分:主词和宾词。部分:主词和宾词。主主词词,指指被被研研究究的的总总体体,它它可可以以是是各各个个总总体体单单位位的的名名称称也也可可以以是是总总体体经经分分组组形形成成的的各各个个组组。通通常常情情况况下下,表表的的主主词词排排列列在在表表的的左方,列于横栏;左方,列于横栏;宾宾词词,主主要要用用来来说说明明总总体体的的特特征征,包包括括指指标标名名称称和和指指标标数数值值。通通常常,表表的的宾宾词词排排列列在在表的右方,列于纵栏。表的右方,列于纵栏。有有时时为为了了更更好好地地编编排排表表的的内内容容和和阅阅读读方方便便,主、宾词也可互换位置。主、宾词也可互换位置。三、统计表的分类三、统计表的分类(一)统计表按主词的分组状况分类:(一)统计表按主词的分组状况分类:统计表按主词的分组情况不同,可统计表按主词的分组情况不同,可分为简单表、简单分组表和复合分组表。分为简单表、简单分组表和复合分组表。1 1、简单表,指主词未经任何分组,只是将总体各单位、简单表,指主词未经任何分组,只是将总体各单位名称罗列或按时间顺序排列形成的统计表。如表所示。名称罗列或按时间顺序排列形成的统计表。如表所示。年份年份人口数人口数195319531964196419821982 1990 1990 20002 2、简单分组表,指主词只用一个标志分组形成的统计表。、简单分组表,指主词只用一个标志分组形成的统计表。3 3、复合分组表,指主词用两个获两个以上的标志分组形成的统计。、复合分组表,指主词用两个获两个以上的标志分组形成的统计。生生 产产 方方 向向总产值(万元)总产值(万元)工业工业轻工业轻工业重工业重工业 农业农业合合 计计(二)统计表按宾词的分组状况分类:(二)统计表按宾词的分组状况分类:统统计计表表的的宾宾词词一一般般有有两两种种排排列列方方法法:简单排列和复合排列。简单排列和复合排列。1 1、简简单单排排列列:就就是是将将宾宾词词不不加加任任何何分分组组,按一定顺序排列在统计表上。按一定顺序排列在统计表上。2 2、复复合合排排列列:就就是是将将统统计计指指标标进进行行几几种种分组后重叠排列。分组后重叠排列。机构分类机构数固定职工数临时工研究人员行政人员工人研究员副研究员助理研究员行政管理业务管理后勤服务实验室工厂四、统计表的设计四、统计表的设计总的原则:科学、使用、简练、美观。总的原则:科学、使用、简练、美观。(一)对形式的设计(一)对形式的设计1 1、表表式式不不宜宜过过于于狭狭长长或或宽宽短短,长长、宽宽之之间间应应保保持一定比例,以符合美观原则。持一定比例,以符合美观原则。2 2、线线条条的的绘绘制制。表表的的上上、下下端端应应以以粗粗线线绘绘制制,表表内内纵纵横横线线以以细细线线绘绘制制。表表格格的的左左右右两两端端一一般不划线,采用般不划线,采用“开口式开口式”。3 3、合合计计栏栏的的设设置置。统统计计表表格格纵纵栏栏若若需需合合计计时时,一一般般应应将将合合计计列列在在最最后后一一行行;各各横横行行若若需需要要合计时,可将合计列在最前一栏。合计时,可将合计列在最前一栏。4 4、横行标题为复合分组时,应在第一次分组的、横行标题为复合分组时,应在第一次分组的下行后退一、二格,填写第二次分组的组别。下行后退一、二格,填写第二次分组的组别。5 5、当栏目较多时,为便于阅读,习惯上可对栏、当栏目较多时,为便于阅读,习惯上可对栏目进行编号,主词栏常用(甲)(乙)目进行编号,主词栏常用(甲)(乙),宾词栏常用(宾词栏常用(1 1)()(2 2),各栏间如有数字,各栏间如有数字关系,可用数学等式表示。关系,可用数学等式表示。商品名称计量单位销售量单位价格(元)销售额(甲)(乙)(1)(2)(3)=(1)+(2)ABC支双件5080200.8252040200400合计640(二)对内容的设计(二)对内容的设计 1 1、标标题题设设计计。统统计计表表的的总总标标题题及及横横行行、纵纵栏栏标标题题应应简简明明扼扼要要,以以简简练练而而又又准准确确的的文文字字表表述述统统计计资资料料的的内内容容、资资料料所所属属的的空空间间和和时时间间范围。范围。2 2、指指标标数数值值。表表中中数数字字应应该该填填写写整整齐齐,对对准准位位数数。当当数数字字小小且且可可略略而而不不计计时时,可可写写上上“0”“0”;当当缺缺某某项项数数字字资资料料时时,可可用用符符号号“”“”表表示示;不不应应有有数数字字时时用用符符号号“”“”表表式。式。3 3、计量单位。统计表必须注意数字资料的、计量单位。统计表必须注意数字资料的计量单位。当全表只有一种计量单位时,可计量单位。当全表只有一种计量单位时,可以把它写在表头的右上方。如果表中各栏的以把它写在表头的右上方。如果表中各栏的指标数值计量单位不同,可在横行标题后添指标数值计量单位不同,可在横行标题后添一列计量单位,纵栏标题可直接在标题下方一列计量单位,纵栏标题可直接在标题下方加单位。加单位。4 4、对于分组,一般依照由大到小,由高到、对于分组,一般依照由大到小,由高到低的顺序。如,分数、学历、职称等。低的顺序。如,分数、学历、职称等。5 5、注解或资料来源。必要时,在统计表下、注解或资料来源。必要时,在统计表下应加注解或说明,以便查考。应加注解或说明,以便查考。三次产业就业人数分布年份中国美国日本德国 19601970198019902000注:注:、分别代表第一、二、三产业分别代表第一、二、三产业资料来源:世界银行资料来源:世界银行20012001年世界发展报告年世界发展报告 p307练练 习习为下列题目设计表样为下列题目设计表样1、近五年来我国工业产品产量(钢、煤石油、近五年来我国工业产品产量(钢、煤石油、电力等);电力等);2、我国主要产品产量与西方主要国家比较;、我国主要产品产量与西方主要国家比较;3、某乡所属各村的基本情况(耕地面积、人口、某乡所属各村的基本情况(耕地面积、人口、劳动力等);劳动力等);4、某城市居民家庭住房状况。、某城市居民家庭住房状况。某地区各工业企业工人数如下某地区各工业企业工人数如下:322 674 339 357 346 295 465 355 332 316 453 442 417 587 369 545 323 430 560 528 333 311 410 604 281 461 432 421 484 473 392 354 根据上面的数据编制等距数列,并绘制根据上面的数据编制等距数列,并绘制次数分布图次数分布图

    注意事项

    本文(统计学原理3.ppt)为本站会员(hyn****60)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开