统计学原理相关计算辅导.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《统计学原理相关计算辅导.ppt》由会员分享,可在线阅读,更多相关《统计学原理相关计算辅导.ppt(107页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统统 计计 整整 理理n一、统计分组的概念根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志划分为若干性质不同但又有联系的几个部分称统计分组。总体的变异性是统计分组的客观依据。统计分组是总体内进行的一种定性分类,它把总体划分为一个个性质不同的范围更小的总体。二、统计分组的种类 统计分组按其任务和作用不同,分为类型分组、结构分组和分类型分组、结构分组和分析分组。析分组。类型分组的目的是划分经济类型,结构分类的目的是研究同质总体的构成,分析分组的目的是研究现象总体内部诸标志间的依从和制约关系。按照产业类型分组19941995增加值(亿元)比重%增加值(亿元)比重%一产业10876
2、20.71136519.7二产业2488947.42827449.0三产业1675431.91809431.3合计52519100.057733100.0下表是我国1994和1995年国民生产总值按照三产业分组情况(类型分组类型分组)人均生活收入(元)19941995400-45020450-50068按照流转额分组(万元)商店数流通费用率%50-2007011.2200-400.100.10.4.1994和1995年某市居民人均月生活费收入情况(结构分组结构分组)某市某年某月按照商品流转额分组的流通率水平情况(分析分组分析分组)n统计分组按分组标志的多少分为简单分组和复合分组。简单分组和复合
3、分组。简单分组是将总体按一个标志进行分组,复合分组是将总体按两个或两个以上的标志重叠起来进行分组。简单分组:农村劳动力分组表性别人数男劳动力300女劳动力280复合分组:农村劳动力分组表性别人数男劳动力全劳动力260半劳动力40女劳动力全劳动力200半劳动力80统计分组按分组标志的性质分为品质分组和变量分组。农村劳动力分组表性别人数男劳动力全劳动力260半劳动力40女劳动力全劳动力240半劳动力80变量分组工资人数350-4503450-55023n三、统计分组的方法n(1)品质标志分组方法品质标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也就确定。有些复杂的品质标志分组可
4、根据统一规定的划分标准和分类目录进行。某企业职工按性别分组:性别人数男 150女 120(2)数量标志分组方法按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。数量标志分组方法从以下几个方面来说明:当碰上组与组之间界限不易划分时,按照统一的划分标准或分类目录进行编制。如:企业按生产能力分组:生产能力 企业数大型 中型 小型 单项式分组和组距式分组(a)单项式分组单项式分组对离散变量,如果变量值的变动幅度小,对离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,称单项式分组。如学生按姓名分组,均可采用单项式均可采用单项式分组。分组。按
5、照儿童数分组家庭数没有儿童有一个儿童有二个儿童有三个儿童某地区职工家庭数按照儿童数分组情况某地区职工家庭数按照儿童数分组情况 (b)组距式分组组距式分组 离散变量如果变量值的变动幅度很大,变量值的个数很多,离散变量如果变量值的变动幅度很大,变量值的个数很多,则把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组。这样的分组称为组距式分组。连续变量由于不能一一列举其变量值,只能采用组距式的分组方连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠。如以总产值、商品销售额、劳动生产率、式,且相邻的组限必须重叠
6、。如以总产值、商品销售额、劳动生产率、工资等为标志进行分组,就只能是相邻组限重叠的组距式分组。工资等为标志进行分组,就只能是相邻组限重叠的组距式分组。在相邻组组限重叠的组距式分组中,若某单位的标志值正好等于若某单位的标志值正好等于相邻两组的上下限的数值时,一般把此值归并到作为下限的那一组相邻两组的上下限的数值时,一般把此值归并到作为下限的那一组(适用于连续变量和离散变量)。(适用于连续变量和离散变量)。组距式组距式分组分组工资工资人人数数350-4003 3450-7502323组距式组距式分组分组工资工资人人数数350-4503 3450-7502323n等距分组和不等距分组n等距分组是各组
7、保持相等的组距,也就是说各组标志值的变动都限于相同的范围。不等距分组即各组组距不相等的分组。等距式分组工资人数350-4503450-55023异距式分组工资人数350-4503450-75023组限和组中值组距两端的数值称组限。组限。其中,每组的起点数值称为下限下限,每组的终点数值称为上限。上限。上限和下限的差称组距,组距,表示各组标志值变动的范围。组中值组中值是上下限之间的中点数值,以代表各组标志值的一般水平。组中值的计算是有假定条件的,即假定各组标志值的变化是均匀的(与组距式分组的假定条件相同)。组中值组中值=(上限(上限+下限)下限)2;对于第一组是“多少以下”:缺下限开口组组中值缺下
8、限开口组组中值=上限上限1/2邻组组距邻组组距最后一组是“多少以上”的开口组:缺上限开口组组中值缺上限开口组组中值=下限下限+1/2邻组组距。邻组组距。等距式分组等距式分组工工 资资人数人数350 -4503 3450 -5502323(550)(400)四、变量分配数列编制的步骤 n将原始资料按其数值从小到大重新排列将原始资料按其数值从小到大重新排列 只有把得到的原始资料按其数值大小重新排列顺序,才能看出变量分布的集中趋势和特点,为确定全距、组距和组数作准备。确定全距确定全距 全距是变量值中最大值和最小值的差数。确定全距,主要是确定变量值的变动范围和变动幅度。如果是变动幅度不大的离散变量,即
9、可编制单项式变量数列,如果是变量幅度较大的离散变量或者是连续变量,就要编制组距式变量数列。n确定组距和组数组距的大小和组数的多少,是互为条件和互相制约的。当全距一定时,组距大,组数就少;组距小,组数就多。在实际应用中,组距应是整数,最好是或的整倍数。在确定组距时,必须考虑原始资料的分布状况和集中程度,注意组距的同质性,尤其是对带有根本性的质量界限,绝不能混淆,否则就失去分组的意义。在等距分组条件下,存在以下关系:组数=全距/组距n确定组限组限要根据变量的性质来确定。如果变量值相对集中,无特大或特小的极端数值时,则采用闭口式,使最小组和最大组也都有下限和上限;反之,如果变量值相对比较分散,则采用
10、开口式,使最小组只有上限(用“XX以下”表示),最大组只有下限(用“XX以上表示)。如果是离散型变量,可根据具体情况采用不重叠组限或重叠组限的表示方法,而连续型变量则只能用重叠组限来表示。n编制变量数列经过统计分组,明确了全距、组距、组数和组限及组限表示方法以后,就可以把变量值归类排列,最后把各组单位数经综合后填入相应的各组次数栏中。根据资料编制分配数列(组距分别为80-100,100-120,120-140,140-160)9797888812312312512511911915815811211214614611711710810887871101101071071371371201201
11、3613612512512712714214211811811511511411411711712412412912913813810010010310392929595126126107107108108105105119119127127104104105105103103113113例如:某车间同工种例如:某车间同工种40名工人完成个人生产定额百分数如下名工人完成个人生产定额百分数如下第一步:各个数据从小到大排列:8787888892959797 100100 103103 103 104104 105105105 107107 107107 108108 108 110110 1121
12、12 113 114114 115115117117 117 118 119119 119119 120120 123123 124124 125125 125125126126 127127 127127 129129 136136 137137 138138 142 146146 158158第二步第二步:确定全距确定全距 第三步第三步:确定组距确定组距158-87=71714=17.75 提示提示:为了计算简便,我们把组距定为20,且上限和下限取整数.则有四组:80-100,100-120,120-140,140-160第四步:编制变量数列.某车间同工种40名工人完成个人生产定额情况按照
13、个人生产百分比分组 工人数80-100 5100-120 20120-140 12140-160 3 合 计 40 注意:编制变量数列原则为上限不在内原则 一、平均指标的概念、特点和种类一、平均指标的概念、特点和种类n 1 1、概念:、概念:平均指标又称统计平均数,用以反映社会经济现象总体各单位某一数量标志在一定时间一定时间、地点地点条件下所达到的一般水平的综合指标。一般水平的综合指标。n 2 2、平均指标的特点:、平均指标的特点:()把总体各单位标志值的差异抽象化了;()平均指标是个代表值,代表总体各单位标志值的一般水平。平均值综合指标综合指标 按标志值所处的位置确定的平均数分:众 数 中位
14、数n3 3、平均指标的种类有、平均指标的种类有:按总体所有标志值计算的平均数分:算术平均数调和平均数几何平均数 静态平均数动态平均数 二、平均指标的计算、平均指标的计算 、算术平均数的计算、算术平均数的计算算术平均数是计算平均指标的最常用方法,它的基本公式形式是总体标志总量除以总体单位总量。总体标志总量除以总体单位总量。由于资料的不同,算术平均数有两种计算形式:即简单算术平均数和加权算术平均数,公式为:(a)简单算术平均数计算公式:x代表算术平均数、x代表各单位标志值、代表总和符号、n代表总体单位数(b)加权算术平均数计算公式:x代表算术平均数、x代表各单位标志值、代表总和符号、f代表标志值出
15、现的次数 x代表算术平均数、x代表各单位标志值、代表总和符号、f代表标志值出现的次数 当公式中各组次数相等时,则加权算术平均数又可以转化为简单算术平均数,即:例1、古冶区华云制衣厂2003年6月份按工人劳动生产率高低分组人数资料情况如下:按工人劳动生产率 分组(件人)人数(人)5060 150 6070 100 7080 70 8090 30 90以上 16 试计算该企业工人平均劳动生产率。解:根据题意列计算表如下:按工人劳动生产率 分组(件人)人数(人)f5060 150 6070 100 7080 70 8090 30 90以上 16 合计366-_ xf24070 x =66 件/人 f
16、 3665565758595产量Xf8250 6500 5250 25501520 24070已知X=下限+邻组组距/2X=(下限+上限)/2组中值(件人)X 例2、古冶区华云制衣厂2003年6月份按工人劳动生产率高低分组的人员分布资料情况如下:按工人劳动生产率 分组(件人)比重5060 40.98%6070 27.32%7080 19.13%8090 8.20%90以上 4.37%合计100.00%试计算该企业工人平均劳动生产率。解:根据题意列计算表如下:按工人劳动生产率 分组(件人)组中值(件人)x x比重ff5060 5540.98%6070 6527.32%7080 7519.13%8
17、090 858.20%90以上 954.37%合计-100.00%=55 40.98%+6527.32%+7519.13%+858.20%+954.37%=66 件/人已知由第一列求的 、调调和和平平均均数数的的计计算算在在实实际际工工作作中中,有有时时由由于于缺缺乏乏总总体体的的单单位位数数资资料料,而而不不能能直直接接计计算算平平均均数数,这这时时就就可可采采用用调调和和平平均均数数计计算算。因此在统计工作中,调和平均数常常被作为算术平均数的变形来使用。调和平均数也有简简单单调调和和平平均均数数和加加权权调调和和平平均均数数两种形式,公式分别为:简单调和平均数:加权调和平均数:x代表算术平
18、均数、x代表各单位标志值、代表总和符号、n代表总体单位数 x代表算术平均数、x代表各单位标志值、代表总和符号、m代表各组标志总量 过度过度语语:以上我以上我们介绍了本们介绍了本节课的第一节课的第一个重点内容,个重点内容,但上述两个但上述两个公式公式 应用应用条件都是直条件都是直接或者见解接或者见解已知已知总体总体的单位数的单位数资料资料,如,如果果缺乏总缺乏总体的单位体的单位数资料又数资料又该怎么办该怎么办呢?这就呢?这就需要计算需要计算调和平均调和平均数的计算数的计算 上面我们讲到:当公式中各组次数相等时,则加权算术平均数又可以转化为简单算术平均数,同理,当公式中各组标志总量相等时,则加权调
19、和平均数又可以转化为简单调和平均数。例3、古冶区华云制衣厂2003年6月份按工人劳动生产率高低分组的生产班组数和产量资料如下:按工人劳动生产率分组(件人)生产班组产量(件)506010825060707650070805525080902255090以上11520试计算该企业工人平均劳动生产率。解:根据题意列计算表如下:按工人劳动生产率 分组(件人)组中值(件人)X产量(件)m人数(人)f50-60 55 8250 60-70 65 6500 70-80 75 5250 80-90 85 2550 90以上 95 1520 合 计-24070 已知f=m/x150 100 70 30 16 3
20、66 三、变异指标的计算:1、变异指标的概念:变异指标又称标志变动度,它综合反映总体各个单位标志值的差异程度或离散程度,分为以下几种:全距、平均差、标准差和变异系数。2、变异指标的作用有:反映现象总体总单位变量分布的离中趋势;说明平均指标的代表性程度;测定现象变动的均匀性或稳定性程度。n 3、标准差是总体中各单位标志值与算术平均数的离差平方的算术平均数的平方根,又称为均方差,是测定标志变动程度的最主要的指标。计算公式如下:n 4、变异系数是以相对数形式表示的变异指标。常用的是标标准准差差系系数数。变异系数的应用条件是:当所对比的两个数列的水平当所对比的两个数列的水平n高高低低不不同同时时,就就
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 原理 相关 计算 辅导
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内