统计学原理相关计算辅导幻灯片.ppt
《统计学原理相关计算辅导幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学原理相关计算辅导幻灯片.ppt(107页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学原理相关计算辅导第1页,共107页,编辑于2022年,星期二n一、统计分组的概念根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志划分为若干性质不同但又有联系的几个部分称统计分组。总体的变异性是统计分组的客观依据。统计分组是总体内进行的一种定性分类,它把总体划分为一个个性质不同的范围更小的总体。第2页,共107页,编辑于2022年,星期二二、统计分组的种类统计分组按其任务和作用不同,分为类型分组、结构分组和分类型分组、结构分组和分析分组。析分组。类型分组的目的是划分经济类型,结构分类的目的是研究同质总体的构成,分析分组的目的是研究现象总体内部诸标志间的依从和制约关系。按
2、照产业类型分组19941995增加值(亿元)比重%增加值(亿元)比重%一产业1087620.71136519.7二产业2488947.42827449.0三产业1675431.91809431.3合计52519100.057733100.0下表是我国1994和1995年国民生产总值按照三产业分组情况(类型分类型分组组)第3页,共107页,编辑于2022年,星期二人均生活收入(元)19941995400-45020450-50068按照流转额分组(万元)商店数流通费用率%50-2007011.2200-400.100.10.4.1994和1995年某市居民人均月生活费收入情况(结构分组结构分组)
3、某市某年某月按照商品流转额分组的流通率水平情况(分析分组分析分组)第4页,共107页,编辑于2022年,星期二n统计分组按分组标志的多少分为简单分组和复合分组。简单分组和复合分组。简单分组是将总体按一个标志进行分组,复合分组是将总体按两个或两个以上的标志重叠起来进行分组。简单分组:农村劳动力分组表性别人数男劳动力300女劳动力280复合分组:农村劳动力分组表性别人数男劳动力全劳动力260半劳动力40女劳动力全劳动力200半劳动力80第5页,共107页,编辑于2022年,星期二统计分组按分组标志的性质分为品质分组和变量分组。农村劳动力分组表性别人数男劳动力全劳动力260半劳动力40女劳动力全劳动
4、力240半劳动力80变量分组工资人数350-4503450-55023第6页,共107页,编辑于2022年,星期二n三、统计分组的方法n(1)品质标志分组方法品质标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也就确定。有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。某企业职工按性别分组:性别人数男150女120第7页,共107页,编辑于2022年,星期二(2)数量标志分组方法按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。数量标志分组方法从以下几个方面来说明:当碰上组与组之间界限不易划分时,按照统一的划分
5、标准或分类目录进行编制。如:企业按生产能力分组:生产能力企业数大型中型小型第8页,共107页,编辑于2022年,星期二单项式分组和组距式分组(a)单项式分组单项式分组对离散变量,如果变量值的变动幅度小,对离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,称单项式分组。如学生按姓名分组,均可采用单项式分组。均可采用单项式分组。按照儿童数分组家庭数没有儿童有一个儿童有二个儿童有三个儿童某地区职工家庭数按照儿童数分组情况某地区职工家庭数按照儿童数分组情况第9页,共107页,编辑于2022年,星期二 (b)组距式分组组距式分组 离散变量如果变量值的变动幅度很大,变量值的个数很多,离散变量如果
6、变量值的变动幅度很大,变量值的个数很多,则把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组。这样的分组称为组距式分组。连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠。如以总产值、商品销售额、劳动生产率、工资且相邻的组限必须重叠。如以总产值、商品销售额、劳动生产率、工资等为标志进行分组,就只能是相邻组限重叠的组距式分组。等为标志进行分组,就只能是相邻组限重叠的组距式分组。在相邻组组限重叠的组距式分组中,若某单位的标志值正好等于相邻两若某单
7、位的标志值正好等于相邻两组的上下限的数值时,一般把此值归并到作为下限的那一组(适用于连组的上下限的数值时,一般把此值归并到作为下限的那一组(适用于连续变量和离散变量)。续变量和离散变量)。第10页,共107页,编辑于2022年,星期二组距式分组组距式分组工资工资人数人数350-4003 3450-7502323组距式分组组距式分组工资工资人数人数350-4503 3450-7502323第11页,共107页,编辑于2022年,星期二n等距分组和不等距分组n等距分组是各组保持相等的组距,也就是说各组标志值的变动都限于相同的范围。不等距分组即各组组距不相等的分组。等距式分组工资人数350-4503
8、450-55023异距式分组工资人数350-4503450-75023第12页,共107页,编辑于2022年,星期二组限和组中值组距两端的数值称组限。组限。其中,每组的起点数值称为下限下限,每组的终点数值称为上限。上限。上限和下限的差称组距,组距,表示各组标志值变动的范围。组中值组中值是上下限之间的中点数值,以代表各组标志值的一般水平。组中值的计算是有假定条件的,即假定各组标志值的变化是均匀的(与组距式分组的假定条件相同)。组中值组中值=(上限(上限+下限)下限)2;对于第一组是“多少以下”:缺下限开口组组中值缺下限开口组组中值=上限上限1/2邻组组距邻组组距最后一组是“多少以上”的开口组:缺
9、上限开口组组中值缺上限开口组组中值=下限下限+1/2邻组组距。邻组组距。第13页,共107页,编辑于2022年,星期二等距式分组等距式分组工工 资资人数人数350 -4503 3450 -5502323第14页,共107页,编辑于2022年,星期二(550)(400)第15页,共107页,编辑于2022年,星期二四、变量分配数列编制的步骤n将原始资料按其数值从小到大重新排列将原始资料按其数值从小到大重新排列 只有把得到的原始资料按其数值大小重新排列顺序,才能看出变量分布的集中趋势和特点,为确定全距、组距和组数作准备。确定全距确定全距 全距是变量值中最大值和最小值的差数。确定全距,主要是确定变量
10、值的变动范围和变动幅度。如果是变动幅度不大的离散变量,即可编制单项式变量数列,如果是变量幅度较大的离散变量或者是连续变量,就要编制组距式变量数列。第16页,共107页,编辑于2022年,星期二n确定组距和组数组距的大小和组数的多少,是互为条件和互相制约的。当全距一定时,组距大,组数就少;组距小,组数就多。在实际应用中,组距应是整数,最好是或的整倍数。在确定组距时,必须考虑原始资料的分布状况和集中程度,注意组距的同质性,尤其是对带有根本性的质量界限,绝不能混淆,否则就失去分组的意义。在等距分组条件下,存在以下关系:组数=全距/组距第17页,共107页,编辑于2022年,星期二n确定组限组限要根据
11、变量的性质来确定。如果变量值相对集中,无特大或特小的极端数值时,则采用闭口式,使最小组和最大组也都有下限和上限;反之,如果变量值相对比较分散,则采用开口式,使最小组只有上限(用“XX以下”表示),最大组只有下限(用“XX以上表示)。如果是离散型变量,可根据具体情况采用不重叠组限或重叠组限的表示方法,而连续型变量则只能用重叠组限来表示。第18页,共107页,编辑于2022年,星期二n编制变量数列经过统计分组,明确了全距、组距、组数和组限及组限表示方法以后,就可以把变量值归类排列,最后把各组单位数经综合后填入相应的各组次数栏中。第19页,共107页,编辑于2022年,星期二根据资料编制分配数列(组
12、距分别为80-100,100-120,120-140,140-160)97978888123123125125119119158158112112146146117117108108878711011010710713713712012013613612512512712714214211811811511511411411711712412412912913813810010010310392929595126126107107108108105105119119127127104104105105103103113113例如:某车间同工种例如:某车间同工种40名工人完成个人生产定额百分数如
13、下名工人完成个人生产定额百分数如下第20页,共107页,编辑于2022年,星期二第一步:各个数据从小到大排列:8787888892959797100100103103103104104105105105107107107107108108108110110112112113114114115115117117117118119119119119120120123123124124125125125125126126127127127127129129136136137137138138142146146158158第21页,共107页,编辑于2022年,星期二第二步第二步:确定全距确定全距第三
14、步第三步:确定组距确定组距158-87=71714=17.75提示提示:为了计算简便,我们把组距定为20,且上限和下限取整数.则有四组:80-100,100-120,120-140,140-160第22页,共107页,编辑于2022年,星期二第四步:编制变量数列.某车间同工种40名工人完成个人生产定额情况按照个人生产百分比分组工人数80-100 5100-12020120-14012140-1603合计40注意:编制变量数列原则为上限不在内原则第23页,共107页,编辑于2022年,星期二一、平均指标的概念、特点和种类一、平均指标的概念、特点和种类n 1 1、概念:、概念:平均指标又称统计平均
15、数,用以反映社会经济现象总体各单位某一数量标志在一定时间一定时间、地点地点条件下所达到的一般水平的综合指标。一般水平的综合指标。n 2 2、平均指标的特点:、平均指标的特点:()把总体各单位标志值的差异抽象化了;()平均指标是个代表值,代表总体各单位标志值的一般水平。平均值综合指标综合指标第24页,共107页,编辑于2022年,星期二 按标志值所处的位置确定的平均数分:众 数 中位数n3 3、平均指标的种类有、平均指标的种类有:按总体所有标志值计算的平均数分:算术平均数调和平均数几何平均数 静态平均数动态平均数第25页,共107页,编辑于2022年,星期二二、平均指标的计算、平均指标的计算、算
16、术平均数的计算、算术平均数的计算算术平均数是计算平均指标的最常用方法,它的基本公式形式是总体标志总量除以总体单位总量。总体标志总量除以总体单位总量。由于资料的不同,算术平均数有两种计算形式:即简单算术平均数和加权算术平均数,公式为:(a)简单算术平均数计算公式:x代表算术平均数、x代表各单位标志值、代表总和符号、n代表总体单位数 第26页,共107页,编辑于2022年,星期二(b)加权算术平均数计算公式:x代表算术平均数、x代表各单位标志值、代表总和符号、f代表标志值出现的次数 x代表算术平均数、x代表各单位标志值、代表总和符号、f代表标志值出现的次数 当公式中各组次数相等时,则加权算术平均数
17、又可以转化为简单算术平均数,即:第27页,共107页,编辑于2022年,星期二 例1、古冶区华云制衣厂2003年6月份按工人劳动生产率高低分组人数资料情况如下:按工人劳动生产率 分组(件人)人数(人)5060 150 6070 100 7080 70 8090 30 90以上 16 试计算该企业工人平均劳动生产率。第28页,共107页,编辑于2022年,星期二解:根据题意列计算表如下:按工人劳动生产率 分组(件人)人数(人)f5060 150 6070 100 7080 70 8090 30 90以上 16 合计366-_xf24070 x=66件/人f3665565758595产量Xf825
18、0 6500 5250 25501520 24070已知X=下限+邻组组距/2X=(下限+上限)/2组中值(件人)X第29页,共107页,编辑于2022年,星期二 例2、古冶区华云制衣厂2003年6月份按工人劳动生产率高低分组的人员分布资料情况如下:按工人劳动生产率 分组(件人)比重5060 40.98%6070 27.32%7080 19.13%8090 8.20%90以上 4.37%合计100.00%试计算该企业工人平均劳动生产率。第30页,共107页,编辑于2022年,星期二解:根据题意列计算表如下:按工人劳动生产率 分组(件人)组中值(件人)x x比重ff5060 5540.98%60
19、70 6527.32%7080 7519.13%8090 858.20%90以上 954.37%合计-100.00%=5540.98%+6527.32%+7519.13%+858.20%+954.37%=66件/人已知由第一列求的第31页,共107页,编辑于2022年,星期二 、调调和和平平均均数数的的计计算算在在实实际际工工作作中中,有有时时由由于于缺缺乏乏总总体体的的单单位位数数资资料料,而而不不能能直直接接计计算算平平均均数数,这这时时就就可可采采用用调调和和平平均均数数计计算算。因此在统计工作中,调和平均数常常被作为算术平均数的变形来使用。调和平均数也有简单调和平均数简单调和平均数和加
20、权调和平均数加权调和平均数两种形式,公式分别为:简单调和平均数:加权调和平均数:x代表算术平均数、x代表各单位标志值、代表总和符号、n代表总体单位数 x代表算术平均数、x代表各单位标志值、代表总和符号、m代表各组标志总量 过度语过度语:以以上我们介绍了上我们介绍了本节课的第一本节课的第一个重点内容,个重点内容,但上述两个公但上述两个公式式 应用条件应用条件都是直接或者都是直接或者见解已知见解已知总总体的单位数体的单位数资料资料,如果,如果缺乏总体的缺乏总体的单位数资料单位数资料又该怎么办又该怎么办呢?这就需呢?这就需要计算调和要计算调和平均数的计平均数的计算算 上面我们讲到:当公式中各组次数相
21、等时,则加权算术平均数又可以转化为简单算术平均数,同理,当公式中各组标志总量相等时,则加权调和平均数又可以转化为简单调和平均数。第32页,共107页,编辑于2022年,星期二例3、古冶区华云制衣厂2003年6月份按工人劳动生产率高低分组的生产班组数和产量资料如下:按工人劳动生产率分组(件人)生产班组产量(件)506010825060707650070805525080902255090以上11520试计算该企业工人平均劳动生产率。第33页,共107页,编辑于2022年,星期二解:根据题意列计算表如下:按工人劳动生产率 分组(件人)组中值(件人)X产量(件)m人数(人)f50-60 55 825
22、0 60-70 65 6500 70-80 75 5250 80-90 85 2550 90以上 95 1520 合 计-24070 已知f=m/x150 100 70 30 16 366第34页,共107页,编辑于2022年,星期二三、变异指标的计算:1、变异指标的概念:变异指标又称标志变动度,它综合反映总体各个单位标志值的差异程度或离散程度,分为以下几种:全距、平均差、标准差和变异系数。2、变异指标的作用有:反映现象总体总单位变量分布的离中趋势;说明平均指标的代表性程度;测定现象变动的均匀性或稳定性程度。第35页,共107页,编辑于2022年,星期二n3、标准差是总体中各单位标志值与算术平
23、均数的离差平方的算术平均数的平方根,又称为均方差,是测定标志变动程度的最主要的指标。计算公式如下:第36页,共107页,编辑于2022年,星期二n4、变异系数是以相对数形式表示的变异指标。常用的是标标准准差差系系数数。变异系数的应用条件是:当所对比的两个数列的水平当所对比的两个数列的水平n高高低低不不同同时时,就就不不能能采采用用全全距距、平平均均差差或或标标准准差差进进行行对对比比分分析析,因因为为它它们们都都是是绝绝对对指指标标,其其数数值值的的大大小小不不仅仅受受各各单单位位标标志志值值差差异异程程度度的的影影响响,而而且且受受到到总总体体单单位位标标志志值值本本身身水水平平高高低低的的
24、影影响响;为为了了对对比比分分析析不不同同水水平平的的变变量量数数列列之之间间标标志志值值的的变变异异程程度度,就就必必须须消消除除数数列列水水平平高高低低的的影影响响,这这时时就就要要计计算算变变异异系系数数。计算方法如下:第37页,共107页,编辑于2022年,星期二要求:分别计算两品种的单位面积产量。计算两品种亩产量的标准差和标准差系数。假定生产条件相同,确定哪一品种具有较大稳定性,宜于推广。甲甲 品品 种种 乙乙 品品 种种 田块面积(亩)田块面积(亩)产产 量量(公斤)(公斤)田块面积(亩)田块面积(亩)产产 量量(公斤)(公斤)1.26001.58401.14951.47701.0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 原理 相关 计算 辅导 幻灯片
限制150内