统计学-分布数量特征的统计描述.ppt
统计学统计学-分布数量特征分布数量特征的统计描述的统计描述 统计资料经过加工整理形成分布数列后,我们对它的变化规律已有了一个直观的了解。然而,要作进一步的统计分析仅靠这些直观了解是远远不够的,我们还需要寻找一些能充分度量统计分布数量特征的统计指标,以便对不同的研究对象进行分析研究。对统计资料的度量包括:集中趋势的度量(平均指标);离中趋势的度量(变异指标)。2第一节第一节 统计平均数统计平均数 众数众数 中位数中位数n一、统计平均数的含义与作用一、统计平均数的含义与作用n(一一)含义:也称平均指标,是用来表示社会经济现含义:也称平均指标,是用来表示社会经济现象总体各单位某一标志在一定时间、地点条件下所象总体各单位某一标志在一定时间、地点条件下所达到的一般水平达到的一般水平n(二二)作用作用u反映总体各单位变量分布的一般水平和集中趋势反映总体各单位变量分布的一般水平和集中趋势u比较同类现象在不同单位的发展水平比较同类现象在不同单位的发展水平u比较同类现象在不同时期的发展变化趋势或规律比较同类现象在不同时期的发展变化趋势或规律n(三三)分类分类3n静态平均数静态平均数n同一时间不同单位的数据的平均同一时间不同单位的数据的平均n反映现象总体在一定历史条件下的一般水平反映现象总体在一定历史条件下的一般水平动态平均数动态平均数不同时间同一总体的数据的平均不同时间同一总体的数据的平均反映现象在发展阶段上的一般水平反映现象在发展阶段上的一般水平 455二、算术平均数二、算术平均数n1.算术平均数:总体单位的标志值总量除以总算术平均数:总体单位的标志值总量除以总体单位数所得的结果。体单位数所得的结果。n基本公式:基本公式:n例:例:平均工资平均工资=工资总额工资总额职工人数职工人数n 单位成本单位成本=总成本总成本产量产量62.计算方法计算方法n由于所掌握资料的数据不同,有由于所掌握资料的数据不同,有n(1)简单算术平均数。简单算术平均数主要)简单算术平均数。简单算术平均数主要用于未分组资料,用总体各单位标志值简单用于未分组资料,用总体各单位标志值简单加总得到的标志总量除以总体单位数而得。加总得到的标志总量除以总体单位数而得。计算公式:计算公式:7简单算术平均数简单算术平均数资料未分组时资料未分组时 6名学生的考试成绩分别为(分)79、82、87、60、95、91,他们的平均成绩是多少?(79+82+97+60+60+95+91)/6=84(分)8(2)加权算术平均数)加权算术平均数适合于分组资料适合于分组资料n1、单项式数列、单项式数列nA.加权算术平均数主要用于原始资料已经分加权算术平均数主要用于原始资料已经分组,并得出次数分布的条件。计算公式:组,并得出次数分布的条件。计算公式:fi 为各组标志值出现的次数。为各组标志值出现的次数。9 工人日产量(件)x工人人数(人)f工人人数比重(%)f/f 10 11 12 13 14 70100380150100 8.75 12.50 47.50 18.25 12.50合 计800100.0010 不不符符合合基基本本公公式式,总总体体单单位位总总量量不不是是5个个工工人人,而而是是800个个工工人人;工工人人人人总总产产量量(总总体体标标志志总总量量)不不是是60件件,而是而是9710件件所以,应该这样计算:所以,应该这样计算:可以可以这样计算吗?这样计算吗?不能不能!1112 B.权数的意义和作用权数的意义和作用n权数:各组次数(频数)的大小所对应的标权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用。志值对平均数的影响具有权衡轻重的作用。n当各组的次数都相同时,即当当各组的次数都相同时,即当f1=f2=f3=fn时:时:n加权算术平均数就等于简单算术平均数。加权算术平均数就等于简单算术平均数。132.是非标志的平均数是非标志的平均数 n在总体中,具有某种性质的单位占总体的比在总体中,具有某种性质的单位占总体的比率为率为p,不具有该种性质的单位占总体的比率,不具有该种性质的单位占总体的比率为为 q,以,以1作为具有某种性质的单位的标志值,作为具有某种性质的单位的标志值,以以0作为不具有该种性质的单位的标志值:作为不具有该种性质的单位的标志值:np也称为总体中具有某种属性的单位成数,是也称为总体中具有某种属性的单位成数,是非标志的平均数。非标志的平均数。143、组距式数列计算算术平均数、组距式数列计算算术平均数 x各组的组中值(代表组平均水平)各组的组中值(代表组平均水平)假定条件:组内均匀分布或对称分布假定条件:组内均匀分布或对称分布 一般地,计算结果是近似值。一般地,计算结果是近似值。15成绩(分)x学生人数(人)f60以下60707080809090100 2151915 4合计551616原来只是用组原来只是用组中值作为各组中值作为各组的代表值的代表值174.算术平均数的数学性质算术平均数的数学性质 n(1)算术平均数与标志值个数的乘积等于各)算术平均数与标志值个数的乘积等于各标志值的总和。标志值的总和。n简单算术平均数:简单算术平均数:n加权算术平均数:加权算术平均数:18n(2)各个标志值与其算术平均数的离差之和)各个标志值与其算术平均数的离差之和等于零。等于零。n简单算术平均数:简单算术平均数:n加权算术平均数:加权算术平均数:19n(3)各标志值与算术平均数离差的平方和为)各标志值与算术平均数离差的平方和为最小值。最小值。20 三三 调和平均数调和平均数n1.简单调和平均数:标志值的倒数的算术平均简单调和平均数:标志值的倒数的算术平均数的倒数。数的倒数。212.加权调和平均数加权调和平均数n计算公式:计算公式:n在权数选择合适时,加权调和平均数实际上在权数选择合适时,加权调和平均数实际上是加权算术平均数的变形:是加权算术平均数的变形:22n当各组标志总量相等,当各组标志总量相等,m1=m2=mn时,时,加权调和平均数可化简成为简单调和平均数加权调和平均数可化简成为简单调和平均数形式。形式。23工人日产量(件)x工人日总产量(件)x f1011121314 7001100456019501400合计9710工人人数f=xf/x 7010038015010080024 某供销社分三批收购某种农副产品,其收购单价及各批收购额如下:批次批次单价(元单价(元))收购额收购额12.40600022.251200032.152150合计合计2015025解:解:26某公司下属某公司下属18个企业的计划完成情况(个企业的计划完成情况(1)产值计划完成程度%)组中值(%)x企业数(个)计划产值(万元)f8090 85 2 80090100 95 3 25001001101051017200110120115 3 4400合 计1824900实际产值(万元)xf 680 237518060 5060261752728某公司下属某公司下属18个企业的计划完成情况(个企业的计划完成情况(2)产值计划完成程度(%)组中值(%)x企业数(个)8090 85 290100 95 310011010510110120115 3合 计18实际产值(万元)xf 680 237518060 506026175计划产值(万元)800 250017200 4400249002918个企业的平均计划完成百分比:个企业的平均计划完成百分比:30四、几何平均数四、几何平均数n1.几何平均数:是几何平均数:是n项标志值连乘积的项标志值连乘积的n次方根。次方根。n2.分类:分类:n(1)简单几何平均数:是)简单几何平均数:是n个标志值个标志值xi连乘积连乘积的的n次方根。计算公式为:次方根。计算公式为:G=式中式中G表示几何平均数,表示几何平均数,xi表示各项标志值。表示各项标志值。31(2)加权几何平均数)加权几何平均数n加权几何平均数是各标志值加权几何平均数是各标志值fi次方的连乘积的次方的连乘积的次方根,计算公式为:次方根,计算公式为:G=32 例:某流水生产线有前后衔接的五道工序。某日各工序产品的不合格率分别为5%、3%、1%、5%、2%,整个流水线上产品的平均废品率?平均废品率平均废品率1 平均合格率平均合格率 196.793.2133 某金融机够以复利方式计息。近某金融机够以复利方式计息。近12年来的年利率年来的年利率有有4年为年为3%、2年为年为5%、2年为年为8%、3年为年为10%、1年年为为15%。则。则12年的平均年利率?年的平均年利率?平均年利率平均年利率=106.82%-1=6.82加权几何平均数加权几何平均数加权几何平均法加权几何平均法34五、五、众数众数 Mo n1.定义:众数是指社会现象总体中最普遍出现定义:众数是指社会现象总体中最普遍出现的标志值。的标志值。n集中趋势的测度值之一集中趋势的测度值之一n出现次数最多的变量值出现次数最多的变量值n不受极端值的影响不受极端值的影响n可能没有众数或有几个众数可能没有众数或有几个众数n可以用于定类数据,也可用于定序数据和数可以用于定类数据,也可用于定序数据和数值型数据值型数据35 2.众数的确定众数的确定36 由品质数列(定类数据)确定众数某城市居民关注广告类型的频数分布 广告类型人数(人)比例频率(%)商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100解解:这这里里的的变变量量为为“广广告告类类型型”,这这是是个个定定类类变变量量,不不同同类类型型的的广广告告就就是是变变量量值值。我我们们看看到到,在在所所调调查查的的200人人当当中中,关关注注商商品品广广告告的的人人数数最最多多,为为112人人,占占总总被被调调查查人人数数的的56%,因因此此众众数数为为“商商品品广广告告”这一类别,即这一类别,即 Mo商品广告商品广告37由品质数列(定序数据)确定众数频频率率最最大大的的组组 是是“高高 中中”,占占5252,因因此,此,M0高中高中文化程度人数(人)比重(%)小学初中高中大学4001500 2600 500 8305210合计500010038工人日产量(件)x工人数(人)f1011121314 70100380150100合计800单项式数列确定众数单项式数列确定众数M0=12394.组距式数列确定众数的公式组距式数列确定众数的公式n下限公式:下限公式:n上限公式:上限公式:40 成绩(分)学生人数 (人)60以下60707080809090100 2152015 4合计56(分)(分)众数的近似公式众数的近似公式众数所在组的下限;众数所在组的下限;众数所在组的次数与其前一众数所在组的次数与其前一组的次数之差;组的次数之差;众数所在的次数与其后一组众数所在的次数与其后一组的次数之差;的次数之差;众数组的组距。众数组的组距。413.众数的几何意义众数的几何意义 42六、中位数六、中位数 n1.定义:定义:n中位数是将总体各个单位按其标志值的大小中位数是将总体各个单位按其标志值的大小顺序排列,处于数列中点的那个单位的标志顺序排列,处于数列中点的那个单位的标志值,在总体中,标志值小于中位数的单位占值,在总体中,标志值小于中位数的单位占一半;标志值大于中位数的单位也占一半。一半;标志值大于中位数的单位也占一半。Me50%50%X1Xn43 2.中位数的确定中位数的确定 n1)未分组资料确定中位数。未分组资料确定中位数。n将总体各单位的标志值按照大小顺序排列,将总体各单位的标志值按照大小顺序排列,n当总体单位数当总体单位数n为奇数时:为奇数时:n当总体单位数当总体单位数n为偶数时为偶数时,:44例n原始数据:84 82 81 86 80n排 序:80 81 82 84 86n位 置:1 2 3 4 5中位数位置中位数位置n+15+1322中位数中位数Me 8245n原始数据:84 82 81 86 80 90n排 序:80 81 82 84 86 90n位 置:1 2 3 4 5 6中位数中位数Me 83中位数位置中位数位置n+13.5226+1462)单项式分组资料确定中位数单项式分组资料确定中位数n当当 为奇数时:为奇数时:,n当当 为偶数时为偶数时,473)组距式分组资料确定中位数组距式分组资料确定中位数n下限公式:下限公式:n上限公式:上限公式:48某公司职工按月工资分组某公司职工按月工资分组月工资(元)月工资(元)职工人数职工人数向上累计次数向上累计次数500以下以下208 208500-600314 522600-700382 904700-800456 1360800-900305 1665900-1000237 19021000-110078 19801100以上以上20 2000合计合计2000 49(元)(元)50 测度数据在特定位置上的水平,还可计算四分测度数据在特定位置上的水平,还可计算四分位数、十分位数和百分位数。与中位数计算原理位数、十分位数和百分位数。与中位数计算原理相类似,它们是将数据由小到大排序后,分别位相类似,它们是将数据由小到大排序后,分别位于全部数据于全部数据1/4、1/10和和1/100位置上的数值。实际位置上的数值。实际上,中位数也就是第二个四分位数、第五个十分上,中位数也就是第二个四分位数、第五个十分位数、第五十个百分位数。位数、第五十个百分位数。P是想要得到的那个分位数,n是数据的项数,是多少分位数。3.3.其他分位数其他分位数51 四分位数四分位数四分位数是通过四分位数是通过3 3个点将全部数据等分为个点将全部数据等分为4 4部分,其中每部部分,其中每部分包括分包括25%25%的数据。很显然,第二个四分位数就是中位数,因的数据。很显然,第二个四分位数就是中位数,因此通常所说的四分位数是指处在此通常所说的四分位数是指处在25%25%位置上的数值(下四分位位置上的数值(下四分位数数Q1 )和处在)和处在75%位置上的数值(上四分位数位置上的数值(上四分位数Q3 )。与中位)。与中位数的计算方法类似,根据未分组数据计算四分位数时,首先数的计算方法类似,根据未分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置。对数据进行排序,然后确定四分位数所在的位置。52 中位数、众数和算术平均数的关系中位数、众数和算术平均数的关系:中位数、众数和算术平均数之间的数量中位数、众数和算术平均数之间的数量关系决定于总体内次数分配的状况。关系决定于总体内次数分配的状况。对称钟形分布情形下:对称钟形分布情形下:非对称左偏分布情形下:非对称左偏分布情形下:非对称右偏分布情形下:非对称右偏分布情形下:53众数、中位数和均值的关系图众数、中位数和均值的关系图对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数 0时为正偏斜;当时为正偏斜;当 0)(0时,表示频数分布比正态分布更集中,分时,表示频数分布比正态分布更集中,分布呈尖峰状态,布呈尖峰状态,0)(=0)(0)73