4-描述统计中的测度解析.ppt
《4-描述统计中的测度解析.ppt》由会员分享,可在线阅读,更多相关《4-描述统计中的测度解析.ppt(94页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、3 统计数据的测度统计数据的测度表示统计资料的特征数有哪些?表示统计资料的特征数有哪些?集中趋势集中趋势:对频数分布资料的集中状况和平对频数分布资料的集中状况和平均水平的综合测度,均水平的综合测度,集中性集中性和和共性共性。离中趋势离中趋势:对频数分布资料的差异程度和离:对频数分布资料的差异程度和离散程度的测度,用来衡量散程度的测度,用来衡量稳定性稳定性和和均匀性均匀性。1第一节第一节 集中趋势的描述集中趋势的描述集中趋势集中趋势 集中趋势集中趋势(central tendency),),亦称为趋中性。亦称为趋中性。是是指一组数据向某一中心值靠拢的程度,它反映了一组指一组数据向某一中心值靠拢的
2、程度,它反映了一组数据中心点的位置所在。或者说各观察值有一种向中数据中心点的位置所在。或者说各观察值有一种向中心集中的趋势,在中心附近的观察值数目较多,远离心集中的趋势,在中心附近的观察值数目较多,远离中心的较少。中心的较少。一般用平均指标来表示。一般用平均指标来表示。一、集中趋势与平均指标一、集中趋势与平均指标2第一节第一节 集中趋势的描述集中趋势的描述一、集中趋势与平均指标一、集中趋势与平均指标将变量的各变量值将变量的各变量值差异差异抽象化,以反映变量值一般水抽象化,以反映变量值一般水平或平均水平的指标。其数值表现称为平均数。平或平均水平的指标。其数值表现称为平均数。平均指标平均指标(Av
3、erage Indicators)先进水平,一般水平,落后水平先进水平,一般水平,落后水平一条平均深度只有一条平均深度只有0.5米的河,你可以安全走着过河米的河,你可以安全走着过河吗?吗?31.平均指标的种类平均指标的种类从总体各单位变量值从总体各单位变量值中抽象出具有一般水中抽象出具有一般水平的量,这个量是根平的量,这个量是根据各个单位的具体标据各个单位的具体标志值志值计算出来计算出来的,有的,有算术平均数、调和平算术平均数、调和平均数、几何平均数等均数、几何平均数等形式。形式。先将总体各单位的变量先将总体各单位的变量值按一定顺序排列,然值按一定顺序排列,然后取后取某一位置某一位置的变量值的
4、变量值来反映总体各单位的一来反映总体各单位的一般水平。般水平。具体标志值是具体标志值是确定出来确定出来的。的。有众数、有众数、中位数、四分位数等形中位数、四分位数等形式。式。计算方法不同计算方法不同数值平均数数值平均数位置平均数位置平均数4二、数值平均数二、数值平均数引例引例 某班某班6个学生的年龄(个学生的年龄(X)为:)为:16,21,22,23,18,17现求该现求该6个学生的平均年龄?个学生的平均年龄?如果已知如果已知36个学生的年龄,会算吗?个学生的年龄,会算吗?52.平均指标的作用平均指标的作用利用平利用平均指标均指标可对不可对不同空间同空间的发展的发展水平进水平进行比较行比较可以
5、对某一现可以对某一现象总体在不同象总体在不同时间上的发展时间上的发展水平进行比较,水平进行比较,说明现象发展说明现象发展变化的趋势或变化的趋势或规律性规律性帮助人们对帮助人们对研究研究 现现象的一般数象的一般数量特征有一量特征有一个客观的认个客观的认识识利用平均利用平均指标可以指标可以分析现象分析现象之间的依之间的依存关系或存关系或进行数量进行数量上的推算上的推算平均指标平均指标还可以作还可以作为研究和为研究和评价事物评价事物的一种数的一种数量标准或量标准或参考参考6引例引例 某班某班36个学生的年龄(个学生的年龄(X)分布如下表:)分布如下表:年龄年龄 21 20 19 18 17人数人数
6、5 6 18 4 3,现求该班的平均年龄?,现求该班的平均年龄?解:解:年年龄龄人数人数21201918175618437二、数值平均数二、数值平均数(一)(一)算术平均数算术平均数(Arithmetic Average)算术平均数称为均值,是观察值的总和算术平均数称为均值,是观察值的总和除以观察值个数的商除以观察值个数的商1.概念概念2.分类分类简单算术平均数简单算术平均数加权算术平均数加权算术平均数8例例3.1:中国统计年鉴中国统计年鉴2008资料显示,资料显示,2007年我国各省份(直辖年我国各省份(直辖市)创造的市)创造的GDP(以当年价格计算,单位:亿元)如表所示,计算(以当年价格计
7、算,单位:亿元)如表所示,计算各省份(直辖市)各省份(直辖市)GDP的平均规模。的平均规模。省份(市)省份(市)GDP省份(市)省份(市)GDP省份(市)省份(市)GDP 北北 京京9353.32 辽辽 宁宁11023.49 江江 西西5500.25 天天 津津5050.40 吉吉 林林5284.69 山山 东东25965.91 河河 北北13709.50 黑黑龙龙江江7065.00 重重 庆庆4122.51 山山 西西5733.35 河河 南南15012.46 四四 川川10505.30 内蒙古内蒙古6091.12 湖湖 北北9230.68 贵贵 州州2741.90 上上 海海12188.8
8、5 湖湖 南南9200.00 西西 藏藏342.19 江江 苏苏25741.15 广广 东东31084.40 陕陕 西西5465.79 浙浙 江江18780.44 广广 西西5955.65 甘甘 肃肃2702.40 安安 徽徽7364.18 海海 南南1223.28 青青 海海783.61 福福 建建9249.13 云云 南南4741.31 宁宁 夏夏889.20 新新 疆疆3523.169简单算术平均数的公式往往用简单算术平均数的公式往往用于未经分组整理的原始数据于未经分组整理的原始数据10例例3.3:设某厂职工按日产量分组后所得组距数列设某厂职工按日产量分组后所得组距数列如下所示,据此求该
9、厂职工的平均日产量。如下所示,据此求该厂职工的平均日产量。按日产量分组按日产量分组(千克千克)工人数工人数(人人)60 以下以下 1060 70 1970 80 5080 90 36 90 100 27100 110 14110 以上以上 8合合 计计 16411组中值组中值xi xifi5555065 1235 75 3750 85 3060 95 2565105 1470115 920-13550加权算术平加权算术平加权算术平加权算术平均数公式往均数公式往均数公式往均数公式往往用于分过往用于分过往用于分过往用于分过组经过整理组经过整理组经过整理组经过整理的数据的数据的数据的数据12按日产量
10、分组按日产量分组(千克千克)组中值组中值xi(千克千克)频数(或频率)频数(或频率)fifi/fi 60 以下以下 55 100.06 3.360 70 65 190.12 7.870 80 75 500.30 22.580 90 85 360.22 18.7 90 100 95 270.16 15.2 100 110 105 140.09 9.45110 以上以上115 80.05 5.75合合 计计-1641.00 82.62权数转换权数转换13(2)算术平均数的大小,取决于研究对象的)算术平均数的大小,取决于研究对象的变量值(变量值(x)和各变量值重复出现的频数和各变量值重复出现的频数(
11、f)或频率或频率 (fifi)大小的大小的影响。影响。3.注意点注意点(3)权数的表现形式)权数的表现形式(1)简单算术平均数和加权算数平均数的关系)简单算术平均数和加权算数平均数的关系绝对权数绝对权数相对权数相对权数14 变量值与其算术平均数的离差之和衡等于零,变量值与其算术平均数的离差之和衡等于零,即:即:变量值与其算术平均数的离差平方和为最小,变量值与其算术平均数的离差平方和为最小,即:即:算术平均数的主要数学性质算术平均数的主要数学性质算术平均数的主要数学性质算术平均数的主要数学性质15离差的概念离差的概念离差的概念离差的概念12345678-1-1-2130165.算术平均数的优缺点
12、算术平均数的优缺点 优点优点(1)可用于推算总体标志总量可用于推算总体标志总量(2)代表性强,在抽样中具有良好的稳定性和可靠性代表性强,在抽样中具有良好的稳定性和可靠性(3)可以进行代数运算可以进行代数运算 缺点缺点 (1)当总体中个别单位标志值特别大或特别小时,会导致算当总体中个别单位标志值特别大或特别小时,会导致算术平均数偏大或偏小术平均数偏大或偏小 (2)当组距数列有开口组时,组中值有较大假定性当组距数列有开口组时,组中值有较大假定性17链接例子链接例子1:F1比赛时,比赛时,A车手第一圈时速车手第一圈时速300公里,第公里,第二圈时速二圈时速340公里,公里,B车手第一圈时速车手第一圈
13、时速320公里,第二圈时速公里,第二圈时速318。请问:只赛两圈谁。请问:只赛两圈谁获胜?获胜?链接例子链接例子2,小学四年级的算术题:小学四年级的算术题:一辆小车以每小时一辆小车以每小时80公里的速度从山下公里的速度从山下开到山顶,又以每小时开到山顶,又以每小时100公里的速度公里的速度沿原路返回到山下,问:该车的平均速沿原路返回到山下,问:该车的平均速度。度。80km/h80km/h100km/h100km/h18如果该车山下如果该车山下,山顶来回开,山顶来回开,n次的速度次的速度分别为分别为x1,x2,x3,xn,则平均速度就成,则平均速度就成为:为:推推广广这一计算方式被定义为这一计算
14、方式被定义为“调和平均数调和平均数”(H)变量值倒数的算术平变量值倒数的算术平均数的倒数,故又称均数的倒数,故又称为为“倒数平均数倒数平均数”(二)调和平均数(二)调和平均数(harmonic mean)1.1.简单调和平均数简单调和平均数(1)作为算术平均的变形)作为算术平均的变形例例3.4:三种不同等级的三种不同等级的桔子,每公斤单价分别桔子,每公斤单价分别为为2元、元、4元、元、5元。每种元。每种等级各买等级各买1元,则均价是元,则均价是多少?多少?定义:调和平均数定义:调和平均数是变量值倒数的算术平均数的是变量值倒数的算术平均数的倒数。又称倒数平均数。调和平均通常是作为算倒数。又称倒数
15、平均数。调和平均通常是作为算术平均数的变形来使用的。但一些特殊的领域,术平均数的变形来使用的。但一些特殊的领域,如综合评价,调和平均却是一种独立的统计平均如综合评价,调和平均却是一种独立的统计平均数,有着特定的应用价值。数,有着特定的应用价值。例例3.4等价于:三种等级的桔子等价于:三种等级的桔子单价分别为单价分别为2元元/公斤、公斤、4元元/公公斤、斤、5元元/公斤,分别购买公斤,分别购买0.5公公斤、斤、0.25公斤、公斤、0.2公斤,要求公斤,要求计算平均价格。计算平均价格。适用于总体资料未经分组整理、适用于总体资料未经分组整理、尚为原始资料的情况尚为原始资料的情况2.加权调和平均数加权
16、调和平均数例例3.7:法拉利队的车王迈克尔法拉利队的车王迈克尔舒马赫在舒马赫在2004年年9月初的一次试车中(月初的一次试车中(F2004),以每小时),以每小时320公里公里的速度开了的速度开了52圈,以每小时圈,以每小时345公里的速度开了公里的速度开了35圈,而队友巴里切罗以每小时圈,而队友巴里切罗以每小时322公里的速度公里的速度开了开了45圈,以每小时圈,以每小时337公里的速度开了公里的速度开了42圈,圈,求两人各自的平均车速。求两人各自的平均车速。例例3.8:三种不同等级的桔子分别买三种不同等级的桔子分别买5元、元、6元、元、10元,每公元,每公斤单价分别为斤单价分别为2元、元、
17、4元、元、5元,则平均价格是多少?元,则平均价格是多少?加权调和平均数的基本公式加权调和平均数的基本公式选择合适的选择合适的xi,合适的权重,合适的权重mi 应该以组平均作为应该以组平均作为x xi i,若无,则用组中值近似代表,若无,则用组中值近似代表权重权重m mi i应该是具有实际意义的应该是具有实际意义的“各组标志总量各组标志总量”适用于总体资料经过分组整理形成适用于总体资料经过分组整理形成变量数列的情况变量数列的情况调和平均数易受极端值的影响,且受极小值的影响调和平均数易受极端值的影响,且受极小值的影响比受极大值的影响更大。比受极大值的影响更大。只要有一个变量值为零,就不能计算调和平
18、均数。只要有一个变量值为零,就不能计算调和平均数。当组距数列有开口组时,其组中值即使按相邻组距当组距数列有开口组时,其组中值即使按相邻组距计算了,假定性也很大,这时,调和平均数的代表计算了,假定性也很大,这时,调和平均数的代表性就很不可靠。性就很不可靠。调和平均数应用的范围较小。调和平均数应用的范围较小。D.调和平均的特点调和平均的特点25甲乙两农贸市场三种农产品的价格和成交量和成交额如甲乙两农贸市场三种农产品的价格和成交量和成交额如下:下:产品产品 价格价格 甲市场成交额甲市场成交额 乙市场成交量乙市场成交量 (元(元/斤)斤)(万元)(万元)(万斤)(万斤)A 1.2 1.2 2B 1.4
19、 2.8 1C 1.5 1.5 1分别求两个市场农产品的平均价格分别求两个市场农产品的平均价格。思考题:思考题:26是是是是N N项变量值连乘积的开项变量值连乘积的开项变量值连乘积的开项变量值连乘积的开N N次方根。次方根。次方根。次方根。几何平均数几何平均数mm 各个比率或速度的连乘积等于总比率或总速度;各个比率或速度的连乘积等于总比率或总速度;各个比率或速度的连乘积等于总比率或总速度;各个比率或速度的连乘积等于总比率或总速度;mm 相乘的各个比率或速度不为零或负值。相乘的各个比率或速度不为零或负值。相乘的各个比率或速度不为零或负值。相乘的各个比率或速度不为零或负值。简单简单简单简单几何平均
20、数几何平均数几何平均数几何平均数适用于总体资料未经分组整理适用于总体资料未经分组整理适用于总体资料未经分组整理适用于总体资料未经分组整理尚为原始资料的情况尚为原始资料的情况尚为原始资料的情况尚为原始资料的情况式中:式中:式中:式中:为几何平均数为几何平均数为几何平均数为几何平均数;为变量值的个数;为变量值的个数;为变量值的个数;为变量值的个数;为第为第为第为第 个变量值。个变量值。个变量值。个变量值。适用对象:现象的总比率是若干项变量的乘积,适用对象:现象的总比率是若干项变量的乘积,适用对象:现象的总比率是若干项变量的乘积,适用对象:现象的总比率是若干项变量的乘积,或现象的总发展速度是各时期发
21、展速度的连乘或现象的总发展速度是各时期发展速度的连乘或现象的总发展速度是各时期发展速度的连乘或现象的总发展速度是各时期发展速度的连乘积时,计算平均比率或平均发展速度。积时,计算平均比率或平均发展速度。积时,计算平均比率或平均发展速度。积时,计算平均比率或平均发展速度。27【例例5 5】某流水生产线有前后衔接的五道工序。某日各工序某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为产品的合格率分别为9595、9292、9090、8585、8080,求整,求整个流水生产线产品的平均合格率。个流水生产线产品的平均合格率。设最初投产设最初投产100A100A个单位个单位 ,则,则第一道工序的
22、合格品为第一道工序的合格品为100A100A0.950.95;第二道工序的合格品为第二道工序的合格品为(100A100A0.950.95)0.920.92;第五道工序的合格品为第五道工序的合格品为(100A100A0.950.950.920.920.900.900.850.85)0.800.80;因该流水线的最终合格品即为第五道工序的合格品,故该流水线总的合格品应为:100A0.950.920.900.850.80;则该流水线产品总的合格率为:28解:解:因该流水线的最终合格品即为第五道工序的合因该流水线的最终合格品即为第五道工序的合格品,格品,故该流水线总的合格品应为故该流水线总的合格品应为
23、 100A0.950.920.900.850.80;则该流水线产品总的合格率为:则该流水线产品总的合格率为:即该流水线总的合格率等于各工序合格率的连乘积,符合即该流水线总的合格率等于各工序合格率的连乘积,符合即该流水线总的合格率等于各工序合格率的连乘积,符合即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。几何平均数的适用条件,故需采用几何平均法计算。几何平均数的适用条件,故需采用几何平均法计算。几何平均数的适用条件,故需采用几何平均法计算。29思考思考若上题中不是由五道连续作业的工序组成的流水生产线,若上题中不是由五道连续作业的工序组成的流水生产
24、线,若上题中不是由五道连续作业的工序组成的流水生产线,若上题中不是由五道连续作业的工序组成的流水生产线,而是五个而是五个而是五个而是五个独立作业的车间独立作业的车间独立作业的车间独立作业的车间,且各车间的合格率同前,又假,且各车间的合格率同前,又假,且各车间的合格率同前,又假,且各车间的合格率同前,又假定各车间的产量相等均为定各车间的产量相等均为定各车间的产量相等均为定各车间的产量相等均为100100100100件,求该企业的平均合格率件,求该企业的平均合格率件,求该企业的平均合格率件,求该企业的平均合格率。几何平均数的计算方法几何平均数的计算方法几何平均数的计算方法几何平均数的计算方法 因各
25、车间彼此独立作业,所以有因各车间彼此独立作业,所以有因各车间彼此独立作业,所以有因各车间彼此独立作业,所以有 第一车间的合格品为:第一车间的合格品为:第一车间的合格品为:第一车间的合格品为:1000.951000.95;第二车间的合格品为:第二车间的合格品为:第二车间的合格品为:第二车间的合格品为:1000.921000.92;第五车间的合格品为:第五车间的合格品为:第五车间的合格品为:第五车间的合格品为:1000.801000.80。则该企业全部合格品应为各车间合格品的总和,即则该企业全部合格品应为各车间合格品的总和,即则该企业全部合格品应为各车间合格品的总和,即则该企业全部合格品应为各车间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 描述 统计 中的 测度 解析
限制150内