欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    4-描述统计中的测度解析.ppt

    • 资源ID:74919906       资源大小:2.93MB        全文页数:94页
    • 资源格式: PPT        下载积分:30金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要30金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    4-描述统计中的测度解析.ppt

    3 统计数据的测度统计数据的测度表示统计资料的特征数有哪些?表示统计资料的特征数有哪些?集中趋势集中趋势:对频数分布资料的集中状况和平对频数分布资料的集中状况和平均水平的综合测度,均水平的综合测度,集中性集中性和和共性共性。离中趋势离中趋势:对频数分布资料的差异程度和离:对频数分布资料的差异程度和离散程度的测度,用来衡量散程度的测度,用来衡量稳定性稳定性和和均匀性均匀性。1第一节第一节 集中趋势的描述集中趋势的描述集中趋势集中趋势 集中趋势集中趋势(central tendency),),亦称为趋中性。亦称为趋中性。是是指一组数据向某一中心值靠拢的程度,它反映了一组指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。或者说各观察值有一种向中数据中心点的位置所在。或者说各观察值有一种向中心集中的趋势,在中心附近的观察值数目较多,远离心集中的趋势,在中心附近的观察值数目较多,远离中心的较少。中心的较少。一般用平均指标来表示。一般用平均指标来表示。一、集中趋势与平均指标一、集中趋势与平均指标2第一节第一节 集中趋势的描述集中趋势的描述一、集中趋势与平均指标一、集中趋势与平均指标将变量的各变量值将变量的各变量值差异差异抽象化,以反映变量值一般水抽象化,以反映变量值一般水平或平均水平的指标。其数值表现称为平均数。平或平均水平的指标。其数值表现称为平均数。平均指标平均指标(Average Indicators)先进水平,一般水平,落后水平先进水平,一般水平,落后水平一条平均深度只有一条平均深度只有0.5米的河,你可以安全走着过河米的河,你可以安全走着过河吗?吗?31.平均指标的种类平均指标的种类从总体各单位变量值从总体各单位变量值中抽象出具有一般水中抽象出具有一般水平的量,这个量是根平的量,这个量是根据各个单位的具体标据各个单位的具体标志值志值计算出来计算出来的,有的,有算术平均数、调和平算术平均数、调和平均数、几何平均数等均数、几何平均数等形式。形式。先将总体各单位的变量先将总体各单位的变量值按一定顺序排列,然值按一定顺序排列,然后取后取某一位置某一位置的变量值的变量值来反映总体各单位的一来反映总体各单位的一般水平。般水平。具体标志值是具体标志值是确定出来确定出来的。的。有众数、有众数、中位数、四分位数等形中位数、四分位数等形式。式。计算方法不同计算方法不同数值平均数数值平均数位置平均数位置平均数4二、数值平均数二、数值平均数引例引例 某班某班6个学生的年龄(个学生的年龄(X)为:)为:16,21,22,23,18,17现求该现求该6个学生的平均年龄?个学生的平均年龄?如果已知如果已知36个学生的年龄,会算吗?个学生的年龄,会算吗?52.平均指标的作用平均指标的作用利用平利用平均指标均指标可对不可对不同空间同空间的发展的发展水平进水平进行比较行比较可以对某一现可以对某一现象总体在不同象总体在不同时间上的发展时间上的发展水平进行比较,水平进行比较,说明现象发展说明现象发展变化的趋势或变化的趋势或规律性规律性帮助人们对帮助人们对研究研究 现现象的一般数象的一般数量特征有一量特征有一个客观的认个客观的认识识利用平均利用平均指标可以指标可以分析现象分析现象之间的依之间的依存关系或存关系或进行数量进行数量上的推算上的推算平均指标平均指标还可以作还可以作为研究和为研究和评价事物评价事物的一种数的一种数量标准或量标准或参考参考6引例引例 某班某班36个学生的年龄(个学生的年龄(X)分布如下表:)分布如下表:年龄年龄 21 20 19 18 17人数人数 5 6 18 4 3,现求该班的平均年龄?,现求该班的平均年龄?解:解:年年龄龄人数人数21201918175618437二、数值平均数二、数值平均数(一)(一)算术平均数算术平均数(Arithmetic Average)算术平均数称为均值,是观察值的总和算术平均数称为均值,是观察值的总和除以观察值个数的商除以观察值个数的商1.概念概念2.分类分类简单算术平均数简单算术平均数加权算术平均数加权算术平均数8例例3.1:中国统计年鉴中国统计年鉴2008资料显示,资料显示,2007年我国各省份(直辖年我国各省份(直辖市)创造的市)创造的GDP(以当年价格计算,单位:亿元)如表所示,计算(以当年价格计算,单位:亿元)如表所示,计算各省份(直辖市)各省份(直辖市)GDP的平均规模。的平均规模。省份(市)省份(市)GDP省份(市)省份(市)GDP省份(市)省份(市)GDP 北北 京京9353.32 辽辽 宁宁11023.49 江江 西西5500.25 天天 津津5050.40 吉吉 林林5284.69 山山 东东25965.91 河河 北北13709.50 黑黑龙龙江江7065.00 重重 庆庆4122.51 山山 西西5733.35 河河 南南15012.46 四四 川川10505.30 内蒙古内蒙古6091.12 湖湖 北北9230.68 贵贵 州州2741.90 上上 海海12188.85 湖湖 南南9200.00 西西 藏藏342.19 江江 苏苏25741.15 广广 东东31084.40 陕陕 西西5465.79 浙浙 江江18780.44 广广 西西5955.65 甘甘 肃肃2702.40 安安 徽徽7364.18 海海 南南1223.28 青青 海海783.61 福福 建建9249.13 云云 南南4741.31 宁宁 夏夏889.20 新新 疆疆3523.169简单算术平均数的公式往往用简单算术平均数的公式往往用于未经分组整理的原始数据于未经分组整理的原始数据10例例3.3:设某厂职工按日产量分组后所得组距数列设某厂职工按日产量分组后所得组距数列如下所示,据此求该厂职工的平均日产量。如下所示,据此求该厂职工的平均日产量。按日产量分组按日产量分组(千克千克)工人数工人数(人人)60 以下以下 1060 70 1970 80 5080 90 36 90 100 27100 110 14110 以上以上 8合合 计计 16411组中值组中值xi xifi5555065 1235 75 3750 85 3060 95 2565105 1470115 920-13550加权算术平加权算术平加权算术平加权算术平均数公式往均数公式往均数公式往均数公式往往用于分过往用于分过往用于分过往用于分过组经过整理组经过整理组经过整理组经过整理的数据的数据的数据的数据12按日产量分组按日产量分组(千克千克)组中值组中值xi(千克千克)频数(或频率)频数(或频率)fifi/fi 60 以下以下 55 100.06 3.360 70 65 190.12 7.870 80 75 500.30 22.580 90 85 360.22 18.7 90 100 95 270.16 15.2 100 110 105 140.09 9.45110 以上以上115 80.05 5.75合合 计计-1641.00 82.62权数转换权数转换13(2)算术平均数的大小,取决于研究对象的)算术平均数的大小,取决于研究对象的变量值(变量值(x)和各变量值重复出现的频数和各变量值重复出现的频数(f)或频率或频率 (fifi)大小的大小的影响。影响。3.注意点注意点(3)权数的表现形式)权数的表现形式(1)简单算术平均数和加权算数平均数的关系)简单算术平均数和加权算数平均数的关系绝对权数绝对权数相对权数相对权数14 变量值与其算术平均数的离差之和衡等于零,变量值与其算术平均数的离差之和衡等于零,即:即:变量值与其算术平均数的离差平方和为最小,变量值与其算术平均数的离差平方和为最小,即:即:算术平均数的主要数学性质算术平均数的主要数学性质算术平均数的主要数学性质算术平均数的主要数学性质15离差的概念离差的概念离差的概念离差的概念12345678-1-1-2130165.算术平均数的优缺点算术平均数的优缺点 优点优点(1)可用于推算总体标志总量可用于推算总体标志总量(2)代表性强,在抽样中具有良好的稳定性和可靠性代表性强,在抽样中具有良好的稳定性和可靠性(3)可以进行代数运算可以进行代数运算 缺点缺点 (1)当总体中个别单位标志值特别大或特别小时,会导致算当总体中个别单位标志值特别大或特别小时,会导致算术平均数偏大或偏小术平均数偏大或偏小 (2)当组距数列有开口组时,组中值有较大假定性当组距数列有开口组时,组中值有较大假定性17链接例子链接例子1:F1比赛时,比赛时,A车手第一圈时速车手第一圈时速300公里,第公里,第二圈时速二圈时速340公里,公里,B车手第一圈时速车手第一圈时速320公里,第二圈时速公里,第二圈时速318。请问:只赛两圈谁。请问:只赛两圈谁获胜?获胜?链接例子链接例子2,小学四年级的算术题:小学四年级的算术题:一辆小车以每小时一辆小车以每小时80公里的速度从山下公里的速度从山下开到山顶,又以每小时开到山顶,又以每小时100公里的速度公里的速度沿原路返回到山下,问:该车的平均速沿原路返回到山下,问:该车的平均速度。度。80km/h80km/h100km/h100km/h18如果该车山下如果该车山下,山顶来回开,山顶来回开,n次的速度次的速度分别为分别为x1,x2,x3,xn,则平均速度就成,则平均速度就成为:为:推推广广这一计算方式被定义为这一计算方式被定义为“调和平均数调和平均数”(H)变量值倒数的算术平变量值倒数的算术平均数的倒数,故又称均数的倒数,故又称为为“倒数平均数倒数平均数”(二)调和平均数(二)调和平均数(harmonic mean)1.1.简单调和平均数简单调和平均数(1)作为算术平均的变形)作为算术平均的变形例例3.4:三种不同等级的三种不同等级的桔子,每公斤单价分别桔子,每公斤单价分别为为2元、元、4元、元、5元。每种元。每种等级各买等级各买1元,则均价是元,则均价是多少?多少?定义:调和平均数定义:调和平均数是变量值倒数的算术平均数的是变量值倒数的算术平均数的倒数。又称倒数平均数。调和平均通常是作为算倒数。又称倒数平均数。调和平均通常是作为算术平均数的变形来使用的。但一些特殊的领域,术平均数的变形来使用的。但一些特殊的领域,如综合评价,调和平均却是一种独立的统计平均如综合评价,调和平均却是一种独立的统计平均数,有着特定的应用价值。数,有着特定的应用价值。例例3.4等价于:三种等级的桔子等价于:三种等级的桔子单价分别为单价分别为2元元/公斤、公斤、4元元/公公斤、斤、5元元/公斤,分别购买公斤,分别购买0.5公公斤、斤、0.25公斤、公斤、0.2公斤,要求公斤,要求计算平均价格。计算平均价格。适用于总体资料未经分组整理、适用于总体资料未经分组整理、尚为原始资料的情况尚为原始资料的情况2.加权调和平均数加权调和平均数例例3.7:法拉利队的车王迈克尔法拉利队的车王迈克尔舒马赫在舒马赫在2004年年9月初的一次试车中(月初的一次试车中(F2004),以每小时),以每小时320公里公里的速度开了的速度开了52圈,以每小时圈,以每小时345公里的速度开了公里的速度开了35圈,而队友巴里切罗以每小时圈,而队友巴里切罗以每小时322公里的速度公里的速度开了开了45圈,以每小时圈,以每小时337公里的速度开了公里的速度开了42圈,圈,求两人各自的平均车速。求两人各自的平均车速。例例3.8:三种不同等级的桔子分别买三种不同等级的桔子分别买5元、元、6元、元、10元,每公元,每公斤单价分别为斤单价分别为2元、元、4元、元、5元,则平均价格是多少?元,则平均价格是多少?加权调和平均数的基本公式加权调和平均数的基本公式选择合适的选择合适的xi,合适的权重,合适的权重mi 应该以组平均作为应该以组平均作为x xi i,若无,则用组中值近似代表,若无,则用组中值近似代表权重权重m mi i应该是具有实际意义的应该是具有实际意义的“各组标志总量各组标志总量”适用于总体资料经过分组整理形成适用于总体资料经过分组整理形成变量数列的情况变量数列的情况调和平均数易受极端值的影响,且受极小值的影响调和平均数易受极端值的影响,且受极小值的影响比受极大值的影响更大。比受极大值的影响更大。只要有一个变量值为零,就不能计算调和平均数。只要有一个变量值为零,就不能计算调和平均数。当组距数列有开口组时,其组中值即使按相邻组距当组距数列有开口组时,其组中值即使按相邻组距计算了,假定性也很大,这时,调和平均数的代表计算了,假定性也很大,这时,调和平均数的代表性就很不可靠。性就很不可靠。调和平均数应用的范围较小。调和平均数应用的范围较小。D.调和平均的特点调和平均的特点25甲乙两农贸市场三种农产品的价格和成交量和成交额如甲乙两农贸市场三种农产品的价格和成交量和成交额如下:下:产品产品 价格价格 甲市场成交额甲市场成交额 乙市场成交量乙市场成交量 (元(元/斤)斤)(万元)(万元)(万斤)(万斤)A 1.2 1.2 2B 1.4 2.8 1C 1.5 1.5 1分别求两个市场农产品的平均价格分别求两个市场农产品的平均价格。思考题:思考题:26是是是是N N项变量值连乘积的开项变量值连乘积的开项变量值连乘积的开项变量值连乘积的开N N次方根。次方根。次方根。次方根。几何平均数几何平均数mm 各个比率或速度的连乘积等于总比率或总速度;各个比率或速度的连乘积等于总比率或总速度;各个比率或速度的连乘积等于总比率或总速度;各个比率或速度的连乘积等于总比率或总速度;mm 相乘的各个比率或速度不为零或负值。相乘的各个比率或速度不为零或负值。相乘的各个比率或速度不为零或负值。相乘的各个比率或速度不为零或负值。简单简单简单简单几何平均数几何平均数几何平均数几何平均数适用于总体资料未经分组整理适用于总体资料未经分组整理适用于总体资料未经分组整理适用于总体资料未经分组整理尚为原始资料的情况尚为原始资料的情况尚为原始资料的情况尚为原始资料的情况式中:式中:式中:式中:为几何平均数为几何平均数为几何平均数为几何平均数;为变量值的个数;为变量值的个数;为变量值的个数;为变量值的个数;为第为第为第为第 个变量值。个变量值。个变量值。个变量值。适用对象:现象的总比率是若干项变量的乘积,适用对象:现象的总比率是若干项变量的乘积,适用对象:现象的总比率是若干项变量的乘积,适用对象:现象的总比率是若干项变量的乘积,或现象的总发展速度是各时期发展速度的连乘或现象的总发展速度是各时期发展速度的连乘或现象的总发展速度是各时期发展速度的连乘或现象的总发展速度是各时期发展速度的连乘积时,计算平均比率或平均发展速度。积时,计算平均比率或平均发展速度。积时,计算平均比率或平均发展速度。积时,计算平均比率或平均发展速度。27【例例5 5】某流水生产线有前后衔接的五道工序。某日各工序某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为产品的合格率分别为9595、9292、9090、8585、8080,求整,求整个流水生产线产品的平均合格率。个流水生产线产品的平均合格率。设最初投产设最初投产100A100A个单位个单位 ,则,则第一道工序的合格品为第一道工序的合格品为100A100A0.950.95;第二道工序的合格品为第二道工序的合格品为(100A100A0.950.95)0.920.92;第五道工序的合格品为第五道工序的合格品为(100A100A0.950.950.920.920.900.900.850.85)0.800.80;因该流水线的最终合格品即为第五道工序的合格品,故该流水线总的合格品应为:100A0.950.920.900.850.80;则该流水线产品总的合格率为:28解:解:因该流水线的最终合格品即为第五道工序的合因该流水线的最终合格品即为第五道工序的合格品,格品,故该流水线总的合格品应为故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:则该流水线产品总的合格率为:即该流水线总的合格率等于各工序合格率的连乘积,符合即该流水线总的合格率等于各工序合格率的连乘积,符合即该流水线总的合格率等于各工序合格率的连乘积,符合即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。几何平均数的适用条件,故需采用几何平均法计算。几何平均数的适用条件,故需采用几何平均法计算。几何平均数的适用条件,故需采用几何平均法计算。29思考思考若上题中不是由五道连续作业的工序组成的流水生产线,若上题中不是由五道连续作业的工序组成的流水生产线,若上题中不是由五道连续作业的工序组成的流水生产线,若上题中不是由五道连续作业的工序组成的流水生产线,而是五个而是五个而是五个而是五个独立作业的车间独立作业的车间独立作业的车间独立作业的车间,且各车间的合格率同前,又假,且各车间的合格率同前,又假,且各车间的合格率同前,又假,且各车间的合格率同前,又假定各车间的产量相等均为定各车间的产量相等均为定各车间的产量相等均为定各车间的产量相等均为100100100100件,求该企业的平均合格率件,求该企业的平均合格率件,求该企业的平均合格率件,求该企业的平均合格率。几何平均数的计算方法几何平均数的计算方法几何平均数的计算方法几何平均数的计算方法 因各车间彼此独立作业,所以有因各车间彼此独立作业,所以有因各车间彼此独立作业,所以有因各车间彼此独立作业,所以有 第一车间的合格品为:第一车间的合格品为:第一车间的合格品为:第一车间的合格品为:1000.951000.95;第二车间的合格品为:第二车间的合格品为:第二车间的合格品为:第二车间的合格品为:1000.921000.92;第五车间的合格品为:第五车间的合格品为:第五车间的合格品为:第五车间的合格品为:1000.801000.80。则该企业全部合格品应为各车间合格品的总和,即则该企业全部合格品应为各车间合格品的总和,即则该企业全部合格品应为各车间合格品的总和,即则该企业全部合格品应为各车间合格品的总和,即总合格品总合格品总合格品总合格品=1000.95+1000.80=1000.95+1000.8030应采用加权算术平均数公式计算,即应采用加权算术平均数公式计算,即应采用加权算术平均数公式计算,即应采用加权算术平均数公式计算,即31据报到,成都温江的兰花节上,一盆兰花卖价是据报到,成都温江的兰花节上,一盆兰花卖价是1100万元,这背万元,这背后是迅速壮大的后是迅速壮大的10万户成都养兰、炒兰户。他们当中,不少人是万户成都养兰、炒兰户。他们当中,不少人是在借高利贷炒兰,图谋暴利。专家称,成都兰市价格已涨到了疯在借高利贷炒兰,图谋暴利。专家称,成都兰市价格已涨到了疯狂的境地,投资兰花不能盲目跟风,狂的境地,投资兰花不能盲目跟风,“击鼓传花击鼓传花”式的投机最终式的投机最终会让人血本无归。会让人血本无归。红荷红荷黄金海岸黄金海岸龙女龙女彩蝶彩蝶32例例3.13:设某炒兰投资者从朋友处借得一笔高利贷,以季度为结算单位,每设某炒兰投资者从朋友处借得一笔高利贷,以季度为结算单位,每个季度生成的利息到期自动转为本金,一年连本带利付清。各季利率根据个季度生成的利息到期自动转为本金,一年连本带利付清。各季利率根据兰花价格变化适当调整。实际一年下来,第一季度的利率是兰花价格变化适当调整。实际一年下来,第一季度的利率是13%,第二季,第二季度的利率是度的利率是13.2%,第三季度的利率是,第三季度的利率是13.6%,第四季度的利率是,第四季度的利率是12.8%。问平均利率是多少?问平均利率是多少?即若借款总额为即若借款总额为L万元,则一年之后的付款额(本息和)为:万元,则一年之后的付款额(本息和)为:如果平均利率为如果平均利率为G,则应该有:则应该有:332.加权几何平均数加权几何平均数fi代表各个变量值出现的次数代表各个变量值出现的次数 例例 3.14:投资银行某笔投资的年利率是按复利计算的,投资银行某笔投资的年利率是按复利计算的,10年年的年利率分配是:第的年利率分配是:第1-2年为年为5%,第第3-5年为年为8%,第第6-8年为年为10%,第第9-10年为年为12%,求平均年利率。,求平均年利率。34若不按复利计算,若不按复利计算,35(1)(1)受极端值的影响较算术平均数小。受极端值的影响较算术平均数小。(2)(2)如果变量值有负值,计算出的几何平均如果变量值有负值,计算出的几何平均数就会成为负数或虚数。数就会成为负数或虚数。(3)(3)仅适用于具有等比或近似等比关系的数仅适用于具有等比或近似等比关系的数据。据。(4)(4)其对数是各变量值对数的算术平均数。其对数是各变量值对数的算术平均数。几何平均数特点几何平均数特点36某公司所属三个企业有关生产资料如下:某公司所属三个企业有关生产资料如下:(1)若三个企业生产同种产品,试计算平均合格率)若三个企业生产同种产品,试计算平均合格率(2)若三个企业生产不同产品,试计算平均合格率)若三个企业生产不同产品,试计算平均合格率(3)若三个企业为流水作业生产同一种产品,试计算平均合格率)若三个企业为流水作业生产同一种产品,试计算平均合格率企业企业合格率合格率(%)产品产量产品产量(件)(件)实际消耗工实际消耗工时(工时)时(工时)甲甲96100500乙乙95200450丙丙98300400思考题:37三、位置平均数三、位置平均数 位置平均数位置平均数,就是根据总体中处于特殊位置上,就是根据总体中处于特殊位置上的个别单位或部分单位的标志值来确定的代表值,的个别单位或部分单位的标志值来确定的代表值,它对于整个总体来说,具有非常直观的代表性,它对于整个总体来说,具有非常直观的代表性,因此,常用来反映分布的集中趋势。因此,常用来反映分布的集中趋势。众数众数中位数中位数分位数分位数38(一)中位数与分位数(一)中位数与分位数1.中位数中位数(Median)的含义的含义中位数是将数据按大小顺序排列起来,形成一个中位数是将数据按大小顺序排列起来,形成一个数列,数列,居于数列中间位置居于数列中间位置的那个数据就是中位数。的那个数据就是中位数。中位数用中位数用Me表示。表示。MMe e50%50%在一个等差数列或一个在一个等差数列或一个正态分布数列中,中位正态分布数列中,中位数就等于算术平均数。数就等于算术平均数。不受极端数值的影响不受极端数值的影响不受极端数值的影响不受极端数值的影响,在总体标志值差异很大时,具有较强,在总体标志值差异很大时,具有较强,在总体标志值差异很大时,具有较强,在总体标志值差异很大时,具有较强的代表性。的代表性。的代表性。的代表性。392.中位数的计算中位数的计算A.对于未分组的原始资料,首先必须将标志值按大小对于未分组的原始资料,首先必须将标志值按大小排序。设排序的结果为:排序。设排序的结果为:n 为奇数为奇数n 为偶数为偶数40491004860049950488004720049900513505460049300512005100049400514005180049600534004870050300490004980048900486505130051900例例3.15:24名名IT从业人员年薪资料表如下所示,计算该从业人员年薪资料表如下所示,计算该24名名IT人员的中位数人员的中位数排序得:排序得:中位数的位置在(中位数的位置在(24+1)/2=12.5,中位数在第,中位数在第12个数值个数值(49800)和第)和第13个数值(个数值(49900)之间,即)之间,即 Me=(49800+49900)/2=49850(元元)41(1)由单项数列确定中位数,直接按)由单项数列确定中位数,直接按 公式求出公式求出中位数所在组的位置,计算累计次数确定中位数所在中位数所在组的位置,计算累计次数确定中位数所在的组,组值即是中位数。的组,组值即是中位数。B.由分组资料确定中位数由分组资料确定中位数例例3.16:下表是某车间下表是某车间800名工人日加工零件数名工人日加工零件数分组情况,试计算该车间分组情况,试计算该车间工人日加工零件的中位数。工人日加工零件的中位数。42中位数的确定中位数的确定(单值数列)(单值数列)【例例8 8】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)日产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)10111213147010038015010070170550700800合计合计800计算该企业该日全部工人日产量的中位数。计算该企业该日全部工人日产量的中位数。计算该企业该日全部工人日产量的中位数。计算该企业该日全部工人日产量的中位数。中位数的位次:中位数的位次:中位数的位次:中位数的位次:43中位数的确定中位数的确定(组距数列)(组距数列)【例例9 9】某车间某车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产量(件)月产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50计算该车间工人月产量的中位数。计算该车间工人月产量的中位数。44中位数的确定中位数的确定(组距数列)(组距数列)共共 个单位个单位共共 个单位个单位共共 个单位个单位共共 个单位个单位LU中位数组中位数组中位数组中位数组组距为组距为d共共 个单位个单位假定该组内的单假定该组内的单假定该组内的单假定该组内的单位呈均匀分布位呈均匀分布位呈均匀分布位呈均匀分布共有单位数共有单位数共有单位数共有单位数 中位数公式为中位数公式为中位数公式为中位数公式为 该段长度应为该段长度应为该段长度应为该段长度应为 45中位数的作用及用法中位数的作用及用法中位数一定存在;中位数与算术平均数相近;中位数不受极端值影响;变量值与中位数离差绝对值之和最小。46中位数一定存在;中位数一定存在;中位数与算术平均数相近;中位数与算术平均数相近;中位数不受极端值影响;中位数不受极端值影响;变量值与中位数离差绝对值之和最小。变量值与中位数离差绝对值之和最小。变量值变量值34556910中位数中位数 5平均值平均值 6与中位数离差与中位数离差 -2 -1 0 0 1 4 5与平均数离差与平均数离差 -3 -2 -1 -1 0 3 4绝对绝对数值数值之和之和 13 14中位数的作用及用法中位数的作用及用法47(二)众数(二)众数(Mode)1.众数的含义众数的含义众数是指总体中出现次数最多的那个标志值。用众数是指总体中出现次数最多的那个标志值。用Mo表示。它主要用于表示。它主要用于定类(品质标志)定类(品质标志)数据的集中趋数据的集中趋势,当然也适用于作为定序(品质标志)数据以及势,当然也适用于作为定序(品质标志)数据以及定距和定比(数量标志)数据集中趋势的测度值。定距和定比(数量标志)数据集中趋势的测度值。众数也众数也不受不受数列中数列中极端变量值极端变量值的影响,它可反映总的影响,它可反映总体各单位某一标志值的集中趋势。体各单位某一标志值的集中趋势。482.众数的计算众数的计算(众数的不唯一性众数的不唯一性)无众数无众数原始数据原始数据:10 5 9 12 6 8一个众数一个众数原始数据原始数据:6 5 9 8 5 5多于一个众多于一个众数原始数据数原始数据:25 28 28 36 42 42众数的计算只适用于单位数较多,且存在明显的集中趋势的情况,否则计算众数是没有意义的。49众数众数(mode):出现次数最多即出现频):出现次数最多即出现频率最高的变量值。率最高的变量值。身高身高 人数人数(CM)(人)(人)152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数(CM)(人)(人)164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1总计总计 83 152 154 154 155 155 156 156 156 156 157 158 158 159 159 160 160 160 160 160 160 160 160 160 160 160 160 161 161 161 161 161 161 161 162 162 162 162 162 162 162 162 163 163 163 163 164 164 164 165 165 165 165 165 165 165 165 166 166 166 166 166 167 167 167 168 168 168 168 168 168 168 169 170 170 170 170 170 171 171 172 172 172 17450 身高身高 人数人数 比重比重 (CM)(人)(人)(%)150-155 3 3.61 155-160 11 13.25 160-165 34 40.96 165-170 24 28.92 170以上以上 11 13.25 总计总计 83 100例例10:某年级:某年级83名女生身高资料名女生身高资料众数的确定方法众数的确定方法概约数:众数所在概约数:众数所在组的组中值,在本组的组中值,在本例为例为162.5cm51日产量(件)日产量(件)工人人数(人)工人人数(人)101112131470100380150100合计合计800【例例1111】已知已知某企业某日工人的日产量资料如下某企业某日工人的日产量资料如下:众数的确定众数的确定(单值数列)(单值数列)计算该企业该日全部工人日产量的众数。计算该企业该日全部工人日产量的众数。52众数的确定众数的确定(组距数列)(组距数列)【例例1212】某车间某车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产量(件)月产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50计算该车间工人月产量的众数。计算该车间工人月产量的众数。概约众数:众数所在组的概约众数:众数所在组的组中值,在本例为组中值,在本例为500件件53(1)众数不受分布数列的极大或极小值的影响。众数不受分布数列的极大或极小值的影响。(2)当分组数列没有任何一组的次数占多数,而是近似于均匀分布时,则当分组数列没有任何一组的次数占多数,而是近似于均匀分布时,则该次数分配数列无众数。该次数分配数列无众数。(3)如果与众数组相比邻的上下两组的次数相等,则众数组的组中值就是如果与众数组相比邻的上下两组的次数相等,则众数组的组中值就是众数值;如果与众数组比邻的上一组的次数较多,则众数在众数组内众数值;如果与众数组比邻的上一组的次数较多,则众数在众数组内会偏向该组下限;如果与众数组比邻的下一组的次数较多,则众数在会偏向该组下限;如果与众数组比邻的下一组的次数较多,则众数在众数组内会偏向该组上限。众数组内会偏向该组上限。(4)缺乏敏感性。缺乏敏感性。3.众数特点众数特点当数据分布的集中趋势不明显或存在两个以上分布中当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)或多众数,也等于没有众数)54(三)中位数、众数和算术平均数的关系(三)中位数、众数和算术平均数的关系1.在对称分布(即正态)时在对称分布(即正态)时对称分布对称分布2.在左偏分布时在左偏分布时左偏分布左偏分布右偏分布右偏分布3.在右偏分布时在右偏分布时55 五数概括法五数概括法五数概括法五数概括法(2 2)第)第1 1四分位数(四分位数(Q Q1 1)。)。(3 3)中位数()中位数(Q Q2 2)。)。(4 4)第)第3 3四分位数(四分位数(Q Q3 3)。)。(5 5)最大值。)最大值。(1 1)最小值最小值。56首先将数据按递增顺序排列,然后很容易就能确定最小值、首先将数据按递增顺序排列,然后很容易就能确定最小值、3个四分位数和最大值了。对个四分位数和最大值了。对12个月薪数据的样本,按照递个月薪数据的样本,按照递增顺序排列如下:增顺序排列如下:2210 2255 2350|2380 2380 2390|2420 2440 2450|2550 2630 2825 Q12365 Q22405 Q32500上述起薪数据以五数概括为:上述起薪数据以五数概括为:2210,2365,2405,2500,2825。五数概括法五数概括法57集中趋势的测度集中趋势的测度均值均值:一般水平代表值,数据信息提取最充分。:一般水平代表值,数据信息提取最充分。中位数中位数:容易理解、很直观,不受极端值的影响,但也因此:容易理解、很直观,不受极端值的影响,但也因此利用数据信息不够充分。利用数据信息不够充分。众数众数:容易计算,但不是永远存在,应用场合少:容易计算,但不是永远存在,应用场合少平均指标是一个代表性数值,它反映总体各单位某一数量标志的一般水平,而把总体各单位之间的差异抽象化了。总体各单位之间的差异是客观存在的差异是客观存在的,这种差异也是统计总体的重要特征之一。58第二节第二节 离中趋势的描述离中趋势的描述一、一、离中趋势和离散指标离中趋势和离散指标离中离中趋势趋势 离中趋势,就是变量分布离中趋势,就是变量分布离中趋势,就是变量分布离中趋势,就是变量分布中各变量值背离中心值的中各变量值背离中心值的中各变量值背离中心值的中各变量值背离中心值的倾向。一般用离散指标来倾向。一般用离散指标来倾向。一般用离散指标来倾向。一般用离散指标来描述描述描述描述反映变量值变动范围和差异程度的指标,反映变量值变动范围和差异程度的指标,反映变量值变动范围和差异程度的指标,反映变量值变动范围和差异程度的指标,即反映变量分布中各变量值远离中心值即反映变量分布中各变量值远离中心值即反映变量分布中各变量值远离中心值即反映变量分布中各变量值远离中心值或代表值程度的指标,亦称为变异指标或代表值程度的指标,亦称为变异指标或代表值程度的指标,亦称为变异指标或代表值程度的指标,亦称为变异指标或标志变动度指标。或标志变动度指标。或标志变动度指标。或标志变动度指标。离散离散指标指标59全距、平均差、方差和标准差、变异系数全距、平均差、方差和标准差、变异系数 1.常用指标常用指标2.离散指标作用离散指标作用衡量和比较平均指标的代表性。变异指标越大,衡量和比较平均指标的代表性。变异指标越大,平均指标的代表性越小;变异指标越小,平均平均指标的代表性越小;变异指标越小,平均指标的代表性越大指标的代表性越大反映经济活动过程的均衡性、稳定性和节奏性反映经济活动过程的均衡性、稳定性和节奏性为统计推断提供依据为统计推断提供依据60集中趋势弱、集中趋势弱、离散趋势强离散趋势强集中趋势强、集中趋势强、离散趋势弱离散趋势弱61接吻定律接吻定律 第一次接吻以后,女人会把这个吻当作一笔放出去第一次接吻以后,女人会把这个吻当作一笔放出去的投资,男人却会把它当做一笔收回来的贷款。的投资,男人却会把它当做一笔收回来的贷款。乐观与悲观定律乐观与悲观定律 乐观者发明了游艇,悲观者发明了救生圈;乐观者乐观者发明了游艇,悲观者发明了救生圈;乐观者建造了高楼,悲观者生产了救火栓;乐观者都去做了玩建造了高楼,悲观者生产了救火栓;乐观者都去做了玩命的赛车手,悲观者却穿起了白大褂当了医生;最后乐命的赛车手,悲观者却穿起了白大褂当了医生;最后乐观者发射了宇宙飞船,悲观者则开办了保险公司。观者发射了宇宙飞船,悲观者则开办了保险公司。人力定律人力定律 一个人在一分钟内可以挖一个洞,六十个人在一秒一个人在一分钟内可以挖一个洞,六十个人在一秒钟内就办不到。钟内就办不到。做饭定律做饭定律 因为怕做饭,男人下了班也不忙着回家;因为要做因为怕做饭,男人下了班也不忙着回家;因为要做饭,女人没下班就忙着溜回家。饭,女

    注意事项

    本文(4-描述统计中的测度解析.ppt)为本站会员(得****1)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开