欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    第三章集中和离散.ppt

    • 资源ID:93910982       资源大小:571KB        全文页数:82页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第三章集中和离散.ppt

    第三章 集中趋势和离中趋势31 集中趋势的测度32 离中趋势的测度33 偏态与峰度的测定 31集中趋势的测度n 集集中中趋趋势势是是指指一一组组数数据据(或或总总体体各各单单位位标标志志值值)向向某某一一中中心心值值靠靠拢拢的的倾倾向向,测测度度集集中中趋趋势势也也就就是是寻寻找找资资料料一一般般水水平平代表值或中心值,即平均指标。代表值或中心值,即平均指标。n 所所谓谓平平均均指指标标,是是说说明明同同质质总总体体内内各各单单位位某某一一数数量量标标志志在一定时间、地点条件下所达到的一般水平。在一定时间、地点条件下所达到的一般水平。n 趋趋势势的的测测度度值值(平平均均指指标标)主主要要有有算算术术平平均均数数、调调和和平平均均数数、几几何何平平均均数数、众众数数和和中中位位数数等等。本本节节将将分分别别介介绍绍它它们们的计算方法、特点及应用场合。的计算方法、特点及应用场合。n 2n n2002年,全国职工平均工资为12422元,其中,金融、保险业最高,为19135元,而农、林、牧渔业最低,为6398元,相当于最高的33.44%。n一、算术平均数一、算术平均数n 算算术术平平均均数数是是集集中中趋趋势势中中最最常常用用、最最重重要要的的测测度度值值。它是将总体标志总量除以总体单位总量而得到的均值。它是将总体标志总量除以总体单位总量而得到的均值。n(一)算术平均数的基本公式(一)算术平均数的基本公式n算术平均数总体标志总量算术平均数总体标志总量/总体单位总量总体单位总量n 注注意意,式式中中分分子子、分分母母指指标标必必须须属属于于同同一一总总体体,即即各各标标志志值值与与各各单单位位之之间间是是一一一一对对应应的的。这这也也是是算算术术平平均均数与强度相对指标的区别。数与强度相对指标的区别。n(二)(二)两种计算形式两种计算形式:n 首先看两个资料。首先看两个资料。n5n例一例一:设有一组大学生的月生活费支出为:150,200,240,300,350,500(单位:元)。(x=290)n例二:例二:有一班级的大学生月生活费支出如下表:n 月生活费(元)月生活费(元)x人数(人)人数(人)f频率(频率(%)n 150 3 5.36n 200 5 8.93n 240 7 12.50 n 300 24 42.85n 350 16 28.57n 500 1 1.79n 合 计 56 100.00n n 6n 加权算术平均数计算表加权算术平均数计算表n n 月生活费(元)月生活费(元)x人数(人)人数(人)f频率(频率(%)xfx*频率频率n15035.364508.04n20058.93100017.86n240712.50168030.00n3002442.857200128.55n3501628.575600100.00n50011.795008.95n合合计计56100.0016430293.40资料栏资料栏计算栏计算栏n解:解:该班级学生平均月生活费该班级学生平均月生活费=(公式)(公式)=16430/56=293.39(元元)nn7n1 1、简单算术平均数(适用于未分组资料)简单算术平均数(适用于未分组资料)n计算公式为:计算公式为:n 如如果果所所给给的的数数据据是是已已经经分分组组的的次次数数分分布布数数列列,则则算算术术平平均均数数的的计算应采用加权算术平均数的形式。计算应采用加权算术平均数的形式。n nn8n2 2、加权算术平均数(适用于分组资料)、加权算术平均数(适用于分组资料)n(为为什什么么由由分分组组资资料料计计算算平平均均指指标标不不能能将将各各组组的的标标志志值值简简单单平平均均?)。n计算公式为:计算公式为:nn式中:式中:f代表各组的代表各组的次数或频数(即各组的单位数)。次数或频数(即各组的单位数)。n比较两个公式,并解释比较两个公式,并解释为什么次数为什么次数f f又称之为权数?又称之为权数?n 平平均均数数的的大大小小不不仅仅取取决决于于各各组组标标志志值值x的的大大小小,同同时还受各组次数时还受各组次数f多少的影响。多少的影响。n 各各组组标标志志值值次次数数的的多多少少在在平平均均数数的的计计算算中中具具有有权权衡衡轻轻重重的的作作用用,因因而而把把各各组组的的次次数数又又称称为为权权数数,用用各各组组的的次次数数去去乘乘以以各各组组的的标标志志值值,就就是是对对各各组组的的标标志志值值进进行行加加权权。所所以以,用用这这种种方方法法计计算算的的算算术术平平均均数数,称称为为加加权权算算术平均数。术平均数。n 试想,如果各组次数完全相同,结果会怎样?试想,如果各组次数完全相同,结果会怎样?n11n实务中给定的权数资料,既可以是绝对数,也可以实务中给定的权数资料,既可以是绝对数,也可以是相对数,即频率或称权数系数。当权数为相对数时,是相对数,即频率或称权数系数。当权数为相对数时,加权算术平均数的表达公式如何呢?加权算术平均数的表达公式如何呢?n nnn算术平均数既可依据单项变量数列计算也可依据组距算术平均数既可依据单项变量数列计算也可依据组距数列计算;既可根据绝对数计算,也可根据相对数或平数列计算;既可根据绝对数计算,也可根据相对数或平均数进行计算。均数进行计算。n 1212n n 如如果果根根据据相相对对数数或或平平均均数数进进行行计计算算,则则应应注注意意的的问题是问题是:n(1 1)只能用加权形式计算;只能用加权形式计算;n(2 2)权数的选择问题。权数的选择问题。n 例例 见表所给资料。见表所给资料。n 表一表一 某市某局某市某局1818个企业税收计划完成情况个企业税收计划完成情况n 计划完成(计划完成(%)企业数(个)企业数(个)计划任务数(万元)计划任务数(万元)n 9595100 5 100100 5 100n 100 100105 8 1200105 8 1200n1051103100n110以上以上260n合合计计181460n要求:计算要求:计算18个企业税收收入平均计划完成程度。个企业税收收入平均计划完成程度。n14n 计算表计算表n 计划完成(计划完成(%)组中值组中值x x(%)计划任务数计划任务数f f(万元)万元)实际完成数实际完成数xfxf(万元)万元)n 9595100 97.5 100 97.5100 97.5 100 97.5n 100 100105 102.5 1200 1230.0105 102.5 1200 1230.0n105110107.5100107.5n110以上以上112.56067.5n合合计计14601502.5n计算栏计算栏nn解:平均计划完成程度解:平均计划完成程度x x=xf/xf/f fn=1502.5/1460=102.91%n15n表二表二(用于计算调和平均数用于计算调和平均数)n n 计划完成(计划完成(%)企业数(个)企业数(个)实际完成数(万元)实际完成数(万元)n 9595100 5 97.5100 5 97.5n 100 100105 8 1230.0105 8 1230.0n1051103107.5n110以上以上267.5n合合计计181502.5n要求同上:计算要求同上:计算18个企业税收收入平均计划完成程度。个企业税收收入平均计划完成程度。n16n计算表计算表n计划完成(计划完成(%)组中值组中值x x(%)实际完成数实际完成数m 计划任务数计划任务数m/m/xn (万元)万元)(万元)万元)n 9595100 97.5 100 97.5 97.597.5 100 100 n100100105 102.5 1230.0 1200 105 102.5 1230.0 1200 105110107.5107.5100n110以上以上112.567.560n合合计计1502.51460nn计算栏计算栏n解:解:=1502.5/1460=102.91%nnn17n(三三)算术平均数的数学性质算术平均数的数学性质n 1 1、各个变量值与算术平均数的离差总和等于零。各个变量值与算术平均数的离差总和等于零。n表达式表达式:(x-x)=0或或(x-x)f=0n2、各各个个变变量量值值与与算算术术平平均均数数的的离离差差平平方方总总和和为为最最小小值。值。n表达式表达式:(x-x)2=最小最小nn或或 最小最小n n 18 二、调和平均数二、调和平均数n又又称称“倒倒数数平平均均数数”,它它是是根根据据各各变变量量值值的的倒倒数数来来计计算算的的平平均均数数。具具体体地地讲讲,调调和和平平均均数数是是各各变变量量值值倒数的算术平均数的倒数。倒数的算术平均数的倒数。n(一)调和平均数的计算方法(一)调和平均数的计算方法n 1 1、简单调和平均数(适用于未分组资料)简单调和平均数(适用于未分组资料)n计算公式为:计算公式为:n x xH=n(1/x1+1/x2+1/xn)/n(1/(1/x)n19n2 2、加权调和平均数(适用于分组资料)、加权调和平均数(适用于分组资料)n 计算公式计算公式 :n n以以m m加权的调和平均数与以加权的调和平均数与以f f加权的算术平均数的关系加权的算术平均数的关系.n 2020 n因为,各组标志总量因为,各组标志总量 m=m=xfxfn所以,各组的单位数(次数)所以,各组的单位数(次数)f=m/xf=m/xn则:则:x=x=xf/xf/f f=m/m/m/x=m/x=x xH Hn 由二者的关系式得出,加权调和平均数是加权算由二者的关系式得出,加权调和平均数是加权算术平均数的变形,二者在经济内容、计算结果上是完术平均数的变形,二者在经济内容、计算结果上是完全一致的,仅计算形式不同而已。全一致的,仅计算形式不同而已。n 2121n(二)加权算术平均数和加权调和平均数的采用(二)加权算术平均数和加权调和平均数的采用n 1 1、由平均数计算、由平均数计算n 举例举例 以某种蔬菜为例,资料见表3-4。n 某种蔬菜的有关资料某种蔬菜的有关资料 n 表一表一 n 价格价格x x(元元/公斤)公斤)采购金额采购金额m m(元)元)n 早早 市市 0.50 10.000.50 10.00n 中中 市市 0.45 13.500.45 13.50n 晚晚 市市 0.40 8.000.40 8.00n 合合 计计 31.5031.50 n22n 表二表二 n 价格价格x x(元元/公斤)公斤)采购量采购量f f(公斤)公斤)n 早早 市市 0.50 200.50 20n 中中 市市 0.45 300.45 30n 晚晚 市市 0.40 200.40 20n 合合 计计 70 70n 分别依据表一和表二的资料,计算该种蔬菜的平均价分别依据表一和表二的资料,计算该种蔬菜的平均价格。格。n 思路:思路:平均每公斤价格平均每公斤价格购买金额购买金额/采购量采购量 =0.45=0.45(元(元公斤)公斤)n 23n2 2、由相对数计算、由相对数计算n 例题见前述计划完成程度的计算。例题见前述计划完成程度的计算。n 结论:结论:在由相对数或平均数计算平均数时,在什么在由相对数或平均数计算平均数时,在什么情况下采用加权算术平均数或加权调和平均数,情况下采用加权算术平均数或加权调和平均数,首先首先要要明确所求平均指标的分子、分母是什么,明确所求平均指标的分子、分母是什么,而后而后再根据所再根据所掌握的资料条件来选择。掌握的资料条件来选择。如果如果所掌握的权数资料是计算所掌握的权数资料是计算公式的分母数值时,则直接采用加权算术平均数的形式;公式的分母数值时,则直接采用加权算术平均数的形式;如果如果所掌握的权数资料是计算公式的分子数值时,则需所掌握的权数资料是计算公式的分子数值时,则需采用加权调和平均数的形式。采用加权调和平均数的形式。n 2424 三、几何平均数三、几何平均数n几几何何平平均均数数是是计计算算平平均均比比率率或或平平均均发发展展速速度度的的最最适适用用的一种方法。的一种方法。n 凡凡是是变变量量值值的的连连乘乘积积等等于于总总比比率率或或总总速速度度的的现现象象,都采用几何平均数反映现象总体的一般水平。都采用几何平均数反映现象总体的一般水平。n根据所掌握资料的不同,也有简单和加权两种形式根据所掌握资料的不同,也有简单和加权两种形式:n(一)简单几何平均数(一)简单几何平均数n 是是n n个变量值连乘开个变量值连乘开n n次方根的结果。次方根的结果。nn25三、几何平均数三、几何平均数n(二)加权几何平均数(二)加权几何平均数n 2626四、切尾均值n切尾均值是一种新的集中趋势测度方法,在大赛中切尾均值是一种新的集中趋势测度方法,在大赛中得到广发应用。得到广发应用。切尾均值切尾均值是去掉大小两端的若干数值后计算是去掉大小两端的若干数值后计算中间数中间数据的均值据的均值。27四、切尾均值n式中:式中:n表示观察值的个数;表示观察值的个数;n表示切尾系数表示切尾系数,n各观察值是经排队后由小到大形成的顺序统各观察值是经排队后由小到大形成的顺序统计量值。计量值。n 28 五、位置平均数n(一)众数(一)众数n(二)中位数(二)中位数n(三)分位数(三)分位数n(一)众数一)众数n1、众数的概念众数的概念n 众众数数是是总总体体中中出出现现次次数数最最多多的的标标志志值值,即即最最普普遍遍、最最常常见见的的标标志志值值。众众数数只只有有在在总总体体单单位位较较多多而而又又有有明明确确的的集集中中趋趋势势的的资资料料中中才才有意义。有意义。n2、众数的确定、众数的确定n 单单项项数数列列中中,出出现现次次数数最最多多的的那那个个组组的的标标志志值值就就是是众众数数。若若在在数数列中有两组的次数是相同的,且次数最多,则就是双众数或复众数。列中有两组的次数是相同的,且次数最多,则就是双众数或复众数。n 组距数列中组距数列中,众数的确定要分两步:众数的确定要分两步:n第一步,用直接观察法确定众数组即次数最多的那一组;第一步,用直接观察法确定众数组即次数最多的那一组;n第第二二步步,计计算算众众数数的的近近似似值值。比比较较精精确确的的方方法法是是用用众众数数组组次次数数与与相相邻两组次数之差来推算众数的近似值。邻两组次数之差来推算众数的近似值。n29五、位置平均数五、位置平均数n众数一般有两种计算公式:众数一般有两种计算公式:n1n下限公式:下限公式:M0=L+dn1+2n上限公式:上限公式:M0=U-2/(1+2)dn n 组距数列众数的确定一般与其相邻两组的频数分组距数列众数的确定一般与其相邻两组的频数分布有关。若众数组前一组的频数比众数组后一组的频布有关。若众数组前一组的频数比众数组后一组的频数多,则众数小于众数组的组中值;反之,众数大于数多,则众数小于众数组的组中值;反之,众数大于其组中值。若众数组前一组的频数等于其后一组的频其组中值。若众数组前一组的频数等于其后一组的频数,则众数就是众数组的组中值。数,则众数就是众数组的组中值。n31n五、位置平均数五、位置平均数n(二)中位数(二)中位数n1、中位数的概念中位数的概念n 中中位位数数是是将将总总体体单单位位某某一一变变量量的的各各个个变变量量值值按按大大小小顺序排列,处在数列中间位置的那个变量值就是中位数。顺序排列,处在数列中间位置的那个变量值就是中位数。n2 2、中位数的确定、中位数的确定n(1 1)未分组资料确定中位数未分组资料确定中位数n在资料未分组的情况下,将各变量值按大小顺序排列后,在资料未分组的情况下,将各变量值按大小顺序排列后,n 首先首先,确定中位数的位置,即,确定中位数的位置,即(n+1)/2(n+1)/2;n 然后然后,根据中点位置确定中位数。,根据中点位置确定中位数。n n 3232(二)中位数(二)中位数n2 2、中位数的确定、中位数的确定n 单项数列单项数列 n(2 2)分组资料确定中位数分组资料确定中位数 组距数列组距数列n 由单项数列计算中位数由单项数列计算中位数:n 首先,计算各组的累积次数;首先,计算各组的累积次数;n 然然后后,根根据据中中点点位位置置(总总次次数数/2/2)在在累累积积次次数中确定中位数所在组,以确定中位数。数中确定中位数所在组,以确定中位数。(二)中位数(二)中位数n2 2、中位数的确定、中位数的确定n(2 2)分组资料确定中位数分组资料确定中位数n由组距数列计算中位数由组距数列计算中位数(情况要复杂一些):(情况要复杂一些):n分三步骤:分三步骤:n第一步,计算累积次数;第一步,计算累积次数;n第二步,计算中位数位置(总次数第二步,计算中位数位置(总次数/2/2),以),以 确定中位数组;确定中位数组;n第三步,用比例推算法估计中位数的近似值。第三步,用比例推算法估计中位数的近似值。组距数列中位数的计算公式组距数列中位数的计算公式n下限公式下限公式:n上限公式上限公式:n下限公式的比例推算法:下限公式的比例推算法:累积次数累积次数Sm-1=180中点位置中点位置 f/2=215nn中位数所在组次数中位数所在组次数fm=180n215-180=35n中位数在该组分摊组距的比例为:中位数在该组分摊组距的比例为:35/180五、位置平均数n(三)分位数(三)分位数n中位数是将统计分布从中间分成面积相等的两中位数是将统计分布从中间分成面积相等的两部分(即两边数据个数相等)。与中位数性质部分(即两边数据个数相等)。与中位数性质相似的还有相似的还有四分位数四分位数n十分位数十分位数n百分位数百分位数五、位置平均数n(三)分位数(三)分位数n1、四分位数、四分位数n又称四分位点,它是通过又称四分位点,它是通过3个点将全部数据个点将全部数据等分为等分为4部分,其中每部分包含部分,其中每部分包含25%的数据,的数据,处在分位点上的数值就是四分位数处在分位点上的数值就是四分位数。n很显然,其中中间的四分位数就是中位数。所很显然,其中中间的四分位数就是中位数。所以,通常所说的的四分位数是指第一个和第三以,通常所说的的四分位数是指第一个和第三个四分位数,分别又称作个四分位数,分别又称作下四分位数下四分位数和和上四分上四分位数位数。(三)分位数(三)分位数n四分位数的计算方法四分位数的计算方法:n与中位数计算相类似与中位数计算相类似n(1)未分组资料计算)未分组资料计算n首先首先对数据进行排序,对数据进行排序,然后然后确定四分位数所确定四分位数所在位置。在位置。n设:下四分位数为设:下四分位数为n上四分位数为上四分位数为n中间四分位数为中间四分位数为(三)分位数(三)分位数n四分位数的计算方法四分位数的计算方法:n(1)未分组资料计算)未分组资料计算nn的位置的位置=n的位置的位置=(三)分位数(三)分位数n四分位数的计算方法:四分位数的计算方法:n(1)未分组资料计算)未分组资料计算n n 的位置的位置=(三)分位数(三)分位数n四分位数的计算方法四分位数的计算方法:n(1)未分组资料计算)未分组资料计算n当四分位数的位置不在某个数值上时,当四分位数的位置不在某个数值上时,可根据四分位数的位置,按比例分摊四可根据四分位数的位置,按比例分摊四分位数位置两侧数值的分位数位置两侧数值的差值差值。(三)分位数(三)分位数n四分位数的计算方法:四分位数的计算方法:n(2)分组资料计算)分组资料计算n首先,确定首先,确定和和的位置,并确定的位置,并确定和和n所在的组。所在的组。n 的位置的位置=N/4n的位置的位置=3N/4(三)分位数(三)分位数n四分位数的计算方法:四分位数的计算方法:n(2)分组资料计算)分组资料计算n然后然后,仿照中位数的计算公式确定,仿照中位数的计算公式确定和和的具体数值。的具体数值。(三)分位数(三)分位数n四分位数的计算方法四分位数的计算方法:n(2)分组资料计算)分组资料计算(三)分位数(三)分位数n四分位数的计算方法四分位数的计算方法:n(2)分组资料计算)分组资料计算(三)分位数(三)分位数n2、十分位数、十分位数n3、百分位数、百分位数n十分位数和百分位数是分别将数据分十分位数和百分位数是分别将数据分布布10等分和等分和100等分的数值。计算公式仿等分的数值。计算公式仿照四分位数计算即可。照四分位数计算即可。六、平均指标之间的相互关系六、平均指标之间的相互关系 n(一)(一)算术平均数、几何平均数和调和平均数的关系算术平均数、几何平均数和调和平均数的关系n 三者存在的数量关系表现在:三者存在的数量关系表现在:n 根根据据同同一一资资料料所所计计算算的的三三种种平平均均数数,几几何何平平均均数数大大于于调调和和平平均均数数而而小小于于算算术术平平均均数数,即即X X X XG G X XH H ;n 当当变变量量数数列列中中所所有有的的标标志志值值都都相相等等时时,三三种种平平均均数相同,即数相同,即 X X X XG G X XH H 。n(二)二)中位数、众数与算术平均数的关系中位数、众数与算术平均数的关系n 这这三三者者之之间间的的关关系系,决决定定于于总总体体内内部部的的次次数数分分布布状况。状况。n 48(二)(二)中位数、众数与算术平均数的关系中位数、众数与算术平均数的关系n 在在对称分布对称分布的情况下,中位数的情况下,中位数,众数和算术平均数合而为一,众数和算术平均数合而为一,即:即:n Me=M0=n在在非对称分布非对称分布的情况下,中位数的情况下,中位数,众数和算术平均数之间存在众数和算术平均数之间存在一定的差别。一定的差别。n如果分布右偏,则三者之间的关系是如果分布右偏,则三者之间的关系是:M0Me;n如果分布如果分布左左偏,则三者之间的关系是偏,则三者之间的关系是:M0Me。n 可见,无论是右偏还是左偏,中位数总是介于算术平均数和可见,无论是右偏还是左偏,中位数总是介于算术平均数和众数之间。众数之间。n适度偏态时,适度偏态时,-Me的距离是的距离是-M0的的1/3。49n对称分布M0=Me=X X;MeM0nX X右偏右偏分布分布n左偏分布左偏分布X XMeM0(三)(三)众数、中位数和算术平均数的特点和应用众数、中位数和算术平均数的特点和应用 场合场合n 众众数数是是一一组组数数据据分分布布的的峰峰值值,是是一一种种位位置置代代表表值值。其其优优点点是是易易于于理理解解,不不受受极极端端值值的的影影响响。当当数数据据的的分分布布具具有有明明显显的的集集中中趋趋势势时时,尤尤其其是是对对于于偏偏态态分分布布,众众数数的的代表性比均值要好。其缺点是具有不唯一性。代表性比均值要好。其缺点是具有不唯一性。n 中中位数数是是一一组组数数据据中中间间数数据据的的代代表表值值,其其特特点点是是不不受受数数据据极极端端值值的的影影响响,因因此此,对对于于具具有有偏偏态态分分布布的的数数据据,中位数的代表性要比均值好。中位数的代表性要比均值好。n 算算术平均数平均数是就全部数据计算的,它具有优良的数是就全部数据计算的,它具有优良的数学性质,是实际应用最广泛的集中趋势测度值。其主要学性质,是实际应用最广泛的集中趋势测度值。其主要缺点是易受极端值的影响,对于偏态分布的数据,均值缺点是易受极端值的影响,对于偏态分布的数据,均值的代表性较差的代表性较差。53n 结结论论:从从各各种种代代表表值值之之间间的的关关系系及及其其特特点点可可看看出出:当当数数据据呈呈对对称称分分布布或或接接近近对对称称分分布布时时,三三个个代代表表值值相相等等或或接接近近相相等等,这这时时,应应选选择择均均值值作作为为集集中中趋趋势势的的代代表表值值(为什么为什么?);?);n当当数数据据为为偏偏态态分分布布,特特别别当当偏偏斜斜的的程程度度较较大大时时,我我们们应应选选择择众众数数或或中中为为数数等等位位置置平平均均数数,这这时时它它们们的的代代表表性性要要比均值好。比均值好。n此此外外,均均值值只只适适用用于于定定距距或或定定比比尺尺度度的的数数据据,而而对对于于定定类类或或定定序序尺尺度度的的数数据据无无法法计计算算均均值值,但但却却可可以以计计算算众众数数和中位数。和中位数。n 5454第二节第二节 频数分布离中程度的测度频数分布离中程度的测度n案例1有两组男生身高分别为:n甲组(cm):168,172,172,173,175,190n乙组(cm):168,172,175,175,178,182n两组平均身高均为175cm,它们的代表性一样吗?案例2n有男、女两组身高:n男组(cm):168,172,172,173,175,190n女组(cm):163,164,165,165,167,171n 男组平均身高175cm;n女组平均身高165.83cm。n思考:两组平均身高的代表性如何评价?案例3n从某校一年级大学生中随机抽取100人,测得他们的身高和体重平均值分别是168厘米和52千克,相应的标准差为9厘米和5千克,问身高和体重哪一个差异大?案例1计算表n 甲甲组组乙乙组组n身高身高xx-x(x-x)2身高身高xx-x(x-x)2n168-749168-749n172-39172-39n172-3917500n173-2417500n1750017839n19015225182749n合合计计296合合计计116n 甲组甲组:=(x-x)(x-x)2 2/n/n 1/21/2 =7.02 =7.02(厘米)(厘米)n 乙乙组组:=116=116/6/6 1/21/2=4.4=4.4(厘米)(厘米)第二节第二节 频数分布离中程度的测度频数分布离中程度的测度 n 离离中中程程度度,是是各各个个变变量量值值远远离离其其中中心心值值的的程程度度,又又称称离散程度,离散程度,或变异指标或变异指标 。n 为什么要测度离中程度为什么要测度离中程度?n 集集中中趋趋势势只只是是数数据据分分布布的的一一个个特特征征,它它所所反反映映的的是是总总体体各各单单位位变变量量值值向向其其中中心心值值聚聚集集的的程程度度。而而各各变变量量值值之之间间的的差差异异状状况况如如何何,均均值值的的代代表表性性有有多多大大,这这就就需需要要用用离离中中程程度度对对其其进进行行考考察察。数数据据的的离离中中程程度度是是数数据据分分布布的的另一个重要特征,它与均值的关系是:另一个重要特征,它与均值的关系是:n 变变量量值值的的差差异异大大,离离散散程程度度就就大大,均均值值的的代代表表性性就就小小;变量值差异小,离散程度就小,均值的代表性也就大变量值差异小,离散程度就小,均值的代表性也就大。n 5959n 描述数据离散程度的测度值主要有极差、平均差、方差和标准差、离散系数等。n 一、极差一、极差n 极差亦称全距,即两极之差。根据全距的大小来说明变量值变动范围的大小。n极差R R最大值最大值-最小值最小值n 对于组距分组数据,极差也可以近似表示为:nR R=最高组的上限值-最低组的下限值n极差是描述数据离散程度的最简便测度值,其计算简单,易于理解,但它容易受极端值的影响。n 60补充:内距n内距,是两个四分位数之差,即:内距,是两个四分位数之差,即:n内距内距=上四分位数上四分位数-下四分位数下四分位数n与极差比较,内距基本不受极端值的影响,与极差比较,内距基本不受极端值的影响,且内距反映的是中间且内距反映的是中间50%数值大小的差异,故数值大小的差异,故给我们比极差更多的数据差异信息。给我们比极差更多的数据差异信息。n49二、平均差二、平均差 平平均均差差是是表表明明总总体体各各单单位位变变量量值值与与其其均均值值之之间间绝绝对对离离差差的的算算术术平平均均数数,又又称称平平均均离离差,一般用差,一般用AD表示。表示。为什么采取离差的绝对值,即为什么采取离差的绝对值,即n62平均差平均差两种计算形式两种计算形式n(1)简单平均差简单平均差(适用于未分组资料适用于未分组资料)n其公式为:其公式为:nn(2 2)加权平均差加权平均差(分组资料分组资料)n 其公式为:其公式为:nn51n 平均差是根据全部变量值计算的,受极端值的影响平均差是根据全部变量值计算的,受极端值的影响比较小,所以,它能够综合反映总体中各单位变量值的比较小,所以,它能够综合反映总体中各单位变量值的离散程度。但由于它采用绝对值计算不符合代数方法的离散程度。但由于它采用绝对值计算不符合代数方法的演算,所以在统计研究中应用较少。演算,所以在统计研究中应用较少。52n三、方差和标准差三、方差和标准差n(一)(一)方差和标准差的含义方差和标准差的含义n方方差差,是是总总体体各各单单位位变变量量值值与与其其算算术术平平均均数数的的离离差差平平方方的的算算术术平平均均数数 ,用用2 2表表示示,方方差差的的平平方方根根就就是是标标准准差差。与与方方差差不不同同的的是是,标标准准差差是是具具有有量量纲纲的的,它它与与变变量量值值的的计计量量单单位位相相同同,其其实实际际意意义义要要比比方方差差清清楚楚。因因此此,在在对对社社会会经经济济现现象象进进行行分分析析时时,更更多多使使用用标准差。标准差。n 与平均差比较,标准差的优点是什么?与平均差比较,标准差的优点是什么?n 5 3 5 3 6565 n 标准差与平均差虽都是变量值与均值的平均标准差与平均差虽都是变量值与均值的平均离差,但不同的是离差,但不同的是平均差平均差所平均的是离差绝对值,所平均的是离差绝对值,而而标准差标准差平均的是离差平方。标准差彻底解决了平均的是离差平方。标准差彻底解决了正负离差不能相加的问题。它在抽样调查、相关正负离差不能相加的问题。它在抽样调查、相关分析中应用较多,所以标准差是应用较为广泛的分析中应用较多,所以标准差是应用较为广泛的一种离中趋势的测度值。一种离中趋势的测度值。n 54 54 6666 标准差的标准差的计算有两种形式计算有两种形式 简单平均式和加权平均式简单平均式和加权平均式n(1 1)在)在未分组资料未分组资料情况下,采用情况下,采用简单平均式简单平均式。n 公式为:公式为:n n(2 2)在在分组资料分组资料情况下,采用情况下,采用加权平均式加权平均式。n 公式为:公式为:n n 67n(二二)方差的数学性质方差的数学性质:1 1、变量的方差等于变量平方的平均数减去变量平均、变量的方差等于变量平方的平均数减去变量平均数的平方数的平方 。即:。即:n 2 2x x2 2-(-(x x)2 2n2 2、变变量量对对算算术术平平均均数数的的方方差差,小小于于对对任任意意常常数数的的方方差。差。(三)标准差的应用三)标准差的应用n 标准差可用于计算标准化值。标准差可用于计算标准化值。n 标标准准化化值值是是某某一一数数据据与与平平均均数数的的距距离离以以标标准准差差为为单位的测量值。其计算公式为单位的测量值。其计算公式为 :n Z Zi i=(=(x xi i-x-x)/)/n 6868n 一组数据中的每一个原始数据都可以计算出对应一组数据中的每一个原始数据都可以计算出对应的标准化值,这一组标准化值组成一个的标准化值,这一组标准化值组成一个标准化值的平标准化值的平均数为零,标准差为均数为零,标准差为1 1。n 当当Z Zi i=0=0时时 ,即即x xi i=x=x,这时原始数据正好等于这一组这时原始数据正好等于这一组数据的平均数;数据的平均数;n 当当Z Zi i 0 0时,原始数据高于其平均数;时,原始数据高于其平均数;n 当当Z Zi i00时时,原原始始数数据据低低于于其其平平均均数数。标标准准化化数数据据越越大,说明它距离平均数越远。大,说明它距离平均数越远。n 标标准准化化值值不不仅仅能能表表明明各各原原始始数数据据在在一一组组数数据据分分布布中中的的相相对对位位置置,而而且且能能在在不不同同分分布布的的各各原原始始数数据据间间进进行行比比较较,同同时时还还能能接接受受代代数数方方法法的的处处理理。因因此此,标标准准化值在统计分析中起这十分重要的作用。化值在统计分析中起这十分重要的作用。n 69 四、变异系数四、变异系数n 平平均均差差和和标标准准差差其其数数值值大大小小,不不仅仅决决定定于于各各标标志志值值的的差差异异程程度度,还还决决定定于于数数列列平平均均水水平平的的高高低低,同同时时它它们们具具有有与与标标志志值值相相同同的的名名数数。因因而而,对对于于具具有有不不同同平平均均水水平平和和不不同同计计量量单单位位的的数数列列,就就不不能能直直接接利利用用标标准准差差等等来来比比较较其其标标志志变变动动程程度度的的大大小小,而而需需要要用用变变异异系系数数,以以消消除除不不同同数数列列水水平的影响。平的影响。n58四、变异系数四、变异系数n变变异异系系数数是是将将标标准准差差或或平平均均差差与与其其平平均均数数对对比所得的比值比所得的比值,又称离散系数。公式为:,又称离散系数。公式为:n n 或或 (被常用)(被常用)n n变变异异系系数数是是一一个个无无名名数数的的数数值值,可可用用于于比比较较不同数列的变异程度。不同数列的变异程度。n 59 59 五、成五、成数数n(一)成数的概念(一)成数的概念n 所所谓谓成成数数是是总总体体中中具具有有某某种种属属性性或或特特征征的的单单位位数数占占全全部部单单位位数数的的比比重重,它它反反映映了了总总体体中中“是是”或或 “非非”属属性性的的构构成成,并并且且代代表表着着该该种种属属性性或或特征反复出现的程度,即频率。特征反复出现的程度,即频率。n 成成数数的的计计算算。在在一一个个是是非非标标志志总总体体中中,如如果果全全部部总总体体单单位位数数用用来来表表示示,具具有有某某种种属属性性或或特特征征的的单单位位数数用用1 1表表示示,它它在在全全部部总总体体单单位位数数中中所所占的比重(即成数)用占的比重(即成数)用P P表示。则:表示。则:n P P1 1/n 7272 n 将将不不具具有有某某种种属属性性或或特特征征的的单单位位数数用用0 0表表示示,它它在在全全部部总总体体单单位位数数中中所所占占的的比比重重(成成数数)用用Q Q表示,则:表示,则:n Q Q0 0/n 两个成数之和等于,即:两个成数之和等于,即:n 1 1/0 0/n 亦即,亦即,P PQ Qn 因而,因而,Q QP P 7373(二)是非标志的平均数和标准差(二)是非标志的平均数和标准差 n 是非标志是品质标志,因而无法直接计算其平均质是非标志是品质标志,因而无法直接计算其平均质量。要计算是非标志的平均数,就必须将是非标志在性量。要计算是非标志的平均数,就必须将是非标志在性质上的差别过渡到数量上的变异,即将是非标志数量化。质上的差别过渡到数量上的变异,即将是非标志数量化。如果以如果以“”表示具有某种属性或特征的单位的标志值,表示具有某种属性或特征的单位的标志值,以以“0 0”表示不具有某种属性或特征的单位的标志值表示不具有某种属性或特征的单位的标志值,则,则是非标志就转化为(是非标志就转化为(0 0,1 1)的数量标志值。)的数量标志值。n 列成统计表,则有列成统计表,则有:n 是非标志值(变量值)是非标志值(变量值)x x 比重(成数)比重(成数)f fn 1 P 1 Pn 0 Q 0 Qn 合合 计计 1 1n 是非标志平均数和标准差的计算表是非标志平均数和标准差的计算表 是非标志值是非标志值 比重比重 变量值变量值 离差离差 离差离差 离差平方离差平方 (变量值)(变量值)(成数)(成数)比重比重 平方平方 权数权数n x f x f xfxf x-x (x-x)x-x (x-x)2 2 (x-x)(x-x)2 2 f f n (1)(2)(3)(4)(5)(6)(1)(2)(3)(4)(5)(6)n 1 P P 1-P (1-P)1 P P 1-P (1-P)2 2 (1-P)(1-P)2 2 P P 0 Q 0 0-P P 0 Q 0 0-P P2 2 P P2 2 Q Q 合合 计计 1 P Q1 P Q2 2 P+PP+P2 2 Q Qnn是非标志平均数是非标志平均数x=x

    注意事项

    本文(第三章集中和离散.ppt)为本站会员(s****8)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开