欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    (本科)第3章-数据分布特征描述ppt课件.ppt

    • 资源ID:76414463       资源大小:644KB        全文页数:61页
    • 资源格式: PPT        下载积分:12金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要12金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    (本科)第3章-数据分布特征描述ppt课件.ppt

    第三章第三章数据分布特征描述数据分布特征描述统计变量集中趋势的测定统计变量集中趋势的测定统计变量离散程度的测定统计变量离散程度的测定变量分布偏度与峰度的描述变量分布偏度与峰度的描述(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件第一节第一节统计变量集中趋势的测定统计变量集中趋势的测定测定集中趋势的意义测定集中趋势的意义位置代表值位置代表值数值平均数数值平均数(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件一、测定集中趋势的意义一、测定集中趋势的意义v测定集中趋势的指标有:位置代表值和数值平均数。测定集中趋势的指标有:位置代表值和数值平均数。位置代表值位置代表值:在总体中将变量值按顺序排列后得到的:在总体中将变量值按顺序排列后得到的数列中某个特殊位置的值。数列中某个特殊位置的值。常用的反应集中趋势的位置代表值有众数、中位数常用的反应集中趋势的位置代表值有众数、中位数等。等。数值平均数数值平均数就是均值,它是对总体中的所有数据计算就是均值,它是对总体中的所有数据计算平均值,用以反映所有数据的一般水平。平均值,用以反映所有数据的一般水平。由于计算方法不同,数值平均数有算术平均数、调和由于计算方法不同,数值平均数有算术平均数、调和平均数、几何平均数和幂平均数。平均数、几何平均数和幂平均数。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件v测定集中趋势的作用测定集中趋势的作用1、反映总体各单位变量分布的集中趋势、反映总体各单位变量分布的集中趋势和一般水平。和一般水平。2、比较同类现象在不同单位的发展水平。、比较同类现象在不同单位的发展水平。3、比较同类现象在不同时期的发展变化、比较同类现象在不同时期的发展变化趋势或规律。趋势或规律。4、分析现象之间的依存关系。、分析现象之间的依存关系。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件二、位置代表值二、位置代表值v(一)众数(一)众数(Mode)众数众数是总体中出现次数最多的那个数据值,是总体中出现次数最多的那个数据值,在频数分布中,众数指频数或频率最大的标志值在频数分布中,众数指频数或频率最大的标志值用用表示。表示。(a a)单单众数众数 (b b)双众数)双众数 (c c)五种无众数的情形)五种无众数的情形图图 3-1 3-1 众数示意众数示意图图(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件众数的确定众数的确定1.由品质数列和单项式数量数列确定众数由品质数列和单项式数量数列确定众数2.由组距数量数列确定众数由组距数量数列确定众数由组距数列确定众数,首先应当确定众数组,由组距数列确定众数,首先应当确定众数组,然后通过比例插值法计算众数。然后通过比例插值法计算众数。在等距分组条件下,众数组就是次数最多的那在等距分组条件下,众数组就是次数最多的那一组;一组;在不等距分组的条件下,众数组则是频数密度在不等距分组的条件下,众数组则是频数密度或频率密度最高的那一组。或频率密度最高的那一组。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件fMoL MOMOUMOfMo-fMo+1fMo-fMo-1图图3-2众数与相邻两组的关系众数与相邻两组的关系比例插值法图示比例插值法图示(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件上限公式上限公式:(3.1)下限公式:下限公式:(3.2)MO代表众数;代表众数;代表众数组的下限;代表众数组的下限;代表众数组的上限;代表众数组的上限;代表众数组的次数;代表众数组的次数;代表众数组前一组的次数;代表众数组前一组的次数;代表众数组后一组的次数;代表众数组后一组的次数;代表众数组的组距。代表众数组的组距。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件v例例3-3某地区农民收入情况如表某地区农民收入情况如表3-3,计算其,计算其人均纯收入的众数。人均纯收入的众数。表表3-3农民家庭年人均纯收入情况表农民家庭年人均纯收入情况表按年人均按年人均纯纯收入分收入分组组(元)(元)农农民家庭数(民家庭数(户户)100010001200120024024012001200140014004804801400140016001600 1050 1050160016001800180060060018001800200020002702702000200022002200210210220022002400240012012024002400260026003030合合 计计30003000(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件例例3-3(续)(续)或或(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件v(二)中位数(二)中位数(Median)中位数和众数一样,也是一种位置代表值,中位数和众数一样,也是一种位置代表值,但是,它不能用于定类数据,只能在顺序及以上的但是,它不能用于定类数据,只能在顺序及以上的数据中使用,所以又称为次序统计量,用数据中使用,所以又称为次序统计量,用Me表示。表示。中位数中位数是将总体中的数据按顺序排列后,是将总体中的数据按顺序排列后,处于数列中点位置上的那个数据值或变量值,或者处于数列中点位置上的那个数据值或变量值,或者说中位数是累计频率数列中,累计频率为说中位数是累计频率数列中,累计频率为0.50所对所对应的变量值。应的变量值。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件1、由顺序数据和未分组的数量数据确定中位数。、由顺序数据和未分组的数量数据确定中位数。顺序数据中位数的位置:顺序数据中位数的位置:中位数位置中位数位置=(3.3)未分组的数量数据中位数的位置:未分组的数量数据中位数的位置:中位数位置中位数位置=(3.4)(3.5)(3.6)(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件v例例3-4某高校一次对食堂伙食满意度的调查某高校一次对食堂伙食满意度的调查数据如表数据如表3-4所示。所示。表表3-4调查数据次数分布调查数据次数分布回答回答类别类别学生人数(人)学生人数(人)累累计计学生数(向上累学生数(向上累计计)非常不非常不满满意意240240240240不不满满意意1080108013201320一般一般93093022502250满满意意45045027002700非常非常满满意意30030030003000合合计计30003000中位数位置中位数位置=3000/2=1500从累计学生数看,中位数在第三组,所以:从累计学生数看,中位数在第三组,所以:Me=一般。一般。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件例例3-5有有8名工人,每人日产零件数按从底到名工人,每人日产零件数按从底到高的顺序排列如下:高的顺序排列如下:17、19、20、22、23、23、24、25(件(件/人)。人)。则则中位数为中位数为22.5件件/人,这个数字反映了工人总体人,这个数字反映了工人总体日产零件数的一般水平。日产零件数的一般水平。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件2、由单项式分组数量数据确定中位数、由单项式分组数量数据确定中位数单项式数量数据分组已经将数据顺序化,这时单项式数量数据分组已经将数据顺序化,这时数据个数即总体单位数数据个数即总体单位数n=f,确定中位数位置的方,确定中位数位置的方法要通过累计次数计算。法要通过累计次数计算。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件3、由组距式分组的数量数据确定中位数、由组距式分组的数量数据确定中位数在假定中位数组内的各数据均匀分布的前提下,利用下在假定中位数组内的各数据均匀分布的前提下,利用下面的公式计算中位数的近似值:面的公式计算中位数的近似值:下限公式:下限公式:(3.7)上限公式:上限公式:(3.8)表示中位数;表示中位数;表示中位数所在组的下限;表示中位数所在组的下限;表示中位数所在组的上限;表示中位数所在组的上限;表示向上累计至中位数所在组前一组的次数;表示向上累计至中位数所在组前一组的次数;表示向下累计至中位数所在组后一组的次数;表示向下累计至中位数所在组后一组的次数;表示中位数所在组的次数;表示中位数所在组的次数;表示中位数所在组的组距。表示中位数所在组的组距。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件例例3-7根据表根据表3-3数据计算农民家庭年人均纯收入中位数数据计算农民家庭年人均纯收入中位数表表3-6农民家庭年人均纯收入累计次数表农民家庭年人均纯收入累计次数表按年人均按年人均纯纯收入收入分分组组(元)(元)农农民家庭数民家庭数(户户)累累计户计户数(数(户户)(向上累(向上累计计)累累计户计户数(数(户户)(向下累(向下累计计)1000120024024030001200140048072027601400160010501770228016001800600237012301800200027026406302000220021028503602200240012029701502400260030300030合合计计3000(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件例例3-7续续计算表明,这计算表明,这3000户农民家庭年人均纯收入户农民家庭年人均纯收入的中位数是的中位数是1548.57元,也就是说,人均纯收入在元,也就是说,人均纯收入在1548.57元以上的农民家庭有元以上的农民家庭有1500户,在户,在1547.57元元以下的也有以下的也有1500户。户。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件v(三)其它分位数(三)其它分位数1.四分位数(四分位数(Quartile)(1)顺序数据中四分位数位置的确定。)顺序数据中四分位数位置的确定。(i=1,2,3)(3.9)式中,式中,Qi是第是第i个四分位数,个四分位数,n是数据个数即总体单是数据个数即总体单位数。位数。例例3-8利用例利用例3-4的数据确定四分位数。的数据确定四分位数。=不满意不满意=一般一般=满意满意(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件(2)未分组和单项式分组的数量数据中四分位数位置的)未分组和单项式分组的数量数据中四分位数位置的确定:确定:(i=1,2,3)(3.10)第一个四分位数的位置:第一个四分位数的位置:(3.11)第二个四分位数的位置:第二个四分位数的位置:(3.12)第三个四分位数的位置:第三个四分位数的位置:(3.13)(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件(3)组距式分组数量数据中四分位数位置的确定)组距式分组数量数据中四分位数位置的确定(3.14)式中,式中,表示第表示第i个分位数所在组的下限;个分位数所在组的下限;数据个数,即整体单位数;数据个数,即整体单位数;向上累计至第向上累计至第i个分位数所在组前一组的次数;个分位数所在组前一组的次数;表示第表示第i个分位数所在组的次数;个分位数所在组的次数;表示第表示第i个分位数所在组的组距。个分位数所在组的组距。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件2、百分位数(、百分位数(Percentile)百分位数是数据顺序排列后,将数据百分位数是数据顺序排列后,将数据100等分,位于等分,位于i(i=1,2,99)个等分点位置的数据值。)个等分点位置的数据值。对第对第i百分位数,严格的定义如下:百分位数,严格的定义如下:第第i百分位数是这样一个值,它使得至少有百分位数是这样一个值,它使得至少有i的数据的数据项小于或等于这个值,且至少有(项小于或等于这个值,且至少有(100i)的数据项大)的数据项大于或等于这个值。于或等于这个值。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件三、数值平均数三、数值平均数(一)算术平均数(均值)(一)算术平均数(均值)ArithmeticMean(Mean)1.基本形式基本形式(3.15)(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件2.简单算术平均数(简单算术平均数(simplearithmeticmean)简单算术平均数主要用于未分组数据,计算简单算术平均数主要用于未分组数据,计算公式如下:公式如下:(3.16)式中:式中:代表算术平均数代表算术平均数 xi表各单位标志值表各单位标志值 n代表总体单位数。代表总体单位数。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件3.加权算术平均数(加权算术平均数(weightedarithmeticmean)计算公式为:计算公式为:(3.17)加权算术平均数主要用于数据已经分组,并编制出次加权算术平均数主要用于数据已经分组,并编制出次数分布的条件下。数分布的条件下。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件计算加权算术平均数需要注意的问题计算加权算术平均数需要注意的问题(1)加权算术平均数的大小受两个因素的影响:)加权算术平均数的大小受两个因素的影响:一是变量值大小;一是变量值大小;二是各组次数占总次数比重即频率的影响。二是各组次数占总次数比重即频率的影响。(2)在分组数列的条件下,当各组标志值出现的次数)在分组数列的条件下,当各组标志值出现的次数或各组次数所占比重均相等时,权数就失去了权衡轻重的作或各组次数所占比重均相等时,权数就失去了权衡轻重的作用,这时用加权算术平均数计算的结果与用简单算术平均数用,这时用加权算术平均数计算的结果与用简单算术平均数计算的结果相同计算的结果相同,因此可以把简单算术平均数理解为加权算因此可以把简单算术平均数理解为加权算术平均数当术平均数当f1=f2=fn时的特例。时的特例。(3)关于加权算术平均数的权数选择原则)关于加权算术平均数的权数选择原则:各组标志值各组标志值各组单位数各组单位数=各组标志总量各组标志总量.(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件4、是非标志的平均数、是非标志的平均数通过给品质数据赋值的方式,把品质数据过渡为数量通过给品质数据赋值的方式,把品质数据过渡为数量上的变异,然后计算平均数。上的变异,然后计算平均数。(3.18)p也称为总体中具有某种属性的单位成数,所以成数也称为总体中具有某种属性的单位成数,所以成数是一种特殊的平均数是一种特殊的平均数是非标志的平均数。是非标志的平均数。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件5、算术平均数的数学性质、算术平均数的数学性质(1)算术平均数与标志值个数的乘积等于各标志值的总和。)算术平均数与标志值个数的乘积等于各标志值的总和。(2)各个标志值与算术平均数离差之和等于零。)各个标志值与算术平均数离差之和等于零。(3)各标志值与算术平均数离差的平方和为最小值。)各标志值与算术平均数离差的平方和为最小值。(3.21)(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件(二)调和平均数(二)调和平均数harmean(HarmonicMean)调和平均数是总体中各单位标志值倒数的算调和平均数是总体中各单位标志值倒数的算术平均数的倒数,又称术平均数的倒数,又称“倒数平均数倒数平均数”。1、简单调和平均数、简单调和平均数(3.22)应用场合应用场合各标志值对应的标志总量相等。各标志值对应的标志总量相等。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件2、加权调和平均数、加权调和平均数计算公式:计算公式:(3.23)式中,式中,m表示各单位或各组的标志值对应的标志总量。表示各单位或各组的标志值对应的标志总量。当各标志值对应的标志总量不相等时,就当各标志值对应的标志总量不相等时,就要用加权调和平均数。要用加权调和平均数。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件例例3-17某种蔬菜价格和成交量资料如表某种蔬菜价格和成交量资料如表3-10,求该种,求该种蔬菜一天平均价格。蔬菜一天平均价格。表表3-10蔬菜价格和成交量资料蔬菜价格和成交量资料时间时间批批发发价(元)价(元)成交量(公斤)成交量(公斤)成交成交额额(元)(元)早市早市午市午市晚市晚市0.700.700.680.680.74 0.74 4000400020002000 3000 300028002800 1360 1360 2220 2220 合合计计 7000 7000 6380 6380(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件v分析:分析:v如果已知资料是批发价和成交量采用算术平均数方如果已知资料是批发价和成交量采用算术平均数方法:法:v如果已知资料是批发价和成交额,则要采用调和平如果已知资料是批发价和成交额,则要采用调和平均数方法:均数方法:(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件(三)几何平均数(三)几何平均数Geomean(GeomatricMean)几何平均数也称几何均值或对数平均数,是一种有特几何平均数也称几何均值或对数平均数,是一种有特定作用的平均数。几何平均数是定作用的平均数。几何平均数是个变量值(比率)连乘个变量值(比率)连乘积的次方根,通常用于时间上有联系或有先后顺序关系积的次方根,通常用于时间上有联系或有先后顺序关系的比率求平均,凡是度量值的连乘积等于总比率或总速度的比率求平均,凡是度量值的连乘积等于总比率或总速度的现象都必须使用几何平均法计算均值。的现象都必须使用几何平均法计算均值。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件1、简单几何平均数、简单几何平均数(3.24)式中:式中:G表示几何平均数表示几何平均数 xi表示各项标志值表示各项标志值简单几何平均数适用于计算未分组数列的平均简单几何平均数适用于计算未分组数列的平均比率或平均速度。比率或平均速度。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件例例3-18某产品需经四个工序的加工,已知某产品需经四个工序的加工,已知第一工序加工合格率为第一工序加工合格率为97%,第二个工序加工合,第二个工序加工合格率为格率为95%,第三个工序加工合格率为,第三个工序加工合格率为96%,第,第四三个工序加工合格率为四三个工序加工合格率为94%,求四个工序平均,求四个工序平均加工合格率。加工合格率。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件2、加权几何平均数、加权几何平均数当计算几何平均数的各个标志值的次数不相同时,应当计算几何平均数的各个标志值的次数不相同时,应采用加权几何平均数。加权几何平均数是各标志值采用加权几何平均数。加权几何平均数是各标志值fi次方次方的连乘积的的连乘积的次方根,计算公式为:次方根,计算公式为:(3.26)适合于反映特定现象的平均水平适合于反映特定现象的平均水平现象的总标志值现象的总标志值是各单位标志值的连乘积。但是,如果数列中有一个标志是各单位标志值的连乘积。但是,如果数列中有一个标志值等于值等于0,或者数列中有一个标志值是负值,又要开偶次,或者数列中有一个标志值是负值,又要开偶次方根,就都无法计算几何平均数。方根,就都无法计算几何平均数。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件例例3-19某某2企业企业20002002年增加值发展速度如表年增加值发展速度如表3-11,试计算其试计算其20002002年增加值平均发展速度。年增加值平均发展速度。表表3-11环环比比发发展速()展速()时时期期次数次数f1021990年年1993年年31041993年年1998年年5981998年年1999年年11031999年年2001年年2(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件(四)幂平均数(四)幂平均数幂平均数是标志值幂平均数是标志值K次方的平均数的次方的平均数的K次方根。次方根。(3.27)当当k=1时,幂平均数时,幂平均数为算术平均数。为算术平均数。当当k=-1时,幂平均数时,幂平均数为调和平均数。为调和平均数。当当时,时,幂平均数趋于几何平均数。幂平均数趋于几何平均数。注意:当注意:当K=0时,平均数时,平均数为不定式。为不定式。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件因为算术平均数、几何平均数、调和平均数都是或近因为算术平均数、几何平均数、调和平均数都是或近似幂平均数的似幂平均数的k阶数由阶数由1递减为递减为0又减为又减为-1的特例,由此可的特例,由此可知它们的一般数量关系为:知它们的一般数量关系为:调和平均数小于几何平均数小于算术平均数;调和平均数小于几何平均数小于算术平均数;当各变量相等当各变量相等时,调和平均数等于几何平均数等于时,调和平均数等于几何平均数等于算术平均数。算术平均数。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件(五)集中趋势测定指标的关系(五)集中趋势测定指标的关系1.众数、中位数和算术平均数的关系众数、中位数和算术平均数的关系Mo Me Mo=Me=右偏(正偏)分布右偏(正偏)分布对称分布对称分布左偏(负偏)分布左偏(负偏)分布图图3-3中位数、众数和平均数的位置中位数、众数和平均数的位置(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件2、算术平均数、调和平均数和几何平均数的关系、算术平均数、调和平均数和几何平均数的关系在相同的数据中,算术平均数、调和平均数和几何平在相同的数据中,算术平均数、调和平均数和几何平均数在数值是的关系如下:均数在数值是的关系如下:(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件计算和应用集中趋势测定指标应注意的问题计算和应用集中趋势测定指标应注意的问题1、集中趋势的测定指标只能应用于同质总体;、集中趋势的测定指标只能应用于同质总体;2、用组平均数和分配数列补充说明总平均数;、用组平均数和分配数列补充说明总平均数;3、集中趋势指标与离散程度指标及具体分析相结、集中趋势指标与离散程度指标及具体分析相结合。合。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件第二节第二节统计变量离散程度的测定统计变量离散程度的测定测定离散程度的意义测定离散程度的意义极差、四分位差和平均差极差、四分位差和平均差方差与标准差方差与标准差离散系数与异众比率离散系数与异众比率(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件一、测定离散程度的意义一、测定离散程度的意义v1、反映现象总体中变量分布的离散程度。、反映现象总体中变量分布的离散程度。v2、衡量均值的代表性。、衡量均值的代表性。v3、测定现象变动的均匀性或稳定性程度。、测定现象变动的均匀性或稳定性程度。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件二、极差、四分位差和平均差二、极差、四分位差和平均差v1、极差(、极差(Range,R)又称全距,离散程度的最简单测度值,是最大又称全距,离散程度的最简单测度值,是最大和最小观测值之间的距离。和最小观测值之间的距离。(3.30)式中:式中:Umax代表最高组的上限;代表最高组的上限;Lmin代表最低组的下限。代表最低组的下限。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件v2、四分位差(、四分位差(QuartileDeviation)四分位差是在数列中剔除最大和最小各四分之四分位差是在数列中剔除最大和最小各四分之一的数据,是第一和第三个一的数据,是第一和第三个四分位数之间的差,也称为四四分位数之间的差,也称为四分位点内距。分位点内距。四分位差计算公式为:四分位差计算公式为:(3.31)式中:式中:QD表示四分位差,表示四分位差,Q3、Q1分别为第三个、第一个四分位数。分别为第三个、第一个四分位数。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件v3、平均差(、平均差(MeanAbsoluteDeviation)平均差是分配数列中各单位标志值与其算术平均平均差是分配数列中各单位标志值与其算术平均数之间离差绝对值的平均数,一般用数之间离差绝对值的平均数,一般用MD表示。表示。(1)未分组数列:)未分组数列:(3.32)(2)分组数列:)分组数列:(3.33)(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件三、方差与标准差方差与标准差v1、数量标志的方差与标准差、数量标志的方差与标准差未分组数列的计算公式:未分组数列的计算公式:(3.34)分组数列的计算公式:分组数列的计算公式:(3.35)式中,式中,表示方差;表示方差;表示标准差。表示标准差。方差和标准差一般用于定序数据和定比数据。方差和标准差一般用于定序数据和定比数据。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件v2、是非标志的方差和标准差、是非标志的方差和标准差用用“1”表示表示“是是”的变量值,用的变量值,用“0”表示表示“非非”的变量值,则:的变量值,则:(3.37)(3.36)(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件v3、方差与标准差的数学性质、方差与标准差的数学性质(1)变量的方差等于变量平方的平均数减去变量平)变量的方差等于变量平方的平均数减去变量平均数的平方。即:均数的平方。即:(3.38)(2)变量对算术平均数的方差小于对任意常数的方)变量对算术平均数的方差小于对任意常数的方差。差。(3)n个同性质独立变量和的方差等于各个变量方个同性质独立变量和的方差等于各个变量方差的和。差的和。(4)n个同性质独立变量平均数的方差等于各变量个同性质独立变量平均数的方差等于各变量方差平均数的方差平均数的。(5)变量线性变换的方差等于变量的方差乘以变量)变量线性变换的方差等于变量的方差乘以变量系数的平方。系数的平方。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件四、离散系数与异众比率四、离散系数与异众比率v1.离散系数离散系数(3.44)最常用的变异系数是标准差系数:最常用的变异系数是标准差系数:(3.43)(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件例例3-24在例在例3-23中,假定生产条件相同,确中,假定生产条件相同,确定哪一品种具有较大稳定性,宜于推广?定哪一品种具有较大稳定性,宜于推广?计算结果说明,乙品种的平均亩产量高于甲计算结果说明,乙品种的平均亩产量高于甲品种,离散系数低于甲品种,所以乙品种较高产品种,离散系数低于甲品种,所以乙品种较高产且具有较大的稳定性,宜于推广。且具有较大的稳定性,宜于推广。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件v2、异众比率、异众比率异众比率又称离异比率或变差比,是指异众比率又称离异比率或变差比,是指非众数的次数与全部变量值总次数的比率。非众数的次数与全部变量值总次数的比率。计算公式为:计算公式为:(3.4)(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件第三节第三节变量分布偏度与峰度的描述变量分布偏度与峰度的描述矩矩偏度偏度峰度峰度(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件一、矩一、矩矩也称为动差。它是总体中所有变量值与任矩也称为动差。它是总体中所有变量值与任意常数离差意常数离差K次方的算术平均数。次方的算术平均数。v1、基本形式、基本形式未分组数据:未分组数据:(3.46)分组数据:分组数据:(3.47)式中,式中,k为任意正整数,为任意正整数,a为常数。为常数。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件2、原点矩、原点矩若若a=0,即变量,即变量x关于原点的关于原点的k阶矩阶矩k阶原点矩。阶原点矩。3、中心矩、中心矩若若a=,就得到变量,就得到变量x关于分布中心关于分布中心的的k阶矩阶矩k阶中心阶中心矩。可见,一阶中心矩为矩。可见,一阶中心矩为0,二阶中心矩就是方差。,二阶中心矩就是方差。中心矩的两个重要性质:中心矩的两个重要性质:第一,分布对称时,必有:第一,分布对称时,必有:V1=V3=V5=V2K-1=0,k为任意常数。为任意常数。第二,当分布为正态分布时:第二,当分布为正态分布时:V2K=135(2K-1)2=(2K-1)!)!2K(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件二、偏度二、偏度偏度偏度指分布不对称的方向和程度。指分布不对称的方向和程度。计算公式:计算公式:(3.52)当当=0时,数列分布为正态分布。时,数列分布为正态分布。当当0时,数列分布有便斜,且偏斜程度随着时,数列分布有便斜,且偏斜程度随着绝对绝对值的增大而增大。值的增大而增大。当当0时,表示大于平均数的标志值分布较分散,时,表示大于平均数的标志值分布较分散,分布曲线右边拉长尾巴分布曲线右边拉长尾巴正(右)偏分布。正(右)偏分布。当当0时,表示小于平均数的标志值分布较分散,时,表示小于平均数的标志值分布较分散,分布曲线左边拉长尾巴分布曲线左边拉长尾巴负(左)偏分布。负(左)偏分布。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件三、峰度三、峰度峰度又称峭度,是指分布图形的尖峭程度或峰度又称峭度,是指分布图形的尖峭程度或峰凸程度。峰度是分布集中趋势高峰的形状。峰凸程度。峰度是分布集中趋势高峰的形状。计算公式:计算公式:(3.53)(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件尖态锋尖态锋平坦峰平坦峰图图3-4峰度图示峰度图示=0时,频率分布的峰度为正态分布的峰度。时,频率分布的峰度为正态分布的峰度。0时,频率分布的峰度比正态分布的峰度高时,频率分布的峰度比正态分布的峰度高尖态尖态峰,表明集中趋势显著,离中趋势低。峰,表明集中趋势显著,离中趋势低。0时,频率分布的峰度比正态分布的峰度低时,频率分布的峰度比正态分布的峰度低平坦平坦峰,表明离中趋势显著,集中趋势低。峰,表明离中趋势显著,集中趋势低。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件

    注意事项

    本文((本科)第3章-数据分布特征描述ppt课件.ppt)为本站会员(可****阿)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开