(本科)第3章-数据分布特征描述ppt课件.ppt
《(本科)第3章-数据分布特征描述ppt课件.ppt》由会员分享,可在线阅读,更多相关《(本科)第3章-数据分布特征描述ppt课件.ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章数据分布特征描述数据分布特征描述统计变量集中趋势的测定统计变量集中趋势的测定统计变量离散程度的测定统计变量离散程度的测定变量分布偏度与峰度的描述变量分布偏度与峰度的描述(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件第一节第一节统计变量集中趋势的测定统计变量集中趋势的测定测定集中趋势的意义测定集中趋势的意义位置代表值位置代表值数值平均数数值平均数(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件一、测定集中趋势的意义一、测定集中趋势的意义v测定集中趋势的指标有:位置代表值和数值平均数。测定集中趋势的指标有:位置代表值和数值平均数。位
2、置代表值位置代表值:在总体中将变量值按顺序排列后得到的:在总体中将变量值按顺序排列后得到的数列中某个特殊位置的值。数列中某个特殊位置的值。常用的反应集中趋势的位置代表值有众数、中位数常用的反应集中趋势的位置代表值有众数、中位数等。等。数值平均数数值平均数就是均值,它是对总体中的所有数据计算就是均值,它是对总体中的所有数据计算平均值,用以反映所有数据的一般水平。平均值,用以反映所有数据的一般水平。由于计算方法不同,数值平均数有算术平均数、调和由于计算方法不同,数值平均数有算术平均数、调和平均数、几何平均数和幂平均数。平均数、几何平均数和幂平均数。(本科)第(本科)第3章章 数据分布数据分布特征描
3、述特征描述ppt课课件件v测定集中趋势的作用测定集中趋势的作用1、反映总体各单位变量分布的集中趋势、反映总体各单位变量分布的集中趋势和一般水平。和一般水平。2、比较同类现象在不同单位的发展水平。、比较同类现象在不同单位的发展水平。3、比较同类现象在不同时期的发展变化、比较同类现象在不同时期的发展变化趋势或规律。趋势或规律。4、分析现象之间的依存关系。、分析现象之间的依存关系。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件二、位置代表值二、位置代表值v(一)众数(一)众数(Mode)众数众数是总体中出现次数最多的那个数据值,是总体中出现次数最多的那个数据值,在频数分布
4、中,众数指频数或频率最大的标志值在频数分布中,众数指频数或频率最大的标志值用用表示。表示。(a a)单单众数众数 (b b)双众数)双众数 (c c)五种无众数的情形)五种无众数的情形图图 3-1 3-1 众数示意众数示意图图(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件众数的确定众数的确定1.由品质数列和单项式数量数列确定众数由品质数列和单项式数量数列确定众数2.由组距数量数列确定众数由组距数量数列确定众数由组距数列确定众数,首先应当确定众数组,由组距数列确定众数,首先应当确定众数组,然后通过比例插值法计算众数。然后通过比例插值法计算众数。在等距分组条件下,众数组
5、就是次数最多的那在等距分组条件下,众数组就是次数最多的那一组;一组;在不等距分组的条件下,众数组则是频数密度在不等距分组的条件下,众数组则是频数密度或频率密度最高的那一组。或频率密度最高的那一组。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件fMoL MOMOUMOfMo-fMo+1fMo-fMo-1图图3-2众数与相邻两组的关系众数与相邻两组的关系比例插值法图示比例插值法图示(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件上限公式上限公式:(3.1)下限公式:下限公式:(3.2)MO代表众数;代表众数;代表众数组的下限;代表众数组的下限;
6、代表众数组的上限;代表众数组的上限;代表众数组的次数;代表众数组的次数;代表众数组前一组的次数;代表众数组前一组的次数;代表众数组后一组的次数;代表众数组后一组的次数;代表众数组的组距。代表众数组的组距。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件v例例3-3某地区农民收入情况如表某地区农民收入情况如表3-3,计算其,计算其人均纯收入的众数。人均纯收入的众数。表表3-3农民家庭年人均纯收入情况表农民家庭年人均纯收入情况表按年人均按年人均纯纯收入分收入分组组(元)(元)农农民家庭数(民家庭数(户户)1000100012001200240240120012001400
7、14004804801400140016001600 1050 1050160016001800180060060018001800200020002702702000200022002200210210220022002400240012012024002400260026003030合合 计计30003000(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件例例3-3(续)(续)或或(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件v(二)中位数(二)中位数(Median)中位数和众数一样,也是一种位置代表值,中位数和众数一样,也是一种位置代
8、表值,但是,它不能用于定类数据,只能在顺序及以上的但是,它不能用于定类数据,只能在顺序及以上的数据中使用,所以又称为次序统计量,用数据中使用,所以又称为次序统计量,用Me表示。表示。中位数中位数是将总体中的数据按顺序排列后,是将总体中的数据按顺序排列后,处于数列中点位置上的那个数据值或变量值,或者处于数列中点位置上的那个数据值或变量值,或者说中位数是累计频率数列中,累计频率为说中位数是累计频率数列中,累计频率为0.50所对所对应的变量值。应的变量值。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件1、由顺序数据和未分组的数量数据确定中位数。、由顺序数据和未分组的数量数
9、据确定中位数。顺序数据中位数的位置:顺序数据中位数的位置:中位数位置中位数位置=(3.3)未分组的数量数据中位数的位置:未分组的数量数据中位数的位置:中位数位置中位数位置=(3.4)(3.5)(3.6)(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件v例例3-4某高校一次对食堂伙食满意度的调查某高校一次对食堂伙食满意度的调查数据如表数据如表3-4所示。所示。表表3-4调查数据次数分布调查数据次数分布回答回答类别类别学生人数(人)学生人数(人)累累计计学生数(向上累学生数(向上累计计)非常不非常不满满意意240240240240不不满满意意108010801320132
10、0一般一般93093022502250满满意意45045027002700非常非常满满意意30030030003000合合计计30003000中位数位置中位数位置=3000/2=1500从累计学生数看,中位数在第三组,所以:从累计学生数看,中位数在第三组,所以:Me=一般。一般。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件例例3-5有有8名工人,每人日产零件数按从底到名工人,每人日产零件数按从底到高的顺序排列如下:高的顺序排列如下:17、19、20、22、23、23、24、25(件(件/人)。人)。则则中位数为中位数为22.5件件/人,这个数字反映了工人总体人,这
11、个数字反映了工人总体日产零件数的一般水平。日产零件数的一般水平。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件2、由单项式分组数量数据确定中位数、由单项式分组数量数据确定中位数单项式数量数据分组已经将数据顺序化,这时单项式数量数据分组已经将数据顺序化,这时数据个数即总体单位数数据个数即总体单位数n=f,确定中位数位置的方,确定中位数位置的方法要通过累计次数计算。法要通过累计次数计算。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件3、由组距式分组的数量数据确定中位数、由组距式分组的数量数据确定中位数在假定中位数组内的各数据均匀分布的前提下,
12、利用下在假定中位数组内的各数据均匀分布的前提下,利用下面的公式计算中位数的近似值:面的公式计算中位数的近似值:下限公式:下限公式:(3.7)上限公式:上限公式:(3.8)表示中位数;表示中位数;表示中位数所在组的下限;表示中位数所在组的下限;表示中位数所在组的上限;表示中位数所在组的上限;表示向上累计至中位数所在组前一组的次数;表示向上累计至中位数所在组前一组的次数;表示向下累计至中位数所在组后一组的次数;表示向下累计至中位数所在组后一组的次数;表示中位数所在组的次数;表示中位数所在组的次数;表示中位数所在组的组距。表示中位数所在组的组距。(本科)第(本科)第3章章 数据分布数据分布特征描述特
13、征描述ppt课课件件例例3-7根据表根据表3-3数据计算农民家庭年人均纯收入中位数数据计算农民家庭年人均纯收入中位数表表3-6农民家庭年人均纯收入累计次数表农民家庭年人均纯收入累计次数表按年人均按年人均纯纯收入收入分分组组(元)(元)农农民家庭数民家庭数(户户)累累计户计户数(数(户户)(向上累(向上累计计)累累计户计户数(数(户户)(向下累(向下累计计)1000120024024030001200140048072027601400160010501770228016001800600237012301800200027026406302000220021028503602200240012
14、029701502400260030300030合合计计3000(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件例例3-7续续计算表明,这计算表明,这3000户农民家庭年人均纯收入户农民家庭年人均纯收入的中位数是的中位数是1548.57元,也就是说,人均纯收入在元,也就是说,人均纯收入在1548.57元以上的农民家庭有元以上的农民家庭有1500户,在户,在1547.57元元以下的也有以下的也有1500户。户。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件v(三)其它分位数(三)其它分位数1.四分位数(四分位数(Quartile)(1)顺序数
15、据中四分位数位置的确定。)顺序数据中四分位数位置的确定。(i=1,2,3)(3.9)式中,式中,Qi是第是第i个四分位数,个四分位数,n是数据个数即总体单是数据个数即总体单位数。位数。例例3-8利用例利用例3-4的数据确定四分位数。的数据确定四分位数。=不满意不满意=一般一般=满意满意(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件(2)未分组和单项式分组的数量数据中四分位数位置的)未分组和单项式分组的数量数据中四分位数位置的确定:确定:(i=1,2,3)(3.10)第一个四分位数的位置:第一个四分位数的位置:(3.11)第二个四分位数的位置:第二个四分位数的位置:(
16、3.12)第三个四分位数的位置:第三个四分位数的位置:(3.13)(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件(3)组距式分组数量数据中四分位数位置的确定)组距式分组数量数据中四分位数位置的确定(3.14)式中,式中,表示第表示第i个分位数所在组的下限;个分位数所在组的下限;数据个数,即整体单位数;数据个数,即整体单位数;向上累计至第向上累计至第i个分位数所在组前一组的次数;个分位数所在组前一组的次数;表示第表示第i个分位数所在组的次数;个分位数所在组的次数;表示第表示第i个分位数所在组的组距。个分位数所在组的组距。(本科)第(本科)第3章章 数据分布数据分布特征
17、描述特征描述ppt课课件件2、百分位数(、百分位数(Percentile)百分位数是数据顺序排列后,将数据百分位数是数据顺序排列后,将数据100等分,位于等分,位于i(i=1,2,99)个等分点位置的数据值。)个等分点位置的数据值。对第对第i百分位数,严格的定义如下:百分位数,严格的定义如下:第第i百分位数是这样一个值,它使得至少有百分位数是这样一个值,它使得至少有i的数据的数据项小于或等于这个值,且至少有(项小于或等于这个值,且至少有(100i)的数据项大)的数据项大于或等于这个值。于或等于这个值。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件三、数值平均数三、数
18、值平均数(一)算术平均数(均值)(一)算术平均数(均值)ArithmeticMean(Mean)1.基本形式基本形式(3.15)(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件2.简单算术平均数(简单算术平均数(simplearithmeticmean)简单算术平均数主要用于未分组数据,计算简单算术平均数主要用于未分组数据,计算公式如下:公式如下:(3.16)式中:式中:代表算术平均数代表算术平均数 xi表各单位标志值表各单位标志值 n代表总体单位数。代表总体单位数。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件3.加权算术平均数(加权算术
19、平均数(weightedarithmeticmean)计算公式为:计算公式为:(3.17)加权算术平均数主要用于数据已经分组,并编制出次加权算术平均数主要用于数据已经分组,并编制出次数分布的条件下。数分布的条件下。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件计算加权算术平均数需要注意的问题计算加权算术平均数需要注意的问题(1)加权算术平均数的大小受两个因素的影响:)加权算术平均数的大小受两个因素的影响:一是变量值大小;一是变量值大小;二是各组次数占总次数比重即频率的影响。二是各组次数占总次数比重即频率的影响。(2)在分组数列的条件下,当各组标志值出现的次数)在分组
20、数列的条件下,当各组标志值出现的次数或各组次数所占比重均相等时,权数就失去了权衡轻重的作或各组次数所占比重均相等时,权数就失去了权衡轻重的作用,这时用加权算术平均数计算的结果与用简单算术平均数用,这时用加权算术平均数计算的结果与用简单算术平均数计算的结果相同计算的结果相同,因此可以把简单算术平均数理解为加权算因此可以把简单算术平均数理解为加权算术平均数当术平均数当f1=f2=fn时的特例。时的特例。(3)关于加权算术平均数的权数选择原则)关于加权算术平均数的权数选择原则:各组标志值各组标志值各组单位数各组单位数=各组标志总量各组标志总量.(本科)第(本科)第3章章 数据分布数据分布特征描述特征
21、描述ppt课课件件4、是非标志的平均数、是非标志的平均数通过给品质数据赋值的方式,把品质数据过渡为数量通过给品质数据赋值的方式,把品质数据过渡为数量上的变异,然后计算平均数。上的变异,然后计算平均数。(3.18)p也称为总体中具有某种属性的单位成数,所以成数也称为总体中具有某种属性的单位成数,所以成数是一种特殊的平均数是一种特殊的平均数是非标志的平均数。是非标志的平均数。(本科)第(本科)第3章章 数据分布数据分布特征描述特征描述ppt课课件件5、算术平均数的数学性质、算术平均数的数学性质(1)算术平均数与标志值个数的乘积等于各标志值的总和。)算术平均数与标志值个数的乘积等于各标志值的总和。(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 本科 数据 分布 特征 描述 ppt 课件
限制150内