统计数据的描述之分布集中趋势的测度.pptx
《统计数据的描述之分布集中趋势的测度.pptx》由会员分享,可在线阅读,更多相关《统计数据的描述之分布集中趋势的测度.pptx(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、本资料来源第二章第二章 统计数据的描述统计数据的描述 第第2节节 分布集中趋势的测度分布集中趋势的测度v一、众数一、众数v二、中位数二、中位数v三、四分位数三、四分位数v四、均值四、均值v五、几何平均数五、几何平均数v六、切尾均值六、切尾均值v七、众数、中位数和均值的比较七、众数、中位数和均值的比较集中趋势集中趋势(central tendency)v一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度v测度集中趋势就是寻找数据水平的代表值或中测度集中趋势就是寻找数据水平的代表值或中测度集中趋势就是寻找数据水平
2、的代表值或中测度集中趋势就是寻找数据水平的代表值或中心值心值心值心值v不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值v低层次数据的测度值适用于高层次的测量数据,低层次数据的测度值适用于高层次的测量数据,低层次数据的测度值适用于高层次的测量数据,低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测但高层次数据的测度值并不适用于低层次的测但高层次数据的测度值并不适用于低层次的测但高层次数据的测度值并不适用于低层次的测量数据量数据量数据量数据众数众数(mode)1.一组数据
3、中出现次数最多的变量值一组数据中出现次数最多的变量值一组数据中出现次数最多的变量值一组数据中出现次数最多的变量值2.一般情况下,只有在数据量较大且集中趋势明一般情况下,只有在数据量较大且集中趋势明一般情况下,只有在数据量较大且集中趋势明一般情况下,只有在数据量较大且集中趋势明显的情况下,才能用众数作为总体的代表值。显的情况下,才能用众数作为总体的代表值。显的情况下,才能用众数作为总体的代表值。显的情况下,才能用众数作为总体的代表值。3.众数是一个位置代表值,不受极端值的影响众数是一个位置代表值,不受极端值的影响众数是一个位置代表值,不受极端值的影响众数是一个位置代表值,不受极端值的影响4.主要
4、用于定类尺度数据,也可用于定序尺度数主要用于定类尺度数据,也可用于定序尺度数主要用于定类尺度数据,也可用于定序尺度数主要用于定类尺度数据,也可用于定序尺度数据和定比尺度数据据和定比尺度数据据和定比尺度数据据和定比尺度数据众数的种类众数的种类无众数无众数data:10 5 9 12 6 8一个众数一个众数data:6 5 9 8 5 5双众数双众数data:25 28 28 36 42 42多众数多众数 data:32 32 32 33 34 34 34 35 36 36 36定类尺度数据的众数定类尺度数据的众数(例题分析例题分析)解解解解:众众众众数数数数为为为为“SP09-05”SP09-0
5、5”,即即即即 MMo o SP09-05SP09-05某专卖店新品球衣销售情况(单位某专卖店新品球衣销售情况(单位:件)件)定序尺度数据的众数定序尺度数据的众数定序尺度数据的众数定序尺度数据的众数 (例题分析例题分析例题分析例题分析)解解解解:众众众众数数数数为为为为“副副副副教教教教授授授授”这一级别,即这一级别,即这一级别,即这一级别,即 MMo o副教授副教授副教授副教授某高校在职教师职称分布某高校在职教师职称分布职称职称人数人数百分比百分比 (%)教授教授 副教授副教授 讲师讲师 助教助教 其他教师其他教师 151382 297 203 17 14.3836.3828.2919.33
6、1.62合计合计1050100.00日产量(日产量(日产量(日产量(件)件)件)件)工人人数(人)工人人数(人)工人人数(人)工人人数(人)101011111212131314147070100100380380150150100100合计合计合计合计800800【例例】已知已知某企业某日工人的日产量资料如下某企业某日工人的日产量资料如下:解:该企业该解:该企业该日全部工人日日全部工人日产量的众数为产量的众数为12件。件。定比尺度数据的众数定比尺度数据的众数(单变量值分组单变量值分组)符号含义:符号含义:(A)L为众数组的下限;为众数组的下限;(B)1=fmfm-1,即众数组的次数与前一组次数
7、之,即众数组的次数与前一组次数之差;差;2=fm fm+1,即众数组的次数与后一组次数,即众数组的次数与后一组次数之差之差;(C)i为众数组的组距为众数组的组距。定比尺度数据的众数定比尺度数据的众数(组距分组组距分组)组距分组计算众数组距分组计算众数收入组别收入组别人均收入(元)人均收入(元)频数(人)频数(人)1 12 23 34 45 56 62 0002 000以下以下2 0002 0004 0004 0004 0004 0006 0006 0006 0006 0008 0008 0008 0008 00010 00010 00010 00010 000以上以上2323434368683
8、23224241010合合 计计200200某某地区的人均月收入调查数据地区的人均月收入调查数据排序后处于中间位置上的值排序后处于中间位置上的值排序后处于中间位置上的值排序后处于中间位置上的值不受极端值的影响不受极端值的影响不受极端值的影响不受极端值的影响主要用于定序尺度数据,也可用于定比尺度数主要用于定序尺度数据,也可用于定比尺度数主要用于定序尺度数据,也可用于定比尺度数主要用于定序尺度数据,也可用于定比尺度数据,但不能用于定类尺度数据据,但不能用于定类尺度数据据,但不能用于定类尺度数据据,但不能用于定类尺度数据MMe e50%50%中位数中位数(median)1、确定中位数的位置、确定中位
9、数的位置定序尺度数据的中位数定序尺度数据的中位数2、确定中位数、确定中位数定序尺度数据的中位数定序尺度数据的中位数定序尺度数据的中位数定序尺度数据的中位数 (例题分析例题分析例题分析例题分析)解:中位数的位置为解:中位数的位置为解:中位数的位置为解:中位数的位置为 300/2300/2150150 从从从从累累累累计计计计频频频频数数数数看看看看,中中中中位位位位数数数数在在在在“一一一一般般般般”这这这这一组别中一组别中一组别中一组别中 中位数为中位数为中位数为中位数为 Me=一般一般甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (
10、户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 24132225270300合计合计300(1)由未分组资料确定中位数)由未分组资料确定中位数(2)由单变量值分组确定中位数)由单变量值分组确定中位数(3)由组距分组数据确定中位数)由组距分组数据确定中位数定比尺度数据的中位数定比尺度数据的中位数(计算方法计算方法)(1)由未分组资料确定中位数)由未分组资料确定中位数排序:确定中位数位置排序:确定中位数位置v奇数:中间位置的变量值为中位数。奇数:中间位置的变量值为中位数。奇数:中间位置的变量值为中位数。奇数:中间位置的
11、变量值为中位数。v偶数:中间位置相邻两个变量值的简单平均数是偶数:中间位置相邻两个变量值的简单平均数是偶数:中间位置相邻两个变量值的简单平均数是偶数:中间位置相邻两个变量值的简单平均数是中位数。中位数。中位数。中位数。定比尺度数据的中位数定比尺度数据的中位数定比尺度数据的中位数定比尺度数据的中位数 (计算方法计算方法计算方法计算方法)中位数中位数(9个数据的算例个数据的算例)【例例】9个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排序排序:750 780 850 960 1080 1250 1500
12、 1630 2000位位 置置:1 2 3 4 5 6 7 8 9中位数中位数Me 1080中位数中位数(10个数据的算例个数据的算例)【例例】:10个家庭的人均月收入数据个家庭的人均月收入数据排序排序:660 750 780 850 960 1080 1250 1500 1630 2000位置位置:1 2 3 4 5 6 7 8 9 10 (2)由单变量值分组确定中位数)由单变量值分组确定中位数中位数位置:中位数位置:从累计频数看,中位数在从累计频数看,中位数在“80”这一组别中这一组别中,中位数为中位数为MMe=34e=34(台)(台)(台)(台)402802nOm某公司销售人员月销售冰箱
13、中位数计算某公司销售人员月销售冰箱中位数计算销售冰箱分组销售冰箱分组 (台台)销售人员数销售人员数(人人)向下累计向下累计频数频数向上累计向上累计频数频数25303234363931014271883132754728080776753268合合 计计80v(3)由组距分组数据确定中位数)由组距分组数据确定中位数第一步:确定中位数位置第一步:确定中位数位置其中:其中:L L是中位数所在组的下限是中位数所在组的下限f fm m是中位数所在组的次数是中位数所在组的次数S Sm-1m-1是中位数所在组前面各组累计次数是中位数所在组前面各组累计次数i i是中位数所在组的组距是中位数所在组的组距第二步:
14、采用公式计算第二步:采用公式计算 按家庭收入分组(元)按家庭收入分组(元)家庭数(户)家庭数(户)向下累计频数向下累计频数5 0005 000以下以下5 0005 00010 00010 00010 00010 00015 00015 00015 00015 00020 00020 00020 00020 000以上以上2121454514146 66 621216666808086869292合合 计计9292某地区家庭收入分组某地区家庭收入分组中位数的位置在第中位数的位置在第46(92/2)位,应在第二组)位,应在第二组分位数分位数1、四分位数、四分位数2、十分位数、十分位数3、百分位数、
15、百分位数四分位数四分位数四分位数四分位数(quartile)(quartile)2.不受极端值的影响不受极端值的影响1.排序后处于排序后处于排序后处于排序后处于25%25%和和和和75%75%位置上的值位置上的值位置上的值位置上的值QQ1 1QQ2 2QQ3 325%25%25%25%3、主要用于定序尺度数据,也可用于定比尺、主要用于定序尺度数据,也可用于定比尺度数据,但不能用于定类尺度数据度数据,但不能用于定类尺度数据1、由定序数据确定四分位数、由定序数据确定四分位数(2)确定四分位数)确定四分位数(1)确定位置:)确定位置:四分位数四分位数定序尺度数据的四分位数定序尺度数据的四分位数定序尺
16、度数据的四分位数定序尺度数据的四分位数 (例题分析例题分析例题分析例题分析)解:解:解:解:Q Q1 1位置位置位置位置=(300)/4=75=(300)/4=75 Q Q3 3位置位置位置位置 =(3300)/4=(3300)/4 =225 =225 从从从从累累累累计计计计频频频频数数数数看看看看,Q Q1 1在在在在“不不不不满意满意满意满意”这一组别中;这一组别中;这一组别中;这一组别中;Q Q3 3在在在在“一般一般一般一般”这一组别中这一组别中这一组别中这一组别中 四分位数为四分位数为四分位数为四分位数为 Q Q1 1 =不满意不满意不满意不满意 QQ3 3=一般一般一般一般甲城市
17、家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 24132225270300合计合计300四分位数四分位数2、由未分组数据确定四分位数、由未分组数据确定四分位数(1)确定位置:)确定位置:四分位数四分位数(2)确定四分位数)确定四分位数【例例例例】:9 9个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据原始数据原始数据:1500 750 780 1080 85
18、0 960 2000 1250 1630:1500 750 780 1080 850 960 2000 1250 1630排排排排 序序序序:750 780 850 960 1080 1250 1500 1630 2000:750 780 850 960 1080 1250 1500 1630 2000位位位位 置置置置:1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9四分位数四分位数【例例例例】:1010个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据排序排序排序排序:660 750 780 850 960 1080 1250 1
19、500 1630 2000:660 750 780 850 960 1080 1250 1500 1630 2000位置位置位置位置:1 2 3 4 5 6 7 8 9 10 :1 2 3 4 5 6 7 8 9 10 四分位数四分位数均值均值(mean)(mean)1.集中趋势的最常用测度值集中趋势的最常用测度值集中趋势的最常用测度值集中趋势的最常用测度值2.一组数据的均衡点所在一组数据的均衡点所在一组数据的均衡点所在一组数据的均衡点所在3.体现了数据的必然性特征体现了数据的必然性特征体现了数据的必然性特征体现了数据的必然性特征4.易受极端值的影响易受极端值的影响易受极端值的影响易受极端值的
20、影响5.用于定比尺度数据,不能用于定类尺度数据和定用于定比尺度数据,不能用于定类尺度数据和定用于定比尺度数据,不能用于定类尺度数据和定用于定比尺度数据,不能用于定类尺度数据和定序尺度数据序尺度数据序尺度数据序尺度数据简单平均数与加权平均数简单平均数与加权平均数简单平均数与加权平均数简单平均数与加权平均数(simple mean/weighted mean)(simple mean/weighted mean)设一组数据为:设一组数据为:设一组数据为:设一组数据为:x x1 1,x x2 2,x xn n各组的组中值为:各组的组中值为:各组的组中值为:各组的组中值为:MM1 1,MM2 2,MM
21、k k 相应的频数为:相应的频数为:相应的频数为:相应的频数为:f f1 1,f f2 2,f fk k简单平均数简单平均数简单平均数简单平均数加权平均数加权平均数加权平均数加权平均数某电脑公司销售量数据分组表某电脑公司销售量数据分组表按销售量分组按销售量分组 组中值组中值(Mi)频数频数(fi)Mi fi 140150150160160170170180180190190200200210210220220230230240145155165175185195205215225235 4 91627201710 8 4 5 5801395264047253700331520501720 90
22、01175合计合计12022200加权平均数加权平均数加权平均数加权平均数(例题分析例题分析例题分析例题分析)加权平均数加权平均数加权平均数加权平均数(权数对均值的影响权数对均值的影响权数对均值的影响权数对均值的影响)甲乙两组各有甲乙两组各有甲乙两组各有甲乙两组各有1010名学生,他们的考试成绩及其分布数据如下名学生,他们的考试成绩及其分布数据如下名学生,他们的考试成绩及其分布数据如下名学生,他们的考试成绩及其分布数据如下vv 甲组:甲组:甲组:甲组:考试成绩(考试成绩(考试成绩(考试成绩(x x):0 20 100 0 20 100vv 人数分布(人数分布(人数分布(人数分布(f f):):
23、):):1 1 81 1 8vv 乙组:乙组:乙组:乙组:考试成绩(考试成绩(考试成绩(考试成绩(x x):0 20 100 0 20 100vv 人数分布(人数分布(人数分布(人数分布(f f):):):):8 1 18 1 1几何平均数几何平均数几何平均数几何平均数(geometric mean)(geometric mean)1.1.n n 个变量值乘积的个变量值乘积的个变量值乘积的个变量值乘积的 n n 次方根次方根次方根次方根2.2.适用于对比率数据的平均适用于对比率数据的平均适用于对比率数据的平均适用于对比率数据的平均3.3.主要用于计算平均增长率主要用于计算平均增长率主要用于计算
24、平均增长率主要用于计算平均增长率4.4.计算公式为计算公式为计算公式为计算公式为5.5.当数据中出现零值或负值时不宜计算几何平均数当数据中出现零值或负值时不宜计算几何平均数当数据中出现零值或负值时不宜计算几何平均数当数据中出现零值或负值时不宜计算几何平均数某电器销售公司某电器销售公司2003200320082008年销售量的环比增长年销售量的环比增长率分别为:率分别为:7.6%7.6%、2.5%2.5%、0.60.6、2.7%2.7%和和2.2%2.2%。求这。求这期间销售量的平均增长率。期间销售量的平均增长率。几何平均数的计算示例几何平均数的计算示例销售量的平均增长率销售量的平均增长率=10
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计数据 描述 分布 集中 趋势 测度
限制150内