第4章--数据的概括性度量ppt课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第4章--数据的概括性度量ppt课件.ppt》由会员分享,可在线阅读,更多相关《第4章--数据的概括性度量ppt课件.ppt(126页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 - 1 - 1 - 1 1 1统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )第第 4 章章 数据的概括性度量数据的概括性度量1 - 1 - 1 - 2 2 2统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )第第 4 章章 数据的概括性度量数据的概括性度量4.1 集中趋势的度量集中趋势的度量 4.2 离散程度的度量离散程度的度量4.3 偏态与峰态的度量偏态与峰态的度量1 - 1 - 1
2、 - 3 3 3统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )4.1 集中趋势的度量4.1.1 分类数据:众数分类数据:众数4.1.2 顺序数据:中位数和分位数顺序数据:中位数和分位数4.1.3 数值型数据:平均数数值型数据:平均数4.1.4 众数、中位数和平均数的比较众数、中位数和平均数的比较1 - 1 - 1 - 4 4 4统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )集中趋势集中
3、趋势1. 一一组数据向其中心值靠拢的倾向和程度组数据向其中心值靠拢的倾向和程度2. 测度集中趋势就是寻找数据水平的代表值或中心值测度集中趋势就是寻找数据水平的代表值或中心值3. 不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值4. 低层次数据的测度值适用于高层次的测量数据,但高低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据层次数据的测度值并不适用于低层次的测量数据1 - 1 - 1 - 5 5 5统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五
4、版第五版) ) )分类数据:众数,分类数据:众数, 0M1 - 1 - 1 - 6 6 6统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )众数众数(mode)1. 一组数据中出现次数最多的变量值2. 适合于数据量较多时使用3. 不受极端值的影响4. 一组数据可能没有众数或有几个众数5. 主要用于分类数据,也可用于顺序数据和数值型数据1 - 1 - 1 - 7 7 7统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五
5、版第五版第五版) ) )q当数据分布存在明显的集中趋势,且有显当数据分布存在明显的集中趋势,且有显 著的极端值时,适合使用众数;著的极端值时,适合使用众数;q当数据分布的集中趋势不明显或存在两个当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数以上分布中心时,不适合使用众数众数的原理及应用众数的原理及应用1 - 1 - 1 - 8 8 8统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )不唯一性不唯一性无众数无众数原始数据: 10 5 9 12 6 86 5 9 8 5 5多于
6、一个众数多于一个众数原始数据: 25 28 28 36 42 421 - 1 - 1 - 9 9 9统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )分类数据的众数分类数据的众数 (例题分析例题分析)不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分比百分比(%) 可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计501100变量为变量为“饮
7、料品牌饮料品牌”,这是个分类变量,不同这是个分类变量,不同类型的饮料就是变量值类型的饮料就是变量值 Mo可口可乐可口可乐1 - 1 - 1 - 101010统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )顺序数据的众数顺序数据的众数 (例题分析例题分析)顺序数据。变量为顺序数据。变量为“回答类别回答类别” Mo不满意不满意甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%) 非常不满意非常不满意 不满意不满意
8、一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510合计合计300100.0月产量(件)月产量(件) 工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50 xf001MMff001MMff0Mf0ML0M0MU021100mmdLM下限公式:1001mmff式中:1002mmff021200mmdUM上限公式:数值型数据数值型数据月产量(件)月产量(件) 工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600
9、以上以上373283104250合计合计50 xfdLMo211件502200242525400oM1 - 1 - 1 - 141414统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )顺序数据:中位数和分位数顺序数据:中位数和分位数1 - 1 - 1 - 151515统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )中位数中位数(median)1.排序后处于中间位置上的值Me2. 不受极端值
10、的影响不受极端值的影响3. 主要用于顺序数据,也可用数值型数据,但不能用于分类数据1 - 1 - 1 - 161616统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )中位数中位数(位置和数值的确定位置和数值的确定) 如果统计资料中如果统计资料中含有异常的或极端含有异常的或极端的数据,就有可能的数据,就有可能得到非典型的甚至得到非典型的甚至可能产生误导的平可能产生误导的平均数,这时使用中均数,这时使用中位数来度量集中趋位数来度量集中趋势比较合适。势比较合适。比如有比如有5 5笔付款:笔付款:
11、9 9元,元,1010元,元,1010元,元,1111元,元,6060元元 平均付款为平均付款为100/5=20100/5=20元。元。 很明显,这并不很明显,这并不是一个好的代表值,是一个好的代表值,而中位数而中位数1010元是一元是一个更好的代表值。个更好的代表值。1 - 1 - 1 - 181818统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )顺序数据的中位数顺序数据的中位数 (例题分析例题分析)甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城
12、市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 24132225270300合计合计3001 - 1 - 1 - 191919统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )数值型数据的中位数数值型数据的中位数 (9个数据的算例个数据的算例)【例例】 9个家庭的人均月收入数据原始数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630排排 序序: 750
13、 780 850 960 1080 1250 1500 1630 2000位位 置置: 1 2 3 4 5 6 7 8 91 - 1 - 1 - 202020统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )数值型数据的中位数数值型数据的中位数 (10个数据的算例个数据的算例)【例例】:10个家庭的人均月收入数据排排 序序: 660 750 780 850 960 1080 1250 1500 1630 2000位位 置置: 1 2 3 4 5 6 7 8 9 10 月产量(件)月产量(件)
14、工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50 xf共共 个单位个单位2f共共 个单位个单位2f共共 个单位个单位1mS共共 个单位个单位1mSLU组距为组距为d共共 个单位个单位mf12mSfdfSfLMmme12dfSfmm12向上累计向上累计共共 个单位个单位2f共共 个单位个单位2f共共 个单位个单位1mS共共 个单位个单位1mSLU组距为组距为d共共 个单位个单位mf12mfS12memfSMUdf12mmfSdf向下累计向下累计1 - 1 - 1 - 242424统计学统计学统
15、计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )月产量(件)月产量(件) 工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50 xfdfSfLMmme12 件75.4934006003210250400eM1 - 1 - 1 - 252525统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )四分位数四分位数
16、(quartile)1. 排序后处于25%和75%位置上的值1 - 1 - 1 - 262626统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )四分位数四分位数(位置的确定位置的确定)1 - 1 - 1 - 272727统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )四分位数四分位数(位置的确定位置的确定)方法方法3: 其中 表示中位数的位置取整。这样计算出的四分位数的位置,要么是整数,要
17、么在两个数之间0.5的位置上方法方法4: Excel给出的四分位数位置的确定方法 如果位置不是整数,则按比例分摊位置两侧数值的差值1 - 1 - 1 - 282828统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )顺序数据的四分位数顺序数据的四分位数 (例题分析例题分析)解:解:QL位置= (300)/4 =75 QU位置 =(3300)/4 =225 从累计频数看, QL在“不满意”这一组别中; QU在“一般”这一组别中 四分位数为 QL = 不满意不满意 QU = 一般一般甲城市家庭对住
18、房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 24132225270300合计合计3001 - 1 - 1 - 292929统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )数值型数据的四分位数数值型数据的四分位数 (9个数据的算例个数据的算例)【例例】:9个家庭的人均月收入数据(4种方法计算)原始数据原始数据: 150
19、0 750 780 1080 850 960 2000 1250 1630排排 序序: 750 780 850 960 1080 1250 1500 1630 2000位位 置置: 1 2 3 4 5 6 7 8 91 - 1 - 1 - 303030统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )数值型数据的四分位数数值型数据的四分位数 (9个数据的算例个数据的算例)【例例】:9个家庭的人均月收入数据原始数据原始数据: 1500 750 780 1080 850 960 2000 1250
20、 1630排排 序序: 750 780 850 960 1080 1250 1500 1630 2000位位 置置: 1 2 3 4 5 6 7 8 91 - 1 - 1 - 313131统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )数值型数据的四分位数数值型数据的四分位数 (9个数据的算例个数据的算例)【例例】:9个家庭的人均月收入数据原始数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630排排 序序: 750 780 850 960 1080
21、 1250 1500 1630 2000位位 置置: 1 2 3 4 5 6 7 8 91 - 1 - 1 - 323232统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )数值型数据的四分位数数值型数据的四分位数 (9个数据的算例个数据的算例)【例例】:9个家庭的人均月收入数据原始数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630排排 序序: 750 780 850 960 1080 1250 1500 1630 2000位位 置置: 1 2 3
22、 4 5 6 7 8 91 - 1 - 1 - 333333统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )数值型数据:平均数数值型数据:平均数1 - 1 - 1 - 343434统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )平均数平均数(mean)1. 也称为均值,一组数据相加后除以数据的个数得到的结果2. 集中趋势的最常用测度值3. 一组数据的均衡点所在4. 易受极端值的影响5. 有
23、简单平均数和加权平均数之分6. 根据总体数据计算的,记为;根据样本数据计算的,称为样本平均数,记为x1 - 1 - 1 - 353535统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )简单平均数简单平均数-未分组数据未分组数据(Simple mean)设一组数据为:设一组数据为:x1 ,x2 , ,xn (总体数据总体数据xN) 样本平均数样本平均数总体平均数总体平均数1 - 1 - 1 - 363636统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATIS
24、TICS( ( (第五版第五版第五版第五版第五版第五版) ) )520600480750440527905585xxN元1 - 1 - 1 - 373737统计学统计学统计学统计学统计学统计学STATISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )加权平均数加权平均数-分组数据分组数据 (Weighted mean)设各组的组中值为:设各组的组中值为:M1 ,M2 , ,Mk 相应的频数为:相应的频数为: f1 , f2 , ,fk样本加权平均总体加权平均1 - 1 - 1 - 383838统计学统计学统计学统计学统计学统计学STAT
25、ISTICSSTATISTICSSTATISTICS( ( (第五版第五版第五版第五版第五版第五版) ) )加权平均数加权平均数(权数对均值的影响权数对均值的影响) 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下 甲组:甲组: 考试成绩(考试成绩(x ): 0 20 100 人数分布(人数分布(f ):):1 1 8 乙组:乙组: 考试成绩(考试成绩(x): 0 20 100 人数分布(人数分布(f ):):8 1 1日产量(件)日产量(件)工人人数(人)工人人数(人)xf101112131470100380150100合计合计8001110701410070100971012.137
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 概括性 度量 ppt 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内