第4章-数据的概括性度量.ppt
《第4章-数据的概括性度量.ppt》由会员分享,可在线阅读,更多相关《第4章-数据的概括性度量.ppt(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第4 4章章 数据的概括性度量数据的概括性度量1 1集中趋势的度量集中趋势的度量2 2离散程度的度量离散程度的度量3 3偏态与峰态的度量偏态与峰态的度量某高校只有两个系,财经系和工程系。某高校只有两个系,财经系和工程系。该校报考及录取的总体情况如下:该校报考及录取的总体情况如下:男生男生女生女生录取录取350350200200未录取未录取450450400400报考人数报考人数800800600600引例:引例:录取中有无性别歧视录取中有无性别歧视?工程系工程系财经系财经系男生男生女生女生 男生男生女生女生录取录取3003001001005050100100未录取未录取30030010010
2、0150150300300报考人数报考人数 600600200200200200400400学过统计学的同学不会简单地做出结论,而是继续搜集数据学过统计学的同学不会简单地做出结论,而是继续搜集数据学过统计学的同学不会简单地做出结论,而是继续搜集数据第第1 1节节 分布集中趋势的测度分布集中趋势的测度一、众数一、众数二、中位数二、中位数三、四分位数三、四分位数四、均值四、均值五、几何均值五、几何均值六、切尾均值六、切尾均值七、众数、中位数和均值的比较七、众数、中位数和均值的比较5 5众数众数 (modemode)1.1.一组数据中出现次数最多的变量值一组数据中出现次数最多的变量值2.2.适合于数
3、据量较多时使用适合于数据量较多时使用3.3.不受极端值的影响不受极端值的影响4.4.一组数据可能没有众数或有几个众数一组数据可能没有众数或有几个众数5.5.主要用于分类数据,也可用于顺序数据和数值主要用于分类数据,也可用于顺序数据和数值型数据型数据6 6众数众数 (不惟一性不惟一性)无众数无众数原始数据原始数据:11 3 7 12 9 8:11 3 7 12 9 8一个众数一个众数一个众数一个众数原始数据原始数据原始数据原始数据:7 :7 :7 :7 4 4 4 4 6 13 6 13 6 13 6 13 4 4 4 4 4 4 4 4多于一个众数多于一个众数多于一个众数多于一个众数原始数据原
4、始数据原始数据原始数据:17 :17 :17 :17 25252525 25252525 33 33 33 33 24 24 24 24 242424247 7中位数中位数 (medianmedian)1.1.排序后处于中间位置上的值排序后处于中间位置上的值2.2.2.2.不受极端值的影响不受极端值的影响不受极端值的影响不受极端值的影响3.3.3.3.主要用于顺序数据,也可用数值型数据,但不主要用于顺序数据,也可用数值型数据,但不主要用于顺序数据,也可用数值型数据,但不主要用于顺序数据,也可用数值型数据,但不能用于分类数据能用于分类数据能用于分类数据能用于分类数据4.4.4.4.各变量值与中位
5、数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即MMe e50%50%8 8中位数中位数 (位置的确定位置的确定)9 9案例分析案例分析 (9(9个数据的算例个数据的算例)【例例例例】9 9 9 9个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据原始数据原始数据:1400 750 760 1050 870 950 2100 1450 15401400 750 760 1050 870 950 2100 1450 1540 排排排排 序序序序:
6、750 760 870 950 750 760 870 950 10501050 1400 1450 1540 21001400 1450 1540 2100位位位位 置置置置:1 2 3 4 1 2 3 4 5 5 6 7 8 9 6 7 8 9中位数中位数中位数中位数 =1050=1050=1050=10501010案例分析案例分析 (10(10个数据的算例个数据的算例)【例例例例】10 10 10 10个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据 排排排排 序序序序:635635 690 770 820690 770 820 930 10789
7、30 1078 1230 1450 1690 21501230 1450 1690 2150 位位位位 置置置置:1 2 3 4 1 2 3 4 5 65 6 7 8 9 10 7 8 9 10 1111四分位数四分位数 (quartilequartile)1.1.排序后处于排序后处于25%25%和和75%75%位置上的值位置上的值2.2.2.2.不受极端值的影响不受极端值的影响不受极端值的影响不受极端值的影响3.3.3.3.主要用于顺序数据,也可用于数值型数据,但不主要用于顺序数据,也可用于数值型数据,但不主要用于顺序数据,也可用于数值型数据,但不主要用于顺序数据,也可用于数值型数据,但不能
8、用于分类数据能用于分类数据能用于分类数据能用于分类数据QQL LQQMMQQU U25%25%25%25%1212四分位数四分位数 (位置的确定位置的确定)1313案例分析案例分析 (四分位数四分位数7 7个数据的算例个数据的算例)原始数据原始数据原始数据原始数据:23 21:23 21:23 21:23 21 30 30 30 30 32 28 25 32 28 25 32 28 25 32 28 25 26262626排排排排 序序序序:21 :21 :21 :21 23232323 25 26 28 25 26 28 25 26 28 25 26 28 30303030 32 32 32
9、 32位位位位 置置置置:1 :1 :1 :1 2 3 4 5 6 72 3 4 5 6 72 3 4 5 6 72 3 4 5 6 7QL=23QU=307+7+1 1QQL L位置位置位置位置 =4 4=4 4=2=2QQU U位置位置位置位置 =3(3(N+N+1)1)4 43(73(7+1)1)4 4 =6=6N+N+1 11414案例分析案例分析(四分位数四分位数1010个数据的算例个数据的算例)【例例例例】10 10 10 10个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据排排 序序:500 :500 650 760650 760 780
10、940 1060 1350 780 940 1060 1350 1680 17901680 1790 1900 1900位位 置置:1 :1 2 32 3 4 5 6 7 4 5 6 7 8 98 9 10 10统计函数统计函数统计函数统计函数QUARTILEQUARTILEQUARTILEQUARTILE1515均值均值 (meanmean)1.1.集中趋势的最常用测度值集中趋势的最常用测度值2.2.一组数据的均衡点所在一组数据的均衡点所在3.3.体现了数据的必然性特征体现了数据的必然性特征4.4.易受极端值的影响易受极端值的影响5.5.用于数值型数据,不能用于分类数据和顺序用于数值型数据,
11、不能用于分类数据和顺序数据数据1616简单均值简单均值 (simple mean)(simple mean)设一组数据为:设一组数据为:设一组数据为:设一组数据为:x x x x1 1 1 1,x x x x2 2 2 2,x x x xn n n n总体均值总体均值总体均值总体均值样本均值样本均值样本均值样本均值1717加权均值加权均值 (weighted mean)(weighted mean)设一组数据为:设一组数据为:设一组数据为:设一组数据为:x x x x1 1 1 1,x x x x2 2 2 2,x x x xn n n n相应的频数为:相应的频数为:相应的频数为:相应的频数为
12、:f f f f1 1 1 1,f f f f2 2 2 2,f f f fk k k k总体均值总体均值总体均值总体均值样本均值样本均值样本均值样本均值1818案例分析案例分析 加权均值加权均值按零件数分组按零件数分组组中值(组中值(Xi)频数(频数(Fi)XiFi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计合计506160.0【例例例例】根据表中的数据,计算根据表中的数据,计算根据表中的
13、数据,计算根据表中的数据,计算50 50 50 50 名名名名工人日加工零件数的均值工人日加工零件数的均值工人日加工零件数的均值工人日加工零件数的均值 表表2-5 某车间某车间50名工人日加工零件均值计算表名工人日加工零件均值计算表1919均值均值 (数学性质数学性质)1.1.各变量值与均值的离差之和等于零各变量值与均值的离差之和等于零2.2.2.2.各变量值与均值的离差平方和最小各变量值与均值的离差平方和最小各变量值与均值的离差平方和最小各变量值与均值的离差平方和最小3.3.3.3.统计分布的均衡点统计分布的均衡点统计分布的均衡点统计分布的均衡点2020几何均值几何均值 (geometric
14、 meangeometric mean)1.1.n n 个变量值乘积的个变量值乘积的 n n 次方根次方根2.2.适用于对比率数据的平均适用于对比率数据的平均3.3.主要用于计算平均增长率主要用于计算平均增长率4.4.计算公式为计算公式为:5.5.可看作是均值的一种变形可看作是均值的一种变形可看作是均值的一种变形可看作是均值的一种变形2121案例分析案例分析 几何均值几何均值 【例例】一一位位投投资资者者购购持持有有一一种种股股票票,在在19971997年年、19199898年年、19991999年年和和20002000年年收收益益率率分分别别为为 4.5%4.5%、2.0%2.0%、3.5%
15、3.5%、5.4%5.4%。计计算算该该投投资资者者在在这四年内的平均收益率这四年内的平均收益率 平均收益率平均收益率平均收益率平均收益率103.84%-1=3.84%103.84%-1=3.84%103.84%-1=3.84%103.84%-1=3.84%2222切尾均值切尾均值 (trimmed Mean)(trimmed Mean)1.1.去掉大小两端的若干数值后计算中间数据的均值去掉大小两端的若干数值后计算中间数据的均值2.2.在在电电视视大大奖奖赛赛、体体育育比比赛赛及及需需要要人人们们进进行行综综合合评评价的比赛项目中已得到广泛应用价的比赛项目中已得到广泛应用3.3.计算公式为计算
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 概括性 度量
限制150内