【教学课件】第4章数据的概括性度量.ppt
《【教学课件】第4章数据的概括性度量.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第4章数据的概括性度量.ppt(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、4-1统计学统计学STATISTICS第第 4 章章 数据的概括性度量数据的概括性度量作者:中国人民大学统计学院作者:中国人民大学统计学院贾俊平贾俊平统计学4-2统计学统计学STATISTICS第第 4 章章 数据的概括性度量数据的概括性度量4.1 集中趋势的度量集中趋势的度量 4.2 离散程度的度量离散程度的度量4.3 偏态与峰度的度量偏态与峰度的度量4-3统计学统计学STATISTICS学习目标学习目标1.集中趋势各测度值的计算方法集中趋势各测度值的计算方法2.集中趋势各测度值的特点及应用场合集中趋势各测度值的特点及应用场合3.离散程度各测度值的计算方法离散程度各测度值的计算方法4.离散程
2、度各测度值的特点及应用场合离散程度各测度值的特点及应用场合5.偏态与峰态的测度方法偏态与峰态的测度方法6.用用Excel计算描述统计量并进行分析计算描述统计量并进行分析4-4统计学统计学STATISTICS数据分布的特征数据分布的特征集中趋势集中趋势集中趋势集中趋势 (位置位置位置位置)偏态和峰态偏态和峰态偏态和峰态偏态和峰态(形状)(形状)(形状)(形状)离中趋势离中趋势离中趋势离中趋势 (分散程度分散程度分散程度分散程度)4-5统计学统计学STATISTICS数据分布特征的测度数据分布特征的测度数据特征的测度数据特征的测度众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数平均数
3、平均数平均数平均数平均数平均数离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 态态态态态态四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态分布的形状分布的形状集中趋势集中趋势离散程度离散程度4-6统计学统计学STATISTICS4.1 集中趋势的度量集中趋势的度量4.1.1 分类数据:众数分类数据:众数4.1.2 顺序数据:中位数和分位数顺序数据:中位数和分位数4.1.3 数值型数据:平均数数值型数据:平均数4.1.4 众数、中位数和平
4、均数的比较众数、中位数和平均数的比较4-7统计学统计学STATISTICS集中位置集中位置(central tendency)1.1.一一组数据的中心位置或平均水平组数据的中心位置或平均水平2.2.测度集中趋势就是寻找数据水平的代表值或中心值测度集中趋势就是寻找数据水平的代表值或中心值3.3.不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值4.4.低层次数据的测度值适用于高层次的测量数据,但高低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据层次数据的测度值并不适用于低层次的测量数据4-8统计学统计学STATISTICS分类数据:众
5、数分类数据:众数4-9统计学统计学STATISTICS众数众数(mode)1.一组数据中出现次数最多的变量值2.适合于数据量较多时使用3.不受极端值的影响4.一组数据可能没有众数或有几个众数5.主要用于分类数据,也可用于顺序数据和数值型数据4-10统计学统计学STATISTICS众数众数(不惟一性不惟一性)无众数无众数原始数据:10 5 9 12 6 8一个众数一个众数原始数据:6 5 9 8 5 5多于一个众数多于一个众数原始数据:25 28 28 36 42 424-11统计学统计学STATISTICS分类数据的众数分类数据的众数 (例题分析例题分析)不同品牌饮料的频数分布不同品牌饮料的频
6、数分布不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌饮料品牌饮料品牌频数频数频数频数比例比例比例比例百分比百分比百分比百分比(%)(%)可口可乐可口可乐可口可乐可口可乐 旭日升冰茶旭日升冰茶旭日升冰茶旭日升冰茶 百事可乐百事可乐百事可乐百事可乐 汇源果汁汇源果汁汇源果汁汇源果汁 露露露露露露露露15151111 9 9 6 6 9 90.300.300.220.220.180.180.120.120.180.1830302222181812121818合计合计合计合计50501 1100100解解解解:这这里里的的变变量量为为“饮饮料料品品牌牌”,这这是是个个分分类类变变量量,
7、不不同同类类型型的的饮饮料料就是变量值就是变量值 所所调调查查的的5050人人中中,购购买买可可口口可可乐乐的的人人数数最最多多,为为1515人人,占占总总被被调调查查人人数数的的30%30%,因因此此众众数数为为“可可口口可可乐乐”这这一一品品牌牌,即即 MMo o可口可乐可口可乐可口可乐可口可乐4-12统计学统计学STATISTICS顺序数据的众数顺序数据的众数 (例题分析例题分析)解解解解:这这里里的的数数据据为为顺顺序序数数据据。变变量量为为“回回答类别答类别”甲甲城城市市中中对对住住房房表表示示不不满满意意的的户户数数最最多多,为为108108户户,因因此此众众数数为为“不不满满意意
8、”这这一类别,即一类别,即 MMo o不满意不满意不满意不满意甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户数户数户数户数 (户户户户)百分比百分比百分比百分比 (%)(%)非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意 24 24108108 93 93 45 45 30 30 8 83636313115151010合计合计合计合计300300100.010
9、0.04-13统计学统计学STATISTICS顺序数据:中位数和分位数顺序数据:中位数和分位数4-14统计学统计学STATISTICS中位数中位数(median)1.排序后处于中间位置上的值排序后处于中间位置上的值MMe e50%50%2.不受极端值的影响不受极端值的影响3.主要用于顺序数据,也可用数值型数据,但不能主要用于顺序数据,也可用数值型数据,但不能用于分类数据用于分类数据4.各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即4-15统计学统计学STATISTICS中位数中位数(位置的确定位置的确定)原始数据:原始数据:分组数据:分组数据:4-16统计学统
10、计学STATISTICS顺序数据的中位数顺序数据的中位数 (例题分析例题分析)解:解:解:解:中位数的位置为中位数的位置为 300/2 300/2150150 从从累累计计频频数数看看,中中位位数数在在“一一般般”这这一组别中一组别中 中位数为中位数为 Me=一般一般甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户数户数户数户数 (户户户户)累计频数累计频数累计频数累计频数 非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般
11、一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意 24 24108108 93 93 45 45 30 30 24 24132132225225270270300300合计合计合计合计3003004-17统计学统计学STATISTICS数值型数据的中位数数值型数据的中位数(9个数据的算例个数据的算例)【例】【例】9个家庭的人均月收入数据原始数据原始数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 16301500 750 780 1080 850 960 2000 1250 1630排排排排 序序序序:750 780 850 960 10
12、80 1250 1500 1630 2000750 780 850 960 1080 1250 1500 1630 2000位位位位 置置置置:1 2 3 4 1 2 3 4 5 5 6 7 8 9 6 7 8 9中位数中位数 10804-18统计学统计学STATISTICS数值型数据的中位数数值型数据的中位数(10个数据的算例个数据的算例)【例】:【例】:10个家庭的人均月收入数据排排排排 序序序序:660660 750 780 850 960 1080 1250 1500 1630 2000750 780 850 960 1080 1250 1500 1630 2000位位位位 置置置置:
13、1 2 3 4 1 2 3 4 5 5 6 6 7 8 9 10 7 8 9 10 4-19统计学统计学STATISTICS四分位数四分位数(quartile)1.排序后处于25%和75%位置上的值2.不受极端值的影响3.主要用于顺序数据,也可用于数值型数据,但不能用于分类数据QQL LQQMMQQU U25%25%25%25%4-20统计学统计学STATISTICS四分位数四分位数(位置的确定位置的确定)原始数据:原始数据:分组数据:分组数据:4-21统计学统计学STATISTICS顺序数据的四分位数顺序数据的四分位数 (例题分析例题分析)解:解:解:解:Q QL L位置位置=(300)/4
14、 (300)/4=7575 Q QU U位置位置 =(3300)/4(3300)/4 =225225 从从累累计计频频数数看看,Q QL L在在“不不满意满意”这一组别中;这一组别中;Q QU U在在“一般一般”这一组别中这一组别中 四分位数为四分位数为 Q QL L =不满意不满意不满意不满意 QQU U =一般一般一般一般甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户数户数户数户数 (户户户户)累计频数累计频数累计频数累计频数 非常不满意非常不
15、满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意 24 24108108 93 93 45 45 30 30 24 24132132225225270270300300合计合计合计合计3003004-22统计学统计学STATISTICS数值型数据的四分位数数值型数据的四分位数(9个数据的算例个数据的算例)【例】:【例】:9个家庭的人均月收入数据原始数据原始数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 16301500 750 780 1080 850 960 2000 125
16、0 1630排排排排 序序序序:750 780 850 960 1080 1250 1500 1630 2000750 780 850 960 1080 1250 1500 1630 2000位位位位 置置置置:1 1 2 32 3 4 4 5 5 6 6 7 87 8 9 94-23统计学统计学STATISTICS数值型数据的四分位数数值型数据的四分位数(10个数据的算例个数据的算例)【例】:【例】:10个家庭的人均月收入数据排排排排 序序序序:660660 750 780 850 960 1080 1250 1500 1630 2000750 780 850 960 1080 1250 1
17、500 1630 2000位位位位 置置置置:1 1 2 32 3 4 4 5 65 6 7 7 8 98 9 10 10 4-24统计学统计学STATISTICS数值型数据:平均数数值型数据:平均数4-25统计学统计学STATISTICS平均数平均数(mean)1.集中趋势的最常用测度值2.一组数据的均衡点所在3.体现了数据的必然性特征4.易受极端值的影响5.用于数值型数据,不能用于分类数据和顺序数据4-26统计学统计学STATISTICS简单平均数与加权平均数简单平均数与加权平均数(simple mean/weighted mean)设一组数据为:设一组数据为:x x1 1,x x2 2,
18、x xn n各组的组中值为:各组的组中值为:MM1 1,MM2 2,MMk k 相应的频数为:相应的频数为:f f1 1,f f2 2,f fk k简单均值简单均值简单均值简单均值加权均值加权均值加权均值加权均值4-27统计学统计学STATISTICS已改至此!已改至此!某电脑公司销售量数据分组表某电脑公司销售量数据分组表某电脑公司销售量数据分组表某电脑公司销售量数据分组表按销售量分组按销售量分组按销售量分组按销售量分组组中值组中值组中值组中值(MMi i)频数频数频数频数(f fi i)MMi i f fi i 140140 150150150150 160160160160 1701701
19、70170 180180180180 190190190190 200200200200 210210210220210220220230220230230240230240145145155155165165175175185185195195205205215215225225235235 4 4 9 916162727202017171010 8 8 4 4 5 5 580 58013951395264026404725472537003700331533152050205017201720 900 90011751175合计合计合计合计1201202220022200加权平均数加权平均
20、数 (例题分析例题分析)4-28统计学统计学STATISTICS加权平均数加权平均数(权数对均值的影响权数对均值的影响)甲乙两组各有甲乙两组各有1010名学生,他们的考试成绩及其分布数据如下名学生,他们的考试成绩及其分布数据如下 甲组:甲组:甲组:甲组:考试成绩(考试成绩(考试成绩(考试成绩(x x):0 20 100 0 20 100 人数分布(人数分布(人数分布(人数分布(f f):):):):1 1 81 1 8 乙组:乙组:乙组:乙组:考试成绩(考试成绩(考试成绩(考试成绩(x x):0 20 100 0 20 100 人数分布(人数分布(人数分布(人数分布(f f):):):):8
21、1 18 1 14-29统计学统计学STATISTICS平均数平均数(数学性质数学性质)1.各变量值与均值的离差之和等于零 2.各变量值与均值的离差平方和最小4-30统计学统计学STATISTICS调和平均数调和平均数(harmonic mean)1.均值的另一种表现形式2.易受极端值的影响3.计算公式为原来只是计算原来只是计算时使用了不同时使用了不同的数据!的数据!4-31统计学统计学STATISTICS调和平均数调和平均数 (例题分析例题分析)某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜蔬菜蔬菜蔬菜名称名称名称名称批发价格批发
22、价格批发价格批发价格(元元元元)MMi i成交额成交额成交额成交额(元元元元)MMi i f fi i成交量成交量成交量成交量(公斤公斤公斤公斤)f fi i甲甲甲甲乙乙乙乙丙丙丙丙1.201.200.500.500.800.8018000180001250012500 6400 640015000150002500025000 8000 8000合计合计合计合计36900369004800048000【例例例例】某某蔬蔬菜菜批批发发市市场场三三种种蔬蔬菜菜的的日日成成交交数数据据如如表表,计计算算三三种蔬菜该日的平均批发价格种蔬菜该日的平均批发价格4-32统计学统计学STATISTICS几何
23、平均数几何平均数(geometric mean)1.n n 个变量值乘积的个变量值乘积的 n n 次方根次方根2.适用于对比率数据的平均适用于对比率数据的平均3.主要用于计算平均增长率主要用于计算平均增长率4.计算公式为计算公式为5.5.可看作是均值的一种变形可看作是均值的一种变形4-33统计学统计学STATISTICS几何平均数几何平均数 (例题分析例题分析)【例例例例】某某水水泥泥生生产产企企业业19991999年年的的水水泥泥产产量量为为100100万万 吨吨,20002000年年 与与 19991999年年 相相 比比 增增 长长 率率 为为 9%9%,20012001年年与与2000
24、2000年年相相比比增增长长率率为为16%16%,20022002年年与与20012001年年相相比比增增长长率率为为20%20%。求求各各年年的的年年平平均均增增长率。长率。年平均增长率年平均增长率114.91%-1=114.91%-1=14.91%14.91%4-34统计学统计学STATISTICS几何平均数几何平均数 (例题分析例题分析)【例例例例】一一位位投投资资者者购购持持有有一一种种股股票票,在在20002000、20012001、20022002和和20032003年年收收益益率率分分别别为为4.5%4.5%、2.1%2.1%、25.5%25.5%、1.9%1.9%。计算该投资者
25、在这四年内的平均收益率。计算该投资者在这四年内的平均收益率 算术平均:算术平均:算术平均:算术平均:几何平均:几何平均:几何平均:几何平均:4-35统计学统计学STATISTICS众数、中位数和平均数的比较众数、中位数和平均数的比较4-36统计学统计学STATISTICS众数、中位数和平均数的关系众数、中位数和平均数的关系左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数右
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 数据 概括性 度量
限制150内