第四章数据的概括性度量优秀PPT.ppt
《第四章数据的概括性度量优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第四章数据的概括性度量优秀PPT.ppt(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章数据的概括性度量第一页,本课件共有80页第 4 章 数据的概括性度量4.1 集中趋势的度量集中趋势的度量 4.2 离散程度的度量离散程度的度量4.3 偏态与峰态的度量偏态与峰态的度量第二页,本课件共有80页学习目标l1.掌握集中趋势各测度值的计算方法掌握集中趋势各测度值的计算方法l2.掌握离散程度各测度值的计算方法掌握离散程度各测度值的计算方法l3.理解偏态与峰态的测度方法理解偏态与峰态的测度方法l4.能熟练运用能熟练运用Excel计算描述统计量并进行计算描述统计量并进行分析分析第三页,本课件共有80页4.1 集中趋势的度量一一.分类数据:众数分类数据:众数二二.顺序数据:中位数和分位数
2、顺序数据:中位数和分位数三三.数值型数据:均值数值型数据:均值四四.众数、中位数和均值的比较众数、中位数和均值的比较第四页,本课件共有80页集中趋势(Central tendency)1.1.一一组数据向其中心值靠拢的倾向和程度2.2.测度集中趋势就是寻找数据水测度集中趋势就是寻找数据水平的代表值或中心值平的代表值或中心值3.3.不同类型的数据用不同的集中趋不同类型的数据用不同的集中趋势测度值势测度值4.4.低层次数据的测度值适用于高低层次数据的测度值适用于高层次的测量数据,但高层次数层次的测量数据,但高层次数据的测度值并不适用于低层次据的测度值并不适用于低层次的测量数据的测量数据第五页,本课
3、件共有80页一、分类数据:众数一、分类数据:众数第六页,本课件共有80页众数(mode)1.出现次数最多的变量值2.不受极端值的影响3.不唯一性:一组数据可能没有众数或有几个众数4.主要应用于分类数据,也可以应用于顺序数据和数值型数据第七页,本课件共有80页众数(不唯一性)l无众数无众数原始数据:10 5 9 12 6 8一个众数一个众数原始数据原始数据:6 5 9 8 5 5多于一个众数多于一个众数多于一个众数多于一个众数原始数据:25 28 28 36 42 42第八页,本课件共有80页分类数据的众数(例题分析)不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例
4、百分比百分比(%)可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露15119690.300.220.180.120.183022181218合计合计501100解解解解:这这里里的的变变量量为为“饮饮料料品品牌牌”,这这是是个个分分类类变变量量,不不同类型的饮料就是变量值同类型的饮料就是变量值 在在所所调调查查的的5050人人中中,购购买买可可口口可可乐乐的的人人数数最最多多,为为1515人人,占占总总被被调调查查人人数数的的30%30%,因因此此众众数数为为“可可口口可可乐乐”这一品牌,即这一品牌,即 MMo o可口可乐可口可乐可口可乐可口可乐第九页,本课
5、件共有80页顺序数据的众数(例题分析)解解解解:这这里里的的数数据据为为顺顺序序数数据据。变变量量为为“回答类别回答类别”甲甲城城市市中中对对住住房房表表示示不不满满意意的的户户数数最最多多,为为108108户户,因因此此众众数数为为“不不满满意意”这这一一类类别,即别,即 MMo o不满意不满意不满意不满意甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510合计合计300100.0第十页,本课件共有8
6、0页二、顺序数据:中位数和分位数第十一页,本课件共有80页中位数(median)1.排序后处于中间位置上的值MMe e50%50%2.2.不受极端值的影响不受极端值的影响3.主要用于顺序数据,也可用数值型数据,但不能用于分类数据第十二页,本课件共有80页中位数(位置的确定)第十三页,本课件共有80页中位数的确定l设一组数据为l按从小到大排序后为,则中位数为:第十四页,本课件共有80页顺序数据的中位数(例题分析)解解解解:中中 位位 数数 的的 位位 置置 为为 (300+1300+1)/2/2150.5150.5 从从累累计计频频数数看看,中中位位数数在在“一一般般”这这一一组组别别中。因此中
7、。因此 Me e=一般一般甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300第十五页,本课件共有80页数值型数据的中位数(9个数据的算例)l【例例】:9个家庭的人均月收入数据l原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630l排排 序序:750 780 850 960 1080 1250 1500 1630 2000l位位 置置:
8、1 2 3 4 5 6 7 8 9中位数中位数 1080第十六页,本课件共有80页数值型数据的中位数(10个数据的算例)l【例例】:10个家庭的人均月收入数据l排排 序序:660 750 780 850 960 1080 1250 1500 1630 2000l位位 置置:1 2 3 4 5 6 7 8 9 10 第十七页,本课件共有80页四分位数(quartile)1.排序后处于25%和75%位置上的值2.不受极端值的影响3.3.主主要要用用于于顺顺序序数数据据,也也可可用用于于数数值值型型数数据据,但但不不能用于分类数据能用于分类数据QLQMQU25%25%25%25%第十八页,本课件共有
9、80页四分位数(位置的确定)第十九页,本课件共有80页顺序数据的四分位数(例题分析)解:解:解:解:Q QL L位置位置=(300)/4 (300)/4=7575 Q QU U位置位置 =(3300)/4(3300)/4 =225225 从从累累计计频频数数看看,Q QL L在在“不不满满意意”这这一一组组别别中中;Q QU U在在“一般一般”这一组别中。因此这一组别中。因此 Q QL L =不满意不满意不满意不满意 Q QU U =一般一般一般一般甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常
10、不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300第二十页,本课件共有80页数值型数据的四分位数(9个数据的算例)l【例例】:9个家庭的人均月收入数据l原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630l排排 序序:750 780 850 960 1080 1250 1500 1630 2000l位位 置置:1 2 3 4 5 6 7 8 9第二十一页,本课件共有80页三、数值型数据:均值第二十二页,本课件共有80页均值(mean)1.集中趋势的最常用测度值2.易受极端值的影
11、响3.用于数值型数据,不能用于分类数据和顺序数据第二十三页,本课件共有80页简单均值与加权均值(simple mean/weighted mean)设一组数据为:设一组数据为:x x1,x x2 2,xn各组的组中值为:M1 1,MM2 2,MMk k 相应的频数为:相应的频数为:f f1 1,f f2 2,fk k简单均值简单均值简单均值简单均值加权均值加权均值加权均值加权均值第二十四页,本课件共有80页已改至此!已改至此!某电脑公司销售量数据分组表某电脑公司销售量数据分组表按销售量分组按销售量分组组中值组中值(Mi)频数频数(fi)Mi fi 14015015016016017017018
12、018019019020020021021022022023023024014515516517518519520521522523549162720171084558013952640472537003315205017209001175合计合计12022200加权均值加权均值 (例题分析例题分析)第二十五页,本课件共有80页加权均值(权数对均值的影响)l 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下l 甲组:甲组:考试成绩(考试成绩(x):0 20 100l 人数分布(人数分布(f):):1 1 8l 乙组:乙组:考试成绩(考试成绩(x):0 20 100l 人数分布(人数分布(
13、f):):8 1 1第二十六页,本课件共有80页均值(数学性质)l1.各变量值与均值的离差之和等于零 2.各变量值与均值的离差平方和最小第二十七页,本课件共有80页调和平均数(harmonic mean)1.均值的另一种表现形式2.易受极端值的影响3.计算公式为原来只是计算原来只是计算时使用了不同时使用了不同的数据!的数据!第二十八页,本课件共有80页调和平均数(例题分析)某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜蔬菜名称名称批发价格批发价格(元元)Mi成交额成交额(元元)Mi fi成交量成交量(公斤公斤)fi甲甲乙乙丙丙1.200.500.8018000125006400150
14、00250008000合计合计3690048000【例例例例】某某蔬蔬菜菜批批发发市市场场三三种种蔬蔬菜菜的的日日成成交交数数据据如如表表,计计算算三三种种蔬蔬菜菜该日的平均批发价格该日的平均批发价格 平均批发价格平均批发价格=成交额成交额/成交量成交量第二十九页,本课件共有80页几何平均数(geometric mean)1.n 个变量值乘积的 n 次方根2.适用于对比率数据的平均3.主要用于计算平均增长率4.计算公式为5.5.可看作是均值的一种变形可看作是均值的一种变形第三十页,本课件共有80页几何平均数(例题分析)l 【例例】某水泥生产企业2001年的水泥产量为100万吨,2002年与20
15、01年相比增长率为9%,2003年与2002年相比增长率为16%,2004年与2003年相比增长率为20%。求各年的年平均增长率。年平均增长率年平均增长率114.91%-1=114.91%-1=14.91%14.91%第三十一页,本课件共有80页四、众数、中位数和均值的比较第三十二页,本课件共有80页众数、中位数和均值的关系(分布角度)左偏分布左偏分布左偏分布左偏分布均值均值均值均值 中位数中位数中位数中位数 众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布
16、右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数均值均值均值均值均值均值第三十三页,本课件共有80页众数、中位数和均值的特点和应用1.众数不受极端值影响具有不唯一性数据分布偏斜程度较大时应用2.中位数不受极端值影响数据分布偏斜程度较大时应用3.均值易受极端值影响数学性质优良数据对称分布或接近对称分布时应用第三十四页,本课件共有80页数据类型与集中趋势测度值数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度值数据类型数据类型分类数据分类数据 顺序数据顺序数据数值型数据数值型数据适适用用的的测测度度值值众数众数中位数中位数均值均值四分位数四分位数调和平均数
17、调和平均数众数众数几何平均数几何平均数 中位数中位数四分位数四分位数众数众数第三十五页,本课件共有80页4.2 离散程度的度量一一.分类数据:异众比率分类数据:异众比率二二.顺序数据:四分位差顺序数据:四分位差三三.数值型数据:方差及标准差数值型数据:方差及标准差四四.相对位置的测量:标准分数相对位置的测量:标准分数五五.相对离散程度:离散系数相对离散程度:离散系数第三十六页,本课件共有80页离中趋势1.1.数据分布的另一个重要特征数据分布的另一个重要特征2.反映各变量值远离其中心值的程度(离散程度)3.3.从从另另一一个个侧侧面面说说明明了了集集中中趋趋势测度值的代表程度势测度值的代表程度4
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 数据 概括性 度量 优秀 PPT
限制150内