第四章数据的概括性度量精选PPT.ppt





《第四章数据的概括性度量精选PPT.ppt》由会员分享,可在线阅读,更多相关《第四章数据的概括性度量精选PPT.ppt(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章数据的概括性度量第1页,此课件共80页哦第 4 章 数据的概括性度量4.1 集中趋势的度量集中趋势的度量 4.2 离散程度的度量离散程度的度量4.3 偏态与峰态的度量偏态与峰态的度量第2页,此课件共80页哦学习目标l1.掌握集中趋势各测度值的计算方法掌握集中趋势各测度值的计算方法l2.掌握离散程度各测度值的计算方法掌握离散程度各测度值的计算方法l3.理解偏态与峰态的测度方法理解偏态与峰态的测度方法l4.能熟练运用能熟练运用Excel计算描述统计量并进行计算描述统计量并进行分析分析第3页,此课件共80页哦4.1 集中趋势的度量一一.分类数据:众数分类数据:众数二二.顺序数据:中位数和分位数
2、顺序数据:中位数和分位数三三.数值型数据:均值数值型数据:均值四四.众数、中位数和均值的比较众数、中位数和均值的比较第4页,此课件共80页哦集中趋势(Central tendency)1.1.一一组数据向其中心值靠拢的倾向和组数据向其中心值靠拢的倾向和程度程度2.2.测度集中趋势就是寻找数据水测度集中趋势就是寻找数据水平的代表值或中心值平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值4.4.低层次数据的测度值适用于高层低层次数据的测度值适用于高层次的测量数据,但高层次数据的次的测量数据,但高层次数据的测度值并不适用于低层次的测量测度值并不适用于低层次的测量数据数据第5页,此课件共80
3、页哦一、分类数据:众数一、分类数据:众数第6页,此课件共80页哦众数(mode)1.出现次数最多的变量值2.不受极端值的影响3.不唯一性:一组数据可能没有众数或有几个众数4.主要应用于分类数据,也可以应用于顺序数据和数值型数据第7页,此课件共80页哦众数(不唯一性)l无众数无众数原始数据:10 5 9 12 6 8一个众数一个众数原始数据原始数据:6 5 9 8 5 5多于一个众数多于一个众数原始数据原始数据:25 28 28 36 42 42第8页,此课件共80页哦分类数据的众数(例题分析)不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分比百分比(%)可口可
4、乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露15119690.300.220.180.120.183022181218合计合计501100解解解解:这这里里的的变变量量为为“饮饮料料品品牌牌”,这这是是个个分分类类变变量量,不不同同类类型的饮料就是变量值型的饮料就是变量值 在在所所调调查查的的5050人人中中,购购买买可可口口可可乐乐的的人人数数最最多多,为为1515人人,占占总总被被调调查查人人数数的的30%30%,因因此此众众数数为为“可可口口可可乐乐”这一品牌,即这一品牌,即 MMo o可口可乐可口可乐可口可乐可口可乐第9页,此课件共80页哦顺序数据的众
5、数(例题分析)解解解解:这这里里的的数数据据为为顺顺序序数数据据。变变量量为为“回回答类别答类别”甲甲城城市市中中对对住住房房表表示示不不满满意意的的户户数数最最多多,为为108108户户,因因此此众众数数为为“不不满满意意”这这一类别,即一类别,即 MMo o不满意不满意不满意不满意甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510合计合计300100.0第10页,此课件共80页哦二、顺序数据:中位
6、数和分位数第11页,此课件共80页哦中位数(median)1.排序后处于中间位置上的值MMe e50%50%2.2.不受极端值的影响不受极端值的影响3.主要用于顺序数据,也可用数值型数据,但不能用于分类数据第12页,此课件共80页哦中位数(位置的确定)第13页,此课件共80页哦中位数的确定l设一组数据为l按从小到大排序后为,则中位数为:第14页,此课件共80页哦顺序数据的中位数(例题分析)解解解解:中中 位位 数数 的的 位位 置置 为为 (300+1300+1)/2/2150.5150.5 从从累累计计频频数数看看,中中位位数数在在“一一般般”这这一一组别中。因此组别中。因此 MMe=一般一
7、般甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300第15页,此课件共80页哦数值型数据的中位数(9个数据的算例)l【例例】:9个家庭的人均月收入数据l原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630l排排 序序:750 780 850 960 1080 1250 1500 1630 2000l位位 置置:1 2 3 4 5 6
8、7 8 9中位数中位数 1080第16页,此课件共80页哦数值型数据的中位数(10个数据的算例)l【例例】:10个家庭的人均月收入数据l排排 序序:660 750 780 850 960 1080 1250 1500 1630 2000l位位 置置:1 2 3 4 5 6 7 8 9 10 第17页,此课件共80页哦四分位数(quartile)1.排序后处于25%和75%位置上的值2.不受极端值的影响3.3.主主要要用用于于顺顺序序数数据据,也也可可用用于于数数值值型型数数据据,但但不不能能用于分类数据用于分类数据QLQMQU25%25%25%25%第18页,此课件共80页哦四分位数(位置的确
9、定)第19页,此课件共80页哦顺序数据的四分位数(例题分析)解:解:解:解:Q QL L位置位置=(300)/4 (300)/4=7575 Q QU U位置位置 =(3300)/4(3300)/4 =225225 从从累累计计频频数数看看,Q QL L在在“不不满满意意”这这一一组组别别中中;Q QU U在在“一一般般”这一组别中。因此这一组别中。因此 Q QL L =不满意不满意不满意不满意 Q QU U =一般一般一般一般甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一
10、般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300第20页,此课件共80页哦数值型数据的四分位数(9个数据的算例)l【例例】:9个家庭的人均月收入数据l原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630l排排 序序:750 780 850 960 1080 1250 1500 1630 2000l位位 置置:1 2 3 4 5 6 7 8 9第21页,此课件共80页哦三、数值型数据:均值第22页,此课件共80页哦均值(mean)1.集中趋势的最常用测度值2.易受极端值的影响3.用于数值型数据,不能用
11、于分类数据和顺序数据第23页,此课件共80页哦简单均值与加权均值(simple mean/weighted mean)设一组数据为:x x1,x x2 2,x xn各组的组中值为:各组的组中值为:MM1 1,MM2 2,Mk k 相应的频数为:相应的频数为:f f1 1,f f2,f fk k简单均值简单均值加权均值加权均值加权均值加权均值第24页,此课件共80页哦已改至此!已改至此!某电脑公司销售量数据分组表某电脑公司销售量数据分组表按销售量分组按销售量分组组中值组中值(Mi)频数频数(fi)Mi fi 14015015016016017017018018019019020020021021
12、022022023023024014515516517518519520521522523549162720171084558013952640472537003315205017209001175合计合计12022200加权均值加权均值 (例题分析例题分析)第25页,此课件共80页哦加权均值(权数对均值的影响)l 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下l 甲组:甲组:考试成绩(考试成绩(x):0 20 100l 人数分布(人数分布(f):):1 1 8l 乙组:乙组:考试成绩(考试成绩(x):0 20 100l 人数分布(人数分布(f):):8 1 1第26页,此课件共80页
13、哦均值(数学性质)l1.各变量值与均值的离差之和等于零 2.各变量值与均值的离差平方和最小第27页,此课件共80页哦调和平均数(harmonic mean)1.均值的另一种表现形式2.易受极端值的影响3.计算公式为原来只是计算原来只是计算时使用了不同时使用了不同的数据!的数据!第28页,此课件共80页哦调和平均数(例题分析)某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜蔬菜名称名称批发价格批发价格(元元)Mi成交额成交额(元元)Mi fi成交量成交量(公斤公斤)fi甲甲乙乙丙丙1.200.500.801800012500640015000250008000合计合计3690048000
14、【例例例例】某某蔬蔬菜菜批批发发市市场场三三种种蔬蔬菜菜的的日日成成交交数数据据如如表表,计计算算三三种种蔬菜该日的平均批发价格蔬菜该日的平均批发价格 平均批发价格平均批发价格=成交额成交额/成交量成交量第29页,此课件共80页哦几何平均数(geometric mean)1.n 个变量值乘积的 n 次方根2.适用于对比率数据的平均3.主要用于计算平均增长率4.计算公式为5.5.可看作是均值的一种变形第30页,此课件共80页哦几何平均数(例题分析)l 【例例】某水泥生产企业2001年的水泥产量为100万吨,2002年与2001年相比增长率为9%,2003年与2002年相比增长率为16%,2004
15、年与2003年相比增长率为20%。求各年的年平均增长率。年平均增长率年平均增长率114.91%-1=114.91%-1=14.91%14.91%第31页,此课件共80页哦四、众数、中位数和均值的比较第32页,此课件共80页哦众数、中位数和均值的关系(分布角度)左偏分布左偏分布左偏分布左偏分布均值均值均值均值 中位数中位数中位数中位数 众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数
16、均值均值均值均值均值均值第33页,此课件共80页哦众数、中位数和均值的特点和应用1.众数不受极端值影响具有不唯一性数据分布偏斜程度较大时应用2.中位数不受极端值影响数据分布偏斜程度较大时应用3.均值易受极端值影响数学性质优良数据对称分布或接近对称分布时应用第34页,此课件共80页哦数据类型与集中趋势测度值数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度值数据类型数据类型分类数据分类数据 顺序数据顺序数据数值型数据数值型数据适适用用的的测测度度值值众数众数中位数中位数均值均值四分位数四分位数调和平均数调和平均数众数众数几何平均数几何平均数 中位数中位数四分位数四分位数众数众数第35
17、页,此课件共80页哦4.2 离散程度的度量一一.分类数据:异众比率分类数据:异众比率二二.顺序数据:四分位差顺序数据:四分位差三三.数值型数据:方差及标准差数值型数据:方差及标准差四四.相对位置的测量:标准分数相对位置的测量:标准分数五五.相对离散程度:离散系数相对离散程度:离散系数第36页,此课件共80页哦离中趋势1.1.数据分布的另一个重要特征数据分布的另一个重要特征2.2.反反映映各各变变量量值值远远离离其其中中心心值值的的程度(离散程度)程度(离散程度)3.从另一个侧面说明了集中趋势测度值的代表程度4.4.不不同同类类型型的的数数据据有有不不同同的的离离散散程度测度值程度测度值第37页
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 数据 概括性 度量 精选 PPT

限制150内