【教学课件】第3章数据的概括性度量.ppt
STAT第 3章 数据的概括性度量3.1 集中趋势的度量集中趋势的度量 3.2 离散程度的度量离散程度的度量3.3 偏态与峰态的度量偏态与峰态的度量STAT学学 习习 目目 标标1.1.1.1.集中趋势各测度值的计算方法集中趋势各测度值的计算方法集中趋势各测度值的计算方法集中趋势各测度值的计算方法2.2.2.2.集中趋势各测度值的特点及应用场合集中趋势各测度值的特点及应用场合集中趋势各测度值的特点及应用场合集中趋势各测度值的特点及应用场合3.3.3.3.离散程度各测度值的计算方法离散程度各测度值的计算方法离散程度各测度值的计算方法离散程度各测度值的计算方法4.4.4.4.离散程度各测度值的特点及应用场合离散程度各测度值的特点及应用场合离散程度各测度值的特点及应用场合离散程度各测度值的特点及应用场合5.5.偏态与峰态的测度方法偏态与峰态的测度方法偏态与峰态的测度方法偏态与峰态的测度方法6.6.用用用用ExcelExcelExcelExcel计算描述统计量并进行分析计算描述统计量并进行分析计算描述统计量并进行分析计算描述统计量并进行分析STAT数据分布的特征数据分布的特征集中趋势集中趋势集中趋势集中趋势 (位置位置位置位置)偏态和峰态偏态和峰态偏态和峰态偏态和峰态(形状)(形状)(形状)(形状)离中趋势离中趋势离中趋势离中趋势 (分散程度分散程度分散程度分散程度)STAT数据分布特征的测度数据分布特征的测度数据特征的测度数据特征的测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众众众 数数数数中位数中位数中位数中位数均均均均 值值值值离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰 态态态态四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率偏偏偏偏 态态态态STAT集中趋势集中趋势集中趋势集中趋势(central tendency)(central tendency)1.1.一一一一组数据组数据组数据组数据向其中心值靠拢向其中心值靠拢向其中心值靠拢向其中心值靠拢的倾向和程度的倾向和程度的倾向和程度的倾向和程度2.2.测度集中趋势就是寻找数据水平的测度集中趋势就是寻找数据水平的测度集中趋势就是寻找数据水平的测度集中趋势就是寻找数据水平的代表值或中心值代表值或中心值代表值或中心值代表值或中心值3.3.不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值4.4.低层次数据的测度值适用于高层次的测量数据,但高层次低层次数据的测度值适用于高层次的测量数据,但高层次低层次数据的测度值适用于高层次的测量数据,但高层次低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据数据的测度值并不适用于低层次的测量数据数据的测度值并不适用于低层次的测量数据数据的测度值并不适用于低层次的测量数据5.5.测度值的选用取决于所掌握的数据的类型测度值的选用取决于所掌握的数据的类型测度值的选用取决于所掌握的数据的类型测度值的选用取决于所掌握的数据的类型3.1 集中趋势的测度集中趋势的测度STAT3.1 3.1 集中趋势的测度集中趋势的测度一一.分类数据:分类数据:众数众数二二.顺序数据:顺序数据:中位数中位数和和分位数分位数三三.数值型数据:数值型数据:均值均值四四.众数、中位数和均值的比较众数、中位数和均值的比较STAT一一.分类数据:分类数据:众数众数(mode)1.集中趋势的测度值之一集中趋势的测度值之一集中趋势的测度值之一集中趋势的测度值之一2.出现次数最多出现次数最多出现次数最多出现次数最多的的的的变量值变量值变量值变量值3.不受极端值的影响不受极端值的影响不受极端值的影响不受极端值的影响4.可能可能可能可能没有众数没有众数没有众数没有众数或有或有或有或有几个众数几个众数几个众数几个众数5.主要用于分类数据,也可用于顺序数据和主要用于分类数据,也可用于顺序数据和主要用于分类数据,也可用于顺序数据和主要用于分类数据,也可用于顺序数据和数值型数据数值型数据数值型数据数值型数据STAT众数众数(不唯一性不唯一性)无众数无众数原始数据原始数据原始数据原始数据:10 5 9 12 6 8:10 5 9 12 6 8:10 5 9 12 6 8:10 5 9 12 6 8一个众数一个众数一个众数一个众数原始数据原始数据原始数据原始数据:6 5 9 8 5 5:6 5 9 8 5 5多于一个众数多于一个众数多于一个众数多于一个众数原始数据原始数据原始数据原始数据:25 28 28 36 42 42:25 28 28 36 42 42:25 28 28 36 42 42:25 28 28 36 42 42STAT分类数据的众数分类数据的众数(例题分析例题分析)某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 广告类型广告类型广告类型广告类型人数人数人数人数(人人人人)比例比例比例比例频率频率频率频率(%)(%)商品广告商品广告商品广告商品广告 服务广告服务广告服务广告服务广告 金融广告金融广告金融广告金融广告 房地产广告房地产广告房地产广告房地产广告 招生招聘广告招生招聘广告招生招聘广告招生招聘广告 其他广告其他广告其他广告其他广告11211251519 9161610102 20.5600.5600.2550.2550.0450.0450.0800.0800.0500.0500.0100.01056.056.025.525.54.54.58.08.05.05.01.01.0合计合计2002001 1100100解解解解:这这这这里里里里的的的的变变变变量量量量为为为为“广广广广告告告告类类类类型型型型”,这这这这是是是是个个个个分分分分类类类类变变变变量量量量,不不不不同同同同类类类类型型型型的的的的广广广广告告告告就就就就是是是是变变变变量量量量值值值值 在在在在所所所所调调调调查查查查的的的的200200人人人人当当当当中中中中,关关关关注注注注商商商商品品品品广广广广告告告告的的的的人人人人数数数数最最最最多多多多,为为为为112112人人人人,占占占占总总总总被被被被调调调调查查查查人人人人数数数数的的的的56%56%,因因因因此此此此众众众众数数数数为为为为“商品广告商品广告商品广告商品广告”这一类别,即这一类别,即这一类别,即这一类别,即 MMo o商品广告商品广告商品广告商品广告STAT顺序数据的众数顺序数据的众数 (例题分析例题分析)解解解解:这这这这里里里里的的的的数数数数据据据据为为为为顺顺顺顺序序序序数数数数据据据据。变变变变量量量量为为为为“回答类别回答类别回答类别回答类别”甲甲甲甲城城城城市市市市中中中中对对对对住住住住房房房房表表表表示示示示不不不不满满满满意意意意的的的的户户户户数数数数最最最最 多多多多,为为为为 108108户户户户,因因因因此此此此众众众众数数数数为为为为“不不不不满满满满意意意意”这一类别,即这一类别,即这一类别,即这一类别,即 M Mo o不满意不满意不满意不满意甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户数户数户数户数 (户户户户)百分比百分比百分比百分比 (%)(%)非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意24241081089393454530308 83636313115151010合计合计300300100.0100.0STAT顺序数据:中位数和分位数顺序数据:中位数和分位数STAT中位数中位数(median)1.1.集中趋势的测度值之一集中趋势的测度值之一集中趋势的测度值之一集中趋势的测度值之一2.2.排序后处于中间位置上的值排序后处于中间位置上的值排序后处于中间位置上的值排序后处于中间位置上的值MMe e50%50%3.3.不受极端值的影响不受极端值的影响不受极端值的影响不受极端值的影响4.4.主要用于顺序数据,也可用数值型数据,但不能用于分主要用于顺序数据,也可用数值型数据,但不能用于分主要用于顺序数据,也可用数值型数据,但不能用于分主要用于顺序数据,也可用数值型数据,但不能用于分类数据类数据类数据类数据5.5.各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即STAT中位数中位数(位置的确定位置的确定)未分组数值型数据:未分组数值型数据:顺序数据:顺序数据:STAT未分组数据的中位数未分组数据的中位数(计算公式计算公式)STAT顺序数据的中位数顺序数据的中位数解解解解:中中中中 位位位位 数数数数 的的的的 位位位位 置置置置 为为为为 300/2300/2150150 从从从从累累累累计计计计频频频频数数数数看看看看,中中中中位位位位数数数数在在在在“一一一一般般般般”这这这这一组别中。因此一组别中。因此一组别中。因此一组别中。因此 Me=一般一般甲城市家庭对住房状况评价的频数甲城市家庭对住房状况评价的频数甲城市家庭对住房状况评价的频数甲城市家庭对住房状况评价的频数分布分布分布分布回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户数户数户数户数 (户户户户)累计频数累计频数累计频数累计频数 非非非非 常常常常 不不不不 满满满满意意意意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意24241081089393454530302424132132225225270270300300合计合计合计合计300300STAT数值型未分组数据的中位数数值型未分组数据的中位数 (9(9个数据的算例个数据的算例个数据的算例个数据的算例)【例】:9个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 16301500 750 780 1080 850 960 2000 1250 16301500 750 780 1080 850 960 2000 1250 16301500 750 780 1080 850 960 2000 1250 1630排序排序排序排序:750 780 850 960 1080 1250 1500 1630 2000:750 780 850 960 1080 1250 1500 1630 2000:750 780 850 960 1080 1250 1500 1630 2000:750 780 850 960 1080 1250 1500 1630 2000位置位置位置位置:1 2 3 4 5 6 7 8 9:1 2 3 4 5 6 7 8 9:1 2 3 4 5 6 7 8 9:1 2 3 4 5 6 7 8 9中位数中位数 1080STAT数值型未分组数据的中位数数值型未分组数据的中位数 (10(10个数据的算例个数据的算例个数据的算例个数据的算例)【例】:【例】:【例】:【例】:10101010个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据 原始数据原始数据原始数据原始数据:1500 750 780 660 1080 850 960 2000 1250 1630:1500 750 780 660 1080 850 960 2000 1250 1630:1500 750 780 660 1080 850 960 2000 1250 1630:1500 750 780 660 1080 850 960 2000 1250 1630 排排排排 序序序序:660 750 780 850 960 1080 1250 1500 1630 2000:660 750 780 850 960 1080 1250 1500 1630 2000:660 750 780 850 960 1080 1250 1500 1630 2000:660 750 780 850 960 1080 1250 1500 1630 2000 位位位位 置置置置:1 2 3 4 5 6 7 8 9 10 :1 2 3 4 5 6 7 8 9 10 :1 2 3 4 5 6 7 8 9 10 :1 2 3 4 5 6 7 8 9 10 STAT四分位数四分位数(quartile)(quartile)(quartile)(quartile)1.集中趋势的测度值之一集中趋势的测度值之一2.排序后处于排序后处于25%和和75%位置上的值位置上的值3.不受极端值的影响不受极端值的影响不受极端值的影响不受极端值的影响4.4.主主主主要要要要用用用用于于于于顺顺顺顺序序序序数数数数据据据据,也也也也可可可可用用用用于于于于数数数数值值值值型型型型数数数数据据据据,但但但但不能用于分类数据不能用于分类数据不能用于分类数据不能用于分类数据QQL LQQMMQQU U25%25%25%25%STAT四分位数四分位数(位置的确定位置的确定)未分组数据:未分组数据:STAT顺序数据的四分位数顺序数据的四分位数 (例题分析例题分析)解:解:解:解:Q QL L位置位置位置位置=(300)/4 (300)/4=7575 Q QU U位置位置位置位置 =(3300)/4(3300)/4 =225225 从从从从累累累累计计计计频频频频数数数数看看看看,Q QL L在在在在“不不不不满满满满意意意意”这这这这一一一一组组组组别别别别中中中中;Q QU U在在在在“一一一一般般般般”这这这这一一一一组组组组别别别别中中中中。因因因因此此此此 Q QL L =不满意不满意不满意不满意 Q QU U =一般一般一般一般甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户数户数户数户数 (户户户户)累计频数累计频数累计频数累计频数 非非非非常常常常不不不不满满满满意意意意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意24241081089393454530302424132132225225270270300300合计合计300300STAT数值型未分组数据的四分位数数值型未分组数据的四分位数 (9个数据的算例个数据的算例)【例】:【例】:【例】:【例】:9 9 9 9个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据 原始数据原始数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630:1500 750 780 1080 850 960 2000 1250 1630:1500 750 780 1080 850 960 2000 1250 1630:1500 750 780 1080 850 960 2000 1250 1630 排排排排 序序序序:750 780 850 960 1080 1250 1500 1630 2000:750 780 850 960 1080 1250 1500 1630 2000:750 780 850 960 1080 1250 1500 1630 2000:750 780 850 960 1080 1250 1500 1630 2000 位位位位 置置置置:1 2 3 4 5 6 7 8 9:1 2 3 4 5 6 7 8 9:1 2 3 4 5 6 7 8 9:1 2 3 4 5 6 7 8 9STAT数值型未分组数据的四分位数数值型未分组数据的四分位数 (10个数据的算例个数据的算例)【例】:【例】:【例】:【例】:10101010个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据原始数据原始数据:1500 750 780 660 1080 850 960 2000 1250 1630:1500 750 780 660 1080 850 960 2000 1250 1630:1500 750 780 660 1080 850 960 2000 1250 1630:1500 750 780 660 1080 850 960 2000 1250 1630排排排排 序序序序:660 750 780 850 960 1080 1250 1500 1630 2000:660 750 780 850 960 1080 1250 1500 1630 2000:660 750 780 850 960 1080 1250 1500 1630 2000:660 750 780 850 960 1080 1250 1500 1630 2000位位位位 置置置置:1 2 3 4 5 6 7 8 9 10 :1 2 3 4 5 6 7 8 9 10 :1 2 3 4 5 6 7 8 9 10 :1 2 3 4 5 6 7 8 9 10 STAT数值型数据:均值数值型数据:均值STAT均值均值(mean)1.集中趋势的测度值之一2.最常用的测度值3.一组数据的均衡点所在4.体现了数据的必然性特征5.易受极端值的影响6.用于数值型数据,不能用于分类数据和顺序数据STAT简单均值简单均值(simple mean)设一组数据为:设一组数据为:设一组数据为:设一组数据为:x x1 1,x x2 2,x xn n(x xN N)样本均值样本均值样本均值样本均值总体均值总体均值总体均值总体均值STAT加权均值加权均值(weighted mean)设各组的组中值为:设各组的组中值为:设各组的组中值为:设各组的组中值为:MM1 1,MM2 2,MMk k 相应的频数为:相应的频数为:相应的频数为:相应的频数为:f f1 1,f f2 2,f fk k样本加权均值样本加权均值样本加权均值样本加权均值总体加权均值总体加权均值总体加权均值总体加权均值STAT已改至此!某电脑公司销售量数据分组表按销售量分组组中值(Mi)频数(fi)Mi fi 140-150150-160160-170170-180180-190190-200200-210210-220220-230230-24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合计12022200加权均值加权均值 (例题分析例题分析)STAT加权均值加权均值(权数对均值的影响权数对均值的影响)甲乙两组各有甲乙两组各有甲乙两组各有甲乙两组各有1010名学生,他们的考试成绩及其分布数据如下名学生,他们的考试成绩及其分布数据如下名学生,他们的考试成绩及其分布数据如下名学生,他们的考试成绩及其分布数据如下 甲组:甲组:甲组:甲组:考试成绩(考试成绩(考试成绩(考试成绩(x x):0 20 100 0 20 100 人数分布(人数分布(人数分布(人数分布(f f):):):):1 1 8 1 1 8 乙组:乙组:乙组:乙组:考试成绩(考试成绩(考试成绩(考试成绩(x x):0 20 100 0 20 100 人数分布(人数分布(人数分布(人数分布(f f):):):):8 1 1 8 1 1STAT均值均值(数学性质数学性质)1.各变量值与均值的离差之和等于零各变量值与均值的离差之和等于零 2.各变量值与均值的离差平方和最小各变量值与均值的离差平方和最小STAT调和平均数调和平均数(harmonic mean)1.集中趋势的测度值之一集中趋势的测度值之一2.2.均值的另一种表现形式均值的另一种表现形式3.3.易受极端值的影响易受极端值的影响4.4.计算公式为计算公式为原来只是计原来只是计原来只是计原来只是计算时使用了算时使用了算时使用了算时使用了不同的数据不同的数据不同的数据不同的数据!STAT调和平均数调和平均数(例题分析例题分析)某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜蔬菜蔬菜蔬菜名称名称名称名称批发价格批发价格批发价格批发价格(元元元元)MMi i成交额成交额成交额成交额(元元元元)MMi i f fi i成交量成交量成交量成交量(公斤公斤公斤公斤)f fi i甲甲甲甲乙乙乙乙丙丙丙丙1.201.200.500.500.800.8018000180001250012500640064001500015000250002500080008000合计合计合计合计36900369004800048000【例例例例】某某某某蔬蔬蔬蔬菜菜菜菜批批批批发发发发市市市市场场场场三三三三种种种种蔬蔬蔬蔬菜菜菜菜的的的的日日日日成成成成交交交交数数数数据据据据如如如如表表表表,计计计计算算算算三三三三种蔬菜该日的平均批发价格种蔬菜该日的平均批发价格种蔬菜该日的平均批发价格种蔬菜该日的平均批发价格STAT几何平均数几何平均数(geometric mean)1.1.1.1.集中趋势的测度值之一集中趋势的测度值之一集中趋势的测度值之一集中趋势的测度值之一2.2.2.2.n n n n 个变量值乘积的个变量值乘积的个变量值乘积的个变量值乘积的 n n n n 次方根次方根次方根次方根3.3.3.3.适用于对比率数据的平均适用于对比率数据的平均适用于对比率数据的平均适用于对比率数据的平均4.4.4.4.主要用于计算平均增长率主要用于计算平均增长率主要用于计算平均增长率主要用于计算平均增长率5.5.5.5.计算公式为计算公式为计算公式为计算公式为6.6.可看作是均值的一种变形可看作是均值的一种变形可看作是均值的一种变形可看作是均值的一种变形STAT几何平均数几何平均数(例题分析例题分析)【例例】一一位位投投资资者者持持有有一一种种股股票票,19961996年年、19971997年年、19981998年年和和19991999年年收收益益率率分分别别为为4.5%4.5%、2.0%2.0%、3.5%3.5%、5.4%5.4%。计计算算该该投投资资者者在这四年内的平均收益率。在这四年内的平均收益率。平均收益率平均收益率平均收益率平均收益率103.84%-1=3.84%103.84%-1=3.84%STAT众数、中位数和均值的比较众数、中位数和均值的比较STAT众数、中位数和均值的关系众数、中位数和均值的关系左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数均值均值均值均值均值均值STAT众数、中位数和均值的特点和应用众数、中位数和均值的特点和应用1.1.众数众数众数众数 不受极端值影响不受极端值影响不受极端值影响不受极端值影响 具有不唯一性具有不唯一性具有不唯一性具有不唯一性 数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用2.2.中位数中位数中位数中位数 不受极端值影响不受极端值影响不受极端值影响不受极端值影响 数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用3.3.平均数平均数平均数平均数 易受极端值影响易受极端值影响易受极端值影响易受极端值影响 数学性质优良数学性质优良数学性质优良数学性质优良 数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用STAT数据类型与集中趋势测度值数据类型与集中趋势测度值数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度值数据类数据类数据类数据类型型型型分类数据分类数据分类数据分类数据 顺序数据顺序数据顺序数据顺序数据间隔数据间隔数据间隔数据间隔数据比率数据比率数据比率数据比率数据适适适适用用用用的的的的测测测测度度度度值值值值众数众数众数众数中位数中位数中位数中位数均值均值均值均值均值均值均值均值四分位数四分位数四分位数四分位数众数众数众数众数调和平均数调和平均数调和平均数调和平均数众数众数众数众数中位数中位数中位数中位数几何平均数几何平均数几何平均数几何平均数四分位数四分位数四分位数四分位数 中位数中位数中位数中位数四分位数四分位数四分位数四分位数众数众数众数众数STAT3.2 3.2 离散程度的测度离散程度的测度一一.分类数据:异众比率分类数据:异众比率二二.顺序数据:四分位差顺序数据:四分位差三三.数值型数据:方差及标准差数值型数据:方差及标准差四四.相对位置的测量:标准分数相对位置的测量:标准分数五五.相对离散程度:离散系数相对离散程度:离散系数STAT离中趋势离中趋势1.数据分布的另一个重要特征数据分布的另一个重要特征数据分布的另一个重要特征数据分布的另一个重要特征2.反映各变量值远离其中心值的程度(离散程度)反映各变量值远离其中心值的程度(离散程度)反映各变量值远离其中心值的程度(离散程度)反映各变量值远离其中心值的程度(离散程度)3.从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度4.不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值STAT分类数据:异众比率分类数据:异众比率STAT异众比率异众比率(variation ratio)1.1.1.1.离散程度的测度值之一离散程度的测度值之一离散程度的测度值之一离散程度的测度值之一2.2.2.2.非众数组的频数占总频数的比率非众数组的频数占总频数的比率非众数组的频数占总频数的比率非众数组的频数占总频数的比率3.3.3.3.计算公式为计算公式为计算公式为计算公式为 4.4.用于衡量众数的代表性用于衡量众数的代表性用于衡量众数的代表性用于衡量众数的代表性STAT异众比率异众比率(例题分析例题分析)某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 广告类型广告类型广告类型广告类型人数人数人数人数(人人人人)频率频率频率频率(%)(%)商品广告商品广告商品广告商品广告 服务广告服务广告服务广告服务广告 金融广告金融广告金融广告金融广告 房地产广告房地产广告房地产广告房地产广告 招生招聘广告招生招聘广告招生招聘广告招生招聘广告 其他广告其他广告其他广告其他广告11211251519 9161610102 256.056.025.525.54.54.58.08.05.05.01.01.0合计合计合计合计200200100100解:解:解:解:在在在在所所所所调调调调查查查查的的的的200200人人人人当当当当中中中中,关关关关注注注注非非非非商商商商品品品品广广广广告告告告的的的的人人人人数数数数占占占占44%44%,异异异异众众众众比比比比率率率率还还还还是是是是比比比比较较较较大大大大。因因因因此此此此,用用用用“商商商商品品品品广广广广告告告告”来来来来反反反反映映映映城城城城市市市市居居居居民民民民对对对对广广广广告告告告关关关关注注注注的的的的一一一一般般般般趋趋趋趋势势势势,其其其其代代代代表表表表性性性性不不不不是是是是很好很好很好很好STAT顺序数据:四分位差顺序数据:四分位差STAT四分位差四分位差(quartile deviation)1.离散程度的测度值之一离散程度的测度值之一2.也称为内距或四分间距也称为内距或四分间距3.上四分位数与下四分位数之差上四分位数与下四分位数之差 QD=QU-QL4.反映了中间反映了中间50%数据的离散程度数据的离散程度5.不受极端值的影响不受极端值的影响6.用于衡量中位数的代表性用于衡量中位数的代表性STAT四分位差四分位差(顺序数据的算例顺序数据的算例)解解解解:设设设设非非非非常常常常不不不不满满满满意意意意为为为为1,1,不不不不满满满满意意意意为为为为2,2,一一一一般般般般为为为为3,3,满满满满意意意意为为为为 4,4,非非非非常常常常满满满满意为意为意为意为5 5 已知已知已知已知 Q QL L=不满意不满意不满意不满意 =2 2 Q QU U =一般一般一般一般 =3 3四分位差:四分位差:四分位差:四分位差:Q QD D=Q QU U =Q QL L =3 2 3 2 =1 1甲城市家庭对住房状况评价的频数分甲城市家庭对住房状况评价的频数分甲城市家庭对住房状况评价的频数分甲城市家庭对住房状况评价的频数分布布布布回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户数户数户数户数 (户户户户)累计频数累计频数累计频数累计频数 非非非非 常常常常 不不不不 满满满满意意意意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意24241081089393454530302424132132225225270270300300合计合计合计合计300300STAT数值型数据:方差和标准差数值型数据:方差和标准差STAT极差极差(range)1.1.1.1.一组数据的最大值与最小值之差一组数据的最大值与最小值之差一组数据的最大值与最小值之差一组数据的最大值与最小值之差2.2.2.2.离散程度的最简单测度值离散程度的最简单测度值离散程度的最简单测度值离散程度的最简单测度值3.3.3.3.易受极端值影响易受极端值影响易受极端值影响易受极端值影响4.4.未考虑数据的分布未考虑数据的分布未考虑数据的分布未考虑数据的分布5.5.计算公式为计算公式为计算公式为计算公式为6.R=max(xi)-min(xi)STAT平均差平均差(mean deviation)1.1.1.1.离散程度的测度值之一离散程度的测度值之一离散程度的测度值之一离散程度的测度值之一2.2.2.2.各变量值与其均值离差绝对值的平均数各变量值与其均值离差绝对值的平均数各变量值与其均值离差绝对值的平均数各变量值与其均值离差绝对值的平均数3.3.3.3.能全面反映一组数据的离散程度能全面反映一组数据的离散程度能全面反映一组数据的离散程度能全面反映一组数据的离散程度4.4.4.4.数学性质较差,实际中应用较少数学性质较差,实际中应用较少数学性质较差,实际中应用较少数学性质较差,实际中应用较少 5.5.计算公式为计算公式为计算公式为计算公式为未分组数据未分组数据未分组数据未分组数据组距分组数据组距分组数据组距分组数据组距分组数据STAT平均差平均差(例题分析例题分析)某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表 按销售量分组按销售量分组按销售量分组按销售量分组组中值组中值组中值组中值(M M M Mi i i i)频数频数频数频数(f f f fi i i i)1401501401501401501401501501601501601501601501601601701601701601701601701701801701801701801701801801901801901801901801901902001902001902001902002002102002102002102002102102202102202102202102202202302202302202302202302302402302402302402302401451451451451551551551551651651651651751751751751851851851851951951951952052052052052152152152152252252252252352352352354 4 4 49 9 9 916161616272727272020202017171717101010108 8 8 84 4 4 45 5 5 5404040403030303020202020101010100 0 0 010101010202020203030303040404040505050501601601601602702702702703203203203202702702702700 0 0 0170170170170200200200200240240240240160160160160250250250250合计合计合计合计505050502040204020402040STAT平均差平均差(例题分析例题分析)含义:每一天的销售量平均数相比,含义:每一天的销售量平均数相比,含义:每一天的销售量平均数相比,含义:每一天的销售量平均数相比,平均相差平均相差平均相差平均相差17171717台台台台STAT 方差和标准差方差和标准差(variancevariance and and standard deviationstandard deviation)1.1.离散程度的测度值之一离散程度的测度值之一离散程度的测度值之一离散程度的测度值之一2.2.2.2.最常用的测度值最常用的测度值最常用的测度值最常用的测度值3.3.3.3.反映了数据的分布反映了数据的分布反映了数据的分布反映了数据的分布4.4.反映了各变量值与均值的平均差异反映了各变量值与均值的平均差异反映了各变量值与均值的平均差异反映了各变量值与均值的平均差异5.5.根据总体数据计算的,称为总体方差或标准差;根据总体数据计算的,称为总体方差或标准差;根据总体数据计算的,称为总体方差或标准差;根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差根据样本数据计算的,称为样本方差或标准差根据样本数据计算的,称为样本方差或标准差根据样本数据计算的,称为样本方差或标准差STAT 总体方差和标准差总体方差和标准差(population(population variancevariance and and standard deviationstandard deviation)未分组数据:未分组数据:组距分组数据:组距分组数据:组距分组数据:组距分组数据:未分组数据:未分组数据:未分组数据:未分组数据:组距分组数据:组距分组数据:组距分组数据:组距分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式STAT总体标准差总体标准差(例题分析例题分析)某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表 按销售量分组按销售量分组按销售量分组按销售量分组组中值组中值组中值组中值(M M M Mi i i i)频数频数频数频数(f f f fi i i i)14015014015014015014015015016015016015016015016016017016017016017016017017018017018017018017018018019