《管理统计学》第三章.ppt
第三章第三章 统计数据的概括性描述统计数据的概括性描述 第一节第一节 统计数据的统计数据的整理整理与展示与展示第二节第二节 数据集数据集位置位置的测度的测度第三节第三节 数据集数据集离散程度离散程度的测度的测度第四节第四节 数据集的数据集的峰度峰度与与偏度偏度无无众数众数(极端情况下极端情况下)第二节第二节 数据集位置的测度数据集位置的测度一、众数一、众数(Mode)1.1.众数众数定义定义 2.众数众数种类种类单一单一众数众数(大多数情况下大多数情况下)复复众数众数(一般情况下一般情况下)3.众数的众数的计算计算顺序级顺序级的样本数据的样本数据名义级名义级的样本数据的样本数据刻度级刻度级的样本数据的样本数据分组分组不分组不分组表表1 1 某商品在抽样商店的单价某商品在抽样商店的单价(单位:元)(单位:元)9.98 10.02 10.00 10.04 10.01 9.99 10.05 10.04 10.06 10.0l 10.03 9.99 9.97 9.93 l0.01 10.03 l0.03 10.02 10.05 9.999.95 9.96 9.98 10.00 9.97 10.0l 10.00 9.99 9.98 10.00表表2 某单位职工受教育程度的结构某单位职工受教育程度的结构受教育程度 小学 初中 高中 大学 硕士研究生 合计 各个受教育程度出现的频次 1229216各受教育程度出现的频率(%)6.2512.5 12.556.2512.5100表表3 3 家具基色调出现的频次家具基色调出现的频次 家具的基色调BGRWY合计 各个基色调出现的频次16851030各个基色调出现的频率(%)3.3320.0026.6716.6733.33100单项数列单项数列某商品的价格某商品的价格价格价格单位:元次数次数频率频率9.93 9.94 9.95 9.96 9.97 9.98 9.99 10.00 10.01 10.02 10.03 10.04 10.05 10.06 1 0 1 1 2 3 4 4 4 2 3 2 2 13.33 0 3.33 3.33 6.67 10.0 13.33 13.33 13.33 6.67 10.0 6.67 6.67 3.33组距数列组距数列组别组1组2 组3 组4 组5 组6 组7 组界(15.75,16.25)16.25,16.7516.75,17.25)17.25,17.75)17.75,18.25)18.25,18.75 18.75,19.25)身高16.016.3,16.516.8,17.0,17.1,17.217.5,17.6,17.717.8,18.018.1,18.218.3,18.5,18.619.0频次1246531某班组男职工的身高数据分组某班组男职工的身高数据分组 :众数组的上限众数组的上限 算法2:众数组次数与前一组次数之差众数组次数与前一组次数之差:众数组次数与后一组次数之差众数组次数与后一组次数之差:众数组的下限众数组的下限 算法1:众数组的组距众数组的组距 某工业企业有职工某工业企业有职工1000010000人,其中工人人,其中工人80008000人,干部人,干部20002000人,为了了解职工家庭生活状况,人,为了了解职工家庭生活状况,在工人和干部两个组均以在工人和干部两个组均以5%5%的比例抽选职工进的比例抽选职工进行调查,结果如下表行调查,结果如下表:按家庭按家庭人均月收入(元)人均月收入(元)职工人数(人)工人数(人)工人工人干部干部200200以下以下200300200300300400300400400600400600600600以上以上20206060200200808040405 51313606017175 5合合计4004001001001.1.中位数的中位数的使用使用:当样本数据的个数当样本数据的个数(样本容量样本容量)为为奇数奇数时时,样本样本中位数中位数适用于顺序级以上适用于顺序级以上的样本数据集合;的样本数据集合;当当样本数据的个数样本数据的个数(样本容量样本容量)为为偶数偶数时,样本中时,样本中位数位数仅适用于刻度级仅适用于刻度级的样本数据集合的样本数据集合(因为顺序因为顺序级的数据不能做加减运算级的数据不能做加减运算)。中位数中位数(Median)2.2.样本中位数的样本中位数的计算计算:数据数据未分组分组组距数列单项数列开口闭口 当当 为为奇数奇数时时,中位数中位数位置位置=样本样本中位数中位数=当当 是是偶数偶数时时,中位数中位数位置位置=样本样本中位数中位数=未分组数列未分组数列分组数列分组数列刚好大于等于刚好大于等于 的累计数所在的组的累计数所在的组:中位数组的上限中位数组的上限 算法2:中位数组的次数中位数组的次数:中位数组前一组的向上累计数中位数组前一组的向上累计数算法1:中位数组的组距中位数组的组距 成成绩绩(分分)人数人数(人)(人)频频率率(%)向上累向上累计计 向下累向下累计计(%)6060以下以下 60-70 60-70 70-80 70-80 80-90 80-90 90-100 90-100 5 5 8 8 17 17 14 14 6 6 101022223434222212125 516163333444450501001009090686834341212 合合 计计50501001005050名学生统计学考试成绩分布表名学生统计学考试成绩分布表均值(均值(Mean)样本均值样本均值 又称样本平均数又称样本平均数仅适用于刻度级仅适用于刻度级的数据。的数据。未分组数列未分组数列分组数列分组数列:组中值组中值:频次或次数频次或次数加权平均数加权平均数简单平均数简单平均数某专业硕士班学生年龄情况如下表所示:年龄 人数 年龄 人数 20 21 22 23 24 1 4 8 13 12 25 26 27 28 合计 8 5 3 2 56调和平均数调和平均数 简单调和平均数简单调和平均数 加权调和平均数加权调和平均数 某水果店某日销售三种水果,其价格、销售额及销售量如下表,试求其平均价格。水果价格(元)xi销售额(元)销售量苹果苹果橙子橙子梨梨3.42.52.810201125700300450250合合计-28451000几何平均数几何平均数 简单几何平均数简单几何平均数 加权几何平均数加权几何平均数 某银行对一笔存款按复利计息,具体数据如下表,试求其平均年利率。年限利率(%)存款年数第第12年年第第36年年第第713年年第第1415年年35682472合合计-15价格(元)价格(元)3.32.52.0合计合计销售量(斤销售量(斤)34512价格(元)价格(元)3.32.52.0合计合计销售额(元)销售额(元)10101030例:例:求某种商品三地零售价格的平均值求某种商品三地零售价格的平均值算术平均算术平均调和平均调和平均众数、中位数和均值的比较众数、中位数和均值的比较n数据对称分布,如果为正态分布,以算术平均数为对称轴,两边的频数相等,即 众数众数=中位数中位数=均值均值n数据左偏分布,峰部在右,即频数最大的变量值在右,则众数在右,左边各组频数虽小,但组数多,必定拉动均值向左边靠拢,处于频数中间的中位数应在两者之间,即 众数众数中位数中位数均值均值n数据右偏分布,峰部在左,即频数最大的变量值在左,则众数在左,右边的变量值必定拉动均值向左边靠拢,处于频数中间的中位数应在两者之间,即 众数众数中位数中位数均值均值 检验一个给定的数据是否服从正态分布的判别方法:检验均值和中位数是否相等,偏度是否接近0以及峰度是否接近3来进行初步的估计。1.1.极差极差数据集离散程度的测度数据集离散程度的测度 2.2.总体方差和标准差总体方差和标准差样本方差和标准差样本方差和标准差样本方差样本方差 的计算公式如下的计算公式如下:样本标准差样本标准差(Standard Deviation)s的定义是的定义是:表表1 1 某商品在抽样商店的单价某商品在抽样商店的单价(单位:元)(单位:元)9.98 10.02 10.00 10.04 10.01 9.99 10.05 10.04 10.06 10.0l 10.03 9.99 9.97 9.93 l0.01 10.03 l0.03 10.02 10.05 9.999.95 9.96 9.98 10.00 9.97 10.0l 10.00 9.99 9.98 10.00某商品的价格某商品的价格价格价格单位:元次数次数频率频率9.93 9.94 9.95 9.96 9.97 9.98 9.99 10.00 10.01 10.02 10.03 10.04 10.05 10.06 1 0 1 1 2 3 4 4 4 2 3 2 2 13.33 0 3.33 3.33 6.67 10.0 13.33 13.33 13.33 6.67 10.0 6.67 6.67 3.33 成成绩绩(分分)人数人数(人)(人)频频率率(%)向上累向上累计计 向下累向下累计计(%)6060以下以下 60-70 60-70 70-80 70-80 80-90 80-90 90-100 90-100 5 5 8 8 17 17 14 14 6 6 101022223434222212125 516163333444450501001009090686834341212 合合 计计50501001005050名学生统计学考试成绩分布表名学生统计学考试成绩分布表 成成绩绩(分分)人数人数(人)(人)频频率率(%)向上累向上累计计 向下累向下累计计(%)6060以下以下 60-70 60-70 70-80 70-80 80-90 80-90 90-100 90-100 5 5 8 8 17 17 14 14 6 6 101022223434222212125 516163333444450501001009090686834341212 合合 计计50501001005050名学生统计学考试成绩分布表名学生统计学考试成绩分布表变异系数变异系数(1)平均差系数(2)标准差系数数据集的分布特征数据集的分布特征一、一、峰度峰度(Kurtosis)二、偏度二、偏度(Skewness)偏度偏度(Skewness)峰度峰度(Kurtosis)峰度峰度大于大于0 0表示比正态分布高峰更加陡峭,表示比正态分布高峰更加陡峭,为为尖顶峰尖顶峰;反之,峰度小于;反之,峰度小于0 0,为平顶峰。,为平顶峰。偏度为偏度为0,0,表示数据分布形式与正态分布偏度表示数据分布形式与正态分布偏度相同;偏度相同;偏度大于大于0 0表示正偏差数值较大,为表示正偏差数值较大,为正偏正偏或右偏,即有一长尾巴拖在左边;反之,小于或右偏,即有一长尾巴拖在左边;反之,小于0 0表示负偏差数值较大,为负偏或左偏,表示负偏差数值较大,为负偏或左偏,即有一长即有一长尾巴拖在右边尾巴拖在右边。样本数据的样本数据的基本基本特征特征图形表示图形表示频次与频率频次与频率计算计算延伸延伸累计频次与频率累计频次与频率样本数据的样本数据的位置位置特征特征对数据的对数据的离散离散描述描述对数据的对数据的集中集中描述描述点状描述点状描述区间描述区间描述小结:样本数据的样本数据的综合特征综合特征描述描述箱型图箱型图样本数据的样本数据的分布特征分布特征峰度和偏度峰度和偏度SPSS的处理过程AnalyzeDescriptive StatisticsFrequencies,进入频次分析模块进入频次分析模块FrequenciesAnalyzeDescriptive StatisticsDescriptives,进入描述统计模块进入描述统计模块Descriptives标准化标准化Z分数及其线性转换分数及其线性转换 Z Z分数的正线性转换是分数的正线性转换是T分数分数,公式:公式:计算公式为:计算公式为:定义:从平均数为定义:从平均数为 ,标准差为,标准差为 的总体的总体中抽出一个变量值中抽出一个变量值 ,Z分数表示此变量大于或分数表示此变量大于或小于平均数几个标准差小于平均数几个标准差。目的:由于目的:由于Z Z分数的分子与分母单位相同,故分数的分子与分母单位相同,故Z Z分数无计量单位,因此用来比较两个从不同总分数无计量单位,因此用来比较两个从不同总体中抽出的变量值体中抽出的变量值。