统计学第4章数据的概括性度量详解.ppt
《统计学第4章数据的概括性度量详解.ppt》由会员分享,可在线阅读,更多相关《统计学第4章数据的概括性度量详解.ppt(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Nankai University1第四章第四章 数据的概括性度量数据的概括性度量Contents数据集中趋势的度量数据集中趋势的度量1数据离散程度的度量数据离散程度的度量2数据偏态与峰态的度量数据偏态与峰态的度量3Nankai University21.1.数据集中趋势的度量数据集中趋势的度量Nankai University3v集中趋势集中趋势(central tendency)是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。v众数众数v中位数中位数v四分位数四分位数v平均数平均数Nankai University4众数众数v众数众数(mode)是一组数据中出现次数最
2、多的变量值,用M0表示。v众数主要用于测度分类数据的集中趋势,当然也适用于作为顺序数据以及数值型数据集中趋势的测度值。v一般情况下,只有在数据量较大的情况下,众数才有意义v众数是一个位置代表值,它不受数据中极端值的影响。从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。v众数可能不存在,也可能有多个。Nankai University5中位数中位数v中位数中位数(median)是一组数据排序后处于中间位置上的变量值,用Me表示。v中位数主要用于测度顺序数据的集中趋势,当然也适用于测度数值型数据的集中趋势,但不适用于分类数据。v中位数是一个位置代表值,其
3、特点是不受极端值的影响。Nankai University6v计算中位数时,要先对n个数据进行排序,然后确定中位数的位置,最后确定中位数的具体数值。v中位数位置的确定公式为:设一组数据按从小到大的顺序排序x1,x2,xn,则中位数为:Nankai University7四分位数四分位数v四分位数四分位数(quartile)也称四分位点,它是一组数据排序后处于25%和75%位置上的值,分别称为下四分位数和上四分位数。v计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。v四分位数位置的确定方法有几种*,每种方法得到的结果会有一定差异,但差异不会很大。设下四
4、分位数为QL,上四分位数为QU,根据四分位数定义有 *一种较为准确的算法是按照下列公式确定位置:,Nankai University8v如果位置是整数,四分位数就是该位置对应的值;如果是在0.5的位置上,则取该位置两侧值的平均数;如果是在0.25或0.75的位置上,则四分位数等于该位置的下侧值加上按比例分摊位置两侧数值的差值。v Q1=第1四分位数,即第25百分位数v Q2=第2四分位数,即第50百分位数v Q3=第3四分位数,即第75百分位数Nankai University9平均数平均数v平均数平均数(mean)也称为均值,它是一组数据相加后除以数据的个数得到的结果。v平均数是集中趋势的最
5、主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。v根据未经分组数据计算的平均数称为简单平均数简单平均数。Nankai University10(总体)(样本)v根据分组数据计算的平均数称为加加权权平平均均数数,设共分成k组,各组组中值分别用M1,M2,Mk表示,f1,f2,fk表示各组频数,式中n为样本量 。v计算加权平均数时,用各组的组中值代表各组的实际数据,使用这一代表值时是假定各组数据在组内是均匀分布的,如果实际数据与这一假定相吻合,计算的结果还是比较准确的,否则误差会很大。Nankai University11v几何平均数几何平均数(geometric mean)是n
6、个变量值乘积的n次方根,用G表示。v计算公式为v几何平均数是适用于特殊数据的一种平均数,它主要用于计算平均比率。当变量值本身是比率的形式时,采用几何平均值计算平均比率更为合理。在实际应用中,几何平均数主要用于计算现象的平均增长率。v当所平均的各比率数值相差不大时,算术平均和几何平均的结果相差不大,否则二者的差别就很明显。Nankai University12v例例1:调查:调查300个人的政党背景,形成如下数据分布结果,个人的政党背景,形成如下数据分布结果,请问众数是什么?请问众数是什么?v例例2:随机抽取:随机抽取9个学生,调查得到的每位学生的人均月个学生,调查得到的每位学生的人均月花销数据
7、如下,请计算众数、中位数、均值。花销数据如下,请计算众数、中位数、均值。750 600 820 430 750 1000 550 680 480Nankai University13政党背景政党背景频数频数民主党90共和党70无党派人士140v例例3:下面是随机抽取的:下面是随机抽取的5个家庭的收入:个家庭的收入:135,456 25,500 32,456 54,365 37,668 请问中位数和平均值哪个可以更好的作为这组数据集中请问中位数和平均值哪个可以更好的作为这组数据集中趋势的代表值?趋势的代表值?Nankai University14优点优点众数不受极端值影响众数不受极端值影响可应用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 数据 概括性 度量 详解
限制150内