常用统计量数精选PPT.ppt
《常用统计量数精选PPT.ppt》由会员分享,可在线阅读,更多相关《常用统计量数精选PPT.ppt(82页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于常用统计量数第1页,讲稿共82张,创作于星期日描述统计(descriptive statistics)描述统计对数据特征进行描述数据的两个主要特征中心位置离散性第2页,讲稿共82张,创作于星期日Outline第一节 集中量数一、算术平均数二、几何平均数三、中数与众数第二节 差异量数一、平均差二、方差与标准差三、差异系数第三节 地位量数一、百分位分数二、百分等级分数第3页,讲稿共82张,创作于星期日第一节 集中量数一、算术平均数二、几何平均数三、中数与众数第4页,讲稿共82张,创作于星期日集中量数集中量数对数据的集中趋势的度量确定一组数据的代表值第5页,讲稿共82张,创作于星期日常用的集中量
2、数算术平均数 mean加权平均数几何平均数geometric mean中数median众数mode第6页,讲稿共82张,创作于星期日问题某部门有5名一般职员和1名经理。一般职员的薪水是3000元,而经理的薪水是10000元,请问该部门收入的平均水平是多少?第7页,讲稿共82张,创作于星期日算术平均数:可简称为平均数或均数,是用以度量次数分布集中趋势及位置最常用的集中量数。(一)总体平均数与样本平均数(二)加权平均数第8页,讲稿共82张,创作于星期日(三)算术平均数的性质1.每一个观测值加上一个相同常数C,其平均数为原来的平均数加常数C2.每一个观测值乘以一个相同常数C,其平均数为原来的平均数乘
3、常数C3.每个观测值都乘以一个相同常数c,再加上一个常数d后,计算得到的平均数等于原平均数乘以该常数c再加上常数d4.观测值与平均数的差(离均差)的总和等于零5.观测值与任意常数C的离差平方和不小于观测值与平均数的差的平方和。-离差平方和最小,样板平均数是总体平均数的最佳估计。第9页,讲稿共82张,创作于星期日算术平均数的优点反应灵敏,确定严密,简明易解,计算简便并能作进一步的代数演算,是应用最普遍的一种集中量数。适用情境:数据准确可靠,且又同质,需要每一个数据都能加入计算,同时还要作进一步的代数运算时,一般都用算术平均数表示集中趋势。易受极端数据影响、出现模糊数据和存在不同质数据时无法计算第
4、10页,讲稿共82张,创作于星期日几何平均数适用条件:1.一组数据中任何两个相邻数据之比接近于常数,即数据按一定比例关系变化。在教育与心理研究中,求平均增长率或对心理物理学中的等距与等比量表实验进行数据处理,均应使用几何平均数。2.当一组数据中存在极端数据时,分布呈偏态,算术平均数不能很好地反映数据的典型情况,此时应使用几何平均数或其他集中量数(如中数、众数)来反映数据的典型情况。第11页,讲稿共82张,创作于星期日(一)几何平均数的基本公式第12页,讲稿共82张,创作于星期日(二)几何平均数在教育与心理研究中的应用1.心理物理学中等距与等比量表实验的数据处理2.平均增长率的计算第13页,讲稿
5、共82张,创作于星期日(一)中数中数又称中位数,符号记为Mdn。中数是指位于一组数列中中间位置的那个数,它可以是数列中的某一个原始数据,也可以不是原始数据而是通过计算得到的一个数。总之,如果将一组数据按大小排列,则中数一定是将数据个数平均分为大小相等两部分的那个数。中数的特点:计算简单,不受极端数据影响,但由于是根据数据的相对位置来确定的,在计算时不是每个数据都加入,从而有较大的抽样误差,不如平均数稳定,且会流失很多的被试信息,同时,中数难以作进一步的代数运算第14页,讲稿共82张,创作于星期日(二)众数众数又称为范数,常用Mo表示。众数指次数分布中出现次数最多的那个数的数值。适用条件:当一组
6、数据中出现不同质的情况,或分布中出现极端数据时,常用众数作为集中量数的粗略估计。计算众数的皮尔逊经验法:Mo3Mdn2M第15页,讲稿共82张,创作于星期日众数Mode,Mo众数:一组数据中出现次数最多的数如2、3、5、3、4、3、6的众数为3如果次数分布最多的有两个数,而且两个数是相邻的,那么一般取两者的平均值作为众数;如果这两个数不相邻,那么一般需要报告两个众数,而且认为该组数据是bimodal双峰分布的第16页,讲稿共82张,创作于星期日第二节 差异量数一、平均差二、方差与标准差三、差异系数第17页,讲稿共82张,创作于星期日离中趋势的度量 数据离中趋势是表示数据分散程度的一组统计量,反
7、映的是各变量值远离其中心值的程度。表示数据离中趋势的测度有:平均差、方差、标准差、四分位差、极差(全距)、变异系数等。第18页,讲稿共82张,创作于星期日一、平均差(Mean deviation)1.定义:也称平均离差,次数分布中所有原始数据与平均数举例的绝对值的平均,用AD表示。2.计算公式平均差的数学性质不是最优的,在实际应用中应用较少。第19页,讲稿共82张,创作于星期日二、方差(Variance)与标准差(Standard deviation)方差与标准差事最经常用于描述次数分布离散程度的差异量数。(一)总体方差与总体标准差(二)样本方差与样本标准差(三)标准差的合成(四)方差与标准差
8、的意义第20页,讲稿共82张,创作于星期日方差与标准差的定义方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平方和的平均数。标准差:方差的算术平方根,表示一列数据的平均差距。第21页,讲稿共82张,创作于星期日(一)总体方差与总体标准差总体方差的表示:总体标准差的表示:第22页,讲稿共82张,创作于星期日(二)样本方差与样本标准差样本方差的表示:样本标准差的表示:样本方差为什么要除以(n1)与自由度(degrees of freedom)有关。自由度是数学名词,在统计学中,n个数据如不受任何条件的限制,则n个数据可取任意值,称为有n个自由度。若受到k个条件的限制,就只有(nk)个自由度
9、了。计算样本方差时,n个变量值本身有n个自由度。但受到样本均数的限制,任何一个“离均差”均可以用另外的(n1)个“离均差”表示,所以只有(n1)个独立的“离均差”,因此只有(n1)个自由度。第23页,讲稿共82张,创作于星期日(三)标准差的合成方差具有可加性。在已知几个组方差或标准差的情况下,可以计算她们的总方差或总标准差。-只有在应用同一种观测手段,对不同样本的统一特质进行测量时才能使用。标准差的合成,:总平均数;:各小组的平均数i第24页,讲稿共82张,创作于星期日练习表 4 个学习小组的竞赛成绩学习小组nSA20808B18757C16708D2070674第25页,讲稿共82张,创作于
10、星期日(四)标准差的性质1.每一个观测值都加一个常数c后,计算得到的标准差等于原标准差。2.每一个观测值都乘以一个常数c,则所得的标准差等于原标准差乘以这个常数。3.每个观测值都乘以同一个常数c(c0),再加上一个常数d,所得标准差等于原标准差乘以这个常数c。第26页,讲稿共82张,创作于星期日方差和标准差的优缺点(1)反应灵敏;(2)计算严密;(3)受抽样变动影响小(1)不太容易理解;(2)易受极端数值影响;(3)有个别数值模糊不清时,无法计算。方差和标准差是表示一组数据离散程度的最好指标。值越大,说明次数分布的离散程度越大。第27页,讲稿共82张,创作于星期日三、差异系数(Coeffici
11、ent of variation)1.差异系数也叫变异系数,它是一种相对差异量,常用CV表示。是一组数据的标准差与其相应的均值之比。2.计算公式第28页,讲稿共82张,创作于星期日差异系数的适用情境变异系数指出了标准差相对于平均值的大小,用于比较不同总体或样本数据的离散程度。(1)同一团体不同测量的变异的比较,如相同班级不同科目的变异的比较;-两个或两个以上样本所测的特质不同(2)不同团体同一测量的变异的比较,如不同年级同一科目变异大小的比较。-两个或两个以上样本所测的特质相同,但样本间的水平相差较大。第29页,讲稿共82张,创作于星期日练习1 已知某小学一年级学生的平均体重为25公斤,体重的
12、标准差是3.7公斤,平均身高110厘米,标准差位6.2厘米,问体重与身高的离散程度哪个大?2 通过同一个测验,一年级学生的平均分数为60分,标准差为4.02分,五年级学生的平均分数为80分,标准差为6.04分,这两个年级的测验分数中哪一个分散程度大?第30页,讲稿共82张,创作于星期日全距(range)也称两极差,是一组数据的最大值与最小值之差。R=max(Xi)-min(Xi)第31页,讲稿共82张,创作于星期日差异系数Coefficient of variation变异系数指出了标准差对于平均值的大小,用于比较不同总体或样本数据的离散程度。同一样本不同测量的变异的比较,如相同班级不同科目的
13、变异的比较;不同样本同一测量的变异的比较,如不同年级同一科目变异大小的比较。第32页,讲稿共82张,创作于星期日第三节 地位量数一、百分位分数二、百分等级分数第33页,讲稿共82张,创作于星期日百分位分数百分位分数是一种相对地位量数,它是次数分布中的一个点。把一个次数分布排序之后,分为100个单位,百分位分数就是次数分布中相对于某个特定百分点的原始分数,它表明在次数分布中特定个案百分比低于该分数。用Pm表示,其中m是特定百分点。eg.P30=60,表明在该次数分布中有30%的个案低于60分。第34页,讲稿共82张,创作于星期日计算第p百分位步骤第一步:从小到大排列原始数据第二步:计算指数i i
14、=(p/100)n,n为项数,p为所求的百分位的位置第三步:若i不是整数,将i向上取整;若i是整数,则第p百分位数是第i项与第 i+1 项数据的平均值例:有12个职员薪金的数据,求第85和第50百分位数。解:(1)将12个数据从小到大排序如下:2210 2225 2350 2380 2380 2390 2420 2440 2450 2550 2630 2825 (2)i=(p/100)n=(85/100)12=10.2 (3)由于i=10.2不是整数,向上取整,所以第85百分位数对应的是第11项,其值为2630。同理,计算第50百分位(中位数)。i=(50/100)12=6,是整数,第50百分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 常用 统计 精选 PPT
限制150内