《描述性统计分析过程优秀课件.ppt》由会员分享,可在线阅读,更多相关《描述性统计分析过程优秀课件.ppt(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、描述性统计分析过程第1页,本讲稿共17页1.平均数、标准误平均数、标准误返回本章首页返回本章首页基本的描述性统计量基本的描述性统计量第2页,本讲稿共17页中位数、众数、全距中位数、众数、全距返回本章首页返回本章首页第3页,本讲稿共17页标准差、方差标准差、方差返回本章首页返回本章首页 严格地讲,在方差和标准差的计算中,分母应取严格地讲,在方差和标准差的计算中,分母应取n-1n-1,因为数据,因为数据变异的自由度是变异的自由度是n-1n-1。但在大样本情况下,使用。但在大样本情况下,使用n n和和n-1n-1差别不大。差别不大。第4页,本讲稿共17页四分位、十分位、百分位数四分位、十分位、百分位
2、数返回本章首页返回本章首页第5页,本讲稿共17页频数分布、峰度、偏度频数分布、峰度、偏度 频数频数(Frequency)就是一个变量的各个观测值出现的次数。比就是一个变量的各个观测值出现的次数。比如某班语文考试的成绩,可以统计出各分数值的人数如某班语文考试的成绩,可以统计出各分数值的人数。峰度(峰度(Kurtosis):是描述某变量所有取值的分布形态陡缓程是描述某变量所有取值的分布形态陡缓程度的统计量,而峰度对陡缓程度的度量是与正态分布进行比较的度的统计量,而峰度对陡缓程度的度量是与正态分布进行比较的结果。如果峰度等于结果。如果峰度等于 0,其数据分布的陡缓程度与正态分布相同,其数据分布的陡缓
3、程度与正态分布相同;峰度大于;峰度大于 0,其数据分布比正态分布更陡峭;峰度小于,其数据分布比正态分布更陡峭;峰度小于0,其数,其数据分布比正态分布更平坦据分布比正态分布更平坦。返回本章首页返回本章首页实例演示实例演示第6页,本讲稿共17页 偏度(偏度(Skewness)是描述数据分布对称性的统计量是描述数据分布对称性的统计量,而且也是,而且也是与正态分布的对称性相比较而得到的。如果分布的偏度等于与正态分布的对称性相比较而得到的。如果分布的偏度等于0,则其,则其数据分布的对称性与正态分布相同数据分布的对称性与正态分布相同;如果偏度大于;如果偏度大于0,则其分布为正偏则其分布为正偏或右偏或右偏,
4、即在峰的右边有大的偏差值即在峰的右边有大的偏差值,使右边出现一个拖得较远的尾巴;使右边出现一个拖得较远的尾巴;如果偏度小于如果偏度小于 0,则为负偏或左偏,即在峰的左边有大的偏差值,则为负偏或左偏,即在峰的左边有大的偏差值,使使左边出现一个拖得较远的尾巴。左边出现一个拖得较远的尾巴。返回本章首页返回本章首页实例演示实例演示第7页,本讲稿共17页标准分数及其线性转换标准分数及其线性转换 Z分数:从平均数为分数:从平均数为,标准差为,标准差为 的总体中抽取一观测值,该观测值的的总体中抽取一观测值,该观测值的Z分数是其距离总体平均值的标准差数。标准分数反映的是一观测值与其他分数是其距离总体平均值的标
5、准差数。标准分数反映的是一观测值与其他分数相比的相对位置。比如分数相比的相对位置。比如Z 分数为分数为 1.5,则其比平均数大,则其比平均数大 1.5 个标准差。个标准差。在实际应用中在实际应用中,为了避免小数的不便,可以对标准分数进行线性转换:,为了避免小数的不便,可以对标准分数进行线性转换:T10Z50 比如某人在艾森克人格问卷的测量中比如某人在艾森克人格问卷的测量中,其精神质得分比同年龄人,其精神质得分比同年龄人的平均成绩高的平均成绩高2.0个标准差,则其换算后的标准分数为个标准差,则其换算后的标准分数为 70 分分;如果另;如果另一人的测试分数正好等于平均数,则其标准分数为一人的测试分
6、数正好等于平均数,则其标准分数为50。返回本章首页返回本章首页第8页,本讲稿共17页探索分析探索分析 探索分析是对一组或多组数据的总体分布特征进行分析,以考察其中有无奇探索分析是对一组或多组数据的总体分布特征进行分析,以考察其中有无奇异值、极大或极小值等;考察各组数据或全部数据是不是正态或接近于正态分异值、极大或极小值等;考察各组数据或全部数据是不是正态或接近于正态分布;探索多组数据之间的方差是否齐性,以确定是否可以采用某种统计分析技布;探索多组数据之间的方差是否齐性,以确定是否可以采用某种统计分析技术对数据进行检验等等。我们这里介绍:术对数据进行检验等等。我们这里介绍:1.用直方图反映数据的
7、分布直观形式;用直方图反映数据的分布直观形式;2.用箱图用箱图(或叫框图)反映数据的集中趋势和奇异值;(或叫框图)反映数据的集中趋势和奇异值;3.用用Levene检验考察多组间方差是否齐性检验考察多组间方差是否齐性;4.用用Q-Q概率图检验数据是否正态分布或接近正态分布。概率图检验数据是否正态分布或接近正态分布。返回本章首页返回本章首页第9页,本讲稿共17页1.用直方图直观地反映数据的总体分布用直方图直观地反映数据的总体分布调调用用数数据据文文件件并并得得到到直直方方图图返回本章首页返回本章首页直方图直方图:是一种频数分布图是一种频数分布图,它反它反映处在某一观测值范围内的个案数。映处在某一观
8、测值范围内的个案数。图中每个直方条下部的中点坐标是图中每个直方条下部的中点坐标是该观测值范围的中点、直方条的宽该观测值范围的中点、直方条的宽度代表该观测值范围、直方条的高度代表该观测值范围、直方条的高度代表该观测值范围内的个案数或度代表该观测值范围内的个案数或人数比例。人数比例。第10页,本讲稿共17页2.用箱图用箱图(或叫框图)反映数据的集中趋势和特异值(或叫框图)反映数据的集中趋势和特异值调调用用数数据据文文件件并并得得到到箱箱图图返回本章首页返回本章首页批注批注:箱图可以直观地反映一箱图可以直观地反映一组观测值的集中趋势、离散趋组观测值的集中趋势、离散趋势、不正常观测值(奇异值和势、不正
9、常观测值(奇异值和极值,均可被排除后重新分析)极值,均可被排除后重新分析)。左图中箱图的高度代表了。左图中箱图的高度代表了25 位数到位数到 75 位数的距离;箱位数的距离;箱图中的粗线代表中位数;箱图图中的粗线代表中位数;箱图上下中央的垂直线叫触须线,上下中央的垂直线叫触须线,触须线的上下截止线分别对应触须线的上下截止线分别对应于观测值的最大值和最小值;于观测值的最大值和最小值;用用 O标记的是奇异值标记的是奇异值(与框边距与框边距离超出框高离超出框高1.5倍倍)、用、用*标记标记的为极大值或极小值的为极大值或极小值(与与框边距离超出框高框边距离超出框高3倍倍)。第11页,本讲稿共17页3.
10、3.用用LeveneLevene检验方差是否齐性检验方差是否齐性 方差齐性检验是统计分析中的一种常见过程,它是从样本方差以至方差齐性检验是统计分析中的一种常见过程,它是从样本方差以至样本各自所代表的总体方差是否相同而判断两个样本同质性样本各自所代表的总体方差是否相同而判断两个样本同质性(homogeneity)的方法。简单地说,方差齐性检验就是检验各个方差是的方法。简单地说,方差齐性检验就是检验各个方差是否存在显著性差异。一般采用否存在显著性差异。一般采用Levene方法:先将各组观测值均转换为离方法:先将各组观测值均转换为离差绝对值,然后对各组离差绝对值进行方差分析,如果方差分析的结果差绝对
11、值,然后对各组离差绝对值进行方差分析,如果方差分析的结果中中p 0.05,则认为方差齐性(即方差具有相同性);方差分析的结果中,则认为方差齐性(即方差具有相同性);方差分析的结果中p0.05,则认为方差不齐性(即方差具有不同质性)。,则认为方差不齐性(即方差具有不同质性)。方差齐性检验举例与方差齐性检验举例与spssspss过程演示过程演示返回本章首页返回本章首页第12页,本讲稿共17页4.4.用用Q-QQ-Q概率图检验数据是否正态分布概率图检验数据是否正态分布 可以用正态概率可以用正态概率Q-Q图和离散正态概率图和离散正态概率Q-Q 图检验观测值的分布是图检验观测值的分布是否是或接近于正态分
12、布。正态概率图是由观测值与按正态分布的预期值否是或接近于正态分布。正态概率图是由观测值与按正态分布的预期值作出来的散点图作出来的散点图,如果实际值为正态分布,如果实际值为正态分布,则其与预期值具有线性对应,则其与预期值具有线性对应关系,散点图回归一条斜线,该斜线是正态分布的标准线,散点图组成关系,散点图回归一条斜线,该斜线是正态分布的标准线,散点图组成的回归线越接近于标准线,表示实际观测数据越接近正态分布;如果以的回归线越接近于标准线,表示实际观测数据越接近正态分布;如果以观测值、其与正态分布期望值的离差值做散点图,则当散点近似随机地观测值、其与正态分布期望值的离差值做散点图,则当散点近似随机
13、地落在过原点的中间横线周围时,数据分布接近于正态分布。落在过原点的中间横线周围时,数据分布接近于正态分布。正态概率图(正态概率图(Normal Q-Q Plot)Normal Q-Q Plot)的的SPSSSPSS过程过程离散正态概率图(离散正态概率图(Detrended Normal Q-Q Plot)Detrended Normal Q-Q Plot)的的SPSSSPSS过程过程返回本章首页返回本章首页第13页,本讲稿共17页返回本章首页返回本章首页第14页,本讲稿共17页 描述性统计,是心理学研究、教育研究中资料分析的基本内描述性统计,是心理学研究、教育研究中资料分析的基本内容和进一步分
14、析的基础。常用的除上述介绍之外,还包括交叉列容和进一步分析的基础。常用的除上述介绍之外,还包括交叉列联表分析,我们将交叉列联表的分析转入非参数检验部分讨论。联表分析,我们将交叉列联表的分析转入非参数检验部分讨论。本章要求熟练掌握的内容包括:平均数、标准差、中位数、众数、本章要求熟练掌握的内容包括:平均数、标准差、中位数、众数、频数分布、标准分数频数分布、标准分数(Z)(Z)及其线性转换、峰度计算、偏度计算、奇异值及其线性转换、峰度计算、偏度计算、奇异值和极值检测、方差齐性检验等方面的和极值检测、方差齐性检验等方面的SPSSSPSS过程;准确理解直方图和箱图过程;准确理解直方图和箱图的各种特征及
15、其所代表的含义。的各种特征及其所代表的含义。返回本章首页返回本章首页本章练习题及数据表本章练习题及数据表第15页,本讲稿共17页练习题练习题1.表表2-lx-1所示的数据是某中学初二所示的数据是某中学初二5班学生的期末考试成绩。班学生的期末考试成绩。(1)请建立)请建立SPSS数据文件,然后计算全班同学各门功课成绩的平均数据文件,然后计算全班同学各门功课成绩的平均数、标准误、标准差、中位数、众数、全距;数、标准误、标准差、中位数、众数、全距;(2)作出各门课程成绩的直方图,从直方图大致判断其偏度、峰度)作出各门课程成绩的直方图,从直方图大致判断其偏度、峰度是大于是大于0还是小于还是小于0,然后
16、计算各自的偏度和峰度,并与你的估计作比,然后计算各自的偏度和峰度,并与你的估计作比较;较;(3)将学生各门课程成绩均转换为标准差为)将学生各门课程成绩均转换为标准差为10、平均数为、平均数为100的标的标准分数,然后计算每一学生标准分数的总和,找出成绩最好的学生的准分数,然后计算每一学生标准分数的总和,找出成绩最好的学生的编号;编号;(4)考察分数分布是否正态或接近正态。)考察分数分布是否正态或接近正态。练习题数据表练习题数据表第16页,本讲稿共17页2.某研究者为考察汉字加工中双字词语音识别中的半测优势,以某研究者为考察汉字加工中双字词语音识别中的半测优势,以及这种半测优势所受语义关联性的影
17、响。他选用若干语义无关双及这种半测优势所受语义关联性的影响。他选用若干语义无关双字音节和语义关联双字音节作为实验材料。从某学院字音节和语义关联双字音节作为实验材料。从某学院 300 名男大名男大学生中随机抽取了学生中随机抽取了30名学生,再将其随机分成名学生,再将其随机分成A、B两组两组,分别,分别采用左耳和右耳输入音节,要求其听到输入的音节时尽量快速大采用左耳和右耳输入音节,要求其听到输入的音节时尽量快速大声复述该音节。实验利用计算机程序控制,自动记录其反应时间,声复述该音节。实验利用计算机程序控制,自动记录其反应时间,结果如表结果如表2-lx-2所示。所示。(1)建立正确的)建立正确的SPSS数据文件;数据文件;(2)考察两组被试的反应时间是否接近正态分布;)考察两组被试的反应时间是否接近正态分布;(3)作箱图,检查是否存在奇异值和极值;)作箱图,检查是否存在奇异值和极值;(4)进行反应时间的组间方差齐性检验。)进行反应时间的组间方差齐性检验。练习题数据表练习题数据表转到第三章练习题转到第三章练习题第17页,本讲稿共17页
限制150内