书签分享收藏举报版权申诉 / 30

立即下载

当前位置：首页 > 应用文书 > 工作报告 > 现代心理与教育统计学复习资料.pdf

现代心理与教育统计学复习资料.pdf

上传人：l***

文档编号：74324890

上传时间：2023-02-25

格式：PDF

页数：30

大小：1.60MB

( 4.5 )

《现代心理与教育统计学复习资料.pdf》由会员分享，可在线阅读，更多相关《现代心理与教育统计学复习资料.pdf（30页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、第一章 1、数据类型称名数据计数数据离散型数据顺序数据等距数据测量数据连续型数据等比数据 2、变量：是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时，这个指标是一个变量。用来表示随机现象的变量，称为随机变量。一般用大写的或表示随机变量。随机变量所取得的值，称为观测值。一个随机变量可以有许多个观测值。、需要研究的同质对象的全体，称为总体。每一个具体研究对象，称为一个个体。从总体中抽出的用以推测总体的部分对象的集合称为样本。样本中包含的个体数，称为样本的容量 n。一般把容量 n 30 的样本称为大样本；而 n 30 的样本称为小样本。、统

2、计量和参数统计指标统计量参数平均数 M 标准差 S 相关系数 r 回归系数 b 5、统计误差误差是测得值与真值之间的差值。测得值真值误差统计误差归纳起来可分为两类：测量误差与抽样误差。由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差，称为测量误差。由于随机抽样造成的样本统计量与总体参数间的差别，称为抽样误差第二章一、数据的整理在进行整理时，如果没有充足的理由证明某数据是由实验中的过失造成的，就不能轻易将其排除。对于个别极端数据是否该剔除，应遵循三个标准差法则。二、次数分布表（一）简单次（频）数分布表（二）相对次数分布表将次数分布表中各组的实际次数转化为相

3、对次数，即用频数比率（fN）或百分比（）来表示次数，就可以制成相对次数分布表（三）累加次数分布表（四）双列次数分布表双列次数分布表又称相关次数分布表，是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量，一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标，或同一组被试在两种实验条件下获得的结果。三、次数分布图使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。%100Nf简单次（频）数分布图直方图、次数多边形图累加次数分布图累加直方图、累加曲线（一）简单次数分布图直方图（二）简单次数分布图次数多边图次数分布多边形图是一种表示连续

4、性随机变量次数分布的线形图，属于次数分布图。凡是等距分组的可以用直方图表示的数据，都可用次数多边图来表示。绘制方法：以各分组区间的组中值为横坐标，以各组的频数为纵坐标，描点；将各点以直线连接即构成多边图形。（三）累加次数分布图累加直方图（四）累加次数分布图累加曲线四、其他统计图表条形图：用直条的长短来表示统计项目数值大小的图形，主要是用来比较性质相似的间断型资料。圆形图：是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体，圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。线形图用来表示连续型资料。它能表示两个变量之间的函数关系；一种事物随另一种事物变化的情况；

5、某种事物随时间推移的发展趋势等。基于线形图，既可对有关统计变量进行数量比较，又可分析发展的趋势。散点图是用相同大小圆点的多少或梳密表示统计资料量大小以及变化趋势的图。第三章集中量数用来表现数据资料的典型水平或集中趋势。常用的集中量包括算术平均数、加权平均数、中位数和众数等等。一、算术平均数算术平均数一般简称为平均数或均数、均值。一般用，或者用表示。算术平均数是最常用的集中量 X（一）算术平均数的计算公式（二）算术平均数的意义算术平均数是应用最普遍的一种集中量。它是“真值”（true score）的最佳估计值。真值是反映某种现象的真实水平的分数。由于测量过程中的各种偶然因素的影响，

6、真值往往很难得到。在实际测量中，往往采用“多次测量，取平均数”的方法，用平均数去估计真值。（三）算术平均数的优缺点优点：反应灵敏、有公式严密确定、简明易懂、适合代数运算缺点：容易受两极端数值的影响；一组数据中有模糊不清的数值时无法计算。（四）计算和应用算术平均数的原则同质性原则：算术平均数只能用于表示同类数据的集中趋势。平均数与个体数值相结合的原则：在解释个体特征时，既要看平均数，也要结合个体的数据。平均数与标准差、方差相结合原则：描述一组数据时既要分析其集中趋势，也要分析离散程度。二、中位数中位数又称为中数，是按顺序排列的一组数据中位于中间位置的数。中位数是常用集中量的一种。一般用

7、 Md 或 Mdn 表示（一）中位数的计算方法 1、原始数据计算法一组数据中无重复数值的情况首先将一组数据按顺序排列 ininXnnXXXX1211XnX12,122nnXXMdn则为偶数若 2、次数分布表计算法公式中:Lb 为中位数所在组的精确下限 fb 为中位数所在组下限以下的累积频数 n 为数据总和 fMd 为中位数所在组的频数 i 为组距三众数众数用 Mo 表示，有两种定义：次数分布表中，频数最多那一组数据的组中值，即为众数。四、算术平均数、中位数、众数三者的关系在正态分布中：在正偏态分布中：在负偏态分布中：五、其它集中量数（一）加权平均数加权平均数是不同比重数据（或平

8、均数）的平均数，一般用表示。其计算公式有两种：（二）几何平均数几何平均数（geometric mean）是 n 个数值连乘积的 n 次方根，用或表示。计算公式为：当数据的分布呈偏态时，可用几何平均数表示该组数据的集中趋势。几何平均数的变式两边取对数，得个数为第则为奇数若21,nMdnMdbbfifnLMd2OMMdXOMMdXOMMdXwXiiiwWXWXiiwnXnXgMgXnngXXXM 2111112312 nnnnngXXXXXXXXM1lglg11lgXXnMng注意：几何平均数计算的是平均的变化情况，如果要计算平均增长率，需要从几何平均数中减去基数 1。2.应用几何平均

9、数的变式计算按一定比例变化的一列数据,一般用来求平均变化率如平均增长率.（三）调和平均数调和平均数(harmonic mean),用符号 MH 表示公式为：调和平均数的应用学习速度方面的问题.调和平均数在描述速度方面的集中趋势时,优于其他集中量第四章描述数据离散程度的统计量称为差异量。差异量越大，表明数据越分散、不集中；差异量越小，表明数据越集中，变动范围越小。一、全距、四分位距和百分位距（一）全距 R 全距是一组数据中的最大值与该组数据中最小值之差，又称极差。RXmaxXmin（二）百分位差（百分位距）百分位差是指两个百分位数之差。（三）四分位距四分位距是第一

10、个四分位数与第三个四分位数之差的一半,计算公式为（四）平均差平均差是指一组数据中，每一个数据与该组数据的平均数离差的绝对值的算术平均数，通常用 AD 或 MD 表示。原始数据计算公式（五）方差和标准差 iHXNM1213QQQnXXAD方差（又称为变异数、均方）。是表示一组数据离散程度的统计指标。一般样本的方差用表示，总体的方差用表示。标准差是方差的算术平方根。一般样本的标准差用 S 表示，总体的标准差用表示。标准差和方差是描述数据离散程度的最常用的差异量。1、样本方差及标准差定义公式 2、总体方差及标准差的定义公式是总体的无偏估计 3、原始数据的方差与标准差计算 4、总标准差的

11、合成方差具有可加性的特点。当已知几个小组数据的方差或标准差时，可以计算几个小组联合在一起的总的方差或标准差。计算公式公式中:为总方差,为总标准差 Si 为各小组标准差 ni 为各小组数据个数 5、方差和标准差的性质方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。标准差是一组数据方差的算术平方根，它不可以进行代数计算，但有以下特性：如果则 nXXS22nXXS2NX22NX212nXXS2S2222 nXnXS22 nXnXSiiTiiiTnXXnSnS222iiTiiiTnXXnSnS222TSTSiTiXXdCXYXYSS 如果则 7、标准差的应用差异系数差异

12、系数是指标准差与其算术平均数的百分比，它是没有单位的相对数。常以 CV 表示,其计算公式为：差异系数的作用：比较不同单位资料的差异程度比较单位相同而平均数相差较大的两组资料的差异程度可判断特殊差异情况 8、标准差的应用标准分数 Z 分数，是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。（1）标准分数的计算公式及其性质没有实际单位；可正可负，可为零；一组原始数据中，各个 Z 分数的标准差为 1；正态分布的原始数据，转换得到的 Z 分数是标准的正态分布（0，1）。（2）Z 分数的作用分数可以表明原始分数在团体中的相对位置，因此称为相对位置量数。把原始分数转换成分数，就把单

13、位不等距的和缺乏明确参照点的分数转换成以标准差为单位、以平均数为参照点的分数。（3）标准分数的优点可比性：标准分数以团体的平均数为基准，以标准差为单位，因而具有可比性。可加性：标准分数使不同的原始分数具有相同的参照点，因而具有可加性。明确性：标准分数较原始分数的意义更为明确。合理性：标准分数保证了不同性质的分数在总分数中的权重相同，使分数更合理地反映事实。第五章一、相关系数 XCYXYSCS%100XSCVsXXZ用来描述两个变量相互之间变化方向及密切程度的统计指标称为相关系数，一般样本的相关系数用 r 表示，总体的相关系数用表示。相关系数的取值：-1 r+1 0r1 相关系数的符号：“

14、”表示正相关，“”表示负相关。相关系数不是由相等单位度量而来的，因此只能比较大小，不能做任何加、减、乘、除运算。二、积差相关（一）积差相关及其适用条件皮尔逊积差相关积差相关适用于：1、两个变量都是连续数据；两变量总体都为正态分布；两变量之间为线性关系。2、成对数据，样本容量要大。积差相关条件的判断方法：连续变量：根据得到数据的方式判断，测量数据。正态分布：一般情况下，正常人群的身高、体重、智力水平、心理与教育测验的结果，都可按总体正态分布对待；如果要求比较高，则需要对数据进行正态性检验。线性关系：根据相关散布图可判断两个变量之间是否线性关系。（二）相关系数的等距转换及其合并相关系数不是等

15、距数据，更不是比率数据，它只能比较相对大小，不能进行加减乘除运算。但我们常会遇到需要将取自同一总体的几个样本的相关系数合成、求平均的相关系数这一问题。这时，可以先将相关系数 r 转换成具有等距单位的 Zr 值。三、斯皮尔曼等级相关等级相关是指以等级次序排列或以等级次序表示的变量之间的相关。（一）斯皮尔曼等级相关的概念及适用条件斯皮尔曼等级相关是等级相关的一种。它适用于两个以等级次序表示的变量，并不要求两个变量总体呈正态分布，也不要求样本的容量必须大于 30。当连续数据不能满足计算积差相关的条件时，可以转换成等级数据从而计算斯皮尔曼等级相关系数。五、质与量的相关（一）点二列相关适用条件

16、一个变量为正态、连续变量，另一个变量为真正的二分名义变量，这两个变量之间的相关，称为点二列相关。有时一个变量并非真正的二分变量，而是双峰分布的变量，也可以用点二列相关来表示。多用于评价是非类测验题目组成的测验内部一致性。（二）二列相关两个变量都是正态连续变量，其中一个变量被人为地划分成二分变量，表示这两个变量之间的相关，称为二列相关。将连续变量人为划分为二分变量时，应注意尽量使分界点接近平均数。教育或心理测验中问答题的区分度指标。六、品质相关两个变量都是按性质划分成几种类别，表示这两个变量之间的相关称为品质相关。品质相关处理的一般是计数数据而不是连续数据，变量划分为不同的品质类别,主要用于

17、双向表或称为列联表（RC 表）。品质相关的方法有多种，最常用的是四分相关、相关和列联表相关。第六章一、概率的定义概率：表明随机事件可能性大小的客观指标。概率的两种定义:后验概率和先验概率。后验概率（或统计概率）：随机事件的频率：当 n 无限增大时，随机事件 A 的频率会稳定在一个常数 P，这个常数就是随机事件 A 的概率。先验概率（古典概率）：古典概率模型要求满足两个条件：试验的所有可能结果是有限的；每一种可能结果出现的可能性相等。（二）概率的公理系统 1任何随机事件的概率都是在 0 与 1 之间的正数，即 0 P（A）1 2不可能事件的概率等于零，即 P（A）=0 nmWA)(nmPA)

18、(3必然事件的概率等于 1，即 P（A）=1 （三）概率分布类型概率分布是指对随机变量取不同值时的概率的描述，一般用概率分布函数进行描述。依不同的标准，对概率分布可作不同的分类。、离散型分布与连续型分布依随机变量的类型，可将概率分布分为离散型概率分布与连续型概率分布。心理与教育统计学中最常用的离散型分布是二项分布，最常用的连续型分布是正态分布。、经验分布与理论分布依分布函数的来源，可将概率分布分为经验分布与理论分布。经验分布：是指根据观察或实验所获得的数据而编制的次数分布或相对频率分布。理论分布：是按某种数学模型计算出的概率分布。、基本随机变量分布与抽样分布依所描述的数据的样本特性，

19、可将概率分布分为基本随机变量分布与抽样分布。基本随机变量分布是随机变量各种不同取值情况的概率分布，抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。二、概率分布正态分布（一）正态分布特征正态分布，是连续型随机变量概率分布的一种 1正态分布曲线函数正态分布曲线函数又称概率密度函数，其一般公式为：公式所描述的正态曲线，由和两个参数决定。2、正态分布的性质正态分布是以为中心的对称分配。正态分布有 2 个参数：M(平均数)以及 s(标准差)，其决定了分配的位置及形状。正态分布曲线下面的面积总和等于 1。正态分布在时有一转折点。正态分布曲线的两尾无限延伸。2222XeNY)(xfX 正

20、态分布是一族曲线，标准正态分布是一条曲线。3、标准正态分布曲线将标准分数代入正态曲线函数，并且，令1，则公式变换为标准正态分布函数：标准正态分布曲线的特点曲线在处达到最高点曲线以处为中心，双侧对称曲线从最高点向左右缓慢下降，向两侧无限延伸，但永不与基线相交。标准正态分布曲线的平均数为，标准差为。从3 至3 之间几乎分布着全部数据。曲线的拐点为正负一个标准差处。4、正态分布表的使用已知 Z 值求概率求0 至某一值之间的概率：直接查表求两个值之间的概率两值符号相同：PZ1Z2PZ2PZ1 两值符号相反：PZ1Z2PZ2PZ1 求某一 Z 值以上的概率 Z0 时，PZPZ Z0 时，

21、PZPZ 求某一 Z 值以下的概率 Z0 时，PZPZ Z0 时，PZPZ 已知面积（概率）求 Z 值求 Z0 以上或以下某一面积对应的 Z 值：直接查表求与正态曲线上端或下端某一面积 P 相对应的 Z 值：先用PZ，再查表求与正态曲线下中央部位某一面积相对应的 Z 值：先计算 P2，再查表已知概率或 Z 值，求概率密度 Y 22221XeY2221ZeY直接查正态分布表就能得到相应的概率密度值。如果由概率求值，要注意区分已知概率是位于正态曲线的中间部分，还是两尾端部分，才能通过查表求得正确的概率密度。三、概率分布二项分布（一）二项试验与二项分布二项分布是一种具有广泛用途的离散型随机

22、变量的概率分布 1二项试验满足以下条件的试验称为二项试验：一次试验只有两种可能的结果，即成功和失败；共有 n 次试验，并且 n 是预先给定的任一正整数；各次试验相互独立，即各次试验之间互不影响；各次试验中成功的概率相等，失败的概率也相等。2二项分布函数二项分布是一种离散型随机变量的概率分布。用 n 次方的二项展开式来表达在 n 次二项试验中成功事件出现的不同次数（X0，1）的概率分布，叫做二项分布函数。二项展开式的通式（即二项分布函数）：3、二项分布的平均数和标准差如果二项分布满足 pq 且 nq5（或者 pq 且 np5 时，二项分布接近于正态分布。可用下面的方法计算二项分布的平均数和

23、标准差。二项分布的平均数为：二项分布的标准差为：四、概率分布样本分布（一）、抽样分布区分三种不同性质的分布：总体分布：总体内个体数值的频数分布 XnXXnqpCpnxb),(npnpq 样本分布：样本内个体数值的频数分布抽样分布：某一种统计量的概率分布 1.抽样分布的概念抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。抽样分布是一个理论的概率分布，是统计推断的依据。2平均数抽样分布的几个定理从总体中随机抽出容量为 n 的一切可能样本的平均数之平均数等于总体的平均数。容量为 n 的平均数在抽样分布上的标准差（即平均数的标准误），等于总体标准差除以n 的平方根。从正态总体中，随机抽

24、取的容量为 n 的一切可能样本平均数的分布也呈正态分布。虽然总体不呈正态分布，如果样本容量较大，反映总体和的样本平均数的抽样分布，也接近于正态分布。（二）标准误某种统计量在抽样分布上的标准差，称为标准误。标准误用来衡量抽样误差。标准误越小，表明样本统计量与总体参数的值越接近，样本对总体越有代表性，用样本统计量推断总体参数的可靠度越大。因此，标准误是统计推断可靠性的指标。平均数标准误的计算 1总体正态，已知（不管样本容量大小），或总体非正态，已知，大样本平均数的标准误为：2总体正态，未知（不管样本容量大小），或总体非正态，未知，大样本平均数标准误的估计值为：（三）平均数离差统计量的分布 1

25、总体正态，已知（不管样本容量大小），或总体非正态，已知，大样本平均数离差的的抽样分布呈正态分布正态总体，样本平均数的抽样分布 )(XEnXnX1nSXnXXZXXnX222总体正态，未知（不管样本容量大小），或总体非正态，未知，大样本平均数离差的的抽样分布呈 t 分布 t 分布的特点形状与正态分布曲线相似 t 分布曲线随自由度不同而有一簇曲线自由度的计算：自由度是指能够独立变化的数据个数。查 t 分布表时，需根据自由度及相应的显著性水平，并要注意是单侧数据还是双侧。3总体未知，大样本时的近似处理样本容量增大后，平均数的抽样分布接近于正态分布，可用正态分布近似处理：第七章一、点估计

26、、区间估计与标准误（一）总体参数估计的基本原理根据样本统计量对相应总体参数所作的估计叫做总体参数估计。总体参数估计分为点估计和区间估计。由样本的标准差估计总体的标准差即为点估计；而由样本的平均数估计总体平均数的取值范围则为区间估计。（二）点估计 1、良好的点估计量应具备的条件无偏性：如果一切可能个样本统计量的值与总体参数值偏差的平均值为 0，这种统计量就是总体参数的无偏估计量。有效性：当总体参数不止有一种无偏估计量时，某一种估计量的一切可能样本值的方差小者为有效性高，方差大者为有效性低。一致性：当样本容量无限增大时，估计量的值能越来越接近它所估计的总体参数值，这种估计是总体参数一致性估计量

27、。充分性：一个容量为 n 的样本统计量,应能充分地反映全部 n 个数据所反映的总体的信息。1nSXXtXnSXXZX2、点估计量的缺点：有偏差，没有提供正确估计的概率,即不能提供估计值与参数真值的接近程度和可靠程度（三）区间估计区间估计得出的不是一个单一数值，而是一个数值区间。它既可以告诉我们参数的真值在什么范围内，又能告诉我们参数的真值落在这个范围的概率有多大。区间估计的基础抽样分布根据抽样分布的特点及原理，不同总体条件下，可能会有不同的抽样分布，则可得到不同条件下总体参数的区间估计的计算方法。区间估计涉及和置信区间和显著性水平。区间估计以样本统计量的抽样分布（概率分布）为理论依据，按

28、一定概率的要求，由样本统计量的值估计总体参数值的所在范围，称为总体参数的区间估计。对总体参数值进行区间估计，就是要在一定可靠度上求出总体参数的置信区间的上下限。要知道与所要估计的参数相对应的样本统计量的值，以及样本统计量的理论分布；要求出该种统计量的标准误；要确定在多大的可靠度上对总体参数作估计，再通过某种理论概率分布表，找出与某种可靠度相对应的该分布横轴上记分的临界值，才能计算出总体参数的置信区间的上下限。置信区间置信度，即置信概率，是作出某种推断时正确的可能性（概率）。置信区间，也称置信间距（confidence interval,CI）是指在某一置信度时，总体参数所在的区域距离或区域长

29、度。置信区间是带有置信概率的取值区间。显著性水平对总体平均数进行区间估计时，置信概率表示做出正确推断的可能性，但这种估计还是会有犯错误的可能。显著性水平(significance level)就是指估计总体参数落在某一区间时，可能犯错误的概率，用符号表示。P-2、平均数区间估计的基本原理通过样本的平均数估计总体的平均数,首先假定该样本是随机取自一个正态分布的母总体(或非正态总体中的 n30 的样本)，而计算出来的实际平均数是无数容量为 n 的样本平均数中的一个。根据样本平均数的分布理论，可以对总体平均数进行估计，并以概率说明其正确的可能性。三、总体平均数的估计（一）总体平均数的区间估计 1

30、总体平均数区间估计的基本步骤根据样本的数据，计算样本的平均数和标准差；计算平均数抽样分布的标准误；确定置信概率或显著性水平；根据样本平均数的抽样分布确定查何种统计表；计算置信区间；解释总体平均数的置信区间。2平均数区间估计的计算总体正态，已知（不管样本容量大小），或总体非正态，已知，大样本样本平均数的分布呈正态，平均数的置信区间为：总体正态，未知（不管样本容量大小），或总体非正态，未知，大样本样本平均数的分布为 t 分布，平均数的置信区间为：总体正态，未知，大样本平均数的抽样分布接近于正态分布，用正态分布代替 t 分布近似处理：总体非正态，小样本不能进行参数估计，即不能根据样本分布

31、对总体平均数进行估计。第八章一、假设检验的原理 nZXnZX221122nStXnStXdfdfnSZXnSZX22利用样本信息，根据一定概率，对总体参数或分布的某一假设作出拒绝或保留的决断，称为假设检验。1、假设检验一般有两互相对立的假设。H0：零假设，或称原假设、虚无假设；是要检验的对象之间没有差异的假设。H1：备择假设，或称研究假设、对立假设；是与零假设相对立的假设，即存在差异的假设。进行假设检验时，一般是从零假设出发，以样本与总体无差异的条件计算统计量的值，并分析计算结果在抽样分布上的概率，根据相应的概率判断应接受零假设、拒绝研究假设还是拒绝零假设、接受研究假设。2、小概率事件：样本

32、统计量的值在其抽样分布上出现的概率小于或等于事先规定的水平，这时就认为小概率事件发生了。把出现概率很小的随机事件称为小概率事件。当概率足够小时，可以作为从实际可能性上，把零假设加以否定的理由。因为根据这个原理认为：在随机抽样的条件下，一次实验竟然抽到与总体参数值有这么大差异的样本，可能性是极小的，实际中是罕见的，几乎是不可能的。3、显著性水平统计学中把拒绝零假设的概率称为显著性水平，用表示。显著性水平也是进行统计推断时，可能犯错误的概率。常用的显著性水平有两个：和。4假设检验中的两类错误及其控制对于总体参数的假设检验，有可能犯两种类型的错误，即错误和错误。假设检验中的两类错误 H0 为真

33、 H0 为假拒绝 H0 错误正确接受 H0 正确错误两类错误实际情况 H0 正确 H0 错误研究结论拒绝 H0 型错误正确接受 H0 正确型错误结论（1）两类错误既有联系又有区别错误只在否定 H0 时发生错误增加错误减小错误只在接受 H0 时发生错误增加错误减小（2）n,2 可使两类错误的概率都减小.为了将两种错误同时控制在相对最小的程度，研究者往往通过选择适当的显著性水平而对错误进行控制，如或。对错误，则一方面使样本容量增大，另一方面采用合理的检验形式（即单侧检验或双侧检验）来使误差得到控制。在确定检验形式时，凡是检验是否与假设的总体一致的假设检验，被分散

34、在概率分布曲线的两端，因此称为双侧检验。双侧检验的假设形式为：H0：0，H1：0 凡是检验大于或小于某一特定条件的假设检验，是在概率分布曲线的一端，因此称为单侧检验。单侧检验的假设形式为：H0：0，H1：0 或者 H0：0，H1：0 5假设检验的基本步骤提出假设选择检验统计量并计算统计量的值确定显著性水平做出统计结论二、平均数的显著性检验（一）总体平均数的显著性检验总体平均数的显著性检验是指对样本平均数与总体平均数之间的差异进行的显著性检验。若检验的结果差异显著，可以认为该样本不是来自当前的总体，而来自另一个、与当前总体存在显著差异的总体。即，该样本与当前的总体不一致。1总体平均数

35、显著性检验的原理检验的思路是：假定研究样本是从平均数为的总体随机抽取的，而目标总体的平均数为0，检验与0 之间是否存在差异。如果差异显著，可以认为研究样本的总体不是平均数为0 的总体，也就是说，研究样本不是来自平均数为0 的总体。2总体平均数显著性检验的步骤.提出假设双侧检验的假设形式为：H0：0，H1：0 单侧检验的假设形式为：H0：0，H1:0（左侧检验）或者 H0：0，H1:0（右侧检验）选择检验统计量并计算结果直接应用原始数据检验假设是有困难的，必须借助于根据样本构造出来的统计量，而且针对不同的条件，需要选择不同的检验统计量。确定显著性水平在假设检验中有可能会犯错误。如果零假设

36、是正确的，却把它当成错误的加以拒绝，就会犯错误。表示做出统计结论时犯错误的概率，称为显著性水平。显著性水平一般为和。做出统计结论根据已确定的显著性水平，查统计量的分布表，找到该显著性水平时统计量的临界值，并以计算得到的统计量值与查表得到的临界值比较，根据统计决断规则做出拒绝或接受零假设的决定。例：某小学历届毕业生汉语拼音测验平均分数为 66 分，标准差为。现以同样的试题测验应届毕业生（假定应届与历届毕业生条件基本相同），并从中随机抽 18 份试卷，算得平均分为 69 分，问该校应届与历届毕业生汉语拼音测验成绩是否一样解：H0：0，H1：0 学生汉语拼音成绩可以假定是从正态总体中抽出的随机样

37、本。总体标准差已知，样本统计量的抽样分布服从正态，以 Z 为检验统计量显著性水平为=，双侧检验查表得 Z=，而计算得到的 Z=|Z|，则概率 P 差异不显著,应在显著性水平接受零假设结论:该校应届毕业生与历届毕业生汉语拼音测验成绩一致，没有显著差异。nXZ0187.11666909.1 双侧 Z 检验统计决断规则 Z与临界值比较 P 值显著性检验结果 Z P 不显著保留 H0，拒绝 H1 Z P 显著在显著性水平拒绝H0，接受 H1 Z P 极其显著在显著性水平拒绝H0，接受 H1 单侧 Z 检验统计决断规则 Z与临界值比较 P 值显著性检验结果 Z P 不显著保留 H0

38、，拒绝 H1 Z P 显著在显著性水平拒绝H0，接受 H1 Z P 极其显著在显著性水平拒绝H0，接受 H1 3平均数显著性检验的几种情形总体为正态，总体标准差已知平均数的抽样分布服从正态分布，以为检验统计量，其计算公式为：总体为正态，总体标准差未知，样本容量小于 30 平均数的抽样分布服从 t 分布，以 t 为检验统计量，计算公式为：总体标准差未知，样本容量大于 30 平均数的抽样分布服从 t 分布，但由于样本容量较大，平均数的抽样分布接近于正态分布，因此可以用 Z 代替 t 近似处理，计算公式为：总体非正态，小样本不能对总体平均数进行显著性检验。三、平均数差异的显著性检验平均数差

39、异显著性检验的统计量及计算公式（一）两总体正态，两总体方差已知总体方差已知条件下，平均数之差的抽样分布服从正态分布，以作为检验统计量，计算公式为：1两样本独立 2两样本相关 100nSXXtX1ndfnSXXZX00XDSEXXZ21nXXZX00 两样本相关的判断：两个样本的数据之间存在着一一对应的关系时，称两样本为相关样本。常见的情形主要包括三种：一是同一组被试在前后两次在同一类测验上的结果；二是同一组被试分别接受两种不同实验的测验结果；三是按条件相同的原则选择的配对实验结果。例 1:某幼儿园在儿童入园时对 49 名儿童进行了比奈智力测验(=16)，结果平均智商为 106。一年后再对同组

40、被试施测，结果平均智商分数为 110。已知两次测验结果的相关系数为 r=，问能否说随着年龄的增长和一年的教育，儿童智商有了显著提高解：H0:12 H1:12 正常儿童的智力测验结果，可以认为是从正态总体中随机抽出的样本。总体标准差已知，而同一组被试前后两次的测验成绩，属于相关样本。因此平均数之差的抽样分布服从正态分布，应选用作检验统计量，并选择相关样本、总体标准差已知的计算公式。提示：1216 显著性水平为=单侧检验时=，=而计算得到的=，|Z|，则概率 P 差异显著,应在显著性水平接受零假设结论:可以说随着年龄的增长和一年的教育，儿童智商有了显著提高。22212121nnXXZnrXXZ

41、212221212nrXXZ21222121249161674.0216161101062234.2（二）两总体正态，两总体方差未知总体方差未知条件下，平均数之差的抽样分布服从 t 分布，以 t 作为检验统计量，计算公式为：1两样本独立，两总体方差一致方差齐性检验方差齐性检验是对两总体方差是否齐性（即是否一致或是否存在显著性差异）进行的检验。方差齐性检验的统计量是，其概率分布遵循分布。若从方差相同的两个正态总体中，随机抽取两个独立样本，以此为基础，分别求出两个相应总体方差的估计值，这两个总体方差的估计值的比值称为 F 比值，其计算公式为实际应用中，常需以样本方差估计总体方差，因此公式为

42、当两样本容量相差不大时，上式可简化为 2、两样本独立，两总体方差不齐性对于方差不齐性的独立样本，平均数差异的显著性可能由两方面的原因造成：一是两平均数确实存在显著差异；二是两总体方差之间存在显著差异。当两总体的方差之间差异显著时，运用一般的 t 检验不准确，需要进行特别的检验。总体方差不齐性的两个独立样本平均数之差的标准误，可用两个样本方差分别估计出的两个平均数标准误平方之和再开方来表示。这时样本平均数之差与相应总体平均数之差的离差统计量，既不是 Z 分布，也不是 t 分布，而是与 t 分布相近似的 t分布。这种检验方法被称为 t 检验，其统计量的计算公式为 t临界值的计算公式 XDSEX

43、Xt21212121222211212nnnnnnSnSnXXt221nndf2221F1/1/22221211nSnnSnF2221SSF 1122212121nSnSXXt2222212211XXdfXdfXSESEtSEtSEt 3总体方差未知，独立样本和相关样本（三）两总体非正态，n1 和 n2 大于 30（或 50）总体标准差未知条件下，平均数之差的抽样分布服从 t 分布，但样本容量较大，t 分布接近于正态分布，可以以近似处理，因此以 Z作为检验统计量，计算公式为：两样本相关两样本独立（四）总体非正态，小样本不能对平均数差异进行显著性检验。第九章一、方差分析的基本原理及步骤

44、1、方差：又叫均方，是标准差的平方，是表示变异的量方差分析通过对多组平均数的差异进行显著性检验，分析实验数据中不同来源的变异对总变异影响的大小。2、方差分析的基本原理方差分析通过对多组平均数的差异进行显著性检验，分析实验数据中不同来源的变异对总变异影响的大小。3、方差分析的逻辑方差分析作为一种统计方法，是把实验数据的总变异分解为若干个不同来源的分量。因而它所依据的基本原理是变异的可加性。在统计分析中，一般用方差来描述变量的变异性。方差分析是将总平方和分解为几个不同来源的平方和（实验数据与平均数离差的平方和）。111 ndf122 ndfXDSEXXZ21nrXXZ212221212nSS

45、rSSXXZ21222121222212121nnXXZ22212121nSnSXXZ然后分别计算不同来源的方差，并计算方差的比值即值。根据值是否显著对几组数据的差异是否显著做出判断。4、方差分析的基本过程提出假设选择检验统计量并计算分解平方和 SS 分解自由度 df 计算方差 MS 计算 F 值作出统计结论并列方差分析表 5、方差分析的基本条件总体正态分布各实验处理是随机的且相互独立（一般情况下都能满足）各实验处理内方差一致（需要进行检验）6、方差分析中的几个概念实验中的自变量称为因素。只有一个自变量的实验称为单因素实验，两个或两个以上称为多因素实验。某一因素的不同情况称为因素的

46、“水平”。水平包括量差或质别两类情况，按各个“水平”条件进行的重复实验称为各种实验处理。如果是单因素实验，则处理数就是水平数；如果是多因素实验，处理数就是各因素的水平数的乘积。二、完全随机设计的方差分析方差分析处理的一般是由多个实验组接受一个变量或多个变量的多种水平的实验结果，是一种多组实验设计。这种多组实验设计的类型常用的有组间设计、组内设计和混合设计等等。完全随机设计的方差分析，是单因素组间设计的方差分析。为了检验某一个因素多种不同水平间差异的显著性，将从同一个总体中随机抽取的被试，再随机地分入各实验组，施以各种不同的实验处理之后，用方差分析法对这多个独立样本平均数差异的显著性进行检验，

47、称为完全随机设计的方差分析。完全随机设计的方差分析中，把各种变异的总和称为总变异，并把总变异分成两部分：一部分称为组间变异，是在不同实验组之间表现出来的差异；另一部分称为组内变异，是在同一实验组内部不同被试之间表现出来的差异。三、随机区组设计的方差分析随机区组设计的方差分析，是对多个相关样本平均数的差异进行显著性检验。在检验某一因素多种不同水平（即不同实验处理）之间差异的显著性时，为了减少被试间个别差异对结果的影响，把从同一个总体中抽取的被试按条件相同的原则分成各个组（称为区组），使每个区组内的被试尽量保持同质。在对各区组施以多种实验处理之后，用方差分析法对这多个相关样本平均数差异所进行的显

48、著性检验，称为随机区组设计的方差分析。1区组：随机区组设计的原则是同一区组内的被试应尽量“同质”，每一区组内被试的人数分配有以下三种方式：每一个被试作为一个区组，所有的被试都要分别接受各种实验处理；每一区组内的被试人数是实验处理数的整倍数。同一区组内的每几个被试可以随机接受同一种实验处理；以一个团体为一个基本单元。总之，就区组来说，每一个区组都接受所有的各种实验处理；就实验处理来说，每一种实验处理在各个区组中重复的次数相同。随机区组设计的方差分析中，接受各种实验处理的是同一些区组，故个别差异可以从组内差异中分离出来，从而减少由个别差异造成的误差，增加实验的信息，提高实验的效率。2变异来源随机

49、区组设计的方差分析将变异来源分解为组间变异、区组变异和误差变异三部分：3随机区组设计方差分析的计算公式总平方和组间平方和区组平方和公式中：R 表示某一区组在某种处理的分数 n 表示区组数，K 表示处理数误差平方和分解自由度总自由度可以分解为组间、区组和误差自由度：ERBTSSSSSSSSnXXSST22nXnXSSB22nkRkRSSR22RBTESSSSSSSSERBTdfdfdfdf总自由度组间自由度区组自由度误差自由度组间方差区组方差误差方差计算值组间方差与误差方差的比值区组方差与误差方差的比值随机区组设计的方差分析表表 91 随机区组设计方差分析表

50、变异来源平方和自由度方差 F 值概率组间变异 SSB dfB MSB P P 区组变异 SSR dfR MSR 误差变异 SSE dfE MSE 总变异 SST dfT 随机区组设计的方差分析，根据实验设计的特点，把区组效应从组内平方和中分离出来。这时总平方和被分解为组间平方和、区组平方和、误差项平方和。与完全随机设计的方差分析相比，其最大优点是考虑到个别差异的影响（即区组效应），可1 nkdfT1 kdfB1 ndfRRBTEdfdfdfdfBBBdfSSMS RRRdfSSMSEEEdfSSMSEBMSMSF ERMSMSF 以将这种影响从组内变异中分离出来，从而提高效率。但是这

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

11.9 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 现代心理教育统计学复习资料

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：现代心理与教育统计学复习资料.pdf
链接地址：https://www.taowenge.com/p-74324890.html