《T检验的适应条件及其分析过程ing.pptx》由会员分享,可在线阅读,更多相关《T检验的适应条件及其分析过程ing.pptx(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、本资料来源第四章 T检验的适应条件与分析过程一、推断性统计分析的基本逻辑1.随机事件 所谓随机事件,就是事件的发生具有不确定性,或者说其发生服从于完全的机遇机制。比如,一般的测量中,每一次的测量值都是难以确定的,因为其变化具有随机性;从一个总体中抽出一个人来,其智商分数是多少,也是难以事先确定的,因为抽到的这个人本身就具有随机性。随机性也叫偶然性,然而偶然之中定有必然性,比如测量误差的大小具有随机性,但也有必然性,即随机性测量误差总体上等于 0,各种不同的误差值发生的频数分布为正态分布。描述随机事件的有效方法就是概率和概率分布。比如,对于一个大的总体来说,我们可能无法测定每一个体的智商,但即使
2、如此,也可以根据其正态分布预测各种智商分数发生的概率。根据正态分布规律,我们知道平均数及其附近的值发生概率高,远离平均数的值发生概率较低,当其与平均数的距离达到 1.96个标准差以上时,其发生概率小于 5,即 P0.05,我们就称之为小概率事件。所谓小概率事件,就是发生概率很小的事件,通俗地讲,就是“不大可能”发生的事件。心理学研究中,通常以发生概率小于0.05或0.01为标准来界定小概率事件。2.推断性统计分析的逻辑基础是抽样和抽样误差 研究一个总体,不可能对总体作完全的测量,只能采取抽样测量的方法,但样本测量的结果与总体相比总会出现偏差。我们虽然无法预见或确定每一样本所出现的偏差的大小,但
3、却可以知道偏差越大,发生的概率越小。偏离程度达到一定值时,该样本就成为一种小概率事件了。当我们对一样本进行测量,得到其平均数、标准误,那么如何判断该样本是否能代表某一总体的水平呢?面临这一问题,我们可以先作出一个假设:假设这一样本就是来自于相应总体的一个无偏样本,那就按抽样误差的分布规律来评估其发生概率,如样本测量的平均值与总体平均值相比,差距较大,以至于发生的概率(也叫做伴随概率)小于0.05,它就成了“小概率事件”,意味着这一推断的前提成立的可能性不大,也是一个小概率事件。结论就是:该样本来自于这一总体的可能性很小,它不能代表这一总体,或者就说:它与这一总体的差异显著。3.两个样本平均数差
4、异性检验的逻辑 从一个总体中随机抽取 n 个个体组成样本,则有许多种可能的抽取结果,因此可以得到许多个样本平均数,样本平均数的大小变化又是一个随机事件,两个样本平均数的差异量也是一个随机事件。样本平均数差异量的分布中心为0,然后,差异量越大,越远离0差异,其发生的概率就越小。当差异量达到一定值时,它就也是一个小概率事件了。当要检验两个样本测量得到的平均数是否存在显著差异时,可以先假定它们是来自于同一总体,应该能代表同一总体,然后以此为前提考察这两个样本平均数差异量发生的概率。如果差异量足够大,其发生概率小于0.05,我们就说其是小概率事件,成为“可能性很小”的事件,这就意味着假设前提成为“可能
5、性很小”的,即二者来自于同一总体的“可能性很小”,进而推断:这两个样本很可能来自于两个不同总体,分别代表两个不同的总体,存在显著性差异。否则,就不能说假设前提是“可能性很小”的,也就不能说两个样本有显著性差异了。二、t 值和t 值分布 统计学家长期的研究发现,从正态分布的总体中抽取样本时,样本平均数的分布也是一个正态分布,样本平均数的差异量的分布也是正态分布,其分布特征可以用Z 分数来描述。但是,在实际计算标准分数时,需要首先知道总体的标准差,然后计算抽样分布的标准误。如果总体标准差未知,也就只能使用样本标准差作为它的估计值了,以这一估计值计算的标准误就是一个波动值了。这时,计算的“标准分数”
6、就不再标准了,因此不能使用Z 分数来描述其分布特征,而是要用t 分数来描述其分布特征。t 分布是一个均值为零左右对称的丘形分布,其峰度低于标准正态分布,尾部高于标准正态分布,而且T 分布的峰度变化与自由度有关。自由度越大其分布越接近于正态分布,所以在大样本检验中可以使用Z 检验代替t 检验。根据统计学研究,样本平均数与总体平均数的差异值符合自由度为某一确定值的T 分布,自由度的确定则与样本容量有关;两个样本平均数的差异值也符合自由度为某一确定值的T 分布,自由度的确定则与两个样本的容量及样本的相关关系有关。我们可以将t 分布与Z 分布进行对照。三、不同条件下的t值及t分布自由度的计算1.样本与
7、总体的差异性比较 示例1:某一20人的样本,其身高平均为1.35米,标准差为0.26米,试问该样本是来自于平均身高为1.50米的总体吗?或者:给出样本所有个案的观测值,然后检验该样本是否与某一总体平均值存在显著性差异。单样本t检验过程演示2.独立样本间平均数的比较 独立样本平均数的比较一般出现在两种情况下:一种情况是,两个样本各来自于不同的总体,参加同样的测量,比较两个样本各自测量的平均数以判断两个样本以至两个不同总体之间是否存在某种差异性,如比较男生样本和女生样本的平均记忆力水平、场依存性分数等;另一情况是来自于同一总体的两个样本,分别在不同条件下进行同样的测量,然后比较两个样本测量的平均值
8、的差异性,以判断不同条件对测量结果的影响。在这样的两种情况下,两个样本都是独立的,没有关联性,所以叫做独立样本t 检验。独立样本平均数差异 t 检验,一般包括:进行样本间的方差齐性检验、计算 t 和df 值、进行统计推断。在SPSS 过程中,自动给出方差齐性和方差不齐性的两个结果,同时进行方差齐性检验。研究者根据方差齐性与否选择相应的 t 和 df 值,并进行统计推断。这一分析的SPSS 操作过程如下:独立样本t检验的过程的演示3.配对或相关样本间平均数的差异比较 根据某种预测成绩对被试进行配对分组得到两个样本,分别进行不同控制条件下的观测,得到的两组数据就具有一定关联性;或者一组被试参加了不
9、同条件下的观测,得到的两组数据也具有关联性,这种测量被称为重复测量。象这样两种情况下得到的数据必然是一一对应的,可能存在相关,差异的 t 检验如下列操作程序。配对样本t检验过程的演示复习与t检验的实例练习1.某教师欲进行一项数学教学试验,以考验某种新的教学方法是否更有利于学生成绩的提高,于是从全校 500 名初二学生中抽取了20名学生参加实验班。结果期末数学考试成绩如下,这与全年级学生数学平均为82分相比有无显著差异?你认为其教学试验可以得到什么结论?2.实验班数学考试成绩为:95 87 80 85 79 80 88 82 75 81 76 90 93 80 90 89 85 93 85 752.根据简单反应时间对20名被试进行配对分组,然后各自参加不同条件下的汉字识别实验,记录的反应时间和正确率如下表所示,请分析实验条件的不同是否造成了被试汉字识别速度与正确性的显著差异。1 2 3 4 5 6 7 8 9 10组1正确率.35.40.26.50.40.30.25.65.52.45反应时间522 450 360 650 450 560 485 650 510 400组2正确率.50.66.35.58.40.37.28.65.68.50反应时间500 430 400 550 470 655 680 350 450 380演讲完毕,谢谢观看!
限制150内