2007凯程心理学辅导讲义(心理统计).pdf
《2007凯程心理学辅导讲义(心理统计).pdf》由会员分享,可在线阅读,更多相关《2007凯程心理学辅导讲义(心理统计).pdf(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一部分 描述统计 第一部分 描述统计 2007 年全国硕士研究生入学统一考试心理学专业基础综合考试大纲 心理统计复习提纲 统计主要研究的是:应用 课程说明:危难之处显身手!学习方法:理清条件,提纲挈领,加强练习,融会贯通!讲授重点:疑点、难点、考点与答题方法。最高宗旨:统计部分不一定能满分,但要拿到高分。主要内容三个部分 1.统计概述先明后白。方向、目标、道路。有了方向才有动力,有了动力才有坚实的行动,有了坚实的行动才可能有辉煌的结果。2.心理统计的知识脉络系统梳理,方能轻松掌握。主要包括了心理统计的有关理论和方法:描述统计、推论统计和实验设计。3.心理统计的关键点疑点、难点。4.心理统计练
2、习题。统计概述 1.为什么要学习和考查统计知识?统计让混乱的世界变得清晰,是认识世界的有效法宝。2.统计要学些什么?要打通经脉。顺应规律,方能轻松应对,又见实效。3.怎样学习呢?认真地钻研参考书,然后多加练习,定能考出好的成绩来。4.基本概念 统计 总体 样本 参数 统计量 数据 描述统计 推论统计 取样误差 随机取样 变量 常数 自变量 因变量 假设 命名量表 顺序量表 等距量表 比例量表 离散型变量 连续型变量 统计中常用的符号-注意参数与样本统计量的差异 5.心理统计复习的基本脉络 头脑清晰,方能答题清晰。统计分为三部分:描述统计、推论统计、实验设计 一、描述统计 目的:简化和整理数据的
3、表达。例题:一位研究者收集其实验的样本组成如下。对这些数据进行分类整理和概括。性别 年级 年龄 女 3 26 女 1 22 女 3 25 女 3 26 男 1 23 女 2 23 男 1 26 女 1 22 女 1 23 女 4 25 女 1 23 女 1 22 (一)统计图表 注意:使用统计图时与实际数据特征的对应。1.统计图用图来直观表达数据的分布特征。统计图的构成(图号、图题,图目、图尺、图形、图例、图注)次数分布图:直方图、次数多边形、累加次数多边形、累加曲线 条形图、圆形图、线形图、散点图、茎叶图等实用数据与应用条件。比如:数据分为离散数据和连续性数据 条形图和圆形图可用来表示离散数
4、据 直方图、线形图、曲线形图可以来表示连续性数据 散点图表示数据关系 2.统计表用来整理纷繁混乱的大量数据。统计表的构成要素(表号、名称、表目、数字、表注),三线表 次数分布表(简单次数分布表、分组次数分布表、相对次数分布表、累加次数分布表、不等距次数分布表)(二)集中量数 重点:根据给定的数据特征,如何选用适宜的集中量数最能有效的代表改组数据 1.算术平均数极为重要但永远不会考!可以复习一下分组数据求平均数。a)实质是全组所有数据到此点的距离之和最小,是全组的重心点。b)优点:灵敏、严密、可作进一步代数运算。c)缺点:只能是等距或等比数据,怕极端数值、怕模糊数据。2.中数与算术平均数优缺点互
5、补。a)实质是把全组数据的个数分成了相等的两半。b)适合顺序型数据,有极端数值、有模糊数据和开放数值的情况。c)在非参数检验中大显身手。d)特别注意有重复数据和分组数据的情况下,如何求中数。用精确上下限插值法可能是原数据中不存在的数值。3.众数具有最多次数的那个分数或类目。适合命名型数据。皮尔逊经验法:Mo=3Md2M 比较与应用 算术平均数是一个分布的重心,中数把分布分成相等的两半,众数是分布的最高点。分布对称则三点重合,正偏态则 MMdMo,负偏态则 MMdMo。对于下列样本:1,4,3,6,2,7,18,3,7,2,4,3 其适宜的集中趋势;其值是 其适宜的离中趋势;其值是 均值:是首选
6、,它考虑了分布中的每一个分数,与分布的变异性也有关系。中数:在下列情况中数最为适合:在分布中有少数极端值(有长尾的偏态分布)、有未确定的值、所考察分布是开放性的、数据是顺序量表。众数:对于命名型量表无法计算均值和中数,只能用众数作集中量数。(三)差异量数 反映数据的变异性(分散情况、聚类情况)1.离差与平均差 (1)离差又称离均差,反映一个数据与该组数据中心的距离。(离差),(2)平均差,离差绝对值的平均数。可以反映同组数据的分散情况。2.方差与标准差 (1)总体 (2)样本 样本为什么要用 n1,自由度的理解:最少要固定的数目个数确定整组数目的不变。以后还会遇到:t,F 等,慢慢体会。和方利
7、于减省写法。方差和标准差的优点:反应灵敏,随任何一个数据的变化而表示;一组数据的方差和标准差有确定的值;计算简单;适合代数计算,不仅求方差和标准差的过程 中可以进行代数运算,而且可以将几个方差和标准差综合成一个总的方差和标准差;用样本数据推断总体差异量时,方差和标准差是最好的估计量。3.变异系数(差异系数、相对标准差)比如:一个班有 10 个人它们的身高是 1.60 米它的标准差是 0.12,体重平均是 55,标准差是 5。问这个 10个人是身高变异大还是体重变异大 先求差异系数:CV比较均值不等的两组数据的分散情况。用自己的平均数作为尺度得到一个相对量来衡量变化。(四)相对量数 1.百分位数
8、-在某个百分位置上的数。无论是否分组,均要考虑其精确上限和精确下限,用插值法。例:2 5 8 9 100 求 20%位置的数是多少?0 2 5 8 9 10 求 90%位置上的数的是多少?假设:90%上的数是 x 那么 90%上的位置是:2.百分等级某个数在整个分布中所处的百分位置 无论是否分组,均要考虑其精确上限和精确下限,用插值法。3.标准分数(Z 分数)(1)实质是以标准差为单位表示一个原始分数在团体中所处的相对位置。(2)样本 总体 (3)注意 Z 分数的应用广泛:a)对单个数据而言,意味着:个体的相对位置可以比较不同团体中的个体;计算不同质的观测值的总和或平均数以示其在团体中的相对位
9、置。b)对于总体而言,Z 分布可以完成数据的标准化,测验学上用于测验分数的标准化。尤其是可以表示分布的概率。记住常用的 Z 分数与概率的对应(注意单侧与双侧)。c)异常值的取舍,上下三个标准差以内。(五)相关量数 事物之间关系:因果,共变,相关。共变:指受第三者变量或者是不了解的变量 相关是度量和描述两个变量之间关系的一种统计技术。用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数,取值范围-11。正 负反映变化的方向。相关系数的值,仅仅是一个比值。它不是由相等单位度量而来(即不等距),也不是百分比,因此,不能直接作加、减、乘、除。例题:一位研究生调查n=100个大学生每周用于
10、体育锻炼的时间和医生对其健康状况的点评,得积差相关r=0.43。由此可推:如果相关值在0.2 之间是弱相关、在 0.40.6 之间是中等强度的相关、在 0.60.8 之间有较强的相关、0.8 以上为强相关。比如 1 2 4 5 2 4 8 9 成直线相关 如果成 1 2 4 5 10 2 4 8 9 0 这个相关较小 1.积差相关(Pearson r)前提:正态成对连续数据,直线相关;实质:协方差:既随着 X 变化,又 Y 也变化。标准公式 原始数据求 标准分数求 方差公式:也可简写成 2.等级相关 例如:1 2 4 5 6 2 3 6 18 12 作出散点图 等级相关是指以等级次序排列或以等
11、级次序表示的变量之间的相关。两个相应总体并不一定呈正态分布,样本容量也不一定大于 30。另外也不一定要线性相关。能用积差相关的数据都能用等级相关。斯皮尔曼(Spearman)等级相关(D 为成对数据的等级之差,N 为等级个数)直接用等级序数计算(RX,RY为相应原始等级)。有相同等级出现时,会影响,需要用到较正公式。(见张厚粲书 139 页)例题:对 10 名同三学生的语文成绩和英语成绩进行排名,得出以下结果:学生编号 1 2 3 4 5 6 7 8 9 10 语文名次 1 2 3 4 5 6 7 8 9 10 英语名次 2 1 3 4 5 7 6 8 10 9 试求语文与英语的相关系数。3.
12、肯德尔等级相关 (1)Kendall 和谐系数(W):适用于两列以上的等级变量。(例如考查 K 个被试对 N 件作品的等级评定)(2)Kendall 一致性系数(U):适用于两列以上的等级变量。(例如考查 K 个评价者的一致性程度)4.点二列相关与二列相关 (1)点二列相关(一列为正态连续变量,另一列为二分名义变量。例如性别,生死,婚否)(SX-连续变量所有数据的标准差)(2)二列相关(两列均为正态连续变量,其中一列人为划分为二分变量比如成绩优秀否,及格否,高个子与矮个子等)(很不常用,用于对项目区分度的确定。如果变量的正态性无法确定时,都用点二列相关)(St两列连续变量总的标准差,y 为正态
13、曲线中 P 值对应的高度)5.相关 当两列变量都是真正的二分变量时,可以用 相关。如何选择呢?主要是考虑两列测量数据类别的匹配。相关系数的使用 Y X 名义变量 顺序变量 等距或等比变量 名义变量 相关 顺序变量 Spearman 等级相关 等距或等比变量 点二系列相关(其中一列转化为等级)Spearman 等级相关(r)Pearson 积差相关(r)多系列变量 Kendall 和谐系数与一致性系数 第二部分讲义(暂缺)第三部分 总结心理统计关键点 第二部分讲义(暂缺)第三部分 总结心理统计关键点 1.数据类型:命名/顺序/等距/等比数据 20 以下 5 2040 3 40 以上 8 2.分布
14、形态与集中量数、重复数据求中数 3.变异性及其度量、次数分布中 z 与 p 的关系 例题:有一学生成绩低于平均成绩一个标准差,他在该班的百分位点是;【答疑编号:10330101 针对该题提问】4.等级相关与积差相关 5.样本均值分布及标准误 6.I 类错误和 II 类错误、统计效力、假设检验 p 值的意义 7.t 检验(独立与相关样本)8.方差与方差分析表 间 df A B AB 它是简单主效应 9.卡方拟合度与独立性检验 10.常用非参数检验的应用条件 11.一元回归方程建立、检验与应用 假设检验总汇 数据类型 单样本问题 独立样本的比较 相关样本的比较 多组样本的比较 相关问题 总体正态分
15、布 单样本t/Z 检验 独立样本t/Z 检验相关样本 t 检验 单因素 方差分析重复测验方差分析 积差相关 等比/等距型 分布形态未知 大样本下相应的t/Z 检验 大样本下相应的 t/Z 检验大样本下相应的 t检验 转化为顺序型 转化为顺序型 顺序型 符号检验法 曼-惠特尼U 检验 维尔克松 T检验 克-瓦式单向方差分析 弗里德曼双向方差分析 等级相关 第四部分 练习题 第四部分 练习题 一、填空 1.对于下列样本:1,4,3,6,2,7,18,3,7,2,4,3 其适宜的集中趋势;其值是 其适宜的离中趋势;其值是 【答疑编号:10340101 针对该题提问】2.有一学生成绩低于平均成绩一个标
16、准差,他在该班的百分位点是;【答疑编号:10340102 针对该题提问】3.一组测验分数近似正态分布,平均值为 65.5,标准差为 5,问分数在 55.和 70.5 之间的人数占全体总人数的百分比是。【答疑编号:10340103 针对该题提问】4.一般人群中,每年溃疡的患病率是 4%,在一个 200 名 CEO 的样本中,近 12 个月中有 32 个换上溃疡。为检验 CEO 与一般人群的患病率是否不同,需用检验,所得统计量为,结论为。【答疑编号:10340104 针对该题提问】5.一位研究者报告重复测量的方差分析中,F 检验的结果是 F(2,8)=4.29。求其中有几个被试:【答疑编号:103
17、40105 针对该题提问】被试:公式:6.一位研究者调查 n=200 的青少年样本,发现阅读分数与某个脑电指标的相关是 0.12,他进一步抽取了极端组,发现轻微阅读障碍的儿童与同样指标的相关增加到 0.61,你如何解释这个差异:【答疑编号:10340106 针对该题提问】7.用变量 X 预测 Y,已知 X 的和方是 5,回归线离差乘积和是 10,变量 X,Y 的均值是 2 和 4,求 Y 的回归方程_。【答疑编号:10340107 针对该题提问】8.有 n=102 对数据,已知积差相关系数为 r=0.6,Y 的和方 SSY=100,如以这些数据建立回归方程的根据,则结果的标准误是 【答疑编号:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2007 心理学 辅导 讲义 心理 统计
限制150内