2022年心理与教育测量重点总结 .pdf
《2022年心理与教育测量重点总结 .pdf》由会员分享,可在线阅读,更多相关《2022年心理与教育测量重点总结 .pdf(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、心理与教育测量第一章 心理与教育测量概论(一)一般测量概论1. 测量:依据一定的法则使用量尺对事物的属性进行定量描述的过程。2. 测量的基本要素:(1)参照点 : 绝对参照点:以绝对的零点作为测量的起点,如长度测量相对参照点:以人为确定的零点为测量的起点,如对地势高度的测量。(2)测量的单位:要有确定的意义,即对同一单位,所有人的理解都是相同的。要有相等的价值,即第一个单位与第二个单位之间的距离等于第二个单位与第三个单位之间的距离。3. 测量的量表:能够使事物的特征数量化的数字的连续体。陈名量表 -用数字代表事物的成分或用数字对事物经行分类,但该类数字没有数量的意义。可细分为两种形式,一是命名
2、量表(用数字指代个别事物,如用数字给运动员编号);二是类别量表(用数字指代事物的种类,如用1、2、3 分别代表不同的职业类型)。其适用的统计方法有百分比、次数、众数和卡方检验。顺序量表 -其中的数字不仅能够指代类别,而且能够表明不同类别的大小、等级或事物具有某种特征的程度,它既没有相等距离的单位,也没有固定的测量原点。适用的统计方法有中位数、百分位数、等级相关系数和肯德尔和谐系数等。等距量表 -不仅能够指代事物的类别和等级,而且具有相等距离的测量单位。没有绝对的零点,适用的统计方法有平均数、标准差、积差相关系数、等级相关系数以及t 检验和 F 检验。比率量表 -具有类别、等级和等距的特征外,还
3、具有绝对的零点或固定的原点。适用的统计方法除了与等距量表相同外,还与几何平均数、变异系数相同。(二)心理与教育测量的性质1. 心理与教育测量的定义:依据一定的心理学和教育学理论在测验上对人的心理特质和教育成就进行定量描述的过程。2. 心理与教育测量的量表属于顺序量表的原因:从所使用的参照点来说,教育测量和心理测量领域的参照点均为相对零点。从所使用的单位来说,教育与心理测量的单位远没有其他测量的单位成熟和完善。3.标准化需具备的条件:测验内容的标准化施测条件的标准化评分规则的标准化测验常模的标准化4. 心理与教育测验的种类:(1)常模参照测验-以常模为参照编制的测验(如高考只有百分之几的人可以进
4、入重点大学)标准参照测验(目标参照测验)-以标准为参照编制的测验(如,视力测验、考驾照)(2)智力测验 -测量个人的智力(一般认知能力)水平的高低能力倾向测验-测量个人的潜在才能,预测个人的能力发展倾向成就测验 -测量个人在接受教育后的学业成(3)个别测验 -同一主试在同一时间只能测量一个被试团体测验 -同一主试在同一时间内能够测量许多被试(4)难度测验 -识别个人能够达到的最高水平速度测验 -识别个人做题的最快速度精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 1 页,共 14 页 - - - - -
5、- - - - - 第二章 心理与教育测量简史1.高尔顿:把统计方法应用到对个别差异资料的分析之中2.卡特尔:首次提出“心理测验”这个术语认为心理学只有立足于实验与测量,才能达到如同自然科学一样的准确性认为心理测验只有建立普遍的统一标准,并与常模相比较,才能充分地实现其科学价值和实用价值3.比内:1903 年, 智力的实验研究问世,提出了智力的定义,认为智力是高级心理过程,包括推理、判断以及运用已知知识解决新问题的能力1904 年与其助手西蒙合作完成了世界上第一个智力测验量表-比内 -西蒙量表,因此成为了心理测验的鼻祖4.智力测验的发展:最著名的的是推孟于1916 年修订的斯坦福-比内量表。其
6、中影响最为深远的变动是推孟采用了比率智商的概念来表示智力水平的高低第一个团体测验-陆军甲种测验和陆军乙种测验30 年代后,瑞文相继编制了瑞文标准推理测验、瑞文彩色推理测验、瑞文高级推理测验韦克斯勒舍弃了比率智商,而用离差智商代之,从而克服了比率智商的局限;他编制的智力量表分为言语量表和操作量表两部分5.能力倾向测验的发展:最初被称为“学业能力倾向测验”,后来进一步扩展到职业咨询、工业部门及军事领域的人才选拔和安置工作领域。在编制成套能力倾向测验的过程中,因素分析方法起了重要的作用。6.成就测验的发展:20 世纪初,桑代克编制了第一个标准化的教育成就测验。因此而被公推为教育测量的鼻祖。1923
7、年,凯利、鲁奇和推孟合作编制了第一个成套成就测验- 斯坦福成就测验20 世纪 30 年代后期,在美国出现了跨州、跨区域乃至全国的测验程序7.人格测验的发展:20 世纪初叶,出现了自陈人格问卷。伍德沃斯用自陈问卷法编制了适用于诊断士兵神经症的个人资料调查表;卡特尔编制了卡特尔16 种人格问卷;埃森克编制成埃森克人格问卷;美国明尼苏达大学的哈撒韦和莫垦利编制成明尼苏达多项人格调查表。另一种技术是投射测验。罗夏克墨迹测验;哈罗尔编制了以团体方式实施的墨迹测验。第三章 经典测验理论的基本假设1.心理特质:表现在一个人身上所特有的相对稳定的行为方式2.测量误差:(1)含义:在测量过程中由那些与测量目的无
8、关的变化因素所产生的一种不准确或不一致的测量效应(2)种类:随机误差 -由与测量目的无关的偶然因素引起的而又不易控制的误差,其方向和大小的变化完全是随机的。例如在进行手枪射击时,新手往往很难控制手臂的轻微摆动。系统误差 -由与测量目的无关的变因引起的一种恒定而有规律的效应。例如, 在设计过程中,尽管射击手非常优秀,每次结果都很一致,但若是枪的准心有点儿毛病,则其射击结果将会有稳定的偏差。(3)来源:测量工具:心理测量量表是否稳定、是否真正测到了我们所要测的东西是测量工具造精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - -
9、- - -第 2 页,共 14 页 - - - - - - - - - - 成误差的两种主要原因。测量对象:主要原因是受测者的真正水平是否得到真正发挥。施测过程:主要是一些偶然因素(恒定因素较易控制)3.真分数:(1)概念:反映被试某种心理特质真正水平的那个数值称作该特质的真分数(简称T 分数) ,真分数是一个在理论上构想出来的抽象概念,在实际测量中是很难得到的。(2)数学模型:观察分数(记为X)与真分数( T)之间是一种线性关系,并只相差一个随机误差(记之为 E) 。即X=T+E (3)假设:若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分数的平均值会接近于真分数。真分数和
10、误差分数之间的相关为零。各平行测验上的误差分数之间相关为零。(4)推导:S2X =S2T + S2E即在一次测量中,被试观察分数的方差等于其真分数方差与误差分数方差之和。第四章 测量信度1.概念:测量结果的稳定性程度。也是一致性,可靠性。2.定 义 : 信 度 ( 信 度 系 数 ) 是 一 个 被 测 团 体 的 真 分 数 的 变 异 数 与 实 得 分 数 的 变 异 数 之 比 ,即 rXY = S2T /S2X 信度是一个被试团体的真分数与实得分数的相关系数的平方。即rXY =2xT信度是一个测验x(A 卷)与它的任意一个“平行测验”x (B 卷)的相关系数,即rXY =xx3.作用
11、:(1)信度是测量过程中所存在的随机误差大小的反映(2)信度可以用来解释个人测验分数的意义标准误: 每个人两次测量的分数之差可以构成一个新的分布,这个分布的标准差就是测量的标准误,它是此次测量中误差大小的客观指标,有了这一指标,我们就可以对团体中任何一个人的测验成绩做出恰当的解释。公式:SE=SX 1-rxx(SE是标准误, SX是实得分标准差,rxx是信度)置信区间:当测验满足经典测验理论的三大假设时,根据以上估计的测量标准误便可用以下方法构建测验真分数估计的置信区间:公式:x - ZCSE T x + ZCSE (x 是被试的观测分数,SE为测量标准误,ZC是对应于某个统计检验显著性水平的
12、标准正态分布下的临界值)注:例题参考 P52 最上面。4.信度的估计方法:(1)重测信度:定义 -用同一个量表对同一组被试施测两次所得结果的一致性程度。其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数:)()()(22yyxxyyxxrxx(x和是x第一次测量的实得分数及实得分数的平均值;y和y是第二次测量的实得分数及实得分数的平均值,精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 3 页,共 14 页 - - - - - - - - - - xxr是重测信度。公式不要求记,但要会用)使用的前
13、提 - A 所测量的心理特性必须是稳定的B 遗忘和练习的效果基本上相互抵消C 在两次实测的间隔期内,被试在所要测查的心理特质方面没有获得更多的学习和训练误差来源 -A 测验本身B 被试方面(个体差异)C 偶发因素干扰优缺点 -A能提供测验结果是否随时间而变化的资料,可作为预测被试特定行为的依据。B 易受练习和记忆的影响意义 -A反应的是在测验时间上的等值性B 适用于 速度测验与人格测验,不适用于难度测验(2)复本信度:定义 -A 复本信度 -指两个平行的测验测量同一批被试所得结果的一致性程度。其大小等于同一批被试在两个副本测验上所得分数的皮尔逊积差相关系数。(同上面)B 等值性系数 -两个复本
14、测验是同时连续施测的。C 稳定性与等值性系数-两个复本测验相距一段时间分两次施测。D 平衡设计 -为低效施测的顺序效应,随机地选出一半被试先做A 卷后再做B 卷,另一半被试先做 B 卷再做 A 卷。 使 用 的 前 提 -A首 先 要 构 造 出 两 份 或 两 份 以 上 真 正 平 行 的 测 验 ( 即A 、 B卷 )B 被试要有条件接受两个测验。误差来源 -A 测验的两种形式是否等值(是否是平行测验)B 被试情绪波动,动机变化等测验情景变化、偶发因素干扰。优缺点 -A 代表性强,信度准,避免练习、记忆效应B 编制复本难,影响积极性,被试容易触类旁通意义 -A反应的是在测验内容上的等值性
15、(3)分半信度:定义 -将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。由于描述的是两半题目间的一致性,所以有时也称内部一致性系数。计算 - A 方法与复本信度的类似,但是被试在两半测验上的得分的相关系数只是半个测验的信度,所以还要用斯皮尔曼-布朗公式矫正:hhhhxxrrr12(xxr是两个分数间的相关系数,hhr是整个测验的信度值)B 上式只有在两半测验分数的变异数(即总体方差)相等时才能使用,否则,就用下面的弗朗那根公式或卢伦公式。)1(2222xbaxxSSSr(2aS和2bS分别表示所有被试在两半测验上的得分的变异数,2xS表示全体被试在整个测验上总得分的变异数)
16、精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 4 页,共 14 页 - - - - - - - - - - 22/1xdxxSSr(2dS表示同一组被试在两半测验上得分之差的变异数,其他与上式相同)使用前提 -A 在只能施测一次或没有复本的情况下使用B 当一个测验无法分成对等的两半时,不宜使用C 常用的分半方法有奇偶分半、按题目难度分半等注: 速度测验 不适合分半信度(4)同质性信度:定义 -A- 也叫做内部一致性系数,是指测验内部所有题目间的一致性程度。所谓一致性, 是指所有题目测的都是同一种心理特质
17、以及所有题目得分之间都具有较高的正相关。B- 如果一个测验的同质性信度不高,则说明结果可能是几种心理特质的综合反映,所以结果不好解释。一种好办的方法就是把一个异质的测验分解成多个具有同质性的测验,再根据被试在分测验上的得分分别做出解释。C- 同质性高才是测验测的单一特质的充分条件。即一些表面上看起来是测量同一种心理特质的题目,如果其题目间不具有较高的正相关,则不能认为它们具有同质性。计算 -克龙巴赫 系数:A 公式:)1(122xiSSKK(K 是题目数,2iS是所有被试在第i 题上的分数变异,2xS是测验总分的变异)B 适用范围: 不要求测验题目仅是(0、1)记分,可以处理任何测验的内部一致
18、性系数的计算问题,此外, 值还是所有可能的分半信度的平均值,它只是测量信度下界的一个估计值C 计算过程和例子:参考P58 (5)评分者信度:定义 -多个评分者给同一批人的答卷进行评分的一致性程度。(通常要求成对的受过训练的评分者之间平均一致性达到0.9 以上,才算公平。 )计算 -当评分者人数多于两个时,评分者信度可用肯德尔和谐系数进行估计:A 公式:NNKNRRWii322212(K 是评分者人数,N 是被评的对象数,iR是第 i 个被评对象的水平等级之和)B 若评分中有相同等级出现,则使用下列公式:121233222nnKNNKNRRWii(n 为相同等级的个数)例题及计算方法:参考P60
19、 精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 5 页,共 14 页 - - - - - - - - - - 5.影响测量信度的因素:(1)被试方面 :单个被试 -身心健康状况、应试动机、注意力、耐心、求胜心、态度被试团体 -整个团体内部水平的离散程度以及团体的平均水平(2)主试方面: 就施测者而言,不按指导手册规定施测就阅读评分者而言,评分标准掌握不一(3)施测情境: 考场环境、设备是否良好、空间宽窄是否恰当等等(4)测量工具: 试题取样 -利用斯皮尔曼 -布朗公式可以预测试题长度与信度的关系:公式:
20、11xxxxzzKK(K 为改变后的测验长度与原来长度之比,xx为原测验的信度,zz为测验长度增加为K 倍后的测验信度)试题之间的同质性程度试题的难度(5)两次施测的间隔时间:间隔时间越短,信度值越大,反之亦然。6.提高测量信度的方法:(1)适当增加测验的长度:新增项目必须与试卷中原有的项目同质新增项目的数量必须适度(2)使测验中所有的试题的难度接近正态分布,并控制在中等水平(3)努力提高测验试题的区分度(4)选取恰当的被试团体(5)主试者要严格执行实测规程,评分者要严格按标准给分。第五章 测量效度1. 概念:指一个测验或量表实际能测出其所要测的心理特质的程度。准确性+有效性。2. 定义: (
21、 1)效度是一个相对的概念:效度是相对于一定的测量目的而言的心理测量只能达到某种程度上的准确(2)效度是测量的随机误差和系统误差的综合反映(3)判断一个测量是否有效要从多方面搜集证据:在测量理论中,效度被定义为在一列测量中,与测量目的有关的真实变异数(由所要测量的变因引起的有效变异)与总变异数(实得变异数)的比率, 通常用2xyr表示,其定义为:222xVxySSr(xyr是效度系数,2VS是有效变异数,2xS是总变异数)3.与信度的关系:信度高是效度高的必要而非充分条件,即效度高一定信度高,反之不一定。(比如,用标准米尺来量身高是有效也是可信的,但是如果用英文来考一批母语为中文孩子的数学,虽
22、然多次测量的结果可能很一致(即信度高) ,但是它的测量效度未必高,因为考生的英文水平会影响数学水平的发挥。)测验的效度受它的信度制约。信度总是大于效度的。4.效度的评估:精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 6 页,共 14 页 - - - - - - - - - - (1)内容效度:定义 -指一个测验实际测到的内容与所要测量的内容之间的吻合程度。测量内容包括- A 欲测的知识范围B 该范围内各知识点所要求掌握的程度适用与不适用:A 适用于成就测验和某些用于选拔和分类的职业测验B 不适用于能力倾
23、向测验和人格测验与表面效度不同:表面效度不能算是一种效度,它不反应测验实际测量的东西,它是外行人对某个测验从表面上好像是测某种心理特质的一种现象。当外行人认为某测验能有效地测得某种心理特质时,该测验就被认为有较高的表面效度。一般来说, 最佳行为测验 (答案有正误之分、主试与被试目的一致,如高考)往往表面效度高,其他测验则希望表面效度低。确定方法: A 逻辑分析法 - -a明确欲测内容的范围,包括知识范围和能力要求两个方面。b 确定每个题目所要测的内容,并与双向细目表(考试蓝图)对照c 制定评定量表,对整个测验的有效性做出总的评价B 统计分析法 -从同一个教学内容总体中抽取两套独立的平行测验,用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年心理与教育测量重点总结 2022 心理 教育 测量 重点 总结
限制150内