心理学考研测量心理学知识点整理.doc
《心理学考研测量心理学知识点整理.doc》由会员分享,可在线阅读,更多相关《心理学考研测量心理学知识点整理.doc(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、测量测量就是依据一定的法则使用量具对事物的特征进行定量描述的过程一定法则 是建立在科学规则和科学原理基础上 并通过科学的方法和程序完成测量的过程事物特征 是所要测量的事物的特定属性 根据性质可根伟 确定型 随机型 模糊型量具 是测量的工具定量描述 是任何测量的结果 总是对事物特征的量的确定 区分性 序列性 等距性 可加性测量精度影响因素测量对象本身性质 确定型 事物量保持恒定不变 随机型 事物量随机改变 模糊型 对象本身不确定测量工具的精密性 测量的基本要素参照点 绝对参照点 以绝对零点为测量的起点 零点的意义为无 什么都测不到 相对零点 只能加减 不能乘除单位 理想单位具备两个条件 要有确定
2、的意义 同一单位所有理解相同 要有相等的价值 测量量表命名量表 是最低水平量表 只用数字来表示事物或进行分类 适用统计方法 百分比 次数 众数 卡方顺序量表 次低量表 给个体赋值 数字代表 等级 大小 程度的顺序 没有相等单位 没有绝对零点 适用统计 中位数 百分比 百分位数 等级相关系数 肯德尔和谐系数等距量表 较高水平量表 等距量表的数字具有真正的数量 给个体赋值 数值间的差反映个体心理在特征上的差异程度 没有绝对零点 能够进行加减运算 适合统计方法 平均数 标准差 积差相关 t检验F检验比率量表 最高水平量表 个体间数值反映个体心理在特性上的比率 有绝对零点 适合统计 几何平均数 变异系
3、数心理测量的定义依据一定的心理学理论 使用一定的操作程序 给人的行为和心理属性确定出一种数量化的价值心理测量与一般测量的比较心理测量依据的法则很大程度上只是一种理论 通过理论来编制测量工具并完成测量工作 不如物理测量准确心理测量对象是人的心理特质和成就 特质含义模糊 不大容易给予界定 其具有内隐性 需要通过行为推断心理测量量具由有关专家编制 长期形成 标准化测验 心理测量目标虽然是对人心理特质和教育成就进行定量分析单精度较差 编制技术水平并不高心理测验的定义是对行为样本的客观的和标准化的测量行为样本 从总体行为中抽取出来 能反应个体特定心理特质的一组行为 可以依据对这一组行为测量结果推断其心理
4、特质 样本需要有较好的代表性 样本的代表性制约 测量的质量 并且要了解 全部行为样本的意义 心理测量的目标是 通过测量 来预测被试以后将会出现的行为标准化 指测验编制 实施 计分 以及测量分数解释程序的一致性 标准化需要具备 测验内容标准化 所有接受测量的个人实施相同的或等值的测验内容 施测条件标准化 所有接受测量个人必须在相同施测条件下接受测验 情境 指导语 时限评分规则标准化 测验制定评分标准 最大化 使不同人的评分一致测验常模标准化 个体分数需要与他人比较才有意义 常模即给解释分数一个可比较参照点难度或应答率 难度太低或太高 不能有效将不同水平个体区分信度和效度 信度是指一个测验的可靠性
5、 即多测用同一测验测量统一团体所得分数的一致性 效度 是测量有效性 一个测验多大程度上能够测量到它所要测量的心理特质分类按对象属性和特质不同分认知测验 包括能力测验 智力测验(斯比量表 威克斯勒智力量表 瑞文推理) 成就测验人格测验 指测量个人注入兴趣动机等(16PF 艾森克人格问卷 罗下墨迹 主题统觉)按测量方式分个体测验 主试在同一时间内只能测量一个被试 斯比 威克斯勒 罗下墨迹 主题统觉 优点 主试对被试的观察更细致 有机会获得测量分数之外的信息 主试和被试的面对面交流更多 容易和被试建立融洽合作关系 一些特殊被试只能选择个体测验 缺点 费时间 难以在短时间内收集大量测量资料 测验手续比
6、较复杂 需要经过较高水平训练的人担任主试团体测验 同一主试在同一时间内 能够测量许多被试 瑞文 陆军甲乙团体智力 优点 短时间内可以大量获得信息 节省时间 在教育 选拔 团体比较中广泛使用 缺点 不易有效控制被试的行为 容易产生测量误差 按照测试内容不同文字测验 测验内容通过文字形式表现 容易受被试文化影响非文字测验 通过图形 仪器 工具 实物 模型等形式表现 常限于个别测量按测验目的分 描述测验 诊断测验 预示性测验按测验难度和时限分 难度测验 和速度测验按测验 的要求分 最高行为测验和典型行为测验按计分方式分 客观测验 和非客观测验心理测验理论研究功能收集研究资料 通过测验获得第一手自老
7、作为实证资料做出科学结论建立和检验理论假设 根据已有研究 进行理论假设 再论证实验分组 可以和实验结合起来运用于研究工作实用功能 选拔人才 人员安置 心理诊断 描述评价经典测量理论经典测量理论模型心理特质的含义心理特质是表现一个人身上所特有的相对稳定的行为方式含义 特质是一组具有内部相关的行为概括 具有一定抽象性 (让座 友好待人 热情助人) 特质是一种一般神经心理系统 可以综合不同刺激 使人对这些刺激做出相同反映(对老弱病残都能让座) 特质是一个人身上比较稳定的特点 一个人的精神面貌是有多种特质分多个层次有机组合而成 心理测量任务就是 区别出不同个体在能力 个性等特质上的差异 特质可以决定一
8、个人对特定刺激的反应倾向 可以对人的行为做预期可测性假设 凡是事物都是有数量的 凡是有数量的都是可以观测的真分数的含义 被试某种心理特质的真正水平的那个值称作该特质的真分数 把实测的称为观察分数由于误差的存在 真分数很难得到 只能通过改进工具 完善操作 使观测分数不断接近真分数X=T+ECTT数学模型的三个假设公理若一个人的某种心理特质可以用平行测验反复测量足够多次其观察分数的平均数 会接近真分数真分数和误差分数之间相关为0各平行测量上的误差分数之间相关为0结论在问题范围内 某心理特质水平的真分数坚定不会变 测量任务就是估计这个真分数的大小观察分数被假定等于真分数与误差之和 即观察分数和真分数
9、之间是线性关系测量误差是随机误差 并服从均值为0的正态分布一般情况下计算真分数不是通过对一个个体施测多个平行测试 而是对多个同质个体进行同一测验的测量当团体人数足够大的时候就会出现各误差相互抵消推导公式P44戴 虽然GG的有 但是我不想COPY过来 大家自己再好好看看自己过一遍手记忆深刻经典测量理论的评价1信度估计精度不高 根据真分数理论假设 测验原始分数X线性分解为测验真分数T和误差分数E两部分误差分数 原始分数 真分数相互独立 假设本身就不可靠 并且定义测验信度不能提高信度估计 严格的平行测验很难获得等都导致 信度估计不高2误差指标笼统单一 不精细 导出标准误 是所有被试测量误差的标准差
10、相同测验对不同测验的误差是不同的3各种参数的估计对样本的依赖性太大 编制高质量测验 离不开四度 对不同被试的得分影响大 并受制与随机抽样的理想状态 4参数指标之间的配套性较差 通过现有指标 不能找到验证某试题是否恰好匹配其被试的计量方法 测量信度 测量结果的稳定性程度 对测量一致性程度的估计 也叫测量的可靠性 P46戴定义1 被测团体的真分数的变异数与实得分数的变异数之比 公式定义2 被测团体的真分数与实得分数的相关系数的平方 公式定义3 信度是一个测验X与它的任意一个平行测验X的相关系数 定义12具有理论意义 3具有实际意义原因在于 通常我们是为了测查一批人 而不是反复测量一个人的 (怎么理
11、解?)公式信度的作用 信度是测量过程中所存在随机误差大小的反映 P47戴 信度可以解释个人测验分数的意义 标准误是一次测量中误差大小的客观指标 标准误 对于同一团体两次施测之差的分布的标准差 信度的标准误公式 信度可以帮助进行不同测验分数的比较 通过采用差异的标准误进行差异显著性检验 S为相同尺度的标准分数的标准差 差异显著性检验公式 信度有多种计算方式 只是对测量分数的一致性估计并不指出原因 获得较高信度只是测验有效性的必要条件测量结果是以一个点为中心SE倍数为半径上下波动的范围信度系数的估计 (只是用常模参照测验)学绩0.9 人格0.8 教师自编学绩0.6重测信度 是指用一个量表同时对一组
12、被试施测两次所得结果的一致性程度 为两次成绩的皮尔逊相关公式 重测信度值大说明两次结果比较一致 被试的心理特质不易受环境和状态影响 时间跨度稳定性好误差来源 所测特性本身就不稳定 成熟知识的发展并非人人等量增长 练习因素 和记忆因素 及偶发因素使用前提 所测量心理特质必须稳定的 练习和遗忘的效果基本上相互抵消 两次施测间无更多学习几点说明 重测信度一般用于反映随机变量因素导致的变化而不是行为的长期变化 适用人格测验 速度测验复本信度 两个平行测验测量同一批被试所得结果的一致性程度 其结果等于两次结果皮尔逊积差相关的数 如果两次施测是同时 称为等值性系数 反映了题目所带来的差异 如果有时间间距则
13、称为稳定-等值系数 是最严格的检验误差来源 非平行测验的两个复本间差异 被试的情绪波动 动机变化 测验情景的变化使用前提 要构造两份或两份以上真正平行测验 被试要有条件接受两个 测验分半信度 将一个测验分为两半后 所有被试在这两半上所得分数的一致性程度制作分半的办法 奇偶法 随机安置法使用前提 在只能施测一次或没有副本的情况下使用 如果无法对等分半就不宜使用几点说明 有牵连的题目要放在同一半或则会高估信度 存在任意题或速度测验不易用半分法 如果测验有多个分量表 应在分量表内排好顺序 在把分量表两半组合起来求相关斯皮尔曼-布朗公式 适用两分半测验等价时不等价时用费拉南根 或 卢龙公式同质性信度
14、也叫内部一致性系数 指测验内部所有题目间的一致性信度 当具备较高同质性信度说明测验主要测的是某一个心理特质 如果不高测验结果是几种心理特质综合反映测量单一特性是同质性高的必要而不充分条件计算同质性信度的四种方法 库得-李查逊20 21 卡隆巴赫 荷伊特 评分者信度 多个评分者给同一批人的答卷进行评分的一致性程度 当评分者为2时计算为 同一被试所有分数的相关系数 当大于2时用肯德尔和谐系数当评分者为3-20 被评分者N=3-7 可以查W表 W值高则信度高 当N大于7可以计算卡方指公式信度的影响因素被试方面 个体身心健康 应试动机 注意力 耐力 求胜心 同质性低 分数高 可能高估信度值主试方面 施
15、测者不按照规定施测 给被试暗示 指导语不当 主试的期望和情绪影响 评分者的标准施测情境 会对测验构成影响 光线 空间狭窄等测量工具 在测验长度上 测验越长 测验的信度越高 在难度上 过难或太容易都会降低信度 取样不当也会影响信度两次测量间隔时间 时间间隔越长信度越低提高信度的方法1适当增加测验中与原题目具有较好同质性的题目 增加测验长度 长度要适度2是测验中所有试题的难度接近正态分布 并控制在中等水平 这样的分的分布更广3努力提高题目区分度4选取恰当被试团体 提高测验在各同质性较强的亚团体上的信度 注意被试的个人信息5主试严格执行施测规则 评分严格按照评分准则 施测场地按要求布置 减少无关干扰
16、测量效度 指一个测验或量表实际能测出其所要测的心理特质的程度,效度是总变异中由所测量的特性造成的变异所占的百分比注意 效度是一个相对概念 心理测量的效度只有程度上的差别效度相对一定目的而言 心理测量的特质具有隐蔽性需要通过行为表现推测 而不是百分百准确的 不能为0 效度是测量的随机误差和系统误差的综合反映 只要出现测量误差 效度必受影响 判断一个测量是否有效要从多方面收集证据测量理论中 效度指 与测量有关的真实变异与总变异的比效度的估计内容效度 测验题目对有关内容或行为取样的适当程度 一个测验实际测到的内容与所要测量的内容之间的吻合程度注意条件 要有定义完好的内容范围 测验题目应是所界定的内容
17、范围的代表性取样 主要采用逻辑分析法 即专家根据自己的知识经验对量表的有效性做出判断主要步骤 确定测验内容的总体范围 确定 每个题目所测内容 比较自己分类和测验编制者的分类 编制评定量表 从所测验内容所测的技能 题目对所定义范围覆盖率各种题目数目和分数的比例以及题目形式的适当性做出评价内容效度 主要应用成就测验 和某些选拔 分类的职业测验 不适用 能力倾向测验和人格测验 主要问题在于缺乏理想的数量指标是它最突出的问题 贝隆巴赫指出 被试后测成绩显著由于前测成绩说明 内容有较高内容效度结构效度 适用所要测量的理论结构或特质的程度 或者说所测验分数能够说明心理学理论的某种结构或者特质的程度 所谓某
18、种结构或特质是心理学理论抽象而假设性概念主要特点 结构效度的大小取决于事先假设的心理特质理论 具有不同理论构思的测验其结构效度无法进行比较 结构效度有时难以获得 当实际测量资料无法证实假设理论的时候 不一定确定结构效度低 可能假设错误 结构效度没有单一指标 需要由各方面证据累积起来进行评价确定方法 步骤 提出理论假设 并分解成一些细小纲目 依据理论构架推演有关测验成绩假设 用逻辑和实证 检验假设测验内方法 主要包括内容效度 被试解答测题时的反应过程和测验的同质性测验间方法 相容效度法 计算新的测验与测量同一特质的已知效度较高的原有测验的相关系数 区分效度法 如果两个测验测量的是不同特质 使用相
19、同方法进行测量他们之间的相关也应该很低 因素分析法 通过因素分析找出影响测验的共同效度测验分数总变异来自有关因素的比例是其指标 考察效标关联效度 根据效度把人分为两类 考察其得分差异 依据测验得分把人分为高分组和低分组 考察这两组在所测特质方面是否有差异多种特质-多种矩阵法 若用多种极不相同的方法测量同一特质相关很高效标关联效度 常用于 学业成就 等级评定 临床诊断 专门训练 实际工作表现 团体能力区分一个测验对处于特定情境中的个体的行为进行估计的有效性 又叫实证效度效标 被估计的行为是检验测验效度的外在标准简称效标 也是独立于测验并可以从实践中直接获得的我们感兴趣的行为根据时间分类 可以分为
20、同时效度 测验分数和效标资料是同时收集 预测效度 先获得测验分数 隔一段时间再收集效标资料常用效标 学业成就 临床诊断 实际工作表现 特殊训练成绩 不同团体的总体表现 先前有效的测验 等级评定测量要求 有效性 效标测量能真正反映观念效标 代表理论上测验有效性的主要方面 可靠性 效标测验应具有较高的信度 客观性 效标测量必须能真正反应观念效标 避免效标污染 评定者知道被试分数而影响对效标的评定 实用性 优秀的效标测验应该方法简单经济实用效标估计方法 相关法 计算测验分数与效标测量之间的相关系数 区分法 根据效标测验的成绩区分被试为两组 然后分析这两组被试原来接受测验的分数差异若差异显著说明测验有
21、较高的效标 命中率 当测验做取舍决策时 正命中率和总命中率是较好的效标 功利率 测验所需费用和得到收益进行比较效度影响因素测验构成 测验中词汇和举行不能过于困难 题目表达要清楚 测题不能给出额外线索 测题编制要合理 测验正确答案不能有明显组型 测试题目难度适当 测题数目适当 题目长度增加可以提高信度 正相关测验实施过程 遵从指导语 控制计分差错测验被试 被试的动机 情绪 态度 对于团体如果缺乏必要同质性 可能导致下降所选效标的性质 效标与测验行为的近似型 效标本身的可靠性 效标行为和测验分数之间是否呈线性关系(皮尔逊相关引起)测量的信度 信度不高的测验 不可能有高效度提高效度方法精心编制测验量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理学 考研 测量 知识点 整理
限制150内