欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    心理学考研测量心理学知识点整理.doc

    • 资源ID:18806546       资源大小:93.50KB        全文页数:14页
    • 资源格式: DOC        下载积分:8金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要8金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    心理学考研测量心理学知识点整理.doc

    测量测量就是依据一定的法则使用量具对事物的特征进行定量描述的过程一定法则 是建立在科学规则和科学原理基础上 并通过科学的方法和程序完成测量的过程事物特征 是所要测量的事物的特定属性 根据性质可根伟 确定型 随机型 模糊型量具 是测量的工具定量描述 是任何测量的结果 总是对事物特征的量的确定 区分性 序列性 等距性 可加性测量精度影响因素测量对象本身性质 确定型 事物量保持恒定不变 随机型 事物量随机改变 模糊型 对象本身不确定测量工具的精密性 测量的基本要素参照点 绝对参照点 以绝对零点为测量的起点 零点的意义为无 什么都测不到 相对零点 只能加减 不能乘除单位 理想单位具备两个条件 要有确定的意义 同一单位所有理解相同 要有相等的价值 测量量表命名量表 是最低水平量表 只用数字来表示事物或进行分类 适用统计方法 百分比 次数 众数 卡方顺序量表 次低量表 给个体赋值 数字代表 等级 大小 程度的顺序 没有相等单位 没有绝对零点 适用统计 中位数 百分比 百分位数 等级相关系数 肯德尔和谐系数等距量表 较高水平量表 等距量表的数字具有真正的数量 给个体赋值 数值间的差反映个体心理在特征上的差异程度 没有绝对零点 能够进行加减运算 适合统计方法 平均数 标准差 积差相关 t检验F检验比率量表 最高水平量表 个体间数值反映个体心理在特性上的比率 有绝对零点 适合统计 几何平均数 变异系数心理测量的定义依据一定的心理学理论 使用一定的操作程序 给人的行为和心理属性确定出一种数量化的价值心理测量与一般测量的比较心理测量依据的法则很大程度上只是一种理论 通过理论来编制测量工具并完成测量工作 不如物理测量准确心理测量对象是人的心理特质和成就 特质含义模糊 不大容易给予界定 其具有内隐性 需要通过行为推断心理测量量具由有关专家编制 长期形成 标准化测验 心理测量目标虽然是对人心理特质和教育成就进行定量分析单精度较差 编制技术水平并不高心理测验的定义是对行为样本的客观的和标准化的测量行为样本 从总体行为中抽取出来 能反应个体特定心理特质的一组行为 可以依据对这一组行为测量结果推断其心理特质 样本需要有较好的代表性 样本的代表性制约 测量的质量 并且要了解 全部行为样本的意义 心理测量的目标是 通过测量 来预测被试以后将会出现的行为标准化 指测验编制 实施 计分 以及测量分数解释程序的一致性 标准化需要具备 测验内容标准化 所有接受测量的个人实施相同的或等值的测验内容 施测条件标准化 所有接受测量个人必须在相同施测条件下接受测验 情境 指导语 时限评分规则标准化 测验制定评分标准 最大化 使不同人的评分一致测验常模标准化 个体分数需要与他人比较才有意义 常模即给解释分数一个可比较参照点难度或应答率 难度太低或太高 不能有效将不同水平个体区分信度和效度 信度是指一个测验的可靠性 即多测用同一测验测量统一团体所得分数的一致性 效度 是测量有效性 一个测验多大程度上能够测量到它所要测量的心理特质分类按对象属性和特质不同分认知测验 包括能力测验 智力测验(斯比量表 威克斯勒智力量表 瑞文推理) 成就测验人格测验 指测量个人注入兴趣动机等(16PF 艾森克人格问卷 罗下墨迹 主题统觉)按测量方式分个体测验 主试在同一时间内只能测量一个被试 斯比 威克斯勒 罗下墨迹 主题统觉 优点 主试对被试的观察更细致 有机会获得测量分数之外的信息 主试和被试的面对面交流更多 容易和被试建立融洽合作关系 一些特殊被试只能选择个体测验 缺点 费时间 难以在短时间内收集大量测量资料 测验手续比较复杂 需要经过较高水平训练的人担任主试团体测验 同一主试在同一时间内 能够测量许多被试 瑞文 陆军甲乙团体智力 优点 短时间内可以大量获得信息 节省时间 在教育 选拔 团体比较中广泛使用 缺点 不易有效控制被试的行为 容易产生测量误差 按照测试内容不同文字测验 测验内容通过文字形式表现 容易受被试文化影响非文字测验 通过图形 仪器 工具 实物 模型等形式表现 常限于个别测量按测验目的分 描述测验 诊断测验 预示性测验按测验难度和时限分 难度测验 和速度测验按测验 的要求分 最高行为测验和典型行为测验按计分方式分 客观测验 和非客观测验心理测验理论研究功能收集研究资料 通过测验获得第一手自老 作为实证资料做出科学结论建立和检验理论假设 根据已有研究 进行理论假设 再论证实验分组 可以和实验结合起来运用于研究工作实用功能 选拔人才 人员安置 心理诊断 描述评价经典测量理论经典测量理论模型心理特质的含义心理特质是表现一个人身上所特有的相对稳定的行为方式含义 特质是一组具有内部相关的行为概括 具有一定抽象性 (让座 友好待人 热情助人) 特质是一种一般神经心理系统 可以综合不同刺激 使人对这些刺激做出相同反映(对老弱病残都能让座) 特质是一个人身上比较稳定的特点 一个人的精神面貌是有多种特质分多个层次有机组合而成 心理测量任务就是 区别出不同个体在能力 个性等特质上的差异 特质可以决定一个人对特定刺激的反应倾向 可以对人的行为做预期可测性假设 凡是事物都是有数量的 凡是有数量的都是可以观测的真分数的含义 被试某种心理特质的真正水平的那个值称作该特质的真分数 把实测的称为观察分数由于误差的存在 真分数很难得到 只能通过改进工具 完善操作 使观测分数不断接近真分数X=T+ECTT数学模型的三个假设公理若一个人的某种心理特质可以用平行测验反复测量足够多次其观察分数的平均数 会接近真分数真分数和误差分数之间相关为0各平行测量上的误差分数之间相关为0结论在问题范围内 某心理特质水平的真分数坚定不会变 测量任务就是估计这个真分数的大小观察分数被假定等于真分数与误差之和 即观察分数和真分数之间是线性关系测量误差是随机误差 并服从均值为0的正态分布一般情况下计算真分数不是通过对一个个体施测多个平行测试 而是对多个同质个体进行同一测验的测量当团体人数足够大的时候就会出现各误差相互抵消推导公式P44戴 虽然GG的有 但是我不想COPY过来 大家自己再好好看看自己过一遍手记忆深刻经典测量理论的评价1信度估计精度不高 根据真分数理论假设 测验原始分数X线性分解为测验真分数T和误差分数E两部分误差分数 原始分数 真分数相互独立 假设本身就不可靠 并且定义测验信度不能提高信度估计 严格的平行测验很难获得等都导致 信度估计不高2误差指标笼统单一 不精细 导出标准误 是所有被试测量误差的标准差 相同测验对不同测验的误差是不同的3各种参数的估计对样本的依赖性太大 编制高质量测验 离不开四度 对不同被试的得分影响大 并受制与随机抽样的理想状态 4参数指标之间的配套性较差 通过现有指标 不能找到验证某试题是否恰好匹配其被试的计量方法 测量信度 测量结果的稳定性程度 对测量一致性程度的估计 也叫测量的可靠性 P46戴定义1 被测团体的真分数的变异数与实得分数的变异数之比 公式定义2 被测团体的真分数与实得分数的相关系数的平方 公式定义3 信度是一个测验X与它的任意一个平行测验X的相关系数 定义12具有理论意义 3具有实际意义原因在于 通常我们是为了测查一批人 而不是反复测量一个人的 (怎么理解?)公式信度的作用 信度是测量过程中所存在随机误差大小的反映 P47戴 信度可以解释个人测验分数的意义 标准误是一次测量中误差大小的客观指标 标准误 对于同一团体两次施测之差的分布的标准差 信度的标准误公式 信度可以帮助进行不同测验分数的比较 通过采用差异的标准误进行差异显著性检验 S为相同尺度的标准分数的标准差 差异显著性检验公式 信度有多种计算方式 只是对测量分数的一致性估计并不指出原因 获得较高信度只是测验有效性的必要条件测量结果是以一个点为中心SE倍数为半径上下波动的范围信度系数的估计 (只是用常模参照测验)学绩0.9 人格0.8 教师自编学绩0.6重测信度 是指用一个量表同时对一组被试施测两次所得结果的一致性程度 为两次成绩的皮尔逊相关公式 重测信度值大说明两次结果比较一致 被试的心理特质不易受环境和状态影响 时间跨度稳定性好误差来源 所测特性本身就不稳定 成熟知识的发展并非人人等量增长 练习因素 和记忆因素 及偶发因素使用前提 所测量心理特质必须稳定的 练习和遗忘的效果基本上相互抵消 两次施测间无更多学习几点说明 重测信度一般用于反映随机变量因素导致的变化而不是行为的长期变化 适用人格测验 速度测验复本信度 两个平行测验测量同一批被试所得结果的一致性程度 其结果等于两次结果皮尔逊积差相关的数 如果两次施测是同时 称为等值性系数 反映了题目所带来的差异 如果有时间间距则称为稳定-等值系数 是最严格的检验误差来源 非平行测验的两个复本间差异 被试的情绪波动 动机变化 测验情景的变化使用前提 要构造两份或两份以上真正平行测验 被试要有条件接受两个 测验分半信度 将一个测验分为两半后 所有被试在这两半上所得分数的一致性程度制作分半的办法 奇偶法 随机安置法使用前提 在只能施测一次或没有副本的情况下使用 如果无法对等分半就不宜使用几点说明 有牵连的题目要放在同一半或则会高估信度 存在任意题或速度测验不易用半分法 如果测验有多个分量表 应在分量表内排好顺序 在把分量表两半组合起来求相关斯皮尔曼-布朗公式 适用两分半测验等价时不等价时用费拉南根 或 卢龙公式同质性信度 也叫内部一致性系数 指测验内部所有题目间的一致性信度 当具备较高同质性信度说明测验主要测的是某一个心理特质 如果不高测验结果是几种心理特质综合反映测量单一特性是同质性高的必要而不充分条件计算同质性信度的四种方法 库得-李查逊20 21 卡隆巴赫 荷伊特 评分者信度 多个评分者给同一批人的答卷进行评分的一致性程度 当评分者为2时计算为 同一被试所有分数的相关系数 当大于2时用肯德尔和谐系数当评分者为3-20 被评分者N=3-7 可以查W表 W值高则信度高 当N大于7可以计算卡方指公式信度的影响因素被试方面 个体身心健康 应试动机 注意力 耐力 求胜心 同质性低 分数高 可能高估信度值主试方面 施测者不按照规定施测 给被试暗示 指导语不当 主试的期望和情绪影响 评分者的标准施测情境 会对测验构成影响 光线 空间狭窄等测量工具 在测验长度上 测验越长 测验的信度越高 在难度上 过难或太容易都会降低信度 取样不当也会影响信度两次测量间隔时间 时间间隔越长信度越低提高信度的方法1适当增加测验中与原题目具有较好同质性的题目 增加测验长度 长度要适度2是测验中所有试题的难度接近正态分布 并控制在中等水平 这样的分的分布更广3努力提高题目区分度4选取恰当被试团体 提高测验在各同质性较强的亚团体上的信度 注意被试的个人信息5主试严格执行施测规则 评分严格按照评分准则 施测场地按要求布置 减少无关干扰测量效度 指一个测验或量表实际能测出其所要测的心理特质的程度,效度是总变异中由所测量的特性造成的变异所占的百分比注意 效度是一个相对概念 心理测量的效度只有程度上的差别效度相对一定目的而言 心理测量的特质具有隐蔽性需要通过行为表现推测 而不是百分百准确的 不能为0 效度是测量的随机误差和系统误差的综合反映 只要出现测量误差 效度必受影响 判断一个测量是否有效要从多方面收集证据测量理论中 效度指 与测量有关的真实变异与总变异的比效度的估计内容效度 测验题目对有关内容或行为取样的适当程度 一个测验实际测到的内容与所要测量的内容之间的吻合程度注意条件 要有定义完好的内容范围 测验题目应是所界定的内容范围的代表性取样 主要采用逻辑分析法 即专家根据自己的知识经验对量表的有效性做出判断主要步骤 确定测验内容的总体范围 确定 每个题目所测内容 比较自己分类和测验编制者的分类 编制评定量表 从所测验内容所测的技能 题目对所定义范围覆盖率各种题目数目和分数的比例以及题目形式的适当性做出评价内容效度 主要应用成就测验 和某些选拔 分类的职业测验 不适用 能力倾向测验和人格测验 主要问题在于缺乏理想的数量指标是它最突出的问题 贝隆巴赫指出 被试后测成绩显著由于前测成绩说明 内容有较高内容效度结构效度 适用所要测量的理论结构或特质的程度 或者说所测验分数能够说明心理学理论的某种结构或者特质的程度 所谓某种结构或特质是心理学理论抽象而假设性概念主要特点 结构效度的大小取决于事先假设的心理特质理论 具有不同理论构思的测验其结构效度无法进行比较 结构效度有时难以获得 当实际测量资料无法证实假设理论的时候 不一定确定结构效度低 可能假设错误 结构效度没有单一指标 需要由各方面证据累积起来进行评价确定方法 步骤 提出理论假设 并分解成一些细小纲目 依据理论构架推演有关测验成绩假设 用逻辑和实证 检验假设测验内方法 主要包括内容效度 被试解答测题时的反应过程和测验的同质性测验间方法 相容效度法 计算新的测验与测量同一特质的已知效度较高的原有测验的相关系数 区分效度法 如果两个测验测量的是不同特质 使用相同方法进行测量他们之间的相关也应该很低 因素分析法 通过因素分析找出影响测验的共同效度测验分数总变异来自有关因素的比例是其指标 考察效标关联效度 根据效度把人分为两类 考察其得分差异 依据测验得分把人分为高分组和低分组 考察这两组在所测特质方面是否有差异多种特质-多种矩阵法 若用多种极不相同的方法测量同一特质相关很高效标关联效度 常用于 学业成就 等级评定 临床诊断 专门训练 实际工作表现 团体能力区分一个测验对处于特定情境中的个体的行为进行估计的有效性 又叫实证效度效标 被估计的行为是检验测验效度的外在标准简称效标 也是独立于测验并可以从实践中直接获得的我们感兴趣的行为根据时间分类 可以分为同时效度 测验分数和效标资料是同时收集 预测效度 先获得测验分数 隔一段时间再收集效标资料常用效标 学业成就 临床诊断 实际工作表现 特殊训练成绩 不同团体的总体表现 先前有效的测验 等级评定测量要求 有效性 效标测量能真正反映观念效标 代表理论上测验有效性的主要方面 可靠性 效标测验应具有较高的信度 客观性 效标测量必须能真正反应观念效标 避免效标污染 评定者知道被试分数而影响对效标的评定 实用性 优秀的效标测验应该方法简单经济实用效标估计方法 相关法 计算测验分数与效标测量之间的相关系数 区分法 根据效标测验的成绩区分被试为两组 然后分析这两组被试原来接受测验的分数差异若差异显著说明测验有较高的效标 命中率 当测验做取舍决策时 正命中率和总命中率是较好的效标 功利率 测验所需费用和得到收益进行比较效度影响因素测验构成 测验中词汇和举行不能过于困难 题目表达要清楚 测题不能给出额外线索 测题编制要合理 测验正确答案不能有明显组型 测试题目难度适当 测题数目适当 题目长度增加可以提高信度 正相关测验实施过程 遵从指导语 控制计分差错测验被试 被试的动机 情绪 态度 对于团体如果缺乏必要同质性 可能导致下降所选效标的性质 效标与测验行为的近似型 效标本身的可靠性 效标行为和测验分数之间是否呈线性关系(皮尔逊相关引起)测量的信度 信度不高的测验 不可能有高效度提高效度方法精心编制测验量表 避免出现较大系统误差妥善组织测验 控制随机误差 减少随机误差 创设标准应试情境 让每个被试发挥正常水平 选好正确效标 定好恰当效标测量 正确使用有关公式信度和效度关系信度高是效度高的必要而不充分条件 一个测验效度高信度必然高 但信度高不一定效度高效度受到信度制约公式心理测量的误差测量误差 在测量过程中由那些目的无关变化因素引起的一种不准确或不一致的测量效应包括 测量误差由那些与测量目的无关变因所置 测量误差表现不准确或不一致心理测量误差分类 随机误差 与测量目的无关的 偶然因素引起而又不易控制的误差 使得多次测量结果不一致系统误差 由测量目的无关的变因引起 一种恒定而有规律的效应 稳定存在于每次测量中 (并不一定如此)系统误差只影响测量的准确性 随机误差影响稳定性和准确性测量误差的来源测量工具 测量偏差 测量工具信度不好 效度不好 都会影响测量对象 造成测量误差的主要原因受测者真正水平是否正常发挥 受测者的动机 状态和情绪 心理生理水平施测过程 施测的物理环境 主试的某些属性 计分环节出现干扰等测量误差估计假设如果一个人测量无数次则其误差之和为0 平均误差为0误差与真分数之间独立一个团体的平均真分数 等于该团体中所有被试实得分数的平均值 如果团体足够大则误差会相互抵消对于一个团体 实得分数 真分数 和测量误差之间的关系为 心理测验的项目分析 P72戴题目难度 测验项目的难易程度题目计算 二分计分项目通过率公式 高低分组27% 计算公式 非二分计分项目公式 非二分项目进行难度比较校正排除猜测答案的公式难度水平确定 取决于测验的目的和性质 对于选拔性测验 应该将难度控制在录取率 对于选择题 难度大于猜测概率 难度对测验的影响 1项目难度普遍较大的测验 分数分布为正偏态 小为负偏态 能力成就测验控制在0.5 正偏态适合筛选性测验2过难或过易的测验会使分数集中 题目的区分度 是否具有效度的指示器 取值在-1到+1区分度 指测验项目对被试心理品质水平差异的区分能力或鉴别能力 作为评价项目质量 筛选项目的主要指标依据区分度计算 项目鉴别法 高低分27%公式 N大于100可用50% 相关法 项目分数与效标或测验总分的相关作为项目区分度的指标 相关越高项目区分度越高 方差法 被试在某一项目上的得分越分散则试题鉴别能力越大区分相对性 不同计算方法区分值不同 一个测验的每一项目都要采取同一区分度指标 样本容量大小影响相关法区分度值的大小 一般样本容量越小 统计值越不可靠 分组标准影响鉴别力指数D 极端组划分不同 区分值不同 分组标准的同质性程度影响区分度的大小 被试团体越同质 个体水平越接近 区分度越小猜测问题与猜测率猜测校正公式 被选答案越少 被试得分越高于他们的真是水平 则难度的不能良好反映真是难度 公式 P86戴优点 可避免降低测验的信度 校正后的得分可以反映被试真正水平 比较公平 事前孤立学生答完全部选题 但总有人无法答完缺点 公式的基本假设不成立 只要被试能做完全部试题 猜测校正无实质作用 会出现负数题目的综合分析和筛选 区分度在0.3以上较好 难度保持0.5±0.15的正态分布如果是人格测验 态度测验 以及心理健康测验不要求难度过高 选项异常 正确答案无人选 题目高分组选择低于低分组 错误的选项高分组高于低分组 某个题目无人作答原始分数 被试接受测验后 根据测验计分标准 对照被试的反应所计算出的测验分数成为原始分数导出分数 在原始分上 按照一定规则 经过统计处理后获得的 具有一定参考点和单位可以相互比较的分数导出分数种类 见统计资料分数组合的一般种类 了解基本测验项目组成一个分测验或一个测验 有几个分测验的得分组成合成分数有几个测验的得分的组合 获得合成分数或合成预测分数合成的方法 临床诊断-直觉合成 具有较高综合性具有灵活针对性 容易受主观偏见影响 缺乏精确数量分析加权求和合成 测验间特质相互代偿有为连续分布 并基本同时获得 多重回归 多重划分常模团体 具有某种共同特质的人所组成的一个群体 或是该群体的一个样本 成就测验和能力倾向测验 常模团体应包括目前与潜在的竞争者 广泛能力与性格测验 通常包括具有同样年龄或教育水平的人确定常模团体的注意事项群体构成的界限必须明确 必须清楚说明所要测量的群体的性质和特征常模团体必须是所测群体的一个代表性样本 如果缺乏代表性则会使常模产生偏差取样过程必须明确且有详尽描述 防止测验中产生偏差样本大小要适当 根据总体选择 团体人数 若群体性质单一 则样本数不必大 测验结果的精确度和样本容量正相关常模团体必须是近时的 常模属于历史 而人是随实践变化的注意一般常模与特殊常模的结合主要常模参照分数心理年龄 被试在标准化题目中所得原始分与常模年龄比较 年龄量表基本假设 是 所测量的特质随年龄做有系统的改变基本要素 一组可区分不同年龄的题目 一个常模团体 各个年龄具有代表性的样本 常模表年级当量 被试测验成绩与某一年级学生平均数比较 说成相当于某一年级水平 单位为10个月缺点 教育内容每个年级不同 年级当量解释比较困难 年级常模经常被误用为标准商数教育商数 教育年龄和实际年龄之比 教育年龄为儿童取得的平均教育成就 通过年级当量间接获得成就商数 一个学生的教育年龄比智龄 确定 智龄和学业成就只有中等相关 其次二者测验不可靠编制心理测验的基本程序确定测验目标明确测量对象 即明确测量那些团体和个人 明确测量目标 测量什么心理功能 并进一步具体化明确测量用途 用途不同编制材料的取材范围和难度也不同制定编题计划全面而具有代表性的测验内容 不致使测验偏离应侧范围对各个内容点相对重视程度用途 指明编辑那些方面的测验项目即数目 计分可按计划中百分比确定每类测验项目分数标准编辑测验项目收集测验资料 资料要丰富 资料要具有普遍性 资料要有趣味性选择项目形式 取决于受测者 年龄 人数 测量目的 测验项目性质 编写测验项目 测验项目的取样应当对欲测心理品质具有代表性 确保有效性 测验项目的取材范围要同编题计划所列项目范围一致 测验项目的难度应有一定分布范围 编写测验项目的用语力求精简明了 初编题目数量大于最终题数 便于筛选和编制副本 测验项目的说明必须简明预测与项目分析预测 获得被试对测验项目作何反应的资料注意 预测对象来自正是测验时被备选的群体 具有代表性 预测的情景力求同正式测验一样 测验的时限可以延长 便于做完题目 施测者应对受测者的反应加以记录 对完成数目 和题意不清的项目分析 对预测结果进行统计分析 确定项目难度和区分度 合成测验 经过预测以后证明有价值的项目排成有组织的测验 解决测验项目的选择问题和测验项目的编排问题测验项目选择 性质 难度 区分度测验项目编排 并列直进式 依此由易到难 混合螺旋式 根绝难度分为若干不同层次 做交叉式派力奥 难度渐次上升编制复本 增加实际效用 一种测验只有要有等值的两份条件 各份测验测量相同特质 内容形式相同 不应重复题目 测验数目相同测验标准化见第一页测验内容 施测过程 评分标准分数解释鉴定测验 测验编好必须对信度效度进行鉴定 以及测验量表和常模编写测验说明书测验目的作用 理论依据 测验方法 测验的标准答案和评分方法 关于测验信度 效度资料水明 常模表及解释测验分数的解释解释类型 描述个人心理特征状态 溯因解释及个人目前 预测解释及推测未来 评价的解释原则 充分了解测验性质和功能 对导致测验结果的原因解释应慎重 防止片面 必须充分估计测验常模和效度的局限性 解释分数应参考其他有关资料 对测验应以 “一段分数”来解释 而不是 特定数值如何告知测验分数意义 使用当事人理解的语言 保证当事人知道这个测验测量目的 以常模为参考 需要知道比较的常模团体 要使当事人知道分数只是估计 具有偏差 要考虑 测验分数给受测者的影响 测验结果保密 对低分者解释应小心 报告测验分数应设法了解当事人的心理感受 采取适当措施加以引导测验等值 通过考核同一种心理品质的多个测验形式做出测量分数系统的转化 进而使不同形式之间的测验可比测验等值分数系统转化与测验原始分数与导出分数转化之间区别目的不同 前者 为了比较不同测验形式之间实测分数 后者是为了把原始分转换到可以比较的相对分数系统中性质不同 前者 是两个或多个不同测验形式分数系统转化 后者是一个测验形式不同分数系统转化测验等值的条件同质性 被等值的不同测验形式必须是同一中心理品质 内容范围也一致等信度 不同测验 等值需要相等信度 公平性 考生参加被等值的不同测验形式中任一个测试 等值后结果一致可递推性 很重要。对成型 两个待等值的测验形式 XY 无论等值转换从哪出发 其对应关系相同样本不变性 测验XY的等值关系 与其本身有关 而与样本无关测验等值结果的表示方法列表法 对应排列成表公式法 y=Ax+B图示法 画图。测验等值的计算方法等百分位等值 线性等值 公式P143戴目标参照测验根据某一明确界定的内容范围 而缜密编制的测验 并 被试在所得测验结果 也是根据某一明确界定行为标准直接进行解释目标参照测验的项目分析内容范围的确定内容范围具有边界当其边界得到明确界定的时候 我们可以判定 什么行为属于这一内容范围每一种内容范围均可分为几类每一类内容及其再次内容范围内相对重要性确定以后 内容范围就有了明确的结构特定测验目的的确定常为内容范围的界定提供依据内容效度分析项目分析首先对构成测验的每一个题目是否适合以及有效进行分析 通常采用 专家评定法 根据中数判断质量测验的预测选取一定被试进行预测获取 数据 对项目难度 区分度进行量化分析前测-后测 已接受教学组-未接受教学组对照组 前两个方法 其假定有关教学活动的被试均掌握教学内容 未必成立选择一批被试 经专家评定一组为未接受 一组为接受 在进行控制组对照组 比较难度分析纯粹的目标参照测验一般注重 所测内容范围以及被试所测内容掌握程度 如果某项目为不可或缺 那么难度被忽视区分度分析难度差值 掌握组-未掌握组指数 通过预测可得到两组数据 掌握者和非掌握者 K=Pa-Pb 得数越接近1区分度越高个人获得指数 采取先后测 可获得在前测中错误回答某项目而在后测中能正确回答的人数比例 接近1为有效相关系数 区分度为正负1 为负应当予以修改或剔除 为正保留 接近1有效目标参照测验的信度与效度信度 分类一致性信度 分数解释对被试分类 对被试分类一致性的度量指标 似乎成为分类一致性信度 考察被试在同一测验的两次施测中或量复本中是否被分为一类 运用四格法 公式见P162戴优点 直观易懂 计算简单 缺点 是复本法 和再测法的缺点 见前文方差分析方法荷伊特信度从信度定义出发 利用方差分析方法 找出个体水平真正变异在总变异的水平 作为估计值荷伊特信度不随测验分数分界点而变化 因而更具有普遍性效度内容效度 两个条件 测量有明确界定内容范围 对测验每一题目的内容效度的分析(内容效度分析法)效标效度 在统计指标与常模参照测验不同 提出决策效度 掌握组及格人数比总人数加为掌握组不及格人数比例测验分数的解释目标参照测验 有明确界定的行为标准 即测验分界点 其实解释无法逃避的 或作为决策的依据专家判定法效标组预测法 对照组法 临界组法学绩测验的性质对个体在一个阶段的学习或训练之后知识技能的发展水平的测定 属最佳行为测验最佳行为测验 施测时要求被试调动所学一切知识、所具备的一切技术能力对所有习题给出最佳答案或最佳操作编写时需要注意测验能够诱发被试发挥出最高水平学绩测验对象 认知性心理品质 其优劣表现为 人之内容的多寡 认知能力的高低 学籍测验 是针对有计划的学习或训练之后的成绩测定而设计的学绩测验的作用鉴定学生的学业成绩 学生评价 升学 反思 教师的教学改进 人事管理 录用学绩测验的分类编制方法分 教师自编课堂测验和标准化学绩测验 测验内容分 单科测验 多科测验 单元测验 总测验测验用途分 考察性测验 诊断性测验 标准化学绩测验 在心理教育原理下 遵循一定程序所编制的各方面质量都达到规定标准的学籍测验斯坦福成就测验 综合性学绩考察测验 1923年 团体常模参照测验11个科目内容 词汇 阅读理解 拼字 听理解 词汇学习技能 语言 数学概念 数学计算 数学应用 社会科学知识和自然科学知识 配套测验 斯坦福早期学校成就测验 适用幼儿园和一年级学生 斯坦福学业技能测验 适用八到13岁学生导出分数 百分等级 标准九分数 年级当量 量表分数 正态曲线当量 各分测验信度均在0.8以上教师自编课堂测验特点测验形式灵活多变 测验目的完全一致测验内容与教材内容高度一致测验难度切合学生的实际水平测验编制简单快速 能力测验智力人们在获得知识和运用知识解决实际问题所必须具备的心理条件或特征关于智力 智力是学习的能力 智力是适应环境的能力 智力是抽象思维的能力 智力是信息加工的能力 比内西蒙量表1905年 世界第一个智力量表 处于对诊断异常儿童智力的需要1908年 第一个年龄量表 增加测验项目到59个 测验以年龄分组 以智力年龄评估个体智力1911年 增加适用范围 设置成人题目组斯坦福-比内量表1916年推孟 首次引入比率智商 以IQ作为个体智力水平的指标1937年 将量表适应性扩大到1.5-18岁 1960年 舍弃了比率智商 引入离差智商概念 平均是100 标差161972年 重新修订常模信度 大体在0.9以上 随机误差引起分数变异不足10效度 内容效度 斯比量表 包含多内容 效标关联效度在0.4到0.75中国比内 陆志伟吴天敏 51道题 每题代表4个月韦克斯勒量表W-B1第一个成人智力测验 主要测量10到60岁人WAIS-R 每个分测验独立计分 在转化为平均数10标准差3的标准分数 6语言量表 可得语言分量表 5操作分测验 得操作量表分 全部相加可得全量表分 平均分100标差15信度 背书和数字符号 是复本信度 其他为分半信度 效度 没有收集。中国修订版 1982 龚耀先语言量表 常识 理解 算术 类同 背数 词汇操作量表 数字符号 填图 积木图案 图片排列 拼图 WISC 韦氏儿童量表 降低了测验难度 添加了 迷津测验 背数 迷津为被选测验 适用6到16 每四个月为一个年龄组中国修订版1979年 林传鼎 张厚灿WPPIS 韦氏幼儿量变 1967 使用4到6.5岁 有 句子复述 动物房 几何图案 为新编团体智力测验陆军乙使用非文字测验瑞文推理 非文字图形测验 瑞文标准推理测验 使用5.5岁以上正常智力发展人 瑞文彩图推力测验 使用幼儿和智力底下成人 瑞文高级推力测验 理论假设来源于斯皮尔曼 智力一般因素理论 瑞文将G因素 划分为再生性能力 推断性能力中国版修订1985年 张厚灿认知能力测验1968-1972 桑代克等分为 初级性 适用小学低年级 图片材料 口头指导语 包好 口头 词汇 关系改变 多重智力和数量 文字测验 适用小4以上 有词汇 句子填充 词语分类 词语类推组成 数量测验 适用小4以上 数的大小比较 数列补充和建立关系 非文字测验 使用小4以上 图形分类 图形推理 和图形综合组成能力倾向测验目的在于预测未来 预测个体在将来的学习或工作中可能达到的成功程度 具体能力倾向测验 学术能力倾向测验SAT 分辨能力倾向测验DAT 一般能力倾向成套测验GATB特殊能力测验 西肖尔音乐才能测验 音乐能力测验图 梅尔美术判断力测验 格雷福斯图案判断测验 霍恩没事能力问卷 空间关系测验 机械理解能力测验创造力测验 吉尔福特发散思维测验 主要理论基础是吉尔福特智力结构理论 托伦斯创造性思维测验人格测量通过一定方法 对在人的行为中起稳定调节作用的心理特质和行为倾向进行定量分析 以便进一步预测个人未来行为人格测验信度 效度相对智力测验更低 注意人格测量的真实性问题提高真实性 插入说谎量表 或使用投射测验自陈量表即自我陈述 让被测者个人提供自己人格特征的报告 假设受测者了解自己人格特征特点 题量较大

    注意事项

    本文(心理学考研测量心理学知识点整理.doc)为本站会员(知****量)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开