Chapter5 效度.ppt
《Chapter5 效度.ppt》由会员分享,可在线阅读,更多相关《Chapter5 效度.ppt(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章 效 度孔 明苏州大学医学部12/12/20221信度:信度:测量的稳定性(弹着点的密集程测量的稳定性(弹着点的密集程度)度)效度:效度:测量是否有效(弹着点离靶心的测量是否有效(弹着点离靶心的距离)距离)12/12/20222本章要点 1.1.效度概念及其演变趋势 2.2.传统的三种效度类型:内容效度、效标关联效度、构想效度的概念及其评估方法 3.3.现代效度理论:单一效度4.4.影响测验效度的因素12/12/202231.效度概念及其演变趋势12/12/202241.1 什么是效度效度:是一个测验能够测量其所要测量的东西的程度(the extent or degree to whic
2、h the test measures what it was designed to measure)。或测验使用者的预定目的与实测结果相吻合的程度。这个测验测什么?测得有多准?12/12/20225效度的性质效度是针对测验结果的效度是针对某种特定的测验目的的尺子可以用来度量长度,但不能用来度量重量,即便每次度量的结果都完全一样。16PF16PF是用来测人格的,如果那来测智力的话,就缺乏效度。效度只有程度上的差异12/12/202261.2 效度的测量学定义真分数理论回顾:系统误差(包含在真分数中):Sv2:有关(有效)变异SI2 :无关变异(系统误差)效度的测量学定义:与测量目的有关的真实
3、变异(或有效变异)在总变异中的比例rxy=Sv2/Sx212/12/202271.3 效度与信度的关系?rxy=Sv2/Sx2 =(Sx2-SI2-SE2)/Sx2=1-SI2/Sx2-SE2/Sx2=rXX-SI2/Sx2SI2=0rxy=rxx信度是效度的必要而非充分条件信度:只考虑随机误差随机误差(random error)对测量的影响效度效度:同时受到随机误随机误差差和系统误差系统误差(systematic error)两方面的影响。12/12/20228例子:三个算术测验的比较Sv2SI2SE2SX2 Sv2Sv2SI2SI2SE2SE2Test 1Test 2Test 312/12
4、/202291.4 效度概念的演变趋势早期:测验成绩与效标的相关20世纪4、50年代:四类效度内容效度内容效度(content validity)、构想效度构想效度(construct validity)、预测效度预测效度(predictive validity)和同时效度同时效度(concurrent validity)1966教育与心理测验的标准和指南(美国心理学会、美国教育研究学美国心理学会、美国教育研究学会):效标关联(criterion-related or empirical)、构想、内容单一效度:测验结果的有效性12/12/2022102.传统的三种效度类型12/12/20221
5、1传统的效度的种类证明一个测验是有效的(validation),必须保证在以下三方面均是有效的:内容效度(content)效标关联或实证效度(criterion-related or empirical)构想或结构效度(construct)不能只独立地保证一方面。12/12/2022122.1.1 什么是内容效度内容效度(content validity):测验内容对测验目的的适合程度。基本前提:测验试题应为所欲测内容或行为范围之代表性样本(representative sample)。主要用于建构或评价成就测验或职业测验12/12/202213需要考虑的基本方面:测验内容范围:应能确切涵盖所
6、界定对象之范围测验题目的代表性:每个试题应与所界定内容或行为范围有适度相关;试题分配应能反映范围内各种变项或成分所应占的比重保证测验本身结构、要求受测者对试题做出反应的方式保证有一定的题量12/12/202214 2.1.2 内容效度的估计步骤评估内容效度的基本过程:(一)详细描述内容范围 课程内容、教育目标以及各类题目所占比例(二)明确每一个测验项目,即每一道题所测的内容范围(三)在内容范围和结构方面对测验项目与全测验作比较12/12/2022151、内容范围:10以内加减法运算 内容分类:A.运算类型 B.运算范围 1)加法 2)减法 运算结果10 各类的相对重要性2 2、分析每一测验题的
7、内容、结构。10加法40%10%0减法50%0 0 例:12/12/202216 2.1.3 内容效度的估计方法方法:专家评判 问题:缺乏数量化指标经验方法前测学习再测12/12/2022172.1.4 内容效度与表面效度表面效度(Face validity):表面看起来测验内容与测验目的的一致性程度。市井或通俗测验多有高的表面效度,但它不能保证测量的正确性。提高表面效度可以起到“包装”的作用对表面效度的要求最高水平测验:高;典型行为测验:低12/12/202218内容效度的适用成就测验标准参照测验不适用:能力倾向(aptitude)与人格为什么?12/12/2022192.2 效标关联效度(
8、Criterion-related validation)又称实证效度,指一个测验对处于特定情境中的个体的行为预测的准确性。即:测验结果与效标的关联程度(求相关)。效标(Criterion):希望做出推断的行为或被预测的行为,是检验测验有效性的标准。测验=预测源行为=效标效标关联效度是基于数据的(data based)一个选拔测验与工作绩效的相关一个成就测验与年级的相关一个诚实测验与偷窃的相关12/12/2022202.2.1 常见的效标学业成就:学科成绩,学历,获奖实际的工作表现产量、治愈率、违规次数特殊训练成绩培训临床诊断对团体的区分(人口统计学变量)年龄,种族,疾病类型其他现成的测验12
9、/12/2022212.2.2 效标的选择有效符合测验目的可靠高信度、误差小可行可以收集到客观避免“效标污染”12/12/202222效标污染效标污染效标污染(criterion contamination):一般指由于评定者知道其预测源分数而使效标“纯度”降低的情况(Anastasi,1988)预测源的知识评定偏差团体特征偏差好的效标应是适当的、可信的和无偏见的(Thorndike,1949)12/12/2022232.2.3 两种效标关联效度预测效度(predictive validity):预测未来他将来会患焦虑症吗?同时效度(concurrent validity):诊断现状他患有焦虑
10、症吗?二者的重要差别:进行测验(即预测源)与进行效标测量之间的时间不同时间=预测效度同一时间=同时效度12/12/202224做法不同理想的策略:预测效度理想的策略:预测效度学生参加高考,把所有的人都录取一段时间以后,将他们的平均学业成绩与高考分数求相关这个相关称为效度系数困境?实践上,伦理上实践中的选择:同时效度实践中的选择:同时效度已经上了大学的学生参加高考,同时收集他们的平均学业成绩计算高考分数与学业成绩的相关优势:可行性、易行性二者的差别表面上:时间长短实质上:对样本代表性的要求12/12/2022252.2.4 效标关联效度的估计方法1.相关法:计算测验分数与效标的相关系数。2.区分
11、法:根据效标上的成绩将被试分为好、坏两组,那么,这些组在预测分数上应该有显著差异。如果存在显著差异,说明测验的预测效度高。3.命中率:当使用测验进行决策时,决策的正命中率和总命中率可以作为效度的指标。12/12/202226总命中率命中人数/总人数正命中率=被录取的成功者/录取人数12/12/2022272.2.5 效标关联效度的实际应用问题1.统计的显著性 样本量对相关系数显著性的影响相关系数r样本量n.9973.7078.51415.32537.195102.098402相关显著性与样本量之间相关显著性与样本量之间的关系的关系(p .05 水平)12/12/2022282.估计的标准误估计
12、的标准误标准误(standard error,SE):使用测验分数预测效标分数时的误差大小的估计值:rxy:测验的效度系数 sy:效标成绩的标准差12/12/202229估计的标准误的应用:估计真正效标分的变化范围某能力倾向测验的效标的标准差是15,测验和效标的相关是0.50,那么从该测验估计等级水平的标准误是多少?如果某学生预测的效标得分是50,那么实际获得的效标分数有68的可能落在哪个区间范围内?12/12/2022303.效标关联效度在人事选拔中的应用:预期表(empirical expectancy table)12/12/2022314.测验的效用问题基础率(base rate):未
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Chapter5 效度
限制150内