教育教学测量与评价.doc
《教育教学测量与评价.doc》由会员分享,可在线阅读,更多相关《教育教学测量与评价.doc(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-/第一章、 教育测量与评价的学科发展教育测量与评价一.教育测量1、测量:根据法则给事物赋予数量。(史蒂文斯)测量:客观事物及其属性;所依据的规则或方法;数量化的结果。2、教育测量:广义:对于教育领域内的事物或现象,根据一定的客观标准,作缜密地考核,并依据一定的规则将考核的结果予以数量的描述。狭义:是指对学生某些学科经过学习和训练之后,所获得的知识、技能的测量。又称成就测量、学业成绩测量或学科测量。3、教育测量的特点: 1.间接性和推断性 2.测量对象的模糊性和测量误差的不可避免性 3.量表具有多样性,结果具有相对抽象性 4.测量目的的针对性二.教育评价评价:评:评定; 价:价值教育价值教育评
2、价:注重效果:美国的泰勒; 注重资料的获得:美国的克龙巴赫、斯塔弗尔比姆;注重评价方法、手段:中国的张秀理、日本的长谷川容1、教育评价的概念:教育评价是评价者对教育活动或行为主客体价值关系、价值实现过程、结果及其意义的一种认识活动过程,其核心内容是揭示教育活动或行为中的客体对主体的需要、目标的价值意义。 三.教育测量与评价的关系 联系: 教育测量就是指根据一定的理论、规则,运用一定的测量工具对教育现象进行数量化描述的过程 教育评价是对教育现象状态和价值的判断,这一判断是以对评价对象的客观描述为前提的,没有对评价对象的客观描述,就不会有对评价对象价值的客观判断 教育测量是教育评价的基础,教育评价
3、要在教育测量所获得的客观信息的基础上进行.同时,教育测量的结果要通过评价才能获得实际意义 教育测量与评价的区别: 第一,测量是对事物数量特征的获得。而教育评价则是对教育现象客体的价值进行判断 。 第二,教育测量是一种纯客观的过程,其突出特点是客观性。而教育评价则具有两种属性,即客观性和主观性 第三,测量的任务是对事物的量的认识 ,而评价作为一种认识活动,是人的意识对实践活动及其结果的综合反映,它反映的是活动的过程和终点,又是新的实践活动的起点。 教育测量与评价的产生与发展过程:一.教育测量的产生1904年以前(教育测量的萌芽期)中国的科举制(隋炀帝大业二年,公元606年)科举制的特征:逐级考核
4、、制度完备、考场严格、命题规范科举制的考核方法:口试、贴经、墨义、策间、诗赋 产生在中国、发展在西方美国贺拉斯曼 1845年将“笔试”引入美国英国费舍在1864年作业量表集美国赖斯在1897年的拼字实验19041915年教育测量的开拓期: 美国桑代克的巨著精神与社会测量导论问世。标志着以科学理论为指导的教育测量理论的诞生。 桑代克在这本巨著中提出:无论什么东西,只要存在,总存在于数量之中 麦克尔提出:任何东西,存在于数量中的,都可以被测量 这就是后来人们说的“凡存在的东西必有数量;凡有数量的东西都可以测量” 这两句话,看成是构成一切测验和量化评价的公理。 1909年,桑代克根据“等距原理”发明
5、了编制量表的单位,编制了标准化的测验量表。1915-1930年教育测量的兴盛期: 在桑代克的影响下,教育测量的运动轰轰烈烈的开展 测验品种有算术测验、书法测验、学科测验、智力测验、个性测验、兴趣测验等,在数量上已有3000多种 标准化测验的问世1930-1940年教育测量的批判期:对教育测量批判的原因: 教育测量虽然能使教育成就定量化、客观化、标准化;但毕竟不能测量出人的学力和人格的全部内容。 第一次大战以后,人们的教育观点发生了很大的变化,不在将教育看成是单纯的传授知识,而是将人的全面发展作为教育目标。而人的全面的重要因素如:社会道德、人的情绪态度、动机 兴趣、鉴赏力等是不能光靠测量的。教育
6、测量存在的弊端: 为测量而测量,盲目追求量化,忽视教育服务对象的整体目标与价值。 教育测量的理论基础只有心理学、统计学和测量学,而没有教育学原理。二.教育评价的产生1、教育评价产生的社会背景: 19291933年席卷美国、波及全球的经济大萧条 社会与教育危机四起 生产过剩、工厂倒闭、工人下岗 学校因经济不景气,部分学校关闭,有些学校的班级减少。 整个社会和教育皆处于反省之中 1930年美国有25%的失业,青年近乎100%找不到工作,1910年1417岁的青年17%上大学,而到1930年上升到51%。 有相当一部分人上高中并不想上大学,而当时的美国高中设课就是为了上大学服务的,为此中学设课与失业
7、青年的需求就产生了尖锐的矛盾2、教育评价的起源:美国进步主义联盟负责人艾钦于19331940年领导了中学课程改革实验研究,其中课程评价委员会由俄亥俄州的州立大学教授泰勒主持,这就是美国教育历史上著名的“八年研究”,也是教育评价问世的开始。八年研究的内容: 泰勒教授选了30所参加实验的高中学生,对这些学生进行了4年中学、4年大学学习的追踪研究,历时“八年”,这也是“八年”研究的由来。 当时选进步学校和和传统学校学生各1475人,按性别、年龄、种族、学业能力倾向、家庭、社会环境、职业兴趣和嗜好等基本原则进行一一配对,进行比较。评价是八年研究的有机组成部分,泰勒认为课程计划和编制必须回答以下四个基本
8、问题 1、应帮助学生达到什么目标? 2、为达到目标应帮助学生学习那些预期的知识? 3、怎样组织学习过程才能使学生的学习成效最大? 4、怎样评价教学方案结果发现: 来自实验的学生在大学四年中,每年获学术性荣誉略多; 具有更强的理智、好奇心和学习动机; 思维更精密、更系统、更客观; 对教育的意义有更清晰的看法; 对新情况有更强的应变能力; 具有更有效的解决问题的办法; 更多的参加有组织的学习团体; 获得非学术的荣誉更多些; 对职业的选择有更好的定向; 更积极的关注全国和全世界的事物。新旧课程比较结论: 前三项经统计检验均存在显著性差异 记忆活动传统的高于进步学校,但经统计检验两者没有显著性差异教育
9、评价的问世: 八年研究后泰勒等人的研究结论是:旧课程及其教育测验是教科书主义,测验内容只是要求学生记诵教材中的知识,是片面的,不能反映学生的全面发展。 泰勒提出:以全面发展的教育目标为核心和依据的两条相互依存的原理,即课程编制原理和评价活动原理,也就是泰勒原理教育评价的创始人泰勒: 在八年工作报告中第一次提出教育评价 这个报告被称为“划时代的教育评价宣言” 宣布了教育评价的诞生 给出了教育评价的原理、方法和手段 奠定了泰勒-教育评价之父的地位 同时也迎来了美国教育史上“泰勒时期的到来”3、评价的发展:19401957年教育评价的平稳期:特点: 教育评价的理论在不断的进行深入研究 布鲁姆完成教育
10、目标分类学 教育评价活动没有普及 这与当时美国的历史背景有关,二战后,美国处于“筹划与享受生活的时代”。 社会对教育的发展很少提出新的要求。19571972批判泰勒模式时期:特点: 1957年前苏联的人造卫星上天 引发美国对教育的不满 开始批判泰勒教育模式1972-现在 专业化时期特点: 高等学校出现了许多教育评价的硕士、博士、博士后专业点 各类教育评价研究中心纷纷建立 如:美国有西密执安大学评价中心、洛杉矶加里福尼亚大学研究中心等 教育评价专著、杂志大量出版 如:评价研究评价评论评价信息等4、教育测量与评价的发展趋势及特点 教育测量的政治性得到强化 教育测量的重心发生了变化 教育测量的理论得
11、到飞跃发展 计算机技术的发展提高了测验的效率 测验的统计模型为教育测量学科发展提供强有力的理论支持 更加重视测量结果的解释教育测量内容的发展: 评价方法由注重相对评价转向重视绝对评价 重视教育目标研究 教育评价研究中不断引入新的研究方法 越来越重视发展性教育评价理念和被评价者的参与 越来越重视元评价 越来越重视对评价结果的全面解释和慎重处理第二章、教育测量与评价的基本原理教育评价与测量的类型一、教育评价的分类1、根据评价对象的层次和内容来划分:宏观评价: 指对影响到全社会的那些指导、规范教育活动的各种因素进行的评价。 微观评价:指对某项具体的教育活动过程,对实施、管理教育活动的组织与个人对教育
12、活动指向的具体对象等内容进行的评价2、按评价内容的复合程度来划分:单项评价:指针对教育评价对象某一方面状况进行的评价。综合评价:指对评价对象状况的方方面面作整体评价。3、按评价的功能及用途来划分:诊断性评价:为使教育活动的形式、内容、过程等更适合活动对象的自身条件及需要而进行的评价。如:摸底考试。形成性评价:在教育活动过程中为不断了解活动进行的状况以便能及时对活动进行调整,进而提高活动质量进行的评价。如:单元测验。 终结性评价:指对教育活动的效果进行的评价。如:期末考试4、按评价参照的标准来划分:相对评价:根据评价对象的实际状况设定评价标准。评价标准在被评对象群体内部产生。绝对评价:依据某种需
13、要或要求设定评价标准。评价标准在被评对象群体外部产生,且标准固定。 个体内差异评价:以评价对象某一状况作为设定评价标准依据的评价。 5、按评价主体来划分:他人评价:由活动实施者以外的人作为评价主体进行的评价。 自我评价:由活动实施者作为评价主体进行的评价。 6、按评价方法来划分:定性评价:采用开放的形式来获取评价信息、对评价结果的性质进行说明的评价活动。 定量评价:采用结构式的方法,预先设定操作化的评价内容,收集评价对象可以量化的信息,得出数量化结果的评价活动。 二、教育测量的分类1、根据测验目标来划分成就测验:目标在于测量学生在各学习阶段学到了什么,旨在检测教育目标希望学生能达到的具体行为。
14、 如:学科测验如:教学阶段测验(诊断和总结性测验)能力测验:旨在测量个体的不因外界环境影响而轻易改变的、较稳定的、表现在认知能力方面的心理特质.比如观察力、记忆力、理解力、概括力、空间能力、判断推理能力等等。也被称为“智力测验”。 能力倾向测验:目的在于测量学生的潜在学习能力及学术发展趋向。潜在能力是指个体从未来教育或训练中可能受益的能力。这类测验主要用于预测学生的未来成就和能力,从而可以帮助决策者和学生自己选择合适的学校、专业及最佳职业。能力倾向测验分为:一般学习能力测验、特殊能力倾向测验。2、 根据测验分数的解释标准来划分常模参照测验:目的在于考查被试的个体差异,一般用于衡量被试相对水平的
15、,以选拔为目的的大规模测验 。标准参照测验:目的在于考查被试是否已达到某种标准。一般用于以教学目标为标准考查学生实际水平的测验。常模团体n 总体要明确n 常模团体必须是被试总体的一个代表性样本 n 样本的大小要适当n 注意常模团体的更新n 测验手册中必须详尽描述取样过程常模参照测验与标准参照测验的比较:1、从考试的目的和用途来看,它们都通过测量学生的学习成绩,考查其优劣,但常模参照性测验将考生成绩做横向比较,着眼于个别差异,主要用于选拔性测验和总结性测验等。2、从考核目标的陈述来看,都明确具体,为编制测验提供依据,但常模参照性测验可采用一般目标或具体目标,而标准参照性测验必须采取非常具体且详细
16、的目标。 3、 从题型的选择和题目的分配来看,都需采用各种不同题型,试题必须是教学目标的有代表性的样本;常模参照性测验多采用选择题,题目分散在全学科的全部知识领域内,题目按从易到难的顺序排列;标准参照性测验较少依赖选择题,题目分别分布在一定目标中,题目按教学目标顺序排列即可。 4、从考试及考题的质量要求来看,它们都按照标准化考试的编制原则,保证考试有较高的信度和效度;常模参照测验题目要求难易适中,强调题目的鉴别力,测验信度的估计适合用统计方法;标准参照测验的题目和学习结果直接联系,不强调题目的鉴别力,测验信度的估计不适合用统计方法。 5、从解释考试结果的依据及分数的意义来看,两种考试各有其依据
17、;常模参照性测验的常模是解释分数的标准,用地位量数表示考生在团体中的相对位置;标准参照性测验中教学目标是解释分数的标准,以考生完成题目数量的百分比来表示考生的学习效果。 3、根据教育测量的标准化程度来划分:标准化测验:指测验的编制、实施、记分、分数的解释有统一标准和严格规定的大规模的测验标准化测验的程序:确定考试目的;编制考试蓝图(命题双向细目表);命题、组卷、试测、入库;实测;评分,统计分析;写出指导书。教师自编测验:教师根据教学情况自己编制测题对学生进行的测验。 4、以测量人数多少来划分:n 团体测验n 个人测验 5、根据所使用的材料和形式来划分:n 语言文字测验n 非语言文字测验 教育测
18、量与评价量表 心理学家史蒂文斯根据测量的精确程度把量表从低级到高级分成名称量表、顺序量表、等距量表和比率量表。 名称量表:n 意义:依照某种法则给事物及属性指派名称或类别的量表。 n 功能:区分性。n 数量化结果的含义:不能比较大小。n 适用的统计方法:次数的统计,如次数、众数、百分比、离散相关、卡方检验等。顺序量表:n 含义:依照某种法则给事物或人的心理现象指派名称或类别,还可以将分类结果按数量大小进行排序。n 功能:区分性、顺序性n 数量化结果的含义:比较大小,不能进行运算。n 适用的统计方法:中位数、百分位数、等级相关系数、肯德尔和谐系数以及秩次的方差分析。 等距量表(区间量表 ):n
19、含义:在给事物及属性指派数字和符号时,要求各数字或等级之间的差距是相同的,即具有相等的单位 。 n 功能:区分性、顺序性、等距性n 数量化结果的含义:不仅能分类、排序,还可以进行加减运算。n 适用的统计方法:均数、标准差、相关系数,t、F检验等 比率量表:n 含义:有相等单位和绝对零点的量表。n 功能:区分性、顺序性、等距性、绝对零点。n 数量化结果的含义:可以进行加减乘除四则运算。n 适用的统计方法:均数、几何平均数、标准差、相关系数,变异系数、t、F检验等。教育测量与评价的基本原则1、 教育测量与评价原则的性质 (1)教育测量与评价原则是在教育测量与评价实践活动中总结出来的具有普遍性问题基
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育 教学 测量 丈量 评价
限制150内