《语言测试与成绩分析.pptx》由会员分享,可在线阅读,更多相关《语言测试与成绩分析.pptx(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一节 测试的性质和特点一、测试性质1.语言测试 对被试者的语言能力做出科学评定的一种测量。2.对外汉语测试基础语言学、对外汉语教学、心理测量学、教育测量学结合汉语特点设计的,以考查第一语言非汉语者汉语交际能力为核心、兼顾考查汉语知识的语言测试。第1页/共54页二、测试特点一般语言测试的特点:客观性、科学性、目的性对象的复杂性、内容特殊性、目的多样性 对外汉语测试的个性:1.针对性 2.规范性 3.系统性第2页/共54页二、测试特点1.针对性(1)体现汉语本身的特点A 汉语语音特点 听力试题B 汉语结构特点 语法试题 C 汉字特点 汉字试题(2)体现被测试者的特点第3页/共54页二、测试特点
2、2.规范性 3.系统性A 知识、技能B 具体的知识、技能C 某一级语言项目,限制在同级的语言要素范围内第4页/共54页BCT_读后选择学习需要、工作特点第5页/共54页BCT_写作第6页/共54页根据汉语的特点设置题目针对性第7页/共54页YCT(少儿汉语考试样卷一级听力)年龄特点第8页/共54页规范性第9页/共54页第一节 测试的性质和特点一、测试性质1.语言测试 对被试者的语言能力做出科学评定的一种测量。2.对外汉语测试基础语言学、对外汉语教学、心理测量学、教育测量学结合汉语特点设计的,以考查第一语言非汉语者汉语交际能力为核心、兼顾考查汉语知识的语言测试。第10页/共54页二、测试特点1.
3、针对性(1)体现汉语本身的特点A 汉语语音特点 听力试题B 汉语结构特点 语法试题 C 汉字特点 汉字试题(2)体现被测试者的特点第11页/共54页B 汉语结构特点 语法试题 考察虚词的用法 在每个句子下面都有一个指定词语,句中A、B、C、D是供选择的四个不同位置,请判断这一词语放在句中哪个位置上恰当。了 我已经A开始B做C饭D。考察语序第12页/共54页1.针对性(2)体现被测试者的特点起因对象的复杂性:国内与国外;成人与少儿;华裔与非华裔第13页/共54页二、测试特点 2.规范性 3.系统性A 知识、技能B 具体的知识、技能C 某一级语言项目,限制在同级的语言要素范围内第14页/共54页语
4、言测试作用(1)一般作用:评价学习者的学业成就和语言水平。评估教学的实际效果。为选拔人才提供依据。为改进教学中的问题提供反馈。(2)对于各种有关人的语言能力的假说,需要实证性数据的证实,语言测试在这方面可以为语言研究(语言教学研究)提供信息,发挥重要作用。(3)语言测试研究能够为第二语言习得研究提供更为可靠而有效的方法和手段。(4)推广母语教学,扩大母语影响。第15页/共54页语言测试基本类型一、从目的、用途的角度分:1、成绩测验 特点:教什么测什么,学什么测什么,怎么教怎么测。测试内容必须以教学大纲、教材、教学内容为依据。典型的成绩测验:期中、期末测验 分类:最后成绩测验;进步测验第16页/
5、共54页2、水平测验 特点:不以特定的教学大纲、教学课程或 教学方法为依据,只看被试的语言水平如何。目的:测试对目的语运用的熟练程度,选拔人才。难点:必须弄准什么叫“语言水平”、要求能够预测未来完成特定任务情况。第17页/共54页3 3、学能测验 目的:预测被试学习目的语的能力。难点:必须弄准什么是“能力倾向”,Carrol等人认为包括:语音能力、语法能力、综合归纳能力、语言记忆能力、语言表达能力等。4、诊断测验 特点:了解学生具体某一内容或短时间内存在的问题而进行的测试。目的:了解学习者对教学内容掌握情况,以便调整教学。不一定需要打分,非正式的测验。第18页/共54页依据依据所测能力所测能力
6、信息指向信息指向标准化程度标准化程度 规模规模水平测验水平测验语言理论一般语言水平将来?最高最大成绩测验成绩测验教学内容不一定过去可以较高可以很大倾向测验倾向测验认知理论学习潜能将来可以较高可以很大诊断测验诊断测验教学内容现有水平过去-将来低小各类测验的特点第19页/共54页二、从评分方法的不同分类:1、主观性测验 划分标准:根据评分时是否需要凭主观判断。形式:作文、口试、问答、简述、完成句子、完成会话、造句、翻译 优点:考查有深度和层次;命题容易;很难猜测 缺点:评分不易做到完全一致;评分费时费力第20页/共54页2、客观性测试 划分标准:根据评分时是否需要凭主观判断。形式:选择题、是非判断
7、题、配伍题(如连线)听写、填空是不是客观题 优点:题量大,内容覆盖面广;评分简单、客观;容易满足统计学的要求。缺点:不适合测试产出性语言技能和被试综合运用语言能力;可以猜题;编题费时费力。第21页/共54页三、分立式测验和综合式测验(测试命题方式)1、分立式测验特点:把语言分解成语音、语法、词汇等不同的语言点来测。形式:多项选择、是非判断等题型。优点:评分客观、准确;试题针对性强。2、综合性测验目的:了解被试综合运用语言知识的能力。形式:写作、口试、完形填空、听写、多项选择的阅读听力理解。优点:有效测量被试整体语言水平。第22页/共54页四、标准化测验非标准化测验(反映成绩的方式)1、Stan
8、dardized Tests 特点:一是具有统一的标准,二是对整个测试过程可能出现的误差都可严格监控(试题编制、测验实施、阅卷评分、分数转化解释四个标准化)缺点:忽视不同个体习得第二语言特点,客观性多项选择题能否测量真实语言水平受到怀疑,对语言教学产生误导。2、Non-standardized Tests:表现评价;真实评价第23页/共54页原HSK的题目设置考试内容考试内容试题数量试题数量试题比重试题比重答题时间答题时间听力理解听力理解5029.4%约35分钟语法结构语法结构3017.7%20分钟阅读理解阅读理解5029.4%60分钟综合填空综合填空4023.5%30分钟总计总计170约14
9、5分钟第24页/共54页第25页/共54页原HSK的等级第26页/共54页思 考反映成绩的方式看,HSK是什么测试?A 标准化测试B 常模参照性测试(非标准化测试)第27页/共54页测试的原则1.公平性与可行性相结合2.科学性与真实性相结合3.主观性与客观性相结合第28页/共54页测试的原则1.公平性与可行性相结合A 公平性:a 测试的组织和实施,保证应试条件的一致性b 测试成绩的评定,公正合理c 大型水平考试,保证内容多元化B 可行性:措施的可行性口语测试录音;机器阅卷答题卡、测试系统第29页/共54页测试的原则2.科学性与真实性相结合A 科学性:以考查语言交际能力为主,兼顾知识和各项技能全
10、面测试。B 真实性:语料来源于自然语料,但是经过一定加工后的干预语言。体现交际性、互动性、真实性。第30页/共54页第31页/共54页测试的原则3.主观性与客观性相结合A 宏观上,主客观题目都要有B 微观上,客观题目答案唯一性 客观题目的答案不能因被测者的主观因素(文化观念、生活习惯)而随意选择。第32页/共54页客观性原则了 我 A 吃 B 饭 C 去 D。据有关资料,全世界每年沙漠面积扩大5-7万平方公里,地球上森林面积已由19世纪的55亿公顷减少到现在的28亿公顷。日益严重的水污染和大气污染,更加重了人类居住环境的恶化。问:读这段文字使我们感到:A 气愤 B 不安 C兴奋 D 不在乎第3
11、3页/共54页语言测验开发过程一、设计阶段(1)明确测验目的:语言教育;选拔人才;改进教学(2)明确测验对象:背景:个人特征;知识结构;语言水平;对测验的熟悉程度 需求:求学;求职(3)确定测验内容:教学内容;非教学内容第34页/共54页(4)确定测验方式和卷面构成:题型;题量 汉语水平考试的题量和时间分布考试内容考试内容试题数量试题数量 试题比重试题比重答题时间答题时间听力理解听力理解5029.4%约35分钟语法结构语法结构3017.7%20分钟阅读理解阅读理解5029.4%60分钟综合填空综合填空4023.5%30分钟总计总计170约145分钟第35页/共54页(5)确定评分方式和分数体系
12、:主观题的评分标准和分值(模拟)分分数数整体评分标准整体评分标准分项评分标准分项评分标准词汇词汇语法语法主题主题结构结构4词汇丰富,语法正确,主题鲜明,结构完整词汇丰富,没有错别字无语法错误主题鲜明结构完整,衔接自然3词汇较丰富,语法基本正确,主题鲜明,结构较完整词汇较丰富,偶有错别字偶有语法错误主题鲜明结构较完整,有不连贯的地方2词汇不丰富,语法错误较多,主题不鲜明,结构不完整词汇不丰富,错别字较多语法错误较多主题不鲜明结构不完整第36页/共54页二、操作化阶段(1)编写测验说明和题目细则(2)训练命题员(3)聘请专家就有关问题向其咨询第37页/共54页三、施测阶段(1)预测:在测验正式进行
13、之前,让一组有代表性的被试试做 题目分析(难易度、区分度等),筛选正式题目(2)实测:把符合标准题目合成正式试卷,进行测试,报告分数 统计研究施测结果(信度、效度的定量定性分析)第38页/共54页 题目编写一、客观题的类型(一)多项选择题基本原则:1 1、只有一个正确答案(1)目前目前还没有发现这类问题。A.现在 B.最近 C.看来 D.在眼睛前面(2)我们两家住斜对门住斜对门,关系很好。A.隔壁 B.邻居 C.门有些斜 D.门靠门第39页/共54页2、只测一个语言要素 他们都认为,这是个好主意主意。A.意思 B.办法 C.态度 D.建设 A.东西 B.办法 C.消息 D.现象3、每一个选项在
14、语法上都应该是可替换的 不要再买点心了,再买妈妈又该说说我们了。A.解释 B.劝告 C.责备 D.表扬4、文本不能太难5、越简洁、越清楚越好6、在试卷中一般按从易到难的顺序排列第40页/共54页(二)完形填空题形式有很多种1.有选项的测试:选词填空、选句填空2.无选项的测试第41页/共54页选词填空第42页/共54页选句填空第43页/共54页根据上下文的意思填写汉字本周五下午两点,在国际文化交流学院报厅,举办外国留学生汉语演讲赛。欢迎广大留学生积报名参加。第44页/共54页(三)是非判断题听对话,判断对错A 小明上学的时间不长()B 小明请人教他学会了电脑()客观性测试题C 短文主要讲小明自学
15、电脑的故事()主观性测试题第45页/共54页(四)问答题目听后回答问题A 女的找麦克做什么?B 女的找王丽去做什么?适用于听力、阅读技能的考查,还有语言表达能力的考查。第46页/共54页题目质量分析的方法1.总分对比法A 从高到低排序,分高分组和低分组B 分析每一道题目,在两组的表现是否对应高低之分。2.内外对比法成绩测试:平时成绩、考试成绩能力测试:考试成绩、考后目的语的实际情况第47页/共54页质量评估:信度和效度一、信度:指测量结果的可靠性、一致性和稳定性程度。一个高质量的测验对同样一组被试反复测量结果应该保持一致。1 1、测验信度的估计 再测信度:稳定性系数,防止练习效应 等值复本信度
16、:测验的等值性,平行试卷 分半信度:反映测验内部一致性程度 内部一致性信度:精确 评分者之间信度:0.90以上第48页/共54页2、影响因素:题目数量;题目的同质性;题目难易度分布;被试样本的异质程度二、效度:指测量的有效性和准确性,即测量对它所要测的东西准确测量的程度。:针对特定的测量目的而言;程度概念1 1、类别:(1 1)内容效度:实际测量内容对所欲测量内容的代表性程度。第49页/共54页 表面效度:指一个测验从表面上看是否测了它所要测的知识或能力。:考查书面表达能力可以用写作文的方式和改错句的方式,前者表面效度高,并不一定。:成绩测验最应讲求内容效度,即最强调题目代表性,需要确定测验的
17、范围和各部分的比例。评判方法:靠经验判断等定性分析的方法进行。第50页/共54页(2 2)效标关联效度:指测验结果与效标的一致性程度。效标是指衡量测验有效性的外部标准,通常指测验所要预测的行为。预测效度:测验分数与一段时间后被试的行为表现之间的相关程度。共时效度:以测验实施相同或相近时间内搜集到的其他经验性资料为标准。第51页/共54页(3 3)构想效度:理论、观念效度,测验结果与设计者关于能力的理论构想之间的相关程度。第二语言习得理论有许多假说,用测验验证,涉及构想效度2 2、影响效度的因素:题目的质量(难度等);参照标准的质量;测试实施的程序是否标准化。三、信度、效度关系 信度是效度的必要前提;信度高的测验不一定效度高。第52页/共54页1 1、难易度:指某个题目的答对率,即答对某题目的被试占全部参加测试的被试的比例。p p=答对此题人数/总人数,范围应在0.2-0.8之间。平均难易度(一个测试的各个题目的难易度相加,再除以题目的数量),宜在0.5左右。特别要求:被试的同质性2 2、区分度:指一个题目对于鉴别被试的水平所起的作用有多大。第53页/共54页感谢您的观看!第54页/共54页
限制150内