测验的信度与效度word版本.ppt





《测验的信度与效度word版本.ppt》由会员分享,可在线阅读,更多相关《测验的信度与效度word版本.ppt(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、测验的信度与效度信度的意義測量的一致性(就內容而言)或穩定性(就時間而言),幾次測驗結果是否一致的程度範例一天之內以同一磅秤多次測量某人體重一天之內以同一磅秤多次測量某人體重結果一:大致相同結果一:大致相同測量結果可靠測量結果可靠結果二:有顯著性的差異結果二:有顯著性的差異測量結果不可靠測量結果不可靠信度並非全有或全無,而是程度的問題。若多次重複測量的結果都非常接近,則說明該評量結果信度高;反之,若各次評量結果的變異大,則信度低。與物質、生理特徵的測量相較,心理測驗的測量精確度較低。誤差來源個人狀況個人狀況(身體不適、大意身體不適、大意)題目本身的合宜性題目本身的合宜性(太難、太容易太難、太容
2、易)測驗情境的影響測驗情境的影響(實施、計分的錯誤實施、計分的錯誤)信度的原理實得分數與真正分數實得分數(X)=真正分數(T)+誤差分數(E)實得分數變異數(S2X)=真正分數變異數(S2T)+誤差分數變異數(S2E)信度變異=S2T/S2X信度的類型信度的類型再測信度(test-retest reliability)係指以同一種測量工具,對同一群受試者,前係指以同一種測量工具,對同一群受試者,前後測驗兩次的後測驗兩次的相關係數相關係數。又稱。又稱穩定係數穩定係數。通常。通常時間越長,再測信度越低時間越長,再測信度越低常見於:智力、性向、人格等測驗常見於:智力、性向、人格等測驗通常個別化診斷測
3、驗信度係數須達通常個別化診斷測驗信度係數須達.90.90,團體測,團體測驗為驗為.80.80,篩選測驗為,篩選測驗為.60.60優缺點?優缺點?信度的類型複本信度(複本信度(a1ternate-form reliabilitya1ternate-form reliability)同一群受試者接受兩種複本測驗的得分之同一群受試者接受兩種複本測驗的得分之相關係數。相關係數。複本常見於團體化測驗,可相互替代使用複本常見於團體化測驗,可相互替代使用(例如前後測例如前後測),使用便利,使用便利 複本測驗需要在內容、型式、題數、難度、測驗指導複本測驗需要在內容、型式、題數、難度、測驗指導與時間等都需要與原
4、測驗相等,與時間等都需要與原測驗相等,主要誤差來源:內容取樣、時間間隔、練習效果、學主要誤差來源:內容取樣、時間間隔、練習效果、學習遷移習遷移 優缺點?優缺點?信度的類型內部一致性係數(coefficient of internal consistencycoefficient of internal consistency)反映測量工具內部同質性、一致性或穩定度。反映測量工具內部同質性、一致性或穩定度。同質性越高,代表量表試題是在同質性越高,代表量表試題是在測量相同的特測量相同的特質質。常用方法有:。常用方法有:方法方法庫李庫李(KR20)(1937)(KR20)(1937)適用於二分變數適
5、用於二分變數(對錯對錯)的測量的測量Cronbachs(1951)Cronbachs(1951)適用於多元尺度變數適用於多元尺度變數(多元計分多元計分)的測量的測量折半信度折半信度(split-half reliabilitysplit-half reliability):測驗題目依題目):測驗題目依題目的單雙數或其他方法分成兩半,計算受測者在兩半的單雙數或其他方法分成兩半,計算受測者在兩半測驗上的分數的相關係數。測驗上的分數的相關係數。優缺點?優缺點?信度的類型評分者間信度(inter-rater reliability):不同的不同的評量者的觀察、紀錄、評分評量者的觀察、紀錄、評分的一致性
6、。的一致性。傳統:相關係數、同意百分比法傳統:相關係數、同意百分比法近代:類推性理論近代:類推性理論影響信度的因素影響信度的關鍵因素是測量誤差,可以減低誤差的方法,即影響信度的關鍵因素是測量誤差,可以減低誤差的方法,即能夠提高信度。能夠提高信度。基本原理:中央極限定理基本原理:中央極限定理 、測量標準誤、共變量的計算、測量標準誤、共變量的計算 影響信度的因素影響信度的因素 受試者因素(如受測者的身心健康狀況、動機、注意力、受試者因素(如受測者的身心健康狀況、動機、注意力、持久性、作答態度等變動)持久性、作答態度等變動)主試者因素(如非標準化的測驗程序、主試者的偏頗與主試者因素(如非標準化的測驗
7、程序、主試者的偏頗與暗示、評分的主觀性等等)暗示、評分的主觀性等等)測驗情境因素(測驗環境條件如通風、光線、聲音、桌測驗情境因素(測驗環境條件如通風、光線、聲音、桌面、空間因素等皆有影響的作用)面、空間因素等皆有影響的作用)測驗內容因素(試題取樣不當、內部一致性低、題數過測驗內容因素(試題取樣不當、內部一致性低、題數過少等)少等)時間因素時間因素 效度效度的意義n n效度的意義l l測量的測量的正確性正確性,指測驗或其他測量,指測驗或其他測量工具確能測得其所欲測量的特質或工具確能測得其所欲測量的特質或功能之程度功能之程度l l測量的效度愈高,表示測量的結果測量的效度愈高,表示測量的結果愈能顯現
8、其所欲測量對象的真正特愈能顯現其所欲測量對象的真正特徵徵 評估效度的方法n n判斷法(informed judgmentinformed judgment)l l測量特性與質的評估測量特性與質的評估 n n實徵法(gathering of empirical evidencegathering of empirical evidence)l l根據具體客觀的量化指標來進行評根據具體客觀的量化指標來進行評估估效度的類型n n內容效度(content validitycontent validity)n n效標關聯效度(criterion-related validitycriterion-rel
9、ated validity)n n建構效度(construct validityconstruct validity)內容效度(content validitycontent validity)n n內容效度l l反映測量工具本身內容廣度的適切程度,反映測量工具本身內容廣度的適切程度,強調測量內容強調測量內容(教材內容或預期的行為教材內容或預期的行為)的的廣度、涵蓋性與豐富性廣度、涵蓋性與豐富性 ,以做為外在推,以做為外在推論的主要依據。論的主要依據。l l針對測量工具的目標和內容,以系統的針對測量工具的目標和內容,以系統的邏輯方法來詳細分析,又稱為邏輯方法來詳細分析,又稱為邏輯效度邏輯效度(
10、1ogical validity1ogical validity)l l表面效度(表面效度(face validityface validity),指測量工具),指測量工具在外顯形式上的有效程度在外顯形式上的有效程度 l l限制:出於邏輯判斷,缺乏實證的統計限制:出於邏輯判斷,缺乏實證的統計數據評估指標,需以判斷法來進行效度數據評估指標,需以判斷法來進行效度評估評估內容效度的判斷方式n n專家效度專家效度n n雙向細目表雙向細目表l l表格左方表示教學所欲達成的目標,表格左方表示教學所欲達成的目標,上方表示教材內容範圍,並逐一檢上方表示教材內容範圍,並逐一檢視每一試題以考驗整份測驗之內容視每一
11、試題以考驗整份測驗之內容效度效度雙向細目表題數題數內內容範圍容範圍行為目標行為目標細胞能量代謝光合作用呼吸作用生物分子總題數分數百分比知識知識02110446.7理解理解201227711.7應用應用121116610.0分析分析112116610.0綜合綜合211217711.7評鑑評鑑01121558.3情意情意10111446.7技能技能10010223.3簡答題簡答題1111151931.7總題數總題數98912846分數分數111014151060百分比百分比18.316.723.325.016.7100提高內容效度的方法n n列出教材內容各項重點與所要測量的學習結果或行為n n各項
12、教材重點和學習結果要以相對的重要性來加權n n依據雙向細目表來編製測驗,所編製的測驗越符合細目表各細格所佔的比重,則內容效度越高。效標關聯效度意義 (criterion-related validitycriterion-related validity)n n效標關聯效度效標關聯效度l l測驗分數測驗分數與與外在效標外在效標之間的一致程度之間的一致程度l l外在效標:測驗所要測量的某些行為或外在效標:測驗所要測量的某些行為或特質的代表量數特質的代表量數l l又稱實證效度、統計效度。又稱實證效度、統計效度。l l以測驗分數和特定效標(以測驗分數和特定效標(criterioncriterion)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 测验 信度 word 版本

限制150内