日本語能力試驗計分方式大解謎

jlpt

最近日本語能力試驗公布了結果,不少人都對計分方式充滿疑問。有些人「低空飛過」,問是不是因為今年報考的人拉低了平均值。有些人明明知道自己答錯不少題目,成績卻不錯。有見及此,特別解釋一下日能試的計分方式。

日本語能力試驗的計分方式不是使用「古典測驗理論」,而是使用「項目反應理論」(IRT)。先別被理論的名稱嚇怕,其實不難理解。

為什麼不使用「古典測驗理論」?

「古典測驗理論」(Classical test theory)是最早的測驗理論,建基於以下假設。

觀察成績=真實成績+誤差。

由於「真實成績」只存在理想中的世界,現實上是不可能找到出來。實際執行時,準確度因人而異,問題的難易度和考生的狀態也會增加結果的誤差。

為什麼使用「項目反應理論」?

「項目反應理論」(Item Response Theory)是日本各種考試常用的計分方式,特點是把題目難度考慮在內,以機會率的方法推算考生的實力。根據這個理論,每度題目的結果只有「對」或「錯」,答對的可能性跟考生的能力兩者的關係可以化成數學程式IRF(Item Response Function),並畫成如Figure 1般的曲線。因為考試中收集了大量答卷資料,利用這些資料可以找到每道題目的IRF。

Figure1

最後一步,便是把不同的考試結果分配到各種成績上。例如,如果考試共有條10問題,每題的答案只分「對」或「錯」,考試可能的結果組合是2的10次方,即1024。相對的,成績分數是0-60,即61種分數。主辦機構便會把這1024個結果分配到這61種分數上。對於答錯相同數目問題的人來說,只要答錯的問題不一樣,成績也會不同。

這種計算方式雖然很複雜,但是比「古典測驗理論」更能反映考生的能力,而且考卷的難易度也不會影響成績。

參考資料
日本語能力試驗介紹 > 四大特色
ITEM RESPONSE THEORY RESOURCE CENTER
Classical Test Theory

茂木翔太

茂木翔太

日本文化的愛好者,也愛穿王子裝及寫有趣的文章。
茂木翔太

Latest posts by 茂木翔太 (see all)

Leave a Reply

*