テスト理論から見た大学入試改革論(1)

入試改革論のキーワードとテスト理論の用語・概念

図1は,左側に大学入試改革論のキーワードを並べ,右側にテスト理論の用語・概念を並べて,関連するものを線で結んだものです。この図1を適宜参照しながら,読んでいただければと思います。

figure1-1

図1 キーワード関連づけ

最初に,テスト理論の用語・概念と,その相互関係について,簡単に説明しておきたいと思います。

妥当性・信頼性・情報量

まず,妥当性と信頼性です。

figure1-2

図2 妥当性と信頼性

図2に示したように,テストの得点は,測りたい能力の高低だけで決まるのではなく,それに必ず誤差が加わります。誤差の中には,たとえば,タブレット端末を使ってテストをする場合の,タブレット端末使用の慣れ・不慣れの個人差のように,もう一度テストしても同じように得点を左右する安定的,系統的な誤差と,採点者の判断のブレのような,不安定で偶然的な誤差とがあります。

測りたい能力と,それとは相関しない系統的な誤差,さらにそれらとは相関しない偶然的な誤差の合計でテスト得点が構成されると考えると,テスト得点の分散(集団における散らばり)も,図2に示したように,それら3つの構成要素それぞれの分散の和になります。そのテスト得点の分散のうち,測りたい能力を反映する成分の分散の割合が「妥当性」です。つまり,妥当性は,テストの得点が測りたい能力をどれだけ反映しているかという程度を表す重要な指標です。

一方,テスト得点の分散のうち,測りたい能力を反映する成分と系統的な誤差の分散が占める割合は「信頼性」となります。つまり,信頼性は,テストの得点が偶然誤差によって左右されない程度,その意味で安定している程度を表す指標です。

妥当性と信頼性の間には密接な関係があります。図2からわかるように,妥当性が高ければ,誤差の分散は相対的に小さくなりますから,信頼性も高くなります。それに対し,信頼性が高くても,系統的な誤差の分散が大きい場合には,得点が安定はしても妥当性は低いことになります。安定して,的外れのもの(先の例で挙げたタブレット端末使用の慣れ・不慣れの個人差など)を測っている可能性があるのです。


1 2 3