テスト理論から見た大学入試改革論(2)

段階評価と情報量

2014年12月の中央教育審議会の答申では,「各大学はその教育方針に照らし,どのような評価方法を組み合わせて選抜を行うかを,応募条件として求める「大学入学希望者学力評価テスト(仮称)」の成績の具体的提示等を含め,アドミッション・ポリシーにおいて明確に示すことが求められる」と述べられています(5)。そして,その成績については,「「1点刻み」の客観性にとらわれた評価から脱し,……段階別表示による成績提供を行う」とされていました(6)

つまり,当時「大学入学希望者学力評価テスト」と仮称されていた新しい共通テストでは,成績をおおくくりの段階別表示とし,各大学は,応募条件として受験者にどの段階を求めるかを示すこととされていたのです。大学はその求める段階によってランクづけられ,受験者は自分が得た段階によって応募できる大学が限定されるということですから,もしこの案の通りに進んでいたら,これまでの大学入試のあり方が大幅に変わることになり,良くも悪くも,当時言われた「明治以来の改革」となったことでしょう。しかし,成績を段階評価することについてはさまざまな問題点が指摘され,実質上,とりやめになりました(7)

段階評価の最大の問題点は,選抜に必要な個人差の識別が十分にできないこと,言い換えれば受験者の能力レベルに関する情報量が少なくなることです(8)

図1は,段階評価にすることによって,テストの情報量がどれくらい減少するかを具体的に見ていただくために用意したものです。ここでは,100項目からなるテストを考え,それを1点刻みの100点満点で採点した場合と,20点以下は段階値が1,そして,21点から40点までは段階値が2,という具合に段階値5までの5段階評価をした場合を考えます。計算の簡単のために,100個の項目は困難度などの統計的特性をすべて同じにしてあります。

figure2-1

図1 段階評価と情報量

スポンサードリンク

赤い曲線のうち,上のほうが1点刻みの場合の情報量で,下のほうの波打っている曲線が5段階評価の場合の情報量です。これを見ると,能力レベルの特に高いところと特に低いところでは,5段階評価の情報量がほとんど0になっていること,そして,その他の能力レベルでも1点刻みの情報量に比べてかなり低くなっていることがわかります。

たとえば,段階評価にすることによってテストの情報量が3分の1に減少するとしたら,テストの項目数を3倍にすることでやっと1点刻みの情報量になるということです。言い換えれば,テストの項目のうち3分の2にあたる部分を捨てるのと同等だということです。せっかく入試改革の方針に沿って良い項目をつくってテストを構成しても,それで得られる情報を最後に捨ててしまうのでは意味がありません。

ところで,図1で,5段階評価の情報量の曲線が波打っていることについてですが,それは,能力レベルと5つの段階値との関係によって生じる現象です。図1の左下から右上に向かって上昇している青い曲線は,各能力レベルでの段階値の期待値です。期待値というのは,たとえば,ある能力レベルにおいて段階値が1になる確率が0.8で,段階値が2になる確率が0.2で,段階値が3以上になる確率が0だとすると,1×0.8+2×0.2=1.2と計算されます。その能力レベルにおいて,段階値が1になる場合も2になる場合もあるけど,平均すれば1.2というのが期待値の意味です。

この曲線は,ある能力レベルのあたりで傾きが急になり,その後は緩やかで,またある能力レベルのあたりで急になるという形になっています。傾きが緩やかなところは,そのあたりでは能力レベルがある程度異なっても,段階値はほとんど変化しないことを意味します。結果として,その能力レベルのあたりでは情報量が低くなります。一方,傾きが急なところは,そのあたりでは能力レベルの少しの違いで上の段階値になったり下の段階値になったりするので,そこでは情報量が高くなります。これが,5段階評価の情報量の曲線が波打って上下している仕組みです。

段階評価については,テストの情報量が減少すること以外にもいくつか問題点があります。これについては,第3回で取り上げます。

第3回に続く

文献・注

(1) 文部科学省 (2017).「大学入学共通テスト実施方針」p. 17。

(2) 文献(1)のp. 3, p. 30。

(3) 大学入試センター (2017).「第1回,第2回モニター調査実施結果について」p. 23.

(4) SATの“Writing and Language Test”のサイト参照。

(5) 中央教育審議会 (2014).「新しい時代にふさわしい高大接続の実現に向けた高等学校教育,大学教育,大学入学者選抜の一体的改革について~すべての若者が夢や目標を芽吹かせ,未来に花開かせるために~(答申)」p. 12.

(6) 文献(5)のp. 15。

(7) ただし,第4回で述べるように,英語の民間試験の活用の文脈で,段階評価案が再び浮上しています。

(8) 中央教育審議会の答申は,そのことは承知のうえで,わざと共通テストの情報量を少なくし,後は各大学の個別試験でという案だと思います。ですから,ここでの論点は,情報量が多いか少ないかではなく,情報量が少ないとどのような問題があるかということです。


1 2 3