大学入試における公平性の観点

センター試験の代替として英語民間試験の導入や新共通テストの国語・数学における記述式問題の導入などが進もうとしている。しかし、私はこれらを50万人が毎年受験する試験科目として導入することには反対である。その端的な理由のひとつが、公平性の問題だ。大学入試における公平性の観点はさまざまなものがある。例えば、

0.同一の試験による評価
1.同内容の答案には同得点
2.受験者の経験や予備知識に過度に依存しない作問
3.試験問題の事前秘匿
4.試験の適正な実施
5.適正な学力評価に資する作問
6.地域格差や経済格差への配慮

という6点を挙げてみる。なぜか地域格差や経済格差に関する6のみに焦点があてられて現行のセンター試験や二次試験が不公平であると主張されることが多い。しかし、英語外部試験や新共通テストにおける記述式問題は、そもそも0~5のような試験としての公平性そのものに重大な疑念がある。全体を簡単にまとめるたものが次の表である。

 

f:id:rochejacmonmo:20180923192350j:plain

 

 入試における採点の公平性の中で最も重要なことは、「同じ答案には同得点」という公平性を確保することである。採点基準の客観性はもちろん重要だが、入試は学力調査ではなく選抜試験である以上、同じ内容の答案に対する評価が異なることこそが最も避けなければならない事態だ。英語民間試験でも、新共通テストの記述式問題でも、「1枚の答案を2名の採点者が採点し、一致しなければスーパーバイザーが再度チェック」という体制が採点の公平性を担保するという議論がある。しかし、「同じ答案には同得点」という公平性を担保するためにはこれでは全く不完全。以下説明する。

 記述式答案は多様。事前に採点基準を決めていても、実際の採点では、2つの判断のグレーゾーンに属し評価を確定しにくい答案や、事前に決めた採点基準とは全く違うアプローチの答案が出る。しかも誤り方も多様なため、どのような誤りに対してどう評価を確定するかは実物答案を見て決めざるを得ない。その時点の採点基準で判断が難しい場合、直ちに採点者全員が実物答案を見て合議し、判断を言語化した上で、採点基準に新たな項目を追加したり、必要に応じて部分点の付け方を修正した上で、アップデートされた採点基準を採点者全員が共有し、それまでに採点していた答案も見直す。つまり、記述式問題の採点は、採点基準のアップデートとその共有が不可欠であり、そのためには、全採点者が同時にその場で採点作業をしていることが重要である。

 次に、たとえ採点基準が言語化されていても、採点者が多ければ多いほどその共有が難しくなり、実際の評価に幅が出る危険がある。これを防ぐために、すべての採点基準を正確に理解したチェック者が、同じ内容の答案に同じ得点が与えられているかを全答案にわたってチェックできることが重要である。しかも同じ採点者であっても、全答案のチェックに長い時間が必要だということになると採点がブレる危険性が増す。できるだけ短い時間で、全答案を何度もチェックできることが望ましい。従って、「同じ答案には同得点」という公平性を保つためには、究極的には1名の採点者がすべての答案をできる限り短時間で採点するのが最も望ましい。しかしそうするとその採点者の作成した採点基準は、それに基づく採点は「同じ答案に同得点」を満たし公平ではあっても、基準が採点者の主観に依存しすぎて客観性が損なわれることが懸念される。従って、複数の採点者が採点基準を点検して必要に応じて合議や修正を行うことになる。

 記述式問題の採点を部分点込みで行うには複雑な採点基準が必要になる。
1名でも全答案をチェックできる程度の採点枚数を、採点基準を合議・言語化・共有できる質の揃った少数の採点者が、同じ場所で、短時間で採点業務にあたることが、「同じ答案には同得点」という公平性を確保する上で最も重要。

 英語民間試験や新共通テスト記述式では、

  • 採点枚数が膨大で全チェックが困難。採点時間が長期化。
  • 採点者数が極めて多数で、複雑な採点基準を共有することが困難。
  • しかも対面式面接の場合は、採点者の採点基準を言語化することが難しい。
  • また、採点者が海外や学生アルバイトなど多岐に渡ると、グレーゾーンに属する答案の採点基準を言語化したり、アップデートし共有することも困難となる。

その結果として、「同じ答案には同得点」という公平性が損なわれてしまうという危険性や、極めて教条的な採点基準が杓子定規に適用されて、学力の適正な評価が損なわれる危険性が極めて高くなる。

  以下の記事でも指摘したように、数学の記述式試験においてすら、根拠記述の妥当性をどこまで評価するかを正確に共有しなければ、採点にブレが出て「同じ答案に同得点」という公平性が損なわれる可能性がある。それを避けようとすると採点基準があまりに杓子定規に適用されて適正な学力評価が行われない可能性があることが如実に現れている。いわんや国語や英語ではもっと詳細に採点基準を言語化し共有しなければ公平な採点はできないであろう。


数学に限らず、国語の記述式や英語のライティングやスピーキングなどの試験は、上記の観点から言っても、志望学科ごとに採点することで採点する総枚数を抑えられる個別二次試験にこそふさわしい。採点する枚数はどんなに多くてもせいぜい数千枚が上限だろう。数万から数十万枚の答案を採点しなければならない英語民間試験や新共通テストの記述式問題は、公平な採点が行われないリスクが極めて高く、入試制度としては不適切であると言わざるを得ない。