こんな採点で大丈夫なのか?-新共通テスト試行調査 数学の記述式問題について-

高大接続改革の一環として行われている大学入試改革のひとつである「大学入学新共通テスト」は、記述式試験の導入をひとつの大きな柱として構想されており、文科省は、たとえば次のような形で、記述式問題導入の意義を説いている。

 

2.なぜ記述式問題を導入するの?
 記述式問題の導入により、解答を選択肢の中から選ぶだけではなく、自らの力で考えをまとめたり、相手が理解できるよう根拠に基づいて論述したりする思考力・判断力・表現力を評価することができます。

 また、共通テストに記述式問題を導入することにより、高等学校に対し、「主体的・対話的で深い学び」に向けた授業改善を促していく大きなメッセージとなります。大学においても、思考力・判断力・表現力を前提とした質の高い教育が期待されます。

 併せて、各大学の個別選抜において、それぞれの大学の特色に応じた記述式問題を課すことにより、一層高い効果が期待されます。

 http://www.mext.go.jp/a_menu/koutou/koudai/detail/1397733.htm

  私はさまざまな理由で、記述式試験の導入には反対であり、できるなら現行形式の戻った方が良いと考えている。できればまとまった形で整理したいが、

 のスレッドにも簡単にその理由を述べた。

 

 しかし、現状では既に、試行調査が実施されており、平成29年11月に行われた試行調査では、実際に記述式の問題が出題され、それらの採点などの調査結果が報告としてまとめられている 

 今回記述式問題が出題されたのは、数学と国語だが、この記事では数学の記述式問題とその採点基準について取り上げる*1

 

数学において記述式問題が出題されたのは数学I・Aの第1問と第2問のなかの3つの小問である。実は、どの問題も正答率が非常に低い*2

 

 問(あ)

 問題は以下の通り。

f:id:rochejacmonmo:20180523234806j:plain

誤答例として示されているのは以下の通り。

f:id:rochejacmonmo:20180523235010j:plain

そして正答率は、2.0%。ただし、無答と同じくらい誤答もあることに注意しなければならない。

f:id:rochejacmonmo:20180523235029j:plain

 

私の見解を箇条書きでまとめると次のようになる。

  • まず第一に、端的に問題の条件付けのしかたが良くない。頂点のy座標に関する不等式を用いてとあるが、実際には、判別式が正であることからx軸と相異なる2点で交わり、しかも下に凸であることから、頂点は3,4象限にしか存在できない。つまり頂点のy座標を明示的に求めなくても概形の説明で根拠記述になりえる。また頂点のy座標の不等式というのも範囲が不明確。「頂点のy座標<0」と書いてあればいいのか、y座標の明示式が必要なのかが読み取れない。
  • 従って第二に、理由をどこまで書くか/書かれたものを正答とみなすかのグレーゾーンが広く採点しにくい。例えば、単純に

    「a>0、b^2-4ac>0より頂点のy座標<0だから。」

     

    と書かれた場合、c<0といった記述はなくなるし、頂点のy座標の明示式もない。それでも正答とできるか疑問である。

    「x軸と相異なる2点で交わる下に凸なグラフだから、頂点のy座標<0となるので。」

     

    だったらどうだろう?にもかかわらず正答の条件が非常に狭く設定されている印象が強い。a>0かつc<0が明示的に述べられていなければ誤答とか、頂点のy座標が明示的に求められていなければ誤答といった具合に判断されているのではないか。
  • そして第三に、この程度の根拠記述を求める問題でさえ、根拠をどこまで遡って記述しなければならないかということは必ずしも確定的ではない。今回の問題のように、「a>0かつc<0」だから「頂点のy座標c-b^2/4a<0」なので「頂点は第3,4象限にのみ存在」というように複数のステップを踏む場合、最初の根拠記述を明示しなければいけないというルールを強制できるわけでもない。
  • 第四に、誤答例に示されている根拠と結論の順序が正しくないものも慎重に見る必要がある。答案がすべて「⇒」を使って書いていたわけでなく、おそらく採点者の側がそう読めると判断したものを誤答としたのだろう。しかしこれは答案の書きぶりをどう採点者側が判断するかという点にかなり大きく依存するので、多数の採点者が一致して採点できたかどうか危うい

 ところで、記述式の採点が行われたあと、別の検収者によって答案のチェックも行われている。その説明はこうだ。

f:id:rochejacmonmo:20180524001554j:plain

この補正というのが正答→誤答や誤答→正答といった判定の修正を伴うものであると予想できるが、たとえば、この問(あ)で検収の結果補正された答案の例は、どのような補正作業を行ったのか実際にははっきりしない。疑問点が付記されているだけだからだ。

f:id:rochejacmonmo:20180524001326j:plain

最初の例は単に書き間違えたのだろうと判断できるかもしれないが実際の採点で正答か誤答かの判断は迷う。2つの目の例は、そもそも2つほど不備があって、結果報告を作成する作成者がミスをしているのだと思うが、そこを無視すれば、場合分けして答えても根拠記述として全く正しい。

f:id:rochejacmonmo:20180524002752j:plain

しかしこれが補正にあがるということは、最初は誤答扱いにしていたものを正答にしたのだろうと推測できる*3。しかしこういう採点が行われていると、検収作業を行った抽出答案以外にもこの種の答案は多数あると思われるので、本番の場合には、検収作業の結果すべての答案を再チェックしなければならなくなる可能性が高い

 

問(い)

問題は次の通り。

f:id:rochejacmonmo:20180524003129j:plain

 

 誤答例は次の通り。

f:id:rochejacmonmo:20180524003203j:plain

そして正答率は4.7%。しかしこれも無答ではない誤答がかなりあることに注意しなければならない。

f:id:rochejacmonmo:20180524003218j:plain

これについての私の見解は次の通り

  • ここで挙げられた誤答例を誤答扱いするのは採点基準としてはあまり杓子定規すぎる。180°と書かなければならないのはわかるが、この設定で180が180°のことを表しているということは十分推定できる。-BC cosABCと書かれると、本問では、A,B,Cは確度の大きさとして認めるが、∠ABCとかかないと文字の三つ組みは角度を書いているとはみなさないということなのだろうが、書き方からみて、ABCは角度を表していると推定できる。3番目はさらにひどく、BCと-の間にドットが打ってあるのだから、( )がなくても、BC-cosBと書きたかったわけではないことくらい了解できる。疵はあっても、これを誤答とし、無回答と同じ得点しか与えない採点基準は、まさに杓子定規の一言に尽きる。
  • 少し挑発的に言ってしまうと、私が採点者で、正答か誤答かどちらかに分類せよと言われたら、正答に分類してしまうだろう。しかも正答率が非常に低いのだからなおさらだ。

 

問(う)

問題は次の通り。

f:id:rochejacmonmo:20180524004835j:plain

誤答例は次の通り。

f:id:rochejacmonmo:20180524004844j:plain

正答率は8.4%。これも無答ではない誤答がかなり多いことに注意が必要である。

f:id:rochejacmonmo:20180524004821j:plain

この問題は、この記述式のあとに実際に最も高い県を表す点を図の選択肢から選ばせる問題(2-ス)があり、その正答率は35~40%のようである。

f:id:rochejacmonmo:20180524005039j:plain

その意味では、選べるという部分とそれを根拠づけて説明するということのギャップを測っている問題ということができるのだろう。それを良い問題であるとする向きもあるのかもしれない。しかし補正作業についての結果などを見てみると、書きぶりをどう判断するかがかなり難しかったのではないかという印象が強い。

f:id:rochejacmonmo:20180524005159j:plain

f:id:rochejacmonmo:20180524005206j:plain

これらの例は、どれも概ね方法を正しく理解しているが、1,2,4番目はいささか言葉の選び方が適切でなかったり、言葉足らずであったりする。3番目の例は問題ないので、これを誤答にしてはいけないだろう。これも問(あ)と同じコメントになるが、この程度の答案で補正が必要になるところを見ると、本番では補正作業がかなり必要になることが予想され、チェック作業が非常に過重になる可能性も高い

 

まとめ

 これらの例をもとに私が主張したいことは次のようになる。

  • 答案の内容的/表現的ばらつきを減らさなければならないという要求のために付けられた設問の誘導が必ずしも数学的に本質的とは言い難い面があり、かえって正しく理解している答案を誤答扱いしてしまう懸念がぬぐえない。
  • 部分点を付けることは採点作業を極めて煩雑にするために困難であるという制約により、正答か誤答かの二択で採点せざるを得ないために、採点基準が極めて杓子定規に運用されてしまう懸念がある。これも非常に軽微なミスが過大に減点される危険をはらむ。
  • 採点枚数が非常に膨大(万単位)であるため、すべての答案を何度もチェックする作業が難しくなるという制約があり、全答案の中で内容的理解の度合を整列し、それによって得点にグラデーションを付けるという作業が不可能になってしまっている。そのため、無答とはまったく理解の度合いが異なる答案でも誤答としなければならなくなるという本末転倒に陥る危険性がある*4
  • 採点者の数が多く、統一的な基準で採点を行うことに相当な困難が伴うため、検収作業で原答案を逐一確認する作業が非常に大きくなると予想され、採点や検収に時間的なコストが相当発生すると思われる。
  • (追記)今回の数学の問題は無答率が概ね5割弱あるが、実際の試験では無答率はかなり減ると予想されるため採点にかかる時間や人員のコストは今回のものでは到底比較にならない。

万単位の記述式答案を、同一の基準で、短期間に、採点することが、冒頭で引用した

自らの力で考えをまとめたり、相手が理解できるよう根拠に基づいて論述したりする思考力・判断力・表現力を評価する

 という目的に資するものになっているのかどうか。実際の採点は、極めて教条主義的な採点基準が杓子定規に適用されてしまうことにより、むしろ逆の効果を生んでしまわないか、ということが問題の根源にあると思う。

 

おまけ

ちなみに次のようなことも言っている。

f:id:rochejacmonmo:20180524012146j:plain

いやいや、そんなことは試行調査をする前から全部わかとったことじゃろorz

わかりきってることなのにできてないから文句を言っているわけでござる

 

 

*1:国語の記述式問題も様々な問題点があると思うが、それは別の機会に譲る。

*2:もちろんこれは他の部分の難易度などの影響を強く受けるので、これだけで一概にどうこうできる話ではないことには注意が必要。

*3:まさか正答にしていたものを誤答にしたということは考えにくいだろうと思うので。

*4:個別の大学で課される二次試験なら枚数はせいぜい千のオーダーなので、全答案の出来具合を丁寧に調べ、理解のレベルに応じた整列が可能になる。