松本徹三氏はおそらく基本的な事実を誤認している>東ロボ

松本徹三氏が書いた「AIが神になる日――シンギュラリティーが人類を救う」という書物について、中村伊知哉氏のツイートとそれへの新井紀子氏のコメントがあった。

 

 私は、松本氏の著書をすべて読んだわけではなく、9頁にある次の記述を見ただけである。

●東ロボ君は再挑戦できる
国立情報学研究所の新井紀子教授は、日本におけるAI研究の先駆者で、大変立派な業績を上げている方ですが、AIが東大入試の英語の試験に合格できるかを試す「東ロボ君」のプロジェクトを進めた結果、「合格は不可能」という結論を出しました。

しかし、それは、このプロジェクトのためにメモリーされた英単語が五百億語、文章が十九億文程度で打ち切られていたからだと、私は考えています。単語の方はともかく、文章の方はその百倍の二千億文程度まで増やさないと駄目でしょう。それはそんなに難しいこととは思えません。

クラウドは、今や、一人の人間が一生かかって蓄積しうる記憶をはるかに凌駕する記憶量を持っており、しかも今のこの瞬間も、世界中で休むことなく情報を収集し続けています(*)。

(*)世界中から常時(ネットで)収集し続けている情報の中には、おそらく「作り物の画像や映像」なども含んだ膨大な数の「偽の情報」が含まれているでしょう。しかし、将来のAIの実力からすれば、そういうものを弾き出すことはかなり簡単だと思います。種々のファクターを縦横につなぎあわせてその整合性を検証すれば、かなりの確度で、「真実であるか、あるいは相当嘘っぽいか」程度は言い当てることができると思います。

また、そのプロセッサーのスピードは、膨大な数のトランジスターを超高速で並列的に動かすことによって、想像を絶するほどのものになっています。つまり、もはや、このような基本的な能力においては、いかなる天才も太刀打ちできないレベルに達しつつあるのです。我々は、今こそ、このことの持つ意味を真剣に考えねばなりません。

 他にも東ロボプロジェクトに関する記述があるのかもしれないが、ここに述べられている記述だけみても、松本氏は基本的な事実認識が間違っているか、あるいは事実確認を怠っている

「AIが東大入試の英語の試験に合格できるかを試す「東ロボ君」のプロジェクト」

既にこれが間違っている。今回のプロジェクトで、AIを用いて解答した英語の試験は、センター試験の英語とリスニングの問題であり、東大入試の英語の問題ではない。(そもそも「AIが東大入試の英語の試験に合格できるかどうか」というのも実際のプロジェクトの全体像を矮小化している。今回のプロジェクトではセンター試験の一定の科目を受験(英リ・国・数・物・世)し、東大模試の数学と世界史を受験したのだから、東大の英語がターゲットであったかのように誤解させる松本氏の記述は不適切である。)

このプロジェクトのためにメモリーされた英単語が五百億語、文章が十九億文程度で打ち切られていたからだと、私は考えています。単語の方はともかく、文章の方はその百倍の二千億文程度まで増やさないと駄目でしょう。それはそんなに難しいこととは思えません。

 このような曖昧な書き方をするということから、松本氏は、実際に500億語・19億文を用いて、どのような設問が解答でき、どのような設問が解答できなかったかということを正確に把握しているとは思えない

 今回よい成績だったのは、発音・アクセント・文法と語彙語法・語句整序に関する問題群であり、応答文完成ですら7割程度、会話文完成・不要文除去・意見要旨把握も4割程度。3つの読解文については、統計や生活に関する資料でようやく6割程度だが、物語や論説では2割程度しかできていない。例えば、今年のセンター試験の「不要文除去」の問題をスクリーンショットしておく。

f:id:rochejacmonmo:20171113201915j:plain

こういう問題が現状解けていないので、そもそも長文読解の問題などとてもできない。ましてや東大二次の英語の問題などと到底無理だ。 

 今回担当したグループは、2000億文などとは言わなかった。彼らは複数文の問題でも500億文程度の類似文章が手に入れば、複数文問題でももう少し正答率が改善するであろうという見通しを述べていた。しかし同時にそれだけの文章群を得るための作業コストが経済的に見合うかどうかという問題も浮上すると述べている。

もはや、このような基本的な能力においては、いかなる天才も太刀打ちできないレベルに達しつつあるのです。我々は、今こそ、このことの持つ意味を真剣に考えねばなりません。

 センター試験で200点満点を取る学生というのは、それなりにはいるし、190点以上にすれば、もっと増える。駿台・ベネッセが集計した2017年のデータネット(自己採点集計)の度数分布のスクリーンショットをはっておく。

f:id:rochejacmonmo:20171113203317j:plain

英語の筆記で190点以上とる学生は8000人以上のオーダーで存在する。別にこうした学生のすべてが「天才」というわけでもないだろうし、その意味で今回の東ロボプロジェクトで試みられた得点は、十分によくできる人間の得点に比べて明らかに劣っていると結論するのが妥当である。仮に2000億文が用意できたとして、複数文選択の問題が仮にかなり正答率が上昇したとしても、センター試験の読解問題である第5問や第6問で2箇所でもミスをすれば、合計点は190点を割り込む。その意味で、本当にできる受験生と同程度の得点をあげるために、文例の収集と深層学習というだけではまだ道のりは遠そうに見える。もし仮にそうしたことができるようになるのだとすれば、何らかのブレイクスルーは少なくとも必要なのだろう。

 

この事案を拡散していいのか懸念がある

 宮川 剛 氏が自身のtwitterで、採用内定を取り消されかけている事案に関する情報を公開している。

togetter.com

一般企業では内定取り消しは大きな問題であることは疑いの余地はないが、今回宮川氏が報告している事案は、大学関係の人事問題であり、経緯を詳細に見れば、一般企業における内定取り消し問題と同列に扱えるものか、またこの事例をもって大学の労働環境を論難したり、拡散して大学当局に翻意を促すことが適切なのかどうか、少なくとも私には疑問の余地がある。以下、雑多ながらいくつか列挙する。宮川氏はいくつかの点でもう少し丁寧に説明するべきだと考える。

 (なお、筆者は宮川氏が報告している事案とは一切無関係な第三者であり、しかも以下で書くことは、一般的なことなので、今回の事例に完全に当てはまっているという保証はないし、すべての大学で同じように事が行われているという保証もない。)

 

宮川氏による経過の説明をtwitterから抜粋する。

面接の後、人事委員長で学科長かつ応募書類の宛先になっている教授から電話で「先生に来ていただくことが決まりました。いらしてもらえますね?」と連絡があり、「はい、もちろん。喜んで」と回答。別の人事委員の教授より「桜が咲いているようです。正式な連絡、お待ち下さい。」とも

その二日後、その学科長の先生より「今回の当学科の人事にご応募いただき、ありがとうございました。すでにご連絡いたしましたように、先生に来ていただくことになりました。どうぞよろしくお願いいたします。」と電子メールにて連絡。その後実際に当事者が大学を訪問し、複数の先生と各種打ち合わせ。

その際に、他の複数の教授やポスドク・院生などに、XX先生の後任でいらっしゃる◯◯先生、と紹介され挨拶&世間話。学科事務室を訪問し、同様に紹介・挨拶、時間割、実験演習テキスト、建物内部の図面などをもらう。研究室採寸などし、教科書の第何章から何章までが講義の割当かの指示を受ける。

別の教授に交替し、学科で使われる共通施設や研究設備などをかなりの時間をかけ紹介・案内をしてもらう。そんな感じでありますので、客観的にみても内定が明確に成立していたことは間違いないところです。

着任日までそれほど期間がなく、当事者は具体的に研究室の引っ越しの準備を種々の点で開始しました。当事者は、幸か不幸か大型の研究費を複数取得したばかりで、かなりの人の雇用をその前年に開始してしまっていました。ですので、異動後、多少の間は、現雇用先と兼任をさせてもらう必要がありました。

研究費での被雇用者のことや研究環境の即時の移動の困難さ等から、しばらく兼任をせざるを得ない旨は応募時・面接の際に説明し、了承を得ていました。内定通知のメールにも「また、兼務については、人事係によりますと、◯大本務であれば、本学としては通常の手続きでできるようです。」との記載あり。

異動について現所属の学長・学部長に相談。当事者はその先生方と関係良好で高く評価されていたため「兼任するのであれば、こちらからで人件費を一部負担しますよ。打診してみてください」と提案される。当事者は、その学長の案を、双方、win winと考え、異動先の学科長に提案したのです。

そうしたところ、そのような形態の提案を直接の理由として、「今回の人事選考を白紙にもどす、という判断に至りました」という連絡を受け、内定が取り消されそうになっている、という次第です。

 もう少しよく話を聞いてみると、実際には、当事者の研究規模が大きすぎてその大学のその学科には「収まりきらない」という意見が出たこと、その研究規模の大きさと兼任などから当事者が教育業務や委員会活動、入試業務などを十分に行わないのではないか、という懸念が出されたことが背景の原因のよう。

あと、委員からは、この当事者は、その大学・学科の研究環境に満足ができず、すぐ他に異動してしまうのではないか、という懸念も示されたことも、その内定撤回の理由の一つとしてあるとのことでした。

要は、その当事者の研究規模が大きすぎて、スペースをかなり使われてしまうかもしれないこと(そこの大学の学科では取得研究費の額によってスペースのサイズが変わります)、その他雑用をあまり負担してもらえなくなるかもしれないこと、などが深刻に懸念されてしまったようです。

米国の大学・研究機関では、普通、優れた研究成果を出し、大きな研究費を取得することができた研究者には大きな間接経費がついてきて、それがその大学・学科などの利益になります。ですので、そのような研究者は優遇され、取り合いのような具合になります。しかし日本ではこの状況は随分違うんですね。

まず間接経費割合が米国に比べると少なくメリットが少ないことに加え、(これは大学・学部などにより異なりますが)間接経費のほとんどが中央に取られてしまうんですね。加えて、日本では教育研究以外の業務(各種委員会、入試などのいわゆる「雑用」)が膨大ですが、それを教授等が行う必要がある。

すると、同僚となる教員(人事委員の先生方)には、できるだけ、そのような研究以外の業務をきちんとこなすような人材が好ましい、という方向性になりがちになってしまうわけです。スペースもあまり取られても困りますし。間接経費は中央に行くのでメリットはないわけですし。

 

「学科委員会教授会」での投票が終了したところまでだそうです。その大学としては、事務的な最終決定までは、あといくつかステップがあったようです。その前にそのような連絡を出してしまったミスを学科長・人事委員長の先生はお認めになって謝罪されています。

 

人事委員長のお話では、その学部でそこで決まったこと覆った事例は20数年の間で記憶がないそうです。「(ほぼ)最終決定」が出るのは指示された着任日の1ヶ月ちょっと前(正式な発令はおそらく着任日)であることを考えると、内定をその前のある段階で出す実務的な必要はあると考えられます。

  

この件、もう一点、少し驚くことが。当事者は当初自ら調べて応募したわけでないのです。公募の締切終了後、「インパクトのある人がいなかった」ということで、その大学の人事委員たちが直接目ぼしい研究者複数に声がけをしたとのこと。当事者はその一人で、締め切り後に応募。そういう経緯でそれかと。

 

表に出ている主な理由は、給料が一部出る兼任を提案した、という点と、当事者の研究規模が大きすぎてその大学の学科には収まりきらず研究以外の委員会活動、入試業務などを十分にされないかもしれないという懸念、です。

 

私が考える疑問点は次の通り。

  1. たとえ事務的なものだとしても採用審査過程が完了していないうちは、結果が覆る可能性はある。そのことを十分に伝えなかったのは、大学の落ち度というよりは人事委員会の委員長の責任ではないか。しかもこの人事案件は、採用予定者の研究規模などもろもろの事情でやや特殊な状況であったようにも見える。
  2. 給与に関する採用予定者の提案が不明確である。前任校が「兼任するのであれば、こちらからで人件費を一部負担しますよ。打診してみてください」と提案するとあり、宮川氏も「給料が一部出る兼任を提案」と述べているが、これはどういう身分になるのかはっきりしない。採用予定者の本給を新任校と前任校で分担するという話なのか。専任教員の本給の支給の方法に差を付けるようなことが可能であるとは思えない。たとえば前任校で一定期間非常勤講師や特任教員扱いで時間給をもらうというのなら理解できる。何が「winwin」なのかよくわからない。優秀な研究者を人件費を抑制しつつ採用できるという意味なのかもしれないが、専任教員の給与は新任者だけ特別扱いはできず、大学全体の様々な事情によって決まるものである。採用候補者の給与をどのように取り扱うという提案だったのかはっきりさせない限り、この提案が妥当なものかどうか判断できない。
  3. 新任校を不用意に身構えさせるようなやり方にならないように注意を払うべきではないか。前任校から一定の給与を得たり、兼任で勤務したりすることなどは、採用候補者が新任校に十分な期間在籍してくれないかもしれないという疑念を抱かせる危険性はある。あとでも書くが、大きなラボを引き連れて異動したりすると、本人にやる気があっても、学内業務の分担に支障ができるのではないかという懸念はありえる。
  4. 兼任での勤務形態がどう考えられているのかはっきりしない。前任校にラボを残して兼任したり、人件費や給与を前任校が一部負担したりするような場合、採用後の勤務形態として週何日は前任校に戻るとか、前任校でもいろいろな業務を分担せよとか、様々な制約が付く可能性がある。新任校の側がそうした制約を嫌う可能性はあり、兼任ならばどのような勤務形態でも新任校が受け入れなければならないというのは無理筋に見える。
  5. 学科の人事委員会が大学全体の様々な制約や分担に無頓着なまま採用審査を進めてしまっているのではないか。宮川氏自身が述べているように、大学の研究用のスペースは獲得研究費に依存して決定される場合がある。それ以外にも、賞与や間接経費の配分、校費の配分、委員会や入試等の学内業務の役割分担、研究室受入学生の上限などなど、多くの事柄が学科のスタッフや当人の持つ研究費などによってきめられている。突出した研究費や突出したスタッフの数や突出した学生数を持つ教員が新任として採用された場合に、種々の分担のバランスが崩れる可能性が高く、それを大学側が嫌う可能性はある。本来人事委員会がそうした事情を考慮して、候補者面接を行うべきであり、今回の人事がそもそもそうした慎重さを欠いているようにも見える。
  6. そもそもこの人事は公募の考え方を逸脱しており不適切ではないか。宮川氏の報告によれば、「公募の締切終了後、「インパクトのある人がいなかった」ということで、その大学の人事委員たちが直接目ぼしい研究者複数に声がけをしたとのこと。当事者はその一人で、締め切り後に応募。」とある。公募に適切な人材の応募がなかった場合には再公募を行うべきである。それなしに、公募期間終了後に人事委員会の判断で声かけをして面接候補者を決めたとすれば、もはやそれは公募ではない。宮川氏は

公募に応募すること自体がかなりエネルギーの要ることですし、人生を賭けて抱負を書いたり、ヒアリングの準備したりするのは大変なことです。このようなエピソードで感じるのは、やはり研究者(とその家族・関係者など)は、世間(大学関係者含む)から軽く考えられているのかな、と。

と述べているが、それでは公募期限内に応募した応募者はどうなるのか。能力があったり、大きな研究費を持っていれば、公募締切後の声かけで面接候補に選ばれるというのなら、そもそものはじめから公募などするべきではない。一旦公募をかけた以上、その枠の中で適切な方法で候補者を選ばなければ、そもそも不公正だ。大学名がわかってしまえば、この大学は一見公募をかけていてもその裏で締め切り後に別の候補者に声をかけることもあるのだと認知されてしまう。いずれにせよ、もしこうしたことが事実なら、そもそも今回の採用審査そのものを白紙にし、公募からやり直さなくてはならないのではないか。宮川氏はこうした情報を公開することの重大性を適切に認識しているのか。

 

現時点では、以上の点から、私は、この問題を大学と被雇用者に関する問題一般として受け取ることはできないし、通常の一般企業における採用内定取り消しの問題と同列に議論できることだとは思えない。この事案を拡散していいのか懸念がある。

 

 注:なお、宮川氏から新たな説明があったり、上記の記事内容に不適切な部分があった場合など、随時更新する可能性がある。

2016年12月14日付産経社説を批判する。

産経新聞は2016年12月14日付の社説で、「記述式の入試 人材育てる労を惜しむな」と題する記事を掲載した。

現実の国立大学の二次試験がどのような形式で実施されているかを全く調べず、大学教員に不当な非難を浴びせる極めて悪質な記事であると言わざるを得ない。

産経社説のこの論調は、2016年9月11日付の社説から一貫しており、本ブログでも、既に批判した。

以下、2016年12月14日付の社説について具体的な記述を批判する。

 

記述式試験の実態に対する無知

すでに本ブログでは、

において、新聞各紙が「記述式」の意味を拡大解釈し、国公立大学二次試験の実態を不当に歪めていることを批判した。

今回の産経社説も全く同じ誤りを犯し、国公立大学の二次試験における記述式試験についての実態をミスリードしている。それは冒頭から顕著にあらわれている。

ようやく国立大学の入試で記述式が重視されることになった。

 まったく違う。

国公立大学の二次試験では、英語・数学・国語・理科・社会の主要五教科において、概ね記述式中心か、一定字数の記述式問題が課されている。「ようやく」などという記述は事実誤認である。

センター試験は私大を含め利用大学が増え、定着してきた。その一方、大学によってはセンター試験に頼りすぎ、個別試験で手を抜いていなかったか。

 現行センター試験は選択で答えるマークシート方式だ。前身の共通1次試験時代から「考える力が育たない」と批判があった。

 ならば各大学の試験で記述式を重視すべきだが、現在、国立大2次試験で記述式を課しているのは募集人員の4割にとどまるという。寂しい限りである。

 この記述が誤りであることは既に当ブログで指摘した。高大接続改革の進捗状況に関する文部科学省の文書では、「国語・小論文・総合問題のいずれか一つ以上を課している」のが募集人員の4割だという資料が付けられている。これは「記述式試験」と拡大解釈することは明白な誤りである。この定義では、およそほとんどの理系国公立大学が記述式試験を課されていないことになる。例えば、国公立二次試験で書かれている数学はほとんどすべての大学で記述式である。

 

「個別試験で手を抜く」というのも不当な言いがかりである。国公立理系では、前期日程で概ね英・数の2科目、大学によっては理科の記述式試験が課され、文系国公立では概ね英・国の2科目、大学によっては社会の記述式試験が現実に課されている。後期日程では、試験科目は多少減る大学もあるし、総合問題のような形をとる大学もある。また一部推薦入試の仕組みなどもある。しかし、概ね国公立大学の二次試験では記述式試験が課されているのである。

 

大学教員に対する不当な非難

上で触れた「個別試験で手を抜いている」というのも不当だが、

どんな学生を採り、育てていくかは大学教育の重要な仕事であるはずだ。記述式は採点の負担が増えるといった考えがあるなら、おかしい。

 それとも、受験生の文章の良しあしが見極められないほど大学教員のレベルは低いのか。面接など筆記試験では測れない受験生の能力を多面的に評価することも課題だが、記述式の採点を厭(いと)うような教授らに教育を任せられるか。

 という記述も不当である。大学教員は既に「記述式試験」の採点をしているのである。2月と3月に多くの大学教員が缶詰になって採点作業をしているはずだ。すでに十分負担をしている。どのような学生を選抜するかは大学にとっても大学教員にとっても重要なミッションのひとつである。既に十二分に責任を果たしているのである。採点という作業は確かに労力のかかる仕事である。しかし多くの国公立大学の教員は、記述式試験の採点に労力がかかるからと言って、マークシート式のセンター試験のみで合格を判定したいなどとは考えていないだろう。自分たちの指導する学生を自分たちの手で見極める作業は、たとえ労力がかかったとしても必要不可欠な作業であると自覚しているはずだ。

 

議論の射程の曖昧さ

 大学入試の実態を正確に知らないから議論がぶれるのである。

センター試験は私大を含め利用大学が増え、定着してきた。その一方、大学によってはセンター試験に頼りすぎ、個別試験で手を抜いていなかったか。

 とあるが、議論を国公立大学の話に限定するのか、私立大学の話まで広げるのかで、議論の内容そのものが全く変わってくる。センター試験の成績のみで判定する入試形式を採用しているのは、国公立大学ではなく多くの私立大学である。もちろん私立大学でも自前の入試を行っている大学も多くある。

他方で私立大学は、様々な事情から入試の複線化を行い、入試日程を増やしてきている。一つの大学や学部が複数の形式で入試を行うとそのための個別問題をすべての科目でしかもミスが起こらない正確な問題を用意し、それを採点するのは、時間と人員が必要になる。私立大学の場合、常勤教員だけで人員を確保するのが難しかったり、日程的に合格発表までの期間に採点に充てられる時間が限られていることもあって記述式問題の採点をしきれない大学もあるだろう。これは、傍から見ると大学教員がサボっているように見えるのかもしれないが実態は全く逆である。過密な入試スケジュールの中では到底時間を確保できないというべきである。

しかしこうしたことはさしあたって国公立大学とは別の話である。国公立大学は記述式試験を実施し、時間をかけてその採点を行っている。

受験方式について十分な理解がないから記述が曖昧になるのである。

これを機会に、受験科目が少ない入試も見直したい。昭和54年導入の共通1次は当初、5教科7科目を課していた。センター試験では大学が必要な試験科目を選ぶ形に変わり、科目が少ない大学が増えた。物理を知らない理工学部生など、基礎知識を持たずに入学する学生の増加を生んでいる。

ここでも国公立大学の話がしたいのか、私立大学の話まで含めるのかでまったく議論が変わる。しかもこれはセンター試験の話をしたいのか二次試験の話をしたいのかでも変わる。

センター試験の場合、「5教科7科目」というのは、英・数・国・理科2科目・社会2科目のことだ。理系国公立大学でも社会2科目を課す大学はほとんどないし文系で理科2科目を課す大学もほとんどない。理系国公立でも理科1科目で良いところは多少ある。文系国公立でも社会1科目で良いところは多少ある。しかし、概ね英・数・国・理・社の5科目は課されているはずだ。つまり国公立大学の場合、「5教科7科目」とは言わなくても、概ね5教科の科目が課されている。「科目の少ない大学」というのは概ね私立大学の話である。

他方、二次試験では、すべての科目が課されているとは限らない。国公立でも上位校は理科2科目や社会2科目を課すところもあるが、学科によって学科の内容に関連する専門科目しか課さない大学もある。(それでも記述式という前提は崩れない。)「物理を知らない理工学部生」という話がどのような実例に基づいているのか、この文章だけからでは到底わからないが、たとえばセンターでも二次でも化学だけで合格できる国公立大学もあるだろう。二次試験の科目をもっと増やすべきだというのならそれはそれで一定の理解は可能だが、志願者の全体的な概況などによっても何を課すのが良いかは変わりうるので一概には言いにくい。例えば受験生には科目が多いことを嫌う傾向が一定程度あるので、科目を増やすと成績上位者まで科目の少ない大学へ流れ、結果として科目を増やした大学の入学者のレベルが下がることも残念ながらある。現在の入試実態では、科目を増やせばその科目についての基礎知識を兼ね備えた人材が選抜できるという考え方はかなり危うい、と言わざるを得ない。

 

記述式試験の内容を知らないから内容が曖昧になるのである。

受験生の文章の良しあしが見極められないほど大学教員のレベルは低いのか。

国公立大学二次試験における記述式試験は、英・数・国・理・社の主要五科目で実施されている。そこで問われているのは「文章の良しあし」などという曖昧なものではない。英語ならば英訳・和訳・内容理解、国語ならば課題文の内容把握とその表現、数学ならば与えられた問題に対する発想とそれを裏付ける根拠記述、理科ならば様々な法則に基づいた問題解決や与えられた実験に対する考察理解、社会ならば与えられた課題に対する過不足のない正確な記述などである。単なる「文章の良しあし」などではない、多様な問題群に対する適切な応答が二次試験において記述式試験として課されている。

いわゆる小論文のような試験は大学入試において決して主流ではない。小論文でさえ単なる「文章の良しあし」を判定しているわけではないだろうが。

十分に検討していないから記述が揺れるのである。

新共通テストの国語と数学で記述式問題を加えることが検討されているが、受験者が数十万人規模になるため採点時間などの問題点があった。80字以内といった短文なら可能だとしても、それ以上の長文の記述式は2次試験に任せる方が現実的だろう。

 産経新聞の社説は9月11日に、

記述式の採点には時間がかかるという課題に対し、受験先の大学が採点する案は現実的だろう。

と述べていた。この時点ではどのような方法になるかははっきりと表明されていなかったとはいえ、この社説の執筆者は、80字の記述式も大学に採点させ、しかも長文の記述式も2次試験で扱うのが「現実的」と言うのだろうか。すべて短文であろうと長文であろうとすべて2次試験にゆだねればよい。今の2次試験がそれそのものである。

 

 

 

 

 

 

「国語・小論文・総合問題」を「記述式」と拡大解釈するミスリード

国立大学協会が記述式試験に関する考え方を発表したことを各紙が伝えている。その中に、次のような文言が入っている。

朝日:「国立大の2次試験で、国語などの記述式を導入しているのは募集定員の約4割にとどまっており、」

読売:「国立大2次試験では現在、記述式問題を課しているのは募集人員の約4割にとどまっている。」

毎日:「国立大の2次試験で記述式を課している大学は募集人員ベースで4割にとどまっており、」

産経:「国立大の2次試験で現在、記述式問題を課しているのは募集人員の4割程度にとどまっている。」

 またNHKも次のように伝えている。

NHK:「文部科学省によりますと、国立大学の2次試験で記述式を導入しているのは現在39.1%にとどまっていますが、」

 

これらの報道は、国公立大学の二次試験の現状を著しくミスリードする内容である。まず、この報道の根拠は、文科省が発表した「広大接続改革の進捗状況について」と題された文書にある次のデータに基づいていると考えられる。

f:id:rochejacmonmo:20161209082509j:plain

http://www.mext.go.jp/b_menu/houdou/28/08/__icsFiles/afieldfile/2016/09/01/1376777_01.pdf


ここにはっきりと明記されているように、この数字は、

「国立大学の二次試験においても、国語、小論文、総合問題のいずれも課さない募集人員は、全体の約6割にのぼる。」

ということである。ところが上の報道では、「記述式試験を課しているのが4割」という記述にすり替えられてしまった。具体的な科目名が限定されていたはずなのに、報道される際に、範囲が拡大されてしまったのである。(NHKに至っては、「募集定員ベース」という情報も抜け落ちたあげく、39.1%というのはおそらく前期試験のデータである。)

 

例えば、国公立理科系学部の前期日程の中で、国語を試験科目として課しているのは東大と京大しかない。もちろん小論文や総合問題を課す大学も前期日程では極めて少ない。したがって、上記の4割という数字の中に、大部分の国公立大学理系前期日程の募集定員が含まれていないことになる。

 

例えば河合塾の入試速報サイトに行って前期日程の解答例を見てみるとよい。

国公立理科系に課される数学の試験の場合、完全に白紙の解答用紙に答えまでの導出過程をすべて記述させる形式が一般的である。

f:id:rochejacmonmo:20161209083911j:plainf:id:rochejacmonmo:20161209083914j:plainf:id:rochejacmonmo:20161209083923j:plainf:id:rochejacmonmo:20161209083927j:plainf:id:rochejacmonmo:20161209083918j:plain

例えば、上は、岐阜大、名古屋工業大、大阪市大、東大、京大の解答例の一部をスクリーンショットしたものである。こうした国公立二次試験の数学を記述式でないなどと判断するとしたら、その判断は明らかに誤りである。そのような分類をしてしまったら妥当な議論などできようはずもない。

 

国公立理科系の二次試験では、英語や理科も課されることが普通である。これらの科目は、マークシート方式で実施されているところはおそらくほとんどないと思われるが、解答の形式が選択式や答のみを記述する形式が中心となっている大学も多い。しかし多くの大学で、一部記述式の解答を求めたり、理科では解答用紙が数学同様ほぼ白紙なものが与えられてそこに記述する形式の大学もある。

 

例えば先ほど例に挙げた大学の場合、

岐阜大は、英語はすべて選択式、物理は導出過程を書かせる記述式、化学は答のみを書かせる形式だが記述式もいくつか入る形式、生物も答のみを書く形式が中心だが、比較的長い記述を求める問題が数問入る形式である。

大阪市大は、英語は選択式と和訳・内容把握・英作文などの記述式が混じった形式、物理は導出過程を書かせる記述式、化学は答のみを中心とし、いくつか記述式が含まれる形式、生物や地学は答のみが中心だが、やや記述量が多い問題が含まれる。

名古屋工大は、英語は選択式が中心だが、英作文も含まれる形式、物理・化学いずれも答のみを書かせる形式が中心だが、一部に描図や導出過程の説明を求める形式である。

 東大は、英語では要約問題、英作文、和訳などの記述式問題と選択式問題を組み合わせた形式、物理はほぼ白紙の解答用紙に記述する形式、化学・生物・地学は答のみを書かせる問題もあるが、導出過程や論述を求める問題も多く、解答用紙はほぼ白紙のものがつかわれる。

京大は、英語では選択式は少なく、和訳と英作文で構成される形式、物理や化学は答のみを書かせる問題が中心だが、描図や導出過程を書かせる問題も近年は徐々に出題されるようになっている。生物・地学には字数の多い論述が多数含まれる。

 

例えば河合塾の入試速報サイトなどを見れば上記のことはすぐに確かめられる。 

これらの実例からもわかるように、国公立の二次試験において、数学はもちろんのこと、英語や理科でも記述式問題は多数取り入れられており、これらの大学はすべて「記述式」問題を出題している。

 

そもそも、「国語・小論文・総合問題」に科目を限定して「記述式」云々の議論をすること自体が妥当ではない。しかしそれを「記述式問題」一般に拡大解釈してしまっては、実際の入試状況をミスリードするものになり極めて不当であるといわなければならない。文科省の担当者が意図的にミスリードしているのか、それとも単に現状をしらないだけなのか、取材する側も意図的に歪曲した報道をしているのか、それとも現状を調べようともしていないのか、いずれにしてもこのような議論はまともでない。

 

ちなみに、国語の問題でも選択式の設問はあるし、総合問題という形式をとっていても、実質的には個別科目の問題を並べただけという出題もあり、必ずしも「複数教科を総合して学力を判断する」という説明が適切とは限らないことにも注意したい。

 

 

 

 

 

 

 

80字で測れることは何か?

新共通テストに関して、国大協が「記述式は不要」という見解を出したという一部報道(その後国大協側は否定)があった。

News Picsというサイトでは、この記事に関してこんなコメントが付いている。上の方から順番にいくつかを抜き出してみる。

西田 亮介  東京工業大学 准教授

メンツと落とし所の問題なのだろうけど、もはやここまでくれば新テスト国語に記述式必要ないのでは。80文字以下って、Tweet以下ですよ…。

 

早崎 公威 忠北大学 天文宇宙科学科 助教

文科省が、解答文字数として80文字超と80文字以下の二つの問題を出題する提案をしたとあるが、そもそも80文字という基準は何を根拠にしているのだろうか。少なくとも学力を測定するのに十分な文字数であるとは言えないだろうし、採点コストを考えてのことなら、記述式テストの導入は現実的ではない。

 

Mori Riku 次世代グローバル政策研究フォーラム 代表
「80字を超えるものは実施不要」というのなら、従来のマーク方式から変更する必要はない。字数制限80字の記述問題で何が図れるというのだろう。採点者の負担が増えるだけ。

 

塩本 高之 恵寿総合病院 臨床検査技師
思考と知識、大学で学問をする上でどちらも大切です。しかしながら、知識は後付けしやすい、ググればわかる、ということを考えると、やはり思考をとるべきなのかなと思います。(採点コストは考えず)その観点から考えると、まず記述問題はやはり必要なのではないでしょうか。
ではどの程度の文量が必要か、ということになりますが、そこは詳しくないのでわかりません。少なくとも80字の小論文問題に遭遇したことはありません。(子供の日記じゃあるまいし……)

 

中村 卓 学力工房 代表
そ・ん・な・の、無意味!まず、採点ならば、外部(例えばBenesseなど)で今現在、全国規模の記述の採点をしている業者があるわけですから、自前主義を捨てれば、出来るんです。字数なんか関係ない。これを考えている人は、自分たちの狭い了見だけで考えていて、この日本、世界で現在行われている実際のオペレーションを何も見ていない。所詮、見かけの変化を出すためだけにやるならば、大いなる無駄、なので、今のままでいいです。話にならないレベル。80字なんて、小5でも書きます。普通に。

 

Ichino Misato 編集者/元教師/東京大学大学院 情報学環 在学中

①最初の設定で、なぜ80文字を基準にしたんでしょうか。
AIで採点できそうな文字数だから?
過去の何かの実績から?
80文字って、論理力ではなくて、定型の文を書けるかどうかになってしまうのではと思います。

②80文字が不要という理由は?
議論の過程を見せてくれないと、何なのか理解できないです。

国語がそうなると、他教科にも影響してくるので、本当に早く決めてください...。

 

石川 健 株式会社エディトリアルハウス 代表

記述式問題の導入は良しとしても、出題側の都合が優先されているような感じです。記述による解答が80文字以内とは、意味合いを逸脱しております。簡潔明瞭に記述することは必要ですが、80文字で何を表現できるのでしょう。

 

Matsunaga Masaki 九州大学 QREC 特任准教授

そんなもん「記述」と言わん(苦笑)。がっつりエッセイ・面接できないんだったら、信頼性妥当性が担保されたペーパーテストにしましょうよ。

 

榊 礼武 自営業 事業主

tweetより短いってどうよ。こんな試験の為に頑張っている学生が可哀そうで残念です。論理的思考に基づく長文記述こそ、社会に出たときに役立つスキルなのに。でも、1次試験だから、記述要らないのか。だったらマークシートのみでいいんじゃないの?

 こういうコメントをする人は、実際の国公立大学の二次試験がどのような形式で実施されているかということについてほとんど何も知らないのではないだろうか。一度、河合塾なり駿台なり代ゼミなりの入試速報サイトに行って、実際にどういう問題が出題されているのか調べてから発言した方が良い。

 

例えば、東大の国語の試験第一問は文理共通の問題だが、1個1個の小問は、おおよそ60字~80字前後の字数でしか記述できない形式である。最も字数の多い設問でさえ120字。ツイッターの140字よりも長い記述を求める設問はない。京都大学の国語第一問でも、小問ひとつひとつは概ね100字~120字程度の記述である。

 

ではこのひとつひとつの小問、特に東大現代文第一問の小問1個では、思考力・表現力はなにも測れないというのであろうか。課題文における筆者の主張の根拠を説明したり、筆者の主張の内容を説明する記述式問題において、80字というのはごく一般的かあるいは一般的な字数よりも少し少ない程度である。多くの現役生が最初に記述式模試を受けて十分に点数を取れないことが多いのは、無駄を削り、必要なことは漏らさず盛り込んで解答をまとめるという作業が、決して低いハードルではないことを意味している。これは、思考力や表現力を問うために十分に意味のある出題であると言えるだろう。そして実際に国公立の二次試験では、その範囲で的確な出題をする努力が重ねられ、実際大部分ではそうなっている。

 

問題なのは字数ではない。何を問うかである。そのことが十分に理解できていない人は、あまり安易な発言で議論を歪めないで頂きたいと思う。

 

 

 

記述式試験の採点は公平に行われている

記述式試験は公平でないという意見

現行の大学入試センター試験の後継として計画されている新共通テストでは、記述式の問題が出題され、民間業者への委託と大学教員による採点とが導入される方向で検討が進んでいる。

私は、少なくとも現状では、提案されている国語の問題例のような出題を各大学の教員に採点させる方式には反対である。記述式試験は現行通り二次試験で課されるべきであると考える。それらの理由は、最近の動向も含めて別の記事に書きたいと思う。

もちろん、高大接続システム改革会議での議論に見られるように、記述式問題を出題するべきだと考える論者も多いことは事実である。現行の大学入試センター試験のマーク式という方式に問題が多いと考える議論である。例えば、

「そこが聞きたい 新共通テストの狙い 安西祐一郎氏」(毎日新聞

http://mainichi.jp/articles/20160316/ddm/004/070/005000c

の中で安西祐一郎氏は、

現在のセンター試験のような多肢選択式のテストの場合、問題の解き方は与えられた選択肢の中から正解を一つ見つける、という方法になりがちです。すると、勉強の仕方もそれに合わせた形になってしまいます。例えば、国語の長文読解問題では、全文を読んで理解して解くのではなく、設問に関連した部分だけを読んで選択肢の中から正解を見つけるという傾向が成績上位層ほどある。明らかに誤った選択肢を除いていき、最後に残った選択肢を選ぶ、という解き方も見受けられます。

 これから労働生産性が低迷し、グローバル化が進むなど厳しい時代を生きていくためには、主体性を持って問題に取り組み、文章を書いたり図を描いたりして自ら答えを見つける総合力が求められる。そうした力は「大学の個別入試でみればいい」という指摘もあるが、国の共通テストでやることに意味があります。

 と述べており、記述式導入を訴える多くの論者の議論の共通部分はこうした認識だと思われる。この認識そのものが妥当かどうかについてはここでは触れない*1

ここで取り上げたいのは、記述式という方式に関して、むしろ「公平性が損なわれる」といった反対意見が語られることである。

 

この記事に、Newspicksというサイトで寄せられたコメントの中に次のようなものがある。

高橋 孝輔 新潟県アメリカンフットボール協会 理事
センター試験の受験者数は56万人。

例えば採点を15営業日で終わらせないといけないとする。
受験者1人の採点時間を10分とする。

さて、何人の採点者が必要でしょうか?

1日8時間として計算すると、777人。

777通りの採点基準。

 

堀 義人 グロービス経営大学院 学長 グロービス・キャピタル 代表パートナー

記述式の問題点は、採点者の主観に左右されバラツキが生まれ、不公平感があるところだ。一層の事AIに採点させたらよい。そっちの方が、不公平感は無い。グロービスは、入学願書とレポートの一次採点をAIにすることを検討中。

 

MINOWA MAKOTO 創医塾京都 塾長

採点実務で最も重要(受験生にとって)なのは採点基準です。
絶対、必ずばらつきます。全国55万人以上が受験するのです。そして全国の採点者の所属組織もバックグラウンドも千差万別です。
やってやれないことはない、と押し切って思いもよらない不利益を被るのは受験生です。

というようなコメントである。こうした人たちはさしあたって大学教員ではない人たちだが、中には大学教員であっても記述式試験が公平でないと主張する人もいる。

例えば、武蔵大学の教員である千田有紀氏が自身のツイッターで次のように発言している。

 

 

 

この2つのツイートでは「信用」という言葉が異なった意味で使用されている。前者では、採点者によって採点基準が違うがゆえに点数が異なることを信用できないといっており、後者では教員は採点ミスをするから信用できないといっている。前者は次節で述べるように通常ありえず、後者はどのような試験であれあってはならないことで、これも起らないように二重(以上)のチェックがかけられている。千田氏の発言は不当である。

 

実は上の安西氏のインタビューの中でも、次のような発言がある。(言わずもがなのことだが、安西氏はもともと慶応大学の教員であった人物である。)

−−記述式の採点はどうしますか。

 基本的には人が行います。文科省の試算では、受験者53万人分の解答用紙を1日800人で採点した場合、解答文字数が200〜300字の長文と80字以内の短文を組み合わせて計6問出題すると、最長で約2カ月かかる。短文記述式3問だと最長で25日程度です。コンピューター技術を活用するなど工夫次第で短縮できます。また、出題する時に「2段落構成で」などの条件をつければ、それをクリアしているものと、していないものを最初に選別することもできます。解答用紙を機械で読み込んで電子化し、似ている文章同士を集約して採点すれば、採点のばらつきも減らせるはずです。採点の労力を軽減するのに人工知能を使うことも考えられるでしょう。

 「採点の公平性が保たれるのか」という指摘がありますが、そもそも大学入試を受けるまでの段階で公平なのか考えてほしいと思います。家庭の所得格差が学歴格差の要因になっている。トップレベルの大学の入学者には高所得層の家庭の子どもが多いという状況もあります。そうした中で、新テストの記述式問題の採点部分だけを取り出して公平性を問うのは違和感を覚えます。機会均等の面から入学者選抜や評価に関する公平性をとらえる必要があります。

 つまり、安西氏も、記述式の採点の場合、採点がばらつくことがありうると考えていることになる。

 

現行の大学入試では、国公立の二次試験を中心に多くの国公立・私立の大学、幅広い科目で、記述式試験が実施されている。そうした状況において、上であげたようなコメントは、あたかもそれらの記述式試験の採点が公平性に欠けているかのような印象を与えるもので、非常に危険だ。

 記述式試験の採点は受験者間で公平である

同じ答案が採点者によって異なる評価を与えられるのではないか

 おそらく上にあげたようなコメントをする人は、次のように考えているのではないか、と思う。

  • ある試験問題の答案に対し、2人の採点者AとBがチームを組んで採点作業を行うとする。
  • 受験生Sの答案を採点者Aは満点とした。
  • 受験生Tの答案はSと全く同じ記述の答案であるにもかかわらず採点者Bは減点した。

このような状況が起きると受験生SとTの公平性が損なわれているということなる。

採点基準は厳密に統一されている

しかし、上で述べたような受験者間で採点に違いが出るということは通常ありえない

採点において採点基準を統一する以上、採点者Aと採点者Bの採点が同じ答案で異なることは起こりえないのである。

 

本ブログでは、前の記事で「PISAの落書き問題」を例に、記述式試験の採点のむずかしさについて論じた。


しかし実際に採点する際に、たとえば「落書きを正当化したかったので。」という回答を誤答とするという採点基準を決めたならば、採点者Aと採点者Bでその判断が食い違うことはありえない*2。受験者間での公平性は担保されている。

 

ちなみに、A・Bとは違う別の採点者甲と乙のチームがこの問題の採点を担当した場合、A・Bのチームと同じ採点基準になるとは限らない。例えば、A・Bのチームは「落書きを正当化したかったので。」を誤答とする採点基準で採点作業を行ったが、甲・乙のチームでは「落書きを正当化したかったので。」を正答とする採点基準で採点作業を行うことはあり得る。しかし一つの試験問題はひとつのチームが採点作業を行うのだから、同じ答案を書いた受験生の得点が採点者によって異なることはあり得ないのである。

 

奈良女子大の鴨浩靖氏は次のように言っている。

 この発言は厳密には少々勇み足の感もある。受験者数の多い学部や採点期間が短い大学など、答案を一人で採点できるとは限らない大学もそれなりにあると思われるからだ。また、答案の採点には、多くの場合採点者とチェック者がいるから、最低でも2人以上の眼で見ている。(予備校の模試などでも同様。)採点者とチェック者の間では採点基準を明確に言語化して伝達しあい、同じ採点者でも採点の揺れや見落としが起きないようにチェックしているはずだ。

重要なことは、国公立二次試験で課されている記述式試験の採点者は、各問題ごとに非常に少数で組織されており、採点基準は厳密に統一され、同じ内容の答案に異なる点数が付くという形で受験者間の公平性が損なわれることは通常ありえない、ということだ。

 採点基準は多様である

採点基準が偏っているのではないか

記述試験が公平でないという意見のもうひとつの側面は次のようなことではないか、と思う。

  • 採点チームが合議によって決定した採点基準には偏りがあるのではないか。

 上で述べたように、ひとつの試験で採点を行うチームは固定されているので、受験者間での不公平は通常生じない。しかし、別のチームが採点を行う場合に採点基準が変わりうるなら、そもそもそうした採点基準そのものが適切なのか、という疑問を持つ人もいるかもしれない。

PISAの落書き問題」の場合、「落書きを正当化したかったので。」という回答を正答だと考える人から見ると、もしこれを誤答とする採点基準が採用されていたら、その採点基準は偏っていると考えるかもしれない。

また、問題の出し方によっては、上で述べたような合議によっても採点基準の統一化を図ることが難しく、採点者の主観的な判断に左右されやすいものもありうる。例えば、

「安保法制に賛成か、反対かいずれかの立場を選択してあなたの意見を1000字以内で述べよ」

 というような非常に雑駁な問題を出題すると、どのような内容の議論が論理的/説得力のある議論かを合議によって統一することはかなり難しいと予想される。反対の立場の採点者が賛成の立場の議論に「説得力」を認め得ない状況もありえる。逆も然り。このような問題だと採点者によって採点にばらつきが出ることを防ぎにくくなる。

 試験問題は十分検討されて作成されている

これらの観点は、一般論としては妥当かもしれないが、現実にはそうした懸念は通常無用である。

そもそも、大学入試で出題されている記述式試験においては、採点者の主観的な立場などが入り込む余地がないように事前に検討が行われているということである。国公立二次試験を中心に行われている記述式試験では、そもそも自らのコミットする主張について論じる形式の「小論文試験」は非常に稀である。理系科目では妥当な論述の枠が明確だが、文系科目でも、例えば国語なら課題文の読解が中心であり、英語でも課題文の内容把握や文法的な観点を重視した英作文が大部分である。地歴系の科目でも実際には問題文などで解答すべき内容と方向性を限定することが大半である。記述式試験では、事前に問題が十分に検討され、どのような答案が出てくるかも想定したうえで、正答に幅が出ないように調整されている。

つまり、「PISAの落書き問題」や「安保法制に賛成か、反対かいずれかの立場を選択してあなたの意見を1000字以内で述べよ」などという問題は、大学入試問題としては適切さを欠いた問題であり、現状の大学入試における記述式試験ではこうした問題の出題は通常ありえない。

小論文試験であったとしても、多くの場合は、課題文が掲げられ、その内容を要約したり、課題文の議論に自分の議論を対置させる形式を要求したり、あるいは解答字数を少なくして答案のぶれを抑えるなどの多くの工夫が行われている。

従って、通常の記述式試験において、採点者の主観に基づく採点基準の偏りが顕在化するような事例は起こりえないと考えてよい*3

 現実の入試における採点基準の多様さはもっと複雑である

 入試における採点は、確かに一面では受験生の到達度評価という意味を持っているが、現実的には、選抜という側面が重要である*4。満点や零点に成績分布が偏るような問題は、受験生を選抜する=差をつけるという目的から見ると適切ではない。逆に言えば、受験生の答案全体を見ながら差が付くように採点基準を決めていくことになる。

安田亨氏の著書の中に、東京工業大学のある入試問題では、「nに関する帰納法で証明する」と書いただけで、満点の1/3の加点があった、というエピソードが登場する*5。これを完全に真に受けてよいかどうかは別としても*6、現実の入試の採点基準は、実際に全受験生が書いた答案を見ながら作成される。

上で引用した鴨浩靖氏のツイートにも書かれているように、学部や専攻ごとに採点基準は変わりうる。ある試験問題について、X学部では全体的に出来が良く、別のY学部では全体的に出来が悪いということがありうる。また医学部系と理工系を同一問題で試験した場合には、総じて医学部系の方が出来が良い。こうした事情から、同一問題で試験が行われたとしても、2つのX学部とY学部で見た場合、出来具合を勘案して、X学部ではより厳しい採点基準、Y学部では少し緩い採点基準が採用されることがある。X学部では減点された答案と同じ答案がY学部では満点とされる場合もありえる。入試における採点はそもそも満点が一切の論理的瑕疵のないことと同義であるとは限らないのだ。

もちろん同一問題で実施されている試験で2つの学部を併願できない以上、X学部の受験生全体で受験者間は完全に公平、Y学部の受験生全体で見ても受験者間は完全に公平であることは言うまでもない。

 

このように、採点基準は、受験生の答案全体を見て、得点分布に差がつくように設定されるものであり、論理性や内容の適切性のみが唯一の基準というわけではない。従って、現実の入試における採点基準は、問題だけを見て唯一こうあるべきなどと論じられるものでは、そもそもないというべきである。受験者間での公平性が担保されていれば、採点基準そのものは学部や専攻ごとに柔軟に変えざるを得ないし、内容的な観点よりもむしろ差をつける観点の方が重要なくらいなのである。

 

まとめると、合議によって作成された採点基準が偏っているのではないか、との懸念には、

  • 通常採点基準が特定の採点者の主観に影響されるような形になる問題は出題されない。
  • 正答の幅が限定されるように十分検討されているため、偏った内容が正答とされるような採点基準にはなりにくい。
  • むしろ採点基準は、答案の間の得点差を付け受験生の選抜に資するようにするため、全受験生の出来具合に強く影響され、学部や専攻ごとに変更される。従って、問題だけを見て採点基準が偏っているなどと論じることにほとんど意味はない。

 とこたえることになる。

 

 

 

 

 

*1:例えば、国語の問題と成績上位者の解き方に関する議論は微妙であると思う。

*2:念のため注意しておくが、私が「落書き問題」を例に指摘したのは、採点基準を合議で決めるプロセスに時間がかかること、そして問題の質が悪いとその作業は非常に負担が大きくモチベーションが維持できないのではないか、という点であって、採点が不公平だということでは決してない。

*3:通常と書いているのは、現実には十分に内容の検討が行われていない出題などもあり得るためである。ここには直接的には書かないが、酷い事例もいくつか見聞きしている。

*4:これは予備校の模試と実際の入試の位置づけが全く違うことも意味している。

*5:『入試数学 伝説の良問100』講談社ブルーバックス p.69

*6:実際にどう採点されたかを知る術は私にはないので、安田氏の記述がすべて真実その通りかどうかはもちろんわからない。

【新共通テスト記述式】産経新聞9月11日付「主張」を批判する

9月11日付の産経新聞に「主張:大学入試改革 豊かな知識で学ぶ意欲を」と題された記事が掲載された。

私がこの記事に対して批判したいことは次の2点だ。

  • あたかも大学側が怠惰であるかのような不当な非難
  • 入試科目を増やすという提案に対する具体例の欠如

「論点整理」を無視して大学側だけを非難する不見識

大学入試はどう変わるのか。センター試験に代わる新テストの概要など入試改革の進捗(しんちょく)状況を文部科学省がまとめた。

 思考力や表現力を重視するあまり、知識軽視となっては「ゆとり教育」の二の舞いになる。各大学の個別試験を含め、しっかり学ぶ教育につなげてほしい。

 新テストで、国語と数学に記述式問題を加えることは評価できよう。センター試験の前身の共通1次試験時代から、マークシート方式に対し、「考える力が育たない」との批判があった。

 記述式の採点には時間がかかるという課題に対し、受験先の大学が採点する案は現実的だろう。大学の負担が増えると反対するのはおかしい。どんな学生を採り育てていくか、大学の責任は重い。採点が面倒だと考える大学教員がいるなら、意識を変えるべきだ。

 この記述の後半が産経記事の最大の問題点である。

まず第一に、記述式試験の採点を大学側が採点するという案を「現実的」と評価するなら、少なくとも、国立大学協会が「論点整理」の中で提示した問題点について明確な回答を与える(ことができる)べきだ。産経記事では、「負担」の問題についてだけ直後の文章で書いているが、それ以外の問題点がさまざまなに指摘されていることを結果として隠蔽している。この方式の問題点は、採点の負担だけではない。

国立大学協会の論点整理では、負担の問題以外に、本文中で、

  • 大学(学部)によって対応が分かれる可能性

が指摘されている。現在すでに記述式試験を2次試験で課している大学が新共通テストの記述式問題を選抜基準から外す可能性である。

さらに別紙の中で、次の9項目の課題・論点を示している。

新テストの共通試験としての性格
全ての問題を統一的に採点処理しなければ、共通試験としての性格が失われるのではないか。
センターによる採点基準の設定等
センターはどの程度の採点基準を示すのか。解答例や採点例まで示すのか。段階別表示の方法を含め、各大学における採点にどの程度の裁量を与えるのか。
センターによるクラスタリング等の前処理によって、各大学の負担はどの程度軽減されるのか。
センターで3段階程度の大まかな段階評価を行い、それをそのまま使うか、さらに詳細な評価を行うかは各大学に任せるというような制度設計はあり得るか。
各大学における採点
自ら作成したものではない試験問題について、出題意図や採点基準の的確な把握と採点者間の共通理解の下に、責任ある採点ができるか。結局、作問も各大学が行う方が良いということにならないか。
受験者が前期・後期など複数大学を受験する場合、同一答案について、大学により点数に差があっても問題はないか。
第1段階選抜、推薦入試・AO入試における新テストの結果の利用
各大学が第1段階選抜を実施する場合や推薦入試・AO入試において新テストの結果を利用する場合には、記述式以外の点数のみを利用することでよいか。
実現可能性・セキュリティの確保
新テストを受験した全受験生の中から、出願のあった各大学別に受験生の答案を整理・選別し送付すること等が物理的に可能なのか、また、送付する(複数大学に送ることもあり得る)ことによる漏えい、紛失等を防止するための技術的な措置は可能か。
問題内容の充実の程度
この方式を採ったとしても、試験時間の制約が存在すると考えられるが、どの程度問題内容の充実(字数、問題数)を図ることができるか。受験生の負担や実施体制を考慮しつつ、十分な試験時間をどのように確保することができるのか。
新テストの記述式利用に関する各大学の裁量
個別試験で記述式を全受験生に対して実施している大学・学部は、入試要項にアドミッションポリシーを明記し、新テストの記述式を利用しないことを認めることができるか。
大学関係者の理解・協力
記述式試験の実施が高校教育の質的向上を図る目的であるならば、国立大学のみならず、公私立大学を含めた多くの大学が入学者選抜にこの試験を導入しなければ効果がない。公私立大学関係者の理解と協力を得ることが可能か。
採点実施に係る財政措置の問題
各国立大学が大学入試センターの代わりに実施する採点に係る経費についての財政措置をどうするのか。

 これらの課題・論点に整合的にこたえられない限り、大学側が採点する方式を「現実的」などと断定することは不当である。

 

第二に、「負担」に関する議論で大学側を非難するのは一方的すぎる。産経記事は、「採点が面倒だと考える大学教員がいるなら、意識を変えるべき」と非難するが、これはあまりにも不当である。その理由の一端を述べれば次のようになろう。

  • 一口に大学と言っても、現実にどのような選抜方式を用いているかは極めて多様である。現在、国公立大学センター試験の成績と記述式問題を含む二次試験を独自に課して入学者選抜を行う方式が一般的であり、この観点からみれば自らの大学で育てる人材を選抜するために、既に記述式問題の作問と採点に相当の労力と時間をかけて自前で行っている。
  • 今回の新共通テストにある記述式試験は、与えられた採点基準と自分の大学のアドミッションポリシーに基づいた採点が求められているが、自らが作問に関わることはできない。そのような問題の場合、出題意図を共有できず、また採点基準の妥当性について採点者が十分な合意を得ることは極めて困難である。そのような形で採点を行うことは現実的にかなりの労力を伴い、場合によっては相当な苦痛を伴う。
  • そもそも記述式試験で出題される内容が、自分たちの大学の求めるアドミッション・ポリシーと整合的となる保証もなく、「どんな学生を採り育てていくか」とはおよそ無関係の問題の採点を行わなければならない能性も決して低くない。
  • 現在記述式試験を課していない大学の多くは私立大学である。これらの大学が大学側が採点するという方式を採用しづらいのは、単なる怠惰や意識の低さや無責任だからではない。ひとつは大学独自の選抜試験の実施時期とセンター試験実施時期とが石器真しているためにそもそも国立大学とは採点にかけられる時間的余裕が全く違う点である。また、これらの大学は入試の複線化にともなって多数回の試験を実施しており、受験者数も多く入試日程も過密になっている。そのような状況で受験者全員の記述式試験を統一した基準で採点するために必要な時間と人員の余裕が極めて少ない。

例えば上智大学(私立)の一般型の選抜試験は、センター試験を利用せず独自の試験を行っている。例えばマークシート方式や、記述式とは言っても単に答だけを書かせる方式が多数盛り込まれている。もちろん解答の過程を書かせる記述式や字数の多い記述式の問題もある。上智大学の入試日程を見ると、例えば、2月4日から2月9日までの6日間、毎日一般型の入学試験が実施され、(面接などを課さない学部学科の場合は)概ね5,6日程度で最終的な合格発表が行われている。この型の入試の場合、2015年度は6日間全体で1,385名の定員に延べ23,114名の志願者があった。ちなみに出願締め切りは1月25日であったから合格発表まで20日前後しかない。

 

これらの観点だけを見ても、大学側が採点するという方式のデメリットは、単なる「負担増」や「面倒だ」という感情的な面とは全く異なっている。こうした「現実的」観点を見落として大学側の怠惰や意識の低さや無責任を批判するのは極めて不当である。

 

何を批判するべきなのかが曖昧

思考力や表現力を重視するあまり、知識軽視となっては「ゆとり教育」の二の舞いになる。各大学の個別試験を含め、しっかり学ぶ教育につなげてほしい。

という記述は、全体として誰に何を要求しているのかが曖昧である。高大接続システム改革会議の最終報告は、個別大学の入学者選抜について、次のように述べている(p.43-44)。

具体的な評価方法としては、例えば、次のようなものが考えられる。
・ 「大学入学希望者学力評価テスト(仮称)」の結果
・ 自らの考えに基づき論を立てて記述させる評価方法
・ 調査書
・ 活動報告書
・ 各種大会や顕彰等の記録、資格・検定試験の結果
・ 推薦書等
・ エッセイ
・ 大学入学希望理由書、学修計画書
・ 面接、ディベート、集団討論、プレゼンテーション
・ その他
今後、各大学の入学者選抜において、「学力の3要素」を評価するため、「大学入学希望者学力評価テスト(仮称)」の導入による「知識・技能」「思考力・判断力・表現力」の十分な評価とともに、調査書や大学入学希望理由書、面接など多様な評価方法を工夫しつつ、「主体性を持って多様な人々と協働して学ぶ態度」についての評価を重視すべきである。

産経記事の執筆者はこうした方針についてどう考えているのだろうか。そもそも今回の入試改革の大きな方針は、1点刻みの選抜から脱却し、個別試験でも上記のような「筆記試験以外の方法」を採ることを推奨することにあったのではないか。もし産経記事がそうした方向性に反対するなら文科省や上記最終報告書についてもっと直截に批判するべきだ。

 マークシート方式に対し、「考える力が育たない」との批判があった。

 という部分も内容が曖昧だ。マークシート方式の試験で全方位的な学力が測れるはずはないし、記述式試験に比べれば難易度も下がることは間違いない。しかしだからといってマークシート方式の試験に解答するために「思考力」が全く必要ないなどという議論は乱暴である。国公立大学で言えば、マークシート方式のセンター試験は事実上の「資格試験」であり、基礎的な内容全般を把握しているかどうかを短時間で網羅的にチェックする試験として十分な意味を持ち、しかも多くの科目で、ただ単なる用語選択ではなく、長めの記述の正誤判定や内容理解・資料の読解や考察といった内容を含むよう工夫が重ねられてきている。

他方、マークシート方式の試験のみで合否を判定する私立大学入試も多くある。それらの入試で学力が十分に測れないと批判することは可能ではある。しかし、これにも制度的な限界を十分に想像できていない面もある。

第一に、受験者数と試験の回数が多く、すべての試験で記述式の問題を作問・採点するだけの物理的な時間・人員の確保が難しい。

第二に、そもそも受験生のレベルを考慮すると、記述式試験では選抜に資する得点分布が得られない危険性もある。一般的にマークシート方式より記述式試験の方が難易度が上がるからである。

 

入試科目増を求める具体例の乏しさ

産経記事の後半では、

新テストに注目が集まるが、私大の推薦入試を含め、個別試験の改革を忘れてはならない。とくに受験科目が少ない入試の見直しを求めたい。

と入試科目増を求める記述がある。

受験科目を減らした「軽量入試」につながり、物理の知識がない理工学部生や数学が分からない経済学部生を生んできた。苦労するのは入学後の学生であり、その教育にあたる大学自身である。

 豊かな知識が身についてこそ、その先を学びたいとの意欲や創造力につながる。入試改革にあたって文科省などは明確にメッセージを発すべきだ。

 とある。「軽量入試」を批判する主旨は理解できる。しかしこれは、文科省のメッセージで解決できるような問題かどうかかなり疑わしい。

例えば一時期国公立医学部でセンター試験と2次試験で合計理科3科目を必須とした時期があった。しかし理科2科目のままとした医学部に志望者が流れ、結果としてそうした大学の偏差値が急騰したという事例もある。一部の大学が「科目増」をしても、それらの大学から受験生が離れるというだけという傾向があることは否めない。

しかし産経記事は

受験科目を増やしても、教育内容が伴うことで意欲ある受験生が増えた大学もある。

という。具体例を挙げるべきである。こういうことは宣伝になるのだから、具体例を明示しない理由はどこにもないはずである。この事例が十分一般的なものであれば大いに参考になるであろうが、この記述だけからではどういう事例なのかまったくわからない。