【新共通テスト記述式】大学側が採点する方法に反対する-特に採点の観点から-

前回までのまとめと今回の内容


という2つの記事で、8月19日付朝日新聞1面記事4面解説記事および8月20日付朝日新聞記事の内容を見つつ、編集委員 氏岡真弓氏を批判してきた。

最初の記事では、主として記事化の経緯の不明確さに対する説明を求め、2つ目の記事では、氏岡氏の「記述式試験」に関する見識の危うさを指摘した。

あまり氏岡氏ばかりを批判ばかりしても大人げないかもしれないので今回の記事では少し視点を転じて、私が、「大学側が採点する」という方法に反対な理由について少し書きたい。もちろん氏岡氏の上記の朝日新聞記事も念頭にあるが、国立大協会入試委員会がまとめた「論点整理」にも不用意な点があることを指摘する。

私は反対だ。

ところで、今回の新共通テストにおける記述試験の採点については、当初AIの活用も言及され、高大接続システム改革会議の最終報告の中にも、AIを活用して、記述答案の「下読み」=クラスタリング(類似した解答ごとにグループ化)を行わせる案が記載されている。(p.57)
今回の朝日新聞の記事を受けて、AIの活用に言及するツイートやコメントもいくつか見受けられた。例えば、

大学入試の記述式の採点とか人工知能で十分。ます分量書いてるか、必要なキーワードが入っているか、論理的な文章になっているかどうか。そこを満たせない人を落とすので良い。人工知能以下なら大学教育しても無駄だし。


もちろん批判的な意見もある。

センター試験記述式、去年は人工知能が採点すると報道されていた。それが急に大学教員が採点すると。人工知能は、人工知能はどうしたんだ。誰が提言したんだ。そんな夢物語をベースに試験改革をやるつもりだったのか。呆れてものも言えない。


「東ロボ」プロジェクトを率いる新井紀子氏は、AIの活用には批判的であり、大学側が採点を行う方法について「事実上この方式しかないと思われ。」と述べ、

結局のところセンターで採点するにしても大学教員が駆り出されるのを避けられないなら、まだ自分の大学の答案を自分の基準で採点した方がマシだと思います。実際、今も、センターの監督業務、外注しないで大学教員がしてますよね。

と述べている。大学教員の中にもこのように考える人も多いかもしれない。

しかし、私は総論としては、記述式試験を大学側が採点するという案に反対である。

 

そもそも共通問題を個々の大学のアドミンション・ポリシーに還元できない

個々の大学の採点基準やアドミッション・ポリシーに任せるというのなら、そもそも「共通試験」という前提が崩れ去るという指摘にはもちろん同意する。
しかし、そもそも50万人が共通して回答する問題を、多種多様な各大学のアドミンション・ポリシーに還元し、採点基準を変えることなど土台無理な話だ。
高大接続システム改革会議の最終報告には盛り込まれていないが、12月22日の会議で提出された配布資料の中に、「国語」の問題例がさらに2つある。

 

問 Aの文章のドイツの小説家,Bの文章のアメリカの小説家,Cの文章の日本の作曲家は,それぞれの世界で数多くの作品を生み出している。A,B,Cの文章に示されたこの3人の創作への取組姿勢には,共通するパターンがみられる。それぞれの文章では,創作への取組姿勢について,どのような【状況】のときに,どのような【問題】が生じやすいと述べているか。3人に共通する【状況】と【問題】の組合せを,それぞれの選択肢群から1つずつ選んで答えなさい。なお,該当する組合せは1つとは限らないが,あなたは組合せを1つ答えること。
次に,あなたが選んだ【状況】の下で生じやすい【問題】は,どのように 【解決】できる(している)とそれぞれの文章では述べているか。3人に共通している解決法を,30字以上,50字以内で要約して書きなさい(句読点を含む。) 。

【状況】
1. 作品の締め切りが近いが,なかなかやる気が起こらない。
2. 作品の制作に毎日取り組んでいる。
3. 作品をつくっているところを他の人に見られたくない。
4. いつもよりも難しい作品に挑戦するため,不安になっている。
5. 作品の制作が終了する時刻を決めることができない。
6. 作品についてすばらしいアイデアを思い付いている。
【問題】
1. その日の調子がよいからといって無理をすると,翌日に悪影響が出てしまうことになる。
2. 食事の前に比べて,食事を済ませた後は創造的な感覚が鈍りがちになる。
3. 制作のための作業だけをしていては,毎日続けて制作を行うことは不可能になる。
4. 日々の気分や状況に流されてしまうと,コンスタントに成果を出すことができなくなる。
5. 制作することに集中し過ぎると体を動かさなくなり,体の調子が悪くなる。
6. 制作している途中で邪魔が入ると作業が中断してしまい,制作に没頭できなくなる。

 

(公立図書館に関し,その現状と課題の他,若者の自立・社会参画支援を推進する場,家庭教育支援のための場,地域の人たちの対話や交流の場としての試みなど今後の公立図書館の可能性等について記した1,400字程度の新聞記事を読んで答える問題)

問 今後の公立図書館の在るべき姿について,あなたはどのように考えるか。次の1~3の条件に従って書きなさい。

条件1 200字以上,300字以内で書くこと(句読点を含む。)。
条件2 解答は2段落構成とすること。
第1段落には,今後の公立図書館が果たすべき役割として,あなたが重要と思うものについて書くこと。その際,文中に示された公立図書館の今後の可能性のうち,今,あなたが重要と考える事項を一つ取り上げ,本文中の言葉を用いて書くこと。
第2段落には,仮にあなたが図書館職員だとした場合,図書館において,第1段落で解答した姿を実現するために,どのような企画を提案したいかを記すこと。その際、企画の内容に加えて企画の効果についても記すこと。
条件3 本文中から引用した言葉には,かぎ括弧(「 」)を付けること。

 仮にこのような問題を出した場合、理工系大学の学生を選抜するために適切な出題と言えるだろうか。かなり具体的な内容にすればするほど、すべての学部に共通した問題意識を維持することが難しくなる。

少し極端に言えば、理工系大学に入学する学生を選抜するのに、公立図書館の在るべき姿について考えることなど「必要ない」(かもしれない)。
 採点基準だけでなく、どのような課題を課すか自体が大学のアドミッション・ポリシーなのであって、採点基準だけを独立に議論するのは一面的すぎる。この点で国立大学協会の「論点整理」が

設問の中に構造化された能力評価の観点を踏まえつつ、各大学(学部)はアドミッション・ポリシーに基づき独自の採点基準を採用することができ、各大学(学部)の主体性が発揮できる。(p.3)

などと書いたのは明らかに不用意であったと言わざるを得ない。

 

採点という観点からみる

大学側に採点を委ねる方法を採点という観点でみたとき、国立大学協会の「論点整理」に出てきていないひとつの問題は、各大学の独自基準に任せた採点をさせると、出題側に十分なノウハウを蓄積するのが難しく、次年度以降の作問技術の向上に支障を来すのではないかという点がある。

自分たちで出題しそれを自分たちの眼と手で採点してこそ出題にあった問題点を認識し、次年度以降に生かせるのである。ばらばらな採点基準で採点されたものを紙やデータだけで後から見るだけではそうした効果が相当に減ぜられてしまう。

それでもやはり、私が最大の問題だと考える点は、国立大学協会の論点整理にある次の点だと言ってよい。

○センターによる採点基準の設定等
センターはどの程度の採点基準を示すのか。解答例や採点例まで示すのか。段階別表示の方法を含め、各大学における採点にどの程度の裁量を与えるのか。
○各大学における採点
自ら作成したものではない試験問題について、出題意図や採点基準の的確な把握と採点者間の共通理解の下に、責任ある採点ができるか。結局、作問も各大学が行う方が良いということにならないか。

そもそも記述式の場合、採点基準は具体的な答案を目にして議論せざるえをえない。これがマークシート式との決定的な違いのひとつであり、個々の具体的答案を見ないまま概括的な採点基準や正答例&誤答例を示すだけでは、多様な答案に対応できずほとんど役に立たない。

 より重要なのは2点目だ。
 多くの大学教員は、自分の大学に入ってくる学生の能力をできるだけ正確に把握し、入学後の学びについてこれる学生を取りたいと考えているだろうし、そのために資すると考える問題を作って、自ら採点することでできる限り目的を達しようとしているわけだ。
それは自分たちで作り自分たちで採点することから生まれる責任意識やモチベーションがある、と少なくとも私は信じている。
 実際に答案が送られてくるまでどのような内容の問題であるかも知らされず、どのような答案が出てくる可能性があるかといったシミュレーションもできない、しかも自分の大学で学生に求めたい内容とはかけ離れた出題であった場合、率直に言って採点側にどういうモチベーションを期待できるだろうか。
 面倒だから白紙か何か書いてあるかで2段階評価でいいじゃないかというようないい加減な採点基準になるということだって想定されるだろう。自分たちで熟慮を重ねて作った問題ではないのだ。愛着もないし、単なる面倒な仕事をやっつけるだけになっても採点者を責められないように思う。

 

もちろん大学教員は学生のレポートを評価したり記述式試験を採点したりするという業務を行っている。しかし、入学試験での採点という点で重要なことは、採点者は1名ではなく、受験者一人の答案に少なくとも2名以上の採点者が付くこと、そして、採点者一人がすべての受験者の答案に目を通すとは限らないということだ。従って、採点にあたっては、複数の採点者が採点基準について合議し、共通了解に達しなければならないということである。この合意を取る作業というのは、単なる講義のレポートや講義の試験の採点と異なる点である。一人の採点者が自分の価値判断で採点基準を決められるわけではない。しかし、実際には合意を取る作業というもの自体が決して容易な作業ではないのである。

こういう観点は少しわかりにくいのかもしれないので、少し誤解をおそれず具体的な例を見てみたいと思う。
(念のため付言しておくが、私は大学入試の国語の採点など一切行ったこともないので本記事に書いていることはひとつ想像でしかない部分が多い。)

PISAの「落書き問題」を「採点」という観点でみる

記述式の問題が苦手であるという指摘は従来からあり、その際よく引き合いに出されるのがOECDPISAだろう。
PISA型の問題が本来我々の目指すべき学力を担保し得るのかどうかについても議論が必要かもしれないが、PISAのすべての問題について総括的に議論したいわけではない。
ここで問題にしたいのは、

  • PISA型の問題で自由記述が苦手だという結果が出ているし、
  • 記述式試験の導入しましょう、
  • 採点は大学側にやってもらいましょう、
  • そうすればアドミンション・ポリシーに従って自由に採点できるでしょ

というような極めて安易な発想がどういう事態を意味しているのか、ということを採点という観点に絞って少し考えたい。

PISAの問題例として有名な問題に「落書き」の問題がある。他にも公開問題例はいくつかある。
また採点基準に加えて正答例や誤答例は、日本語の本「PISAの問題できるかな?OECDの学習到達度調査」で読むことができるし、OECDのページには英語版のpdfがある。

 

私がここでこの問題を取り上げる理由は、記述式問題の解答の多様さ採点基準として示される概括的な記述の不十分さ、そして何が「論理的」あるいは「説得力がある」と評価されるべきかという基準の曖昧さをこの問題を通して体感してほしいからである。
たとえばこの問題とあとに述べる採点基準が送られてきて、あとはお前の大学のアドミッション・ポリシーに応じて採点基準を決めて採点せよ、と言われたらどういうことになるのか、ということを。

さて、落書きの問題とは次のような問題であった。

 

*** ヘルガの手紙 ***

 学校の壁の落書きに頭に来ています。壁から落書きを消して塗り直すのは今度が4度目だからです。創造力という点では見上げたものだけれど、社会に余分な損失を負担させないで、自分で表現する方法を探すべきです 。
 禁じられている場所に落書きするという、若い人たちの評価を落とすようなことを、なぜするのでしょう。プロの芸術家は、通りに絵をつるしたりなんかしないで、正式な場所に展示して、金銭的援助を求め、名声を獲得するのではないでしょうか。
 わたしの考えでは、建物やフェンス、公周のペンチは、それ自体がすでに芸術作品です。落書きでそうした建築物を台なしにするというのは、ほんとに悲しいことです。それだけではなくて、落書きという手段は、オゾン層を破壊します。そうした「芸術作品」は、そのたびに消されてしまうのに、この犯罪的な芸術家たちはなぜ落書きをして困らせるのか、本当に私は理解できません。                     ヘルガ

 

*** ソフィアの手紙 ***

 十人十色。人の好みなんてさまざまです。世の中はコミュニケーションと広告であふれています。企業のロゴ、お店の看板、通りに面して大きくて目ざわりなポスター。こういうのは許されるでしょうか。そう、大抵は許されます。では、落書きは許されますか。許せるという人もいれば、許せないという人もいます。
 落書きのための代金はだれが払うのでしょう。だれが最後に広告の代金を払うのでしょう。その通り、消費者です。
 看板を立てた人は、あなたに許可を求めましたか。求めていません。それでは、落書きをする人は許可を求めなければいけませんか。これは単に、コミュニケーションの問題ではないでしょうか。あなた自身の名前も、非行少年グループの名前も、通りで見かける大きな製作物も、一種のコミュ ニケーションではないかしら。
 数年前に店で見かけた、しま模様やチェックの柄の洋服はどうでしょう。それにスキーウェアも。そうした洋服の模様や色は、花模様が措かれたコンクリートの壁をそっくりそのまま真似たものです。そうした模様や色は受け入れられ、高く評価されているのに、それと同じスタイルの落書きが不愉快とみなされているなんて、笑ってしまいます。
 芸術多難の時代です。                ソフィア

 

2通の手紙は、落書きについての手紙で、インターネットから送られてきたものです。落書きとは、壁などところかまわず書かれる違法な絵や文章です。この手紙を読んで問に答えてください。

 

問2:ソフィアが広告を引き合いに出している理由は何ですか。

問3:あなたは、この2通の手紙のどちらに賛成しますか。片方あるいは両方の手紙の内容にふれながら、自分なりの言葉を使ってあなたの答えを説明してください。

問4:手紙になにが書かれているか、内容について考えてみましょう。
手紙がどのような書き方で書かれているか、スタイルについて考えてみましょう。
どちらの手紙に賛成するかは別として、あなたの意見では、どちらの手紙がよい手紙だと思いますか。片方あるいは両方の手紙の書き方にふれながら、あなたの答えを説明してください。

 

 この3つの問はPISAの公開問題例に現れる「記述式問題」の例である。無回答率の高さで日本が突出していたことで話題になった問題のひとつである。この問題についてはすでに多くの議論もあるのかもしれない。今回この記事を書くために少しだけ調べてみた。

皆さんはこの3つの記述式の設問にどう答えるだろうか。

問2(ソフィアが広告を引きあいに出す理由)

この問題は1点か0点(誤答と無答)で採点されることになっており、次のような採点基準が示されている。

正答(1点)

  • 落書きと広告とを比較していることを理解している。広告は落書きの合法的な一形態という考えに沿って答えている。
  • 広告を引き合いに出すことが、落書きを擁護する手段の一つであることを理解している。

誤答(0点)

  • 不十分な答えもしくは漠然とした答えをあげている。
  • 課題文の理解が不正確、または説得力のない答え、無関係な答えをあげている。

無答

 

この基準に従って次の答案例を見てほしい。皆さんが採点者だとして、次の答えを正答と誤答に分けてほしい。

  1. 広告は落書き同様に目ざわりだということをしめすため。
  2. 一部の人びとは、高校をスプレー絵画と同じく見苦しいものと考えているため。
  3. 彼女は、広告は落書きの合法的な一形態にすぎないといっている。
  4. 彼女は、広告は落書きに似ていると思っている。
  5. 広告看板を立てる人は、あなたの許可を求めていないから。
  6. 広告はわたしたちの許可を得ないで置かれているので、落書きと同じだ。
  7. 広告看板も落書きと同じようなものだから。
  8. 落書きは展示のもう一つの形態だから。
  9. 広告主はポスターを壁にはるのだから、広告も落書きと同じだと彼女は考えている。
  10. 広告も壁を使っている点で同じだから。
  11. 広告も落書きも、見た目が良いものもあれば見苦しいものもある点で同じだから。
  12. 広告は落書きと違って受け入れられているので、彼女は広告を引き合いに出している。
  13. (広告のことを考えれば、)落書きは合法であることが判明する。
  14. 彼女が自分の考えを示すため。
  15. 彼女が一つの例として広告のことを述べているのは、自分がそうしたいから。
  16. 自分の考えを示す手段である。
  17. 企業のロゴや店の看板。
  18. 彼女は落書きについて説明している。
  19. なぜなら広告に落書きするから。
  20. 落書きは広告の一種だから。
  21. 落書きは、ある特定の人や集団にとって広告だから。
  22. 落書きを正当化したかったので。
  23. 広告と落書きの共通点を挙げて落書きを擁護するため

PISAの採点では、14-21が誤答であり、1-14はすべて正答とされた。しかし直ちに次のようなことが考えられはしないだろうか。

  • 「比較」といっても、広告と落書きに何が共通しているのか、という点について、正答例の中には様々なレベルがある。何が同じかを述べない答案もあるし、「見苦しさ」「許可を求めているか」「壁」などなど。実は、5には「広告と落書きを暗に比較している」、7には「最低限の答え。何が似ているのかは説明していないが類似性を指摘している」、12には「落書きと広告への人びとのそれぞれの態度を比較して、その類似性をそれとなく示している」というような注釈コメントがついている。では、これらの正答例をA,B,C,Dの4段階で評価してほしいと言われても困惑しないだろうか。
  • 13は正答にされているが、ソフィアは「落書きは合法」と言っているだろうか。これも非常に微妙である。
  • 誤答の方だと、14,16は言っていることは正しいが比較はしていない。15,17,18,19は明らかにおかしいのに比べてこれが0点で良いのかという気もする。
  • 20,21はこのソフィアの文章の「コミュニケーション」という言葉遣いの真意がはっきりしないので、扱いが微妙だという気もする。この言葉の曖昧さについての指摘はあとでも触れる。

では22,23はどうだろう?これはあるウェブサイトで解答例として書かれていたものだ。(こういう態度には敬意を表したい。多くのウェブサイトは問題を紹介するだけで自分の解答例を述べないから。)
実は、私の意見もどちらかというと22に近い。もちろん、穏当に答えを書けと言われれば、私も、
「広告と落書きはどちらも受け手の許可を得ていないという点で同じであるにもかかわらず、広告は評価され、落書きは不愉快とみなされるのは不当だとソフィアは考えているから。」
というような答えを書くだろう。しかし、2人の手紙を読んだとき、落書きを擁護しようとするソフィアの議論には飛躍も多く、「笑っちゃいます」とか「芸術多難の時代です」など、冷やかし的な感じを持った。もちろんそう感じない人もいるだろう。
私にはソフィアの議論は、本来広告と落書きは一概には比較できないのに、広告を持ち出して議論をそらそうとしているようにも見える。無自覚にそうしているのかもしれないが、私はこの文体からだとどうしても意図的に議論をそらしているように見えてしまう。
そうすると、「落書きを擁護するために、同列には比較できない広告の話があたかも落書きと同じであるかのように錯覚させて議論をそらすため」のようなうがった答えも出てくるかもしれない。
そういう答えを他の答えと比較してどのように扱うべきか、ということを考え始めると採点基準は非常に難しい、と言わざるを得ない。

問3(どちらの手紙に賛同するか)

この問題も1点か0点かで採点することになっている。その基準はこうだ。「説得力のあるなし」が採点基準に挙げられていることに注目してほしい。

正答(1点)

  • 片方または両方の手紙の内容に触れながら意見を述べている。手紙の筆者の主張全般(落書きに賛成か反対か)や意見の詳細に言及していてもよい。手紙の筆者の意見に対して、説得力のある解釈をしていること。課題文の内容を言い換えて説明しているのはよいが、何も変更や追加をせずに課題文全部または大部分を引用するのは不可。

誤答(0点)

  • 自分の考え方の根拠が、課題文のそのままの引用に終わっている。(「」で囲ってあってもなくてもよい。)
  • 不十分な答えもしくは漠然とした答えをあげている。
  • 課題文の理解が不正確、または説得力のない答え、無関係な答えをあげている。
  • 無答

 

答案例を見てみる。皆さんはどう採点するだろうか。

  1. ヘルガに賛成する。落書きは違法であり、従って破壊行為だ。
  2. ヘルガ。落書きは反対だから。
  3. ソフィア。落書きアーティストに罰金を科しておきながら、その一方で彼らのデザインをコピーして金儲けをするのは偽善だと思う。
  4. どちらにも賛成かな。公共の場で壁に落書きをするのは違法だが、そうした人たちはどこか別の場所で作品を描くチャンスを与えるべきだ。
  5. ソフィア。彼女の方が芸術に関心をもっているから。
  6. 両方の意見に賛成する。私は偽善者になりたくないから、落書きも悪いけれど広告も悪いと思う。
  7. 私は本当に落書きが好きではないから、ヘルガの方。だけどソフィアの意見や、自分の信じることを実行する人を非難しない、という彼女の姿勢は理解できる。
  8. ヘルガ。こんなことで若い人たちの評価が落ちるなんて本当に残念だから。
  9. ソフィア。店にある、落書きを真似た(品物の)模様や色が、落書きは不愉快と見なしている人々に受け入れられているのは事実だから。
  10. 人々は、社会に余分の損失を生じさせないで自分を表現する方法を探すべき、というヘルガの意見に賛成だ。
  11. ヘルガ。どうして若い人たちの評価が落ちるのだろう。
  12. ソフィア。ヘルガの手紙には、自分の意見を裏付ける理由を述べていないから。(ソフィアは広告に対して自分の意見を述べている。)
  13. ヘルガ。彼女の方が詳しく意見を述べている。
  14. ヘルガに賛成する。
  15. 両方に賛成する。ヘルガの事情は理解できる。しかし、ソフィアも正しいと思う。
  16. どちらかと言えばヘルガの方に賛成する。ソフィアは、自分の考えに自信を持っているようにみえない。
  17. ヘルガ。彼女は、落書きをする芸術家の中には才能ある人もいると思っているから。
  18.  ヘルガの手紙がよい。ヘルガは、落書きの創造力を認めつつも、落書きをしないでと訴えている。理由として、落書きは社会に損失を与え、建物を台なしにすることを挙げている。一方のソフィアは、落書きは許されると述べている。しかし、理由は適切とはいえない。広告する場合は看板設置などの許可が必要である。公共の建物や他人の所有物に勝手に落書きはできない。壁の模様や色が洋服に真似されたからといって、落書きの行為が受け入れられたとはいえない。
  19. ヘルガの手紙がよい。相手を認め、愚かな行為を気づかせようとしている。落書き者の創造力を、「見上げたものだ」としている。相手は好感をもちやすくなる。落書きにも通じる芸術という言葉を使っている。芸術作品である建物を台なしにすることは「悲しい」と述べ、共感を誘う。消されてしまう犯ざい的な落書きではなく、自己の表現方法を他に探してしてほしいと、相手の立場で提案している。

いくつか注釈が付いている。例えば2は「最低限の答え」とされ正答。8は「ボーダーラインの答え。課題文をそのまま引用している部分もあるが、別の文章内で使っている。」として正答。9には「課題文の文章を組み合わせて説明しているが、手を入れた文章からは内容をよく理解していることがわかる。」として正答である。10-17がPISAの報告書で示されている誤答例で、18,19はウェブサイトから拾ってきた解答例である。すぐに次のことが考えられはしないだろうか。

  • 2を「説得力のある解釈をしている」と言えるだろうか。
  • 4はどうだろう?ヘルガとソフィアを比べたとき、ソフィアの方が芸術に関心があるという「説得力のある解釈」はあるだろうか。
  • そもそもヘルガの議論とソフィアの議論のどちらが「論理的」と言えるだろうか。もちろん「論理的でない議論でも賛同できる」という可能性はあるが、例えば「ソフィアの議論は論理的だから賛成」というような答案が出た場合、それも正答だろうか。

3番目に述べたようなことを言うのには理由がある。

ベネッセ教育総合研究所のページにはこう書かれているのだ。

課題文を一読して分かる通り、落書き擁護派のソフィアの文章は明快な三段論法の手法をとっています。すなわち、(1)店の看板やポスターは広告というコミュニケーションの手段として許されている。(2)落書きもコミュニケーションの手段の一つ。(3)だから落書きも許されてよい。

この意見にみんな同意するだろうか。もしそうだとすると、「ソフィアの議論は明快な三段論法になっているから賛成だ。」のような答案を正答として扱う必要もあるかもしれない。しかし、実際には逆の意見もある。妹尾知昭氏の「PISA型「落書き J問題の解答に見る大学生の読解力の傾向」の中で、「彼女の主張には瑕疵が多く見受けられる」(p.44)として多くの問題点を指摘し、「芸術という言葉の中立的な意味合いにより落書き行為を免罪しようとしている」、「ソフィアの発言には規範意識そのものが欠け、好みのレベルでしか論じられていない」などと指摘している。私もこの意見に賛成である。上のベネッセの書き方でいえば、コミュニケーションの手段であるという点が同じでも、すべてのコミュニケーションの手段が容認されるべきとは言えない以上、三段論法は破綻していると考えるべきと思う。
しかしでは入試の現場で、「ソフィアの議論は三段論法に基づく論理的推論であるから賛成する」と書かれた答案に出会った場合、それを無答と同じ0点としてもよいかどうかとなると悩ましくはないだろうか。ベネッセの記事を書いたような人が採点者の中にいた場合、採点基準を統一するのにすさまじい労力を必要とする可能性はないだろうか。

問4(賛否を別にして手紙のスタイルはどちらがよいか)

この問題も1点もしくは0点で採点する。採点基準はこうである。

正答(1点)

  • 片方または両方の手紙のスタイルについて意見を述べている。文体、議論の組み立て、議論の説得力、論調、用語、読み手に訴える手法などの特徴を説明している。「よい議論」と述べている場合、それについての立証が必要である。

誤答(0点)

  • 筆者の主張に対する賛成または反対の観点から判断を下している。またはたんにないようを言い換えている。
  • 十分な説明なしに判断をくだしている。
  • 課題文の理解が不正確、または説得力のない答え、無関係な答えをあげている。
  • 無答

 

では解答例を見てみよう。皆さんはどう採点するだろうか。

  1. ヘルガの手紙。彼女は、問題点を色々提示している。それと落書きアーティストが引き起こす環境被害のことも言っており、これは非常に重要なことだと思う。
  2. ヘルガの手紙は、落書きアーティストのことを直接問題にすることで、強い印象を与えている。
  3. この2つの手紙ではヘルガの手紙の方が優れていると思う。ソフィアの手紙には偏りが多少あると思う。
  4. ソフィアは、強い議論をしているが、ヘルガの手紙の方が構成がしっかりしている。
  5. ソフィア。自分の議論を実際、誰に向けているわけではないから。
  6. ヘルガの手紙の方が好きだ。ヘルガの方が意見をはっきり述べている。
  7. ヘルガ。彼女の言っていることすべてに賛成する。
  8. ヘルガの手紙の方がよい。彼女が述べている通り、落書きは損失であり、無駄である。
  9. ソフィアの手紙が一番よい。
  10. ソフィアの手紙が読みやすい。
  11. ヘルガの方がよい議論をしている。
  12. ヘルガの方がよく書けている。彼女は問題を一歩一歩しっかり把握したうえで、論理的に結論を出している。
  13. ソフィア。彼女の手紙は最後まで自分の立場を貫いているから。
  14. ヘルガの手紙は、ただ単に自分の意見を押し付けている気がします。
  15. ソフィアさんの手紙は一般的な考え方と違う視点で考えていると思います。(中略)世間のルールにとらわれていないソフィアさんの手紙が良いと感じました。
  16. ヘルガの手紙は一般的には正しいことを言っているのかもしれないが、自分の主張しか書いていない。(中略)落書きをすることが全面的に良いとは言えないが、人それぞれの個性を考えてもよいのではないだろうか。
  17. なぜかというとヘルガの手紙は、自分が不愉快に感じていることばかりを主張して独善的に感じるからだ。その一方でソフィアの手紙は、人の落書きに対する考え方は十人十色であることを踏まえたうえで、自分の考えを主張しているからである。
  18. ヘルガは自分の意見ばかりを強く主張し、反対意見に対しては否定しているように感じられるが、ソフィアはどちらの意見に対しても強く否定していない。

1-6がPISA報告書にある正答例で、7-11は誤答例として挙げられている。12-16は妹尾知昭氏の「PISA型「落書き J問題の解答に見る大学生の読解力の傾向」の中で、大学生の解答例として紹介されているものだ。すぐに考えられる点はいくつもある。

  • ヘルガの議論に出てくるオゾン層の破壊は少し唐突すぎて、それを根拠にしている1は正答とみなせるか。
  • 3や6は立証したことになっているだろうか。12は、誤答とされ、「課題文の理解が不正確、または説得力のない答え、無関係な答えをあげている。」に分類されているが、3,6などと比べて明確な差異があるだろうか。
  • 12-16の大学生の答案はどうだろう?これは立証なのか、それとも感覚的な議論なのか。

そもそも議論への賛否を別にして手紙のスタイルだけを論じることが本当にこの問題で可能だろうか。両者を分けられる場合もあるかもしれないが、重なり合う部分も多い。私は、このヘルガとソフィアの議論を見ると、どうやってもソフィアの議論の論理性を擁護できないので、なんとなくフランクに書いている文体そのものにやや嫌悪感がある。しかしそれが良いという人もいるかもしれない。ソフィアの議論には賛成できないが、「文体がフランクで若者向けだ」みたいな答案さえ書けるかもしれない。

問題は何か

 この「落書き」問題そのもに批判的な意見もある。翻訳のまずさや他の問題なども含め次のようにコメントしているブログを見つけた。

言えることは、こんな出題に「無答」で報いた(そうせざるをえなかった)日本の受験生が「批評精神が無い」と言われる筋合いはない、ということです。「批評精神が無い」のはどっちなのだ、と言ってもいいほどです。

私もこれに賛成せざるをえないというのが率直な感想である。
私がこのPISA「落書き」問題の例を通して言いたいことはこうだ。

 不用意に作問された記述式試験に、概括的な採点基準だけを与えられた状況で、入試の判定に使えるように=学生の能力を差別化できるように採点基準を組むことは極めて困難な場合があり得る。
 それも自分たちで作った問題なら自分たちで責任を取ればいいが、作問と採点が切り離されてしまうと、他人の作った極めて質の悪い問題の採点基準を考えるという苦痛に満ちた作業を強いられる。
 どんなに温厚な先生でも、こういう形で他人のしりぬぐいをさせられることにモチベーションを維持できるとはちょっと考えにくいのではないか。
 ましてやこのような採点基準をつくることと大学のアドミッション・ポリシーを結び付けられるはずもない。
 また、上のような答案例を選別するのに、AIを使うということも私には想定しにくい。立証できているのかとか論理的か、説得力があるかということの基準を十分に言語化できないからだ。あるいは、上でも見たように、論理的であるかどうかとは別の観点で書かれた答案を扱わなければならない可能性もある。


 もちろんPISAは15歳の学生を対象にしたものだから大学入試問題と一概に比較することはできない。
 大学受験生が書く答案はもう少し趣が違うかもしれないし、実際に記述式として出題される問題は良い問題であるかもしれない。
 しかし上記のPISAの例は、記述式問題の採点がいかに難しく時間のかかり得る作業であるかということを普通の人でも理解できる良い例であり、バラバラの基準で採点して良いという作問と採点の分離は言うほど容易くないことも実感してもらえるのではないか、と信じたい。


他の例

PISAの例だけではなくもう少し受験用の問題そのものを議論するべきなのかもしれない。
以下では、ごく簡単な例を1つだけ指摘したい。

 

2016年度東京大学現代文第1問

 内田樹氏の「日本の班知性主義」から採られた文章が、東大入試の現代文として出題され話題になった。
 そもそもこの内田氏の文章には山形浩生氏による強い批判「反知性主義3 Part 1: 内田編『日本の反知性主義』は編者のオレ様節が痛々しく浮いた、よじれた本。」があり、出題者がこの批判について知っていて出題文に選んだのかどうか、といった論点はあり得る。また、アゴラでは松本徹三氏が「東大入試合格には「知性的」であってはいけないのか?」という文章を書き、この問題自体を批判している。しかし一方で、東京大学入試問題・国語1(評論)-たくろふのつぶやきには、「僕は個人的に内田樹著作は眉唾ものが多いと見ており、正直なところ話半分に読む程度がいちばん良い距離感だろうと思ってはいるが、この東大入試に使用された文章を読む限り、それほど支離滅裂なことは言っていない。むしろ、東京大学がこの文章を評論文の読解問題に使用した意図がよく分かる。 」との意見があり、2016年東大国語ズバリ的中報告・内田樹氏・『日本の反知性主義』-現代文最新傾向LABO 斎藤隆では「この論考(論点・テーマ)は、受験生の読解力を判定するのに適切」とのコメントもあるなど、内田氏の議論全体の評価はひとまずおいて、出題そのものを擁護する議論もある。

 ここで言いたい事は内田氏の文章の当否でもなく、またこの文章を出題した東大の意図でもない。
 内田氏の文章が論理的文章であると判断するかどうかやこの文章を入試問題として出題するべきか/適切な出題かといった点に議論の余地が大きいという事実があるということである。
 もし作問と採点を分離すると、新共通テスト終了後、この文章と採点基準(あるいはいくつかの解答例も?)と学生の答案が送られてきて、あとは各大学のアドミッション・ポリシーに応じて採点基準を作って採点しなさい、という話になるという状況が想定される。内田氏の文章を全く論理的文章と見なさない採点者と適切な出題であるという採点者がいた場合、両者の採点基準を調整できるだろうか。もし自分たちが出題者なら、この文章に論争的な点が多いという理由で出題をやめたかもしれないし、もし出題するとしても、どの場所を問うかなどを事前に議論するだろう。そして合意できる場所を出題するだろう。東大の場合はそうだったからこそ出題に至ったわけだろうが、それを50万人が利用する試験ですべての大学の採点者にも要求できるか、ということははなはだ疑問である。

 すべての問を概観することはしないが、例えば問1は、

「そのような身体反応を以てさしあたり理非の判断に代えることができる人」(傍線部ア)とはどういう人のことか、説明せよ。

という問題である。いくつかの解答例を見てみよう。これは誤答例ではなく、どれもこれが正答例だとおもって書いている答えであることに初めから注意しておく。

 実際には東大入試の場合、本問は配点40点で、2行で字数制限のない記述が4問、120字程度の記述が1問、漢字の問題である。この1個の小問は少ない場合5点くらいということもありえる。あるいはそういうことは忘れて、じゃあA,B,C,Dの4段階評価で上の解答例を採点してくださいと言われて全部Aでいいのか、という問題である。

 私は傍線部にある「さしあたり」という表現をどう見るのかという点や、例えば河合塾のように「自らの知の枠組みが揺らぐままに内省できる」という表現が妥当かどうか、「実感」「内的感覚」「全身的な感覚」「内的実感」、「内省」といった言葉の選び方、「清廉」や「清廉な判断を下す不随意運動の如く無意識の思考習慣」という言葉の選び方など、さまざまな論点があるように思う。実際の受験生の答案は、これらに比べれば洗練されておらず粗削りだったり当を得ていないものもあるだろう。

 実際の答案は、千差万別だし、そうしたものがAIで理非を判断できたりクラスタリングできるかどうかもかなり怪しい上に、出題にかかわっていない人が、これらの問の採点基準を合議で簡単に決められるとも思えない。
 解答する受験生は試験時間の間だけ考えればよいが、出題する側は非常に多くの時間をかけて解答できる形に問題を練り、そして最後に出てきた答案を見ながら採点基準を決めていく。
 そうしたプロセスに関係していない人がいきなり問題と概括的採点基準と答案を見せられて、では3週間で採点してくださいと言われてもそれは非常に困難な作業ではなかろうか。