2016-09-05

【新共通テスト記述式】こんな読み取りで大丈夫なのか？

文科省が9月1日付で公開した「高大接続改革の進捗状況について」という文書がある。
この文書では、大学入試センター試験の後継となる新共通テストに記述式問題を導入することが盛り込まれている。この記述式試験の採点方法については、以下の記事で、
朝日新聞および読売新聞の報道姿勢を批判した。

また採点そのものの困難さについては以下の記事で指摘した。

【新共通テスト記述式】大学側が採点する方法に反対する-特に採点の観点から- - rochejacmonmoの日記

これについては、日比嘉高氏の論説も大変参考になる。

特に「分厚い採点マニュアル」のくだりには、現実的恐怖がある。しかも、私はおそらくそうした採点マニュアルをどんなに分厚くしても実際に答案をちら見した程度で作られたマニュアルはほとんど役に立たないと思う。記述式の答案は多様で、しかも採点基準の確定が非常に難しいからだ。

さて、今回の記事では、採点における答案の読み取りとクラスタリングについて考えたい。記述式試験の採点に関して、OCRで答案を読み取り、テキスト化し、さらにクラスタリングで分類した後、目視で採点を行う方式が検討されている。

今回文科省が公表した文書のp.29にクラスタリング結果のサンプルが公開されている。

次の図がそれだ。

f:id:rochejacmonmo:20160905124457j:plain

このサンプル結果を一目見ただけで、このサンプル結果の惨状は明らかである。

60個の文例のうち、明らかな読み取りミスがない文例は2個しかない。

f:id:rochejacmonmo:20160905124700j:plain

「フリップ」が「フリック」や「つリック」や「クソップ」になっていたり、「る」が「３」と認識されてたり、句読点も読み取りミスがある。中にはかなりの部分が意味不明になってしまっている読み取りもある。これはもはや笑い話のレベルだ。

もし実際の答案のテキスト化がこれと同じレベルだとすると、テキスト化したあとに、すべての答案を点検して明らか読み取りミスは修正しなければならない。しかし、これは国語の試験であり、「てにをは」や「句読点の使い方」なども採点の対象になりえるので、この精査は慎重にミスなく行う必要がある。この労力も決して馬鹿にできない。また実際に目視で採点作業を行う場合でも、テキスト化されたものをPC画面で見るなどというだけでは全く安心できない。実際の答案のスキャンを手元に置いて確認しながらでなければ到底採点などできないだろう。

つまり、もしこの精度だと、クラスタリング以前の問題である。

2016-09-04

【新共通テスト記述式】再び氏岡真弓氏を批判する

入試国立大学協会大学大学入試センター教育新共通テスト朝日新聞

これまでの経過と本記事の内容

2016年9月2日付の朝日新聞に2つの記事が掲載された。

である。後者は、このブログで一貫して批判してきた教育社説担当の編集委員氏岡真弓氏による署名記事である。前者は署名記事ではないが、教育に関する社説である以上、氏岡氏がその内容に関わっていると考えられる。今回はこの2つの記事のうち、社説の内容について批判する。

　社説の記事は、文部科学省が公開した次の文書に関連している。

高大接続改革の進捗状況について

　後者の記事は、中央教育審議会初等中等教育分科会教育課程部会がまとめた

次期学習指導要領等に向けたこれまでの審議のまとめ（案）

である。これは大部にわたっており、私はすべてに目を通したわけではない。

なお、過去にこのブログで氏岡真弓氏の記事について批判したものは以下の2つである。

相変わらず具体的な案が提示されているとするミスリード

文部科学省が公開した「高大接続改革の進捗状況について」という文書の報道に関しては、この社説と同じ9月2日に読売新聞の社説も取り上げている。内容的には読売新聞の社説は朝日新聞のこの社説に比べるとさらに酷く、粗雑な内容であった。そのことは次の記事で批判した。

この読売社説に比べると、朝日新聞の社説は、やや穏やかな記述で始まっている。

新しい試験の具体像を早く示し、オープンに議論すべきだ。

　大学入試センター試験に代わって２０２０年度に始める共通テストについて、文部科学省が検討状況の中間発表をした。

読売新聞の社説が「大学入試センター試験に代わり、２０２０年度から導入される新テスト「大学入学希望者学力評価テスト（仮称）」について、文部科学省が大学・高校関係者と検討してきた具体的な実施案を公表した。」と明らかにミスリードする記述をしていることに比べれば、この記述は「進捗状況について」と題する文部科学省の文書に沿っていると言える。

しかし、

入試改革の議論は迷走を続けてきたが、今回示されたのは、これまでよりは実現可能性のある案といえる。

と続く。相変わらずである。今回の文書では、何らの具体的な案を示し、これで実施すると結論付けているわけではない。p.12の記述はこうだ。

f:id:rochejacmonmo:20160904202113j:plain

3つの案のどれを採用するとも決めていない以上、今回の文書が、これまでよりもは実現可能性のある案を提示したとする記述は一面的である。実施方法は現状何も確定していないと言わざるを得ない。

一つは記述式問題の導入について、受験生の出願先の各大学が採点する案である。

　文科省が考えていたのは試験を１２月に前倒しする案や、マークシート式とともに１月に実施する案だった。

　だが高校教育への影響が大きかったり、採点期間が短く短文で答える問題しか出せなかったりして出口が見えなかった。

　それに対して今回の案は各大学の２次試験の合格発表までに採点すればよく、時間の余裕が生まれ、出題の幅が広がる。

　ただ、これにも課題がある。どこまでの大学が採点の負担を受け入れて利用するか。国公立だけでなく私立や短大も含め、どう対応できるかだ。

まだ3つの案が併記された状態であるにもかかわらず、この記述はあたかも今回の文書では3つ目の案だけが提示されているかのような書きぶりだ。

これまで指摘し批判してきたように、氏岡真弓氏は8月19日の記事から一貫して、文科省は大学側が採点を行う案で進めるとしている、という情報を発信し続けている。公表されている文書の内容とは異なる情報発信を続けていることになり、この点は極めて重大で悪質なミスリードだと言わざるを得ない。

作問の方向性について十分に資料を検討しているとは思われない

前提となるのがセンターがどんな問題を出し、大学の採点の負担をどう軽くできるかだ。文科省は相当数の問題例を公表し議論の土台を示してほしい。

　もう一つは英語の「聞く、話す、読む、書く」の４技能をめぐり、センターと民間の試験を合わせて評価する案だ。将来は民間への一本化を目指す。

　数十万人が一斉に受ける試験で、センターが「話す」「書く」力を測るには限界がある。

　かといって、どの民間試験でもよいわけではない。学習指導要領をふまえているか、受験料は適正かといった基準を設けるというが、中身によってテストの質が左右されよう。文科省は具体的な基準を示すべきだ。

　生徒が高得点を目指し何度も受験し、高校生活が試験漬けになる恐れがある。経済的な余裕のない家庭の子は何度も受けられず、豊かな家の子との間に不平等が生まれる可能性もある。

　いずれも対策が欠かせない。

　そうした検討の素材が示されて初めて、記述式や４技能試験をそもそも共通テストに盛り込むべきか、それとも個別試験で測るべきかも考えられる。

これらの記述にはいくつかの問題があるが、それらを端的にまとめると、具体例を示せという要求が空疎なものにしか聞こえないということだ。どのような対象者に、どのような内容で、どのような技能を、どのような問題として問うか、ということの大枠がなければ、問題例など作りようがない。にも関わらず、社説は「相当数の問題例」が示されて初めて「記述式や4技能試験をそもそも共通テストに盛り込むべきか、それとも個別試験で測るべきかも考えられる」と述べている。共通試験で何を問うかという大枠を確定させることなく先に問題例を公開することなど無理な要求だ。しかもこのような記述は、今回の「進捗状況について」という文書の中に記載されている内容を十分に精査しているとは到底思えない。

　たとえば国語の記述式問題を扱った部分では、まず問題を考える思考のプロセスを図式化した上で

国語の問題として解答させる内容としては、以下の４種類に大別できる。
[1]テクストの部分的な内容を把握・理解して解答する問題
[2]テクストの全体的な精査・解釈によって解答する問題
[3]テクストの全体的な精査・解釈によって得られた情報を編集・操作して解答する問題
[4]テクストの全体的な精査・解釈を踏まえ、自分の考えと統合・構造化して解答する問題

と整理し、さらに、

大学入学者選抜においては、これまでは、「テクストの内容（筆者の考えなど）を説明する問題」が中心であったが、今後は、「テクストの内容を基に考えを文章化する問題」を導入することが重要である。

これまでの大学入学者選抜等における国語の記述式問題を分析すると、「[1]テクストの部分的な内容を把握・理解して解答する問題」や、テクストを要約したり、共通点・相違点をまとめたりするなどの「[2]テクストの全体的な精査・解釈によって解答する問題」が中心となっている。
これに対し、考えたことを文章により表現する「[3]テクストの全体的な精査・解釈によって得られた情報を編集・操作して解答する問題」は、散見される程度となっている。
他方、「[4]テクストの全体的な精査・解釈を踏まえ、自分の考えと統合・構造化して解答する問題」は、テクストから得た情報を既有の知識・経験等に統合することなどにより、自分の考えを論じるものであることから、小論文などの解答の自由度の高い記述式として出題されている。（解答の自由度の高さから、個別選抜に馴染みやすい）

これらを踏まえ、共通テストの国語の記述式においては、「[2]テクストの全体的な精査・解釈によって解答する問題」だけでなく、「[3]テクストの全体的な精査・解釈
によって得られた情報を編集・操作して解答する問題」を条件付記述式として出題することを想定している。
このことにより、「精査・解釈」に関わる資質・能力（例えば、論理（情報と情報の関係性）の吟味など）だけでなく、「考えの形成・深化」に関わる「情報を編集・操作する力」をよりよく評価する作問に取り組むこととする。

と述べている。しかも別紙には次のような図が付けられており、試験で問う能力を分析している。

f:id:rochejacmonmo:20160904210002j:plain

これらの点では、今回の文書の中で一定の方向付けが示されていると言ってよいだろう。今回の朝日社説は、実施方法という具体案の決まっていないことをあたかも具体的な案が決まっているかのように述べる一方で、出題の内容については少なくともたたき台が示され一定の方向付けがなされているのに、そこにはあたかも具体的な案が何もないかのような記述を行っている。

文科省の文書の疵

文科省の文書に瑕疵がないわけではない。というよりも、文科省の文書も「考え」という観点についての記述があいまいで揺れているように思われる。そこを勝手に独断してしまうと、氏岡氏がかつて書いていたような

「これまでの記述式で中心だった文章を理解し説明する設問と違い、自分の考えを書く問題づくりが可能」

というさらにミスリードするような記述が出てくる。このようなミスリードが生じる第一義の責任はあいまいな文章を書く文科省側にあるが、本来曖昧な部分はその曖昧さを指摘し、そこでこそ具体例などを用いてその曖昧さを除去するように努めるのが情報発信者のするべきことであって、曖昧な部分を自分流に解釈して記述してしまえばさらに議論を混乱させてしまうことになる。

私がここで文科省の文書があいまいであると考えている点を一言で言えば、[2]と[3]と[4]の切り分けが曖昧だということである。

第一に「考え」ということの示す範囲が不明瞭だ。

「テクストの内容（筆者の考えなど）を説明する問題」が中心であったが、今後は、「テクストの内容を基に考えを文章化する問題」を導入することが重要

としつつ

[4]テクストの全体的な精査・解釈を踏まえ、自分の考えと統合・構造化して解答する問題

は個別入試になじむとする整合性の問題である。

例えば別紙の図では、[4]について

テクストにおける筆者の主張を踏まえつつ、自分の考えを形成して論じる
テクストに示された図表等の情報を分析した上で、仮説を立てて、自分の考えを論じる
テクストの論旨を踏まえて、既有知識・経験を具体的に挙げながら、自分の考えを論じる
テクストを踏まえて、テクストと自分自身との関わりについて考えたり、想像したりして、自分の考えを形成して論じる
テクストの全体的な精査・解釈を踏まえ、自分の考えと統合・構造化して、考えを形成し深める
（テクストの情報を用いつつ、）自分の考えを論じる

という項目が掲げられ、[3]では

テクスト全体の論旨を把握し、推論による内容の補足をして、筆者の主張について論じる
テクスト全体の論旨を把握し、既有知識や経験による内容の精緻化を行って論じる
テクスト全体の論旨を把握し、目的に応じて必要な情報を付加、統合して比較したり、関連づけたりして論じる
複数のテクストの妥当性を吟味し、情報を統合・構造化して論じる
テクストの全体的に把握・理解し、精査・解釈を踏まえて、情報を編集・操作して、考えを形成し深める
テクストの情報を多角的・多面的に精査し構造化したり、構成・表現形式を評価したりする等の精査・解釈によって得られた情報を操作・編集し、テクストの内容を説明する

という項目があげられており、[3],[4]いずれも「考えを文章化する問題」と括られている。この「考えを文章化」という記述と「自分の考えとの統合」という記述は何が違うのか、である。具体的な項目を見ると違うようにみえるが括り方との整合性が曖昧である。

f:id:rochejacmonmo:20160904213322j:plain

この図では、[3]と[4]を分けるのは「テキスト内の情報の編集・操作」か「テキスト外の情報との統合・構造化」の違いであるが、この違いは非常にわかりにくい。

また、p.39の大学入学者選抜改革推進委託事業のひとつを説明する図の中で、「国語問題の内容のイメージ例」の中に

文章や図表等の内容を踏まえ、自説を展開する

というような文言も入っている。これも前段の整理との整合性がはっきりせず不用意であったと言わざるを得ない。

第二の問題点は、実際上[2]と[3]の違いも実ははっきりしないことにある。[2]については

テクストにおける筆者の主張とその主張の理由・根拠を説明する
テクストに表現された事物について、目的・場面・文脈・状況等を説明する
テクストの会話や表現等に着目して、登場人物の心情の変化等を説明する
テクストを通じて対比されている事項について考察し、共通点や相違点について説明する
目的に応じてテクスト全体を要約し、論旨に沿って説明する
テクストを全体的に把握・理解して、精査・解釈を行う
テクストに示された情報と情報の関係性を吟味する等、精査・解釈して答える

が挙げられている。確かに文章上は「説明する・解釈する」と「論じる・考えを形成する」という違いがある。しかし、実際にどのような問題が両者の違いなのかはっきりしない。これはこの文書の中で

これまでの大学入学者選抜等における国語の記述式問題を分析すると、「[1]テクストの部分的な内容を把握・理解して解答する問題」や、テクストを要約したり、共通点・相違点をまとめたりするなどの「[2]テクストの全体的な精査・解釈によって解答する問題」が中心

これに対し、考えたことを文章により表現する「[3]テクストの全体的な精査・解釈によって得られた情報を編集・操作して解答する問題」は、散見される程度

と述べている以上、これまでの大学入試の国語記述式問題で判断できる。つまりここでは（新たな問題例ではなく）実際の入試問題が例として挙げられるべきだった。

記事を書くためにするべきこと

文科省の文書を十分検討すれば、どの部分が曖昧で、その曖昧な部分をより明確化するためにはどのような補足情報が必要かわかるはずである。単に「文科省は相当数の問題例を公開せよ」などという要求をしても空疎なだけである。文科省の文書では、具体的な項目を設定して、共通試験で問うべき内容は明示している。その内容をより明らかにする具体例を求めるべきであった。

ここを明確にせず曖昧なまま放置して文章を書いてしまうから、氏岡氏の文章にある

「これまでの記述式で中心だった文章を理解し説明する設問と違い、自分の考えを書く問題づくりが可能」

のようなさらに曖昧な言説になってしまうのである。あるいは社説にあるような「相当数の問題例の公開」の後に「そもそも共通テストに盛り込むべきか、それとも個別試験で測るべきかも考えられる」という順序の逆転した記述になってしまうのである。

自らのミスリードを棚に上げて公開を求める不誠実さ

この節で、私は、今回の社説も氏岡真弓氏が主導して記述を行っているという前提で議論する。

大学入試改革で文科省が水面下の議論を5カ月ぶりに公表。生徒、保護者、高校、大学は不安を抱えている。会議は公開を。（社説）大学入試改革　素材示し議論を広げよ：朝日新聞デジタル https://t.co/9pjonxYy9g
— 氏岡　真弓 (@ujioka) 2016年9月2日

とある以上、氏岡氏はこの社説の執筆に関与しているとみてよいと思うが、もし氏岡氏がこの記事に全く関与していないなら、以下のいくつかの記述は撤回する用意がある。

朝日社説は、次のように述べて社説を締めくくっている。

経過がわからないまま結論を出されても納得はえられまい。

　高校や大学、保護者、そして生徒にこたえるためにも、議論を公開すべきである。

私は、過去の記事で、氏岡真弓氏が、8月19日に極めて不可解な形で「大学側が採点する方法」について報道し、あたかもこの方法が既定路線であるかのようにミスリードすることによって、結果的に問題の多い方法の採用を後押しすることになっているのではないかと批判した。しかも国立大学協会の「論点整理」が出た後になってもなお、この方法が有効であることを「論点整理」の内容を十分に記述しないまま情報発信し続けたことも批判した。さらに氏岡氏の「記述式試験」に関する識見や調査に不十分さがあることも指摘した。これらを通じて、私は氏岡氏が8月19日の記事の記事化の経緯と「記述式試験」の内容に関する解釈について、説明するべきだと述べた。今回の社説の記事においてもなお、ここまでに行われたミスリードに関する修正も行われていないし、公表された文書を十分に検討したと思われない不正確な記述があることを上で指摘した。

氏岡氏こそ、今回の一連の報道や記述の内容について説明するべき責任があると考える。それを棚上げにして、文科省の会議の公開を求めるのは不誠実だ。

「経過がわからないまま結論を出されても」と言うが、そもそも今回の「進捗状況」の文書を詳細に検討すれば、どのようなことが検討され、新共通テストで何を問おうと考えているのかかなりの分量で記載がある。まずその内容を正確に把握し報じるべきだ。少なくともこの社説のような文章を書いてしまうのでは、公表された文書すらまともに読めないということを自ら示してしまっている。このような文章を書く人にいくら情報提供しても正確な理解は得られないと通常は判断する。

そして上のツイッターのつぶやきである。

生徒、保護者、高校、大学は不安を抱えている。会議は公開を。

この間の一連の報道で、大学関係者に不安を抱かせているのは氏岡氏の署名記事に端を発する、大学側が採点する方法があたかも決定事項であるかのような報道にある。不安を煽っているのはほかならぬ氏岡氏自身である。

私は、このような自分の行ったことを棚に上げ、あたかも文科省の対応が「不安」の原因であるかのような書き方は卑怯であると言わざるを得ない。報道に携わる者は、自分の報道が一般社会での一定の議論の方向性や見方を決定づけてしまうことにもっと自覚的でなければならないと思う。私は少なくとも氏岡氏はこの話題に関して情報発信を行う者としての適格さを欠いているのではないかと考えている。

2016-09-03

【新共通テスト記述式】2016年9月2日付読売新聞社説を批判する

読売新聞教育大学入試センター大学国立大学協会入試新共通テスト

2016年9月2日の読売新聞に、「大学入試改革　受験生のためになる１月実施」とする社説が掲載された。しかし、この社説の内容は、実際の発表内容をミスリードしかねない非常に悪質なものであると言わざるを得ない。以下、この社説の内容について具体的に批判する。

そのために、文科省が9月1日付けで何を公表したのかという点を明らかにする必要がある。公式の文書は次のものである。

高大接続改革の進捗状況について

今回の記事では、この文書の内容と9月2日付け読売社説の内容を比較しながら批判する。

公表されたものは何であるのか？

読売社説の冒頭はこうだ。

　受験生の思考力などを的確に評価できる試験にすることが肝要だ。

　大学入試センター試験に代わり、２０２０年度から導入される新テスト「大学入学希望者学力評価テスト（仮称）」について、文部科学省が大学・高校関係者と検討してきた具体的な実施案を公表した。

この記述は完全に勇み足であり、文書の内容と全く整合していない。

文科省の公表した文書の中には、

平成２８年４月に「大学入学希望者学力評価テスト（仮称）」検討・準備グループを設置し、記述式・英語の実施方法・時期等について検討中。
「大学入学希望者学力評価テスト（仮称）（以下「新テスト」という。）」検討・準備グループにおいて、平成２９年度初頭の実施方針の策定・公表に向け、以下のとおり、記述式や英語の制度設計をはじめとする各論点について検討・整理。
特に、記述式については、教科専門家やテスト理論家等の協力を得て、作問方法と採点方法に関する各検討チームを設け、作問の構造化や採点方法の在り方等について具体化を進めている。

とある。さらにより詳細に

現在、次の三つの案を検討。
【案１】１月に実施し、センターが採点する案
【案２】１２月に実施し、センターが採点する案
[1] 記述式とマークシート式を同一日程で実施する案
[2] マークシート式は従来通り１月に実施し、記述式を別日程で実施する案
【案３】１月に実施し、センターがデータを処理し、それを踏まえて各大学が採点する案

※ 【案１】については、採点期間が短期間となるため、精緻な採点が可能かという課題が生じるとともに、出題できる記述式問題の量・質が極めて限定的なものとなる。
※ 【案２の①】に対しては、高等学校教育の影響、運動部活動への影響の観点から、また、【案２の②】については、受験者の負担、実施体制の確保の観点から、関係者
から懸念が示されており、十分な検討が必要。
※ 【案３】は【案１】から派生したものであるが、この案には、出題や採点の幅が広がるメリットがある一方、多くの検討すべき論点・課題もあることから、今後、それ
らについて十分な検討が必要。

と記述されている。これらの記述をもとに、「具体的な実施案」などと書くのは状況をミスリードするものである。

どの時期に、どのような内容で、だれが採点するのか、現状では全く煮詰まっていないことを意味している。どの案にもメリットとデメリットはあることがはっきり明示されている。特に、大学側に採点を委ねる案には、「多くの検討すべき論点・課題」があるとはっきり記されている。

相変わらず大学側が採点する方法について事実関係や内容をミスリード

にもかかわらず読売社説は次のように言う。

実施案では、出願先の各大学が記述式の採点を担う方式が打ち出された。国立大学協会の提案だ。有効な打開策だろう。採点作業が効率化されるため、センター試験と同じ１月中旬にテストを実施できる。この点はメリットだ。

この記述はほぼすべての記述に問題がある。

第一に、既に指摘したように、今回の文科省が公表したものはあくまでも「進捗状況」に関する報告であり、具体的な実施案でもなければ、大学が記述式問題の採点を担うことを確定したわけでもない。にもかかわらず「実施案」「打ち出された」などの表現を利用して、あたかもこの方式が決定したかのようなミスリードが行われている。

第二に、大学側が記述式問題の採点を行う方法を、国立大学協会が提案したというのは現在のところ明確に誤りである。国立大学協会が8月19日に公表した文書は、

大学入学希望者学力評価テストの実施時期等に関する論点整理～とくに国語系記述式試験の取扱いについて～

であり、この中で

今回の文書は、表題の通り「論点整理」であって、特定の結論を述べているものではない。

と明確に述べている。従って、この文書で「大学側が記述式の採点を担う方式」が「国立大学協会の提案」であるとと記述するのは明らかに誤りであるというほかはない。これは「有効な打開策」という読売社説執筆者の勝手な判断を既定路線化するためのミスリードであると言わざるを得ない。事実、読売社説の中には、この方式が多くの問題を抱えていることに対する言及が一切ない。これは、国立大学協会の「論点整理」ではもちろんのこと、文科省が公表した「進捗状況について」の文章ですら明確に言及しているにもかかわらずである。

これら2点は、朝日新聞編集委員氏岡真弓氏による極めて不可解な先行報道と、「大学側に採点を委ねる方式」の本質的なデメリットを隠ぺいしたまま既定路線化させかねない記事に端を発しており、

でも批判した。

この記事の続編にあたる

でも取り上げたが、読売新聞も、8月20日付の記事『大学新テスト、英語「話す」で民間試験の活用案』の中で、既に上記の2点に相当する問題のある記述を行っている。

国大協は記述式の採点を、受験生の出願先の各大学が行う案を示した。（中略）国大協はテストを1月中旬に実施しても、各大学が採点すれば200字～300字程度の記述式が導入できると想定。大学による採点が難しい場合は、採点期間を国立大学前期試験直前の2月下旬まで延長する別の案も示した。

この記述の時点ですでに読売新聞は、国立大学協会の「論点整理」の内容を踏み越えて、その内容を歪曲して報道していることになる。今回の読売社説は、この記事の内容と符合したものであり、氏岡氏の記事と同様、問題の多い案をあたかも既定路線であるかのようにミスリードする記事であり悪質だと言わざるを得ない。

記述式試験に関する不見識としか言い様ない記述

読売社説には、新共通テストに関するいくつかの点に関して、明らかに不見識としか思えない記述が散見される。これが第三の論点である。

実施案では、出願先の各大学が記述式の採点を担う方式が打ち出された。国立大学協会の提案だ。有効な打開策だろう。採点作業が効率化されるため、センター試験と同じ１月中旬にテストを実施できる。この点はメリットだ。

「採点作業が効率化されるため」とはどういう意味なのか。全く理解しがたい。これは「実施できる」の根拠記述としか読めない。しかし、出願先の各大学が記述式の採点を担うことにより、なぜ採点作業が効率化されるのか、その論理関係が全く理解できないのである。

この記述よりも前に

記述式導入の最大の課題は、採点期間の確保だ。民間委託などで採点した場合、２０〜６０日かかると試算されている。

との記述もある。大学側が採点すると、何らかの効率化によって、採点期間が短くて済むとでも言うのだろうか？これは、読売社説の執筆者の、この問題に対する見識、あるいはそれ以前に論理的に文章を書く資質にさえ疑問符が付きかねない記述である。

現在のところ採点作業の効率化は、コンピュータによるクラスタリングにかかっているということになっており、そのことは、読売社説のこの文章よりもあとで触れられる内容である。

実施案では、出願先の各大学が記述式の採点を担う方式が打ち出された。国立大学協会の提案だ。有効な打開策だろう。採点作業が効率化されるため、センター試験と同じ１月中旬にテストを実施できる。この点はメリットだ。

　円滑な実施には、明確な採点基準を示すことが大切である。大学側の協力も欠かせない。文科省は教員を中心とした採点者の確保など、各大学の体制整備を支援する必要がある。

　記述式の答案はまず、大学入試センターがコンピューターを用いて、キーワードなどを基に大まかに分類する。その上で、各大学が成績を段階別で評価する方式が想定されている。

　コンピューターなどによるデータ処理技術が向上すれば、大学の負担は軽減されよう。

　出願先が複数にわたる場合の対応や、個別入試の時期が早い私立大との調整も重要になる。来年度に始まる試行テストで課題を検証し、着実な実施につなげたい。

もしかしたら、途中で推敲する際に漏れたのではないかとさえ疑いたくなる記述である。

さらに、この記述には複数の問題点が潜んでいる。

まず「コンピューターによるデータ処理技術が向上すれば」とあるが、これは明らかに現状ではまだそうした技術が十分とは言えないことを示している。しかもクラスタリングによって答案を分別することによって本当にしア点を効率化できるのかという本質的な問題すら未解決ではないか。問題は、将来的な技術の向上という曖昧な見通しに立脚して、記述式採点を効率化でき、大学の負担は低減できるのだから、大学に採点させる方式が有効だ、と判断し実行に移すことを提唱する、その倫理観の欠如だ。大学に採点させる方式にしたとして、この技術の向上が上手くいかなかった場合、効率化されない過重な負担を大学側に負わせることになる。その責任はどう果たすのであろうか。

文科省の公表した「進捗状況について」という文書には、クラスタリングに関する部分も記載がある。しかし、p.29にある「クラスタリング結果のサンプル」には一見だけで明らかな問題がある。この点については別の記事で触れたいと思う。しかし、その以前に、文科省の側は読売社説よりずっと慎重な言い方をしていることを指摘したい。

現在の技術水準で実現可能な方法により、答案の読み取り、文字認識によるデータ化、キーワードや文章構造による分類（クラスタリング）を行うことについて、民間事業者の知見も踏まえながら検討。

将来技術革新があることを前提に新しいシステムを導入してしまうのは無責任極まりない。現状できる方法で導入し、もし技術革新があれば置き換えていけばよい。いまできる方法で十分に効率化できていないなら、安易に将来を夢想してはいけない。

次に、そもそも「明確な採点基準」がいかに困難なことであるかということに対する無自覚さがある。このことは実際にいろいろな例を見てみれば即座に了解できるはずのことだ。50万人が受験する試験で、記述式答案の採点基準を明確なものにすることが極めて難しい。これについては

の中で、PISAの落書き問題と2016年度東大現代文第一問を例に論じた。

そしてさらに、「来年度に始まる試行テストで課題を検証し、着実な実施につなげたい。」という記述の無責任さだ。「出願先が複数にわたる場合の対応」や「個別入試の時期が早い私立大との調整」は、試行テストによって検証できるものではない。これは制度の問題そのものである。試行テストで検証できるのは、問題の内容や採点基準の作成、そしてクラスタリングの有効性などの方である。つまり、試行テストで何を検証できて、何を試行テストとは独立に設計しておかなければならないかが全く理解されていない記述になっているのである。

文科省の「進捗状況」でもプレテストについて

新テストを円滑に導入・実施するため、記述式の作問・採点を含むテストの信頼性・妥当性、試験問題の難易度や試験運営上の課題、不測の事態発生時の対応、民間の活用の検証等を行うための試行テスト（プレテスト）の実施に向けた必要経費を要求。

とある。「出願先が複数にわたる場合の対応」や「個別入試の時期が早い私立大との調整」は試行テストとは殆ど無関係だ。

曖昧で十分検討したとは思えない記述は、前半にもある。

マークシート式のみのセンター試験に対しては、理解度を十分に測れないとの批判がある。大学側からは、学生の「書く力」が不足しているとの指摘が目立つ。

　知識量だけでなく、思考力、表現力を測るため、新テストに記述式を導入する狙いは理解できる。入試の改革で、高校の授業を変える効果も期待できよう。

センター試験は「理解度を十分に測れない」とはどういう意味だろうか。センター試験が「知識」だけを問うているというのは、相当怪しい迷信だと思う。たとえば国語の試験は、「知識」だけが問われているわけではないし、問題を解くために「思考力」が不要であるとは到底思えないし、「理解度」も一定の側面からは測れている。

学生の「書く力」が不足しているという指摘は、新共通テストに「記述式問題」を導入するべきという主張と直接は結びつかない。そもそも国公立ならば（推薦や一部の後期入試の方式などの例外を除けば）二次試験で文理を問わず何らかの科目の記述式試験を通過して合格しているはずだ。

この辺りは、マークシート式試験と記述式試験を共通テストとして実施することで何を測ろうとするのかという点を十分に検討しなければならず、文科省は現在それを検討していると表明しているのである。読売社説はこうした点について十分に検討していないために、言葉の選び方や記述が曖昧で意味がはっきりしない形になってしまっているのである。

新共通テストの英語試験に関する点でも言葉の選び方に疑問がある部分が見受けられる。

英語で活用する民間試験について、文科省は一定の基準を設けて認定する方向だ。公正性の確保や受験料負担の抑制が望まれる。

「公正」という言葉遣いは、不正やごまかしのないことを通常指す。民間試験を導入する際に、試験の公正性が問題になるというのは通常考えにくい*1。

問題なのは、試験の公平性だ。

ある年度の大学入学者を選抜する際、実施団体が異なる試験や実施団体が同じでも実施時期が異なる試験の結果を用いることは、選抜の公平性とどう折り合いをつけることができるのか、ということが問題なのである。

まとめ

全体として9月2日付の読売新聞社説は、

新共通テストの記述式試験の採点に関する情報のミスリード
大学側が採点する方式のデメリットを実質的に隠ぺい
新共通テストや記述式試験の内容や問題点について十分検討せずに書かれたと判断せざるを得ない粗雑な記述

という問題点の多いものであった。こうした記述は報道機関としての公平性や信義を欠いたものであると言わざるを得ない。

*1:2014年にBBCが報じたTOEC、TOEFLの実施を委託されていた団体の不正行為などの例はあるが、それは民間試験を導入する場合の第一義の問題とは言えないだろう。

2016-08-27

【新共通テスト記述式】大学側が採点する方法に反対する-特に採点の観点から-

入試国立大学協会大学大学入試センター教育新共通テスト朝日新聞

前回までのまとめと今回の内容

という2つの記事で、8月19日付朝日新聞1面記事・4面解説記事および8月20日付朝日新聞記事の内容を見つつ、編集委員氏岡真弓氏を批判してきた。

最初の記事では、主として記事化の経緯の不明確さに対する説明を求め、2つ目の記事では、氏岡氏の「記述式試験」に関する見識の危うさを指摘した。

あまり氏岡氏ばかりを批判ばかりしても大人げないかもしれないので今回の記事では少し視点を転じて、私が、「大学側が採点する」という方法に反対な理由について少し書きたい。もちろん氏岡氏の上記の朝日新聞記事も念頭にあるが、国立大協会入試委員会がまとめた「論点整理」にも不用意な点があることを指摘する。

私は反対だ。

ところで、今回の新共通テストにおける記述試験の採点については、当初AIの活用も言及され、高大接続システム改革会議の最終報告の中にも、AIを活用して、記述答案の「下読み」＝クラスタリング（類似した解答ごとにグループ化）を行わせる案が記載されている。（p.57）
今回の朝日新聞の記事を受けて、AIの活用に言及するツイートやコメントもいくつか見受けられた。例えば、

大学入試の記述式の採点とか人工知能で十分。ます分量書いてるか、必要なキーワードが入っているか、論理的な文章になっているかどうか。そこを満たせない人を落とすので良い。人工知能以下なら大学教育しても無駄だし。

もちろん批判的な意見もある。

センター試験記述式、去年は人工知能が採点すると報道されていた。それが急に大学教員が採点すると。人工知能は、人工知能はどうしたんだ。誰が提言したんだ。そんな夢物語をベースに試験改革をやるつもりだったのか。呆れてものも言えない。

「東ロボ」プロジェクトを率いる新井紀子氏は、AIの活用には批判的であり、大学側が採点を行う方法について「事実上この方式しかないと思われ。」と述べ、

結局のところセンターで採点するにしても大学教員が駆り出されるのを避けられないなら、まだ自分の大学の答案を自分の基準で採点した方がマシだと思います。実際、今も、センターの監督業務、外注しないで大学教員がしてますよね。

と述べている。大学教員の中にもこのように考える人も多いかもしれない。

しかし、私は総論としては、記述式試験を大学側が採点するという案に反対である。

そもそも共通問題を個々の大学のアドミンション・ポリシーに還元できない

個々の大学の採点基準やアドミッション・ポリシーに任せるというのなら、そもそも「共通試験」という前提が崩れ去るという指摘にはもちろん同意する。
しかし、そもそも50万人が共通して回答する問題を、多種多様な各大学のアドミンション・ポリシーに還元し、採点基準を変えることなど土台無理な話だ。
高大接続システム改革会議の最終報告には盛り込まれていないが、12月22日の会議で提出された配布資料の中に、「国語」の問題例がさらに2つある。

問Ａの文章のドイツの小説家，Ｂの文章のアメリカの小説家，Ｃの文章の日本の作曲家は，それぞれの世界で数多くの作品を生み出している。Ａ，Ｂ，Ｃの文章に示されたこの３人の創作への取組姿勢には，共通するパターンがみられる。それぞれの文章では，創作への取組姿勢について，どのような【状況】のときに，どのような【問題】が生じやすいと述べているか。３人に共通する【状況】と【問題】の組合せを，それぞれの選択肢群から１つずつ選んで答えなさい。なお，該当する組合せは１つとは限らないが，あなたは組合せを１つ答えること。
次に，あなたが選んだ【状況】の下で生じやすい【問題】は，どのように【解決】できる（している）とそれぞれの文章では述べているか。３人に共通している解決法を，30字以上，50字以内で要約して書きなさい（句読点を含む。）。

【状況】
1. 作品の締め切りが近いが，なかなかやる気が起こらない。
2. 作品の制作に毎日取り組んでいる。
3. 作品をつくっているところを他の人に見られたくない。
4. いつもよりも難しい作品に挑戦するため，不安になっている。
5. 作品の制作が終了する時刻を決めることができない。
6. 作品についてすばらしいアイデアを思い付いている。
【問題】
1. その日の調子がよいからといって無理をすると，翌日に悪影響が出てしまうことになる。
2. 食事の前に比べて，食事を済ませた後は創造的な感覚が鈍りがちになる。
3. 制作のための作業だけをしていては，毎日続けて制作を行うことは不可能になる。
4. 日々の気分や状況に流されてしまうと，コンスタントに成果を出すことができなくなる。
5. 制作することに集中し過ぎると体を動かさなくなり，体の調子が悪くなる。
6. 制作している途中で邪魔が入ると作業が中断してしまい，制作に没頭できなくなる。

（公立図書館に関し，その現状と課題の他，若者の自立・社会参画支援を推進する場，家庭教育支援のための場，地域の人たちの対話や交流の場としての試みなど今後の公立図書館の可能性等について記した1,400字程度の新聞記事を読んで答える問題）

問今後の公立図書館の在るべき姿について，あなたはどのように考えるか。次の１～３の条件に従って書きなさい。

条件１ 200字以上，300字以内で書くこと（句読点を含む。）。
条件２解答は２段落構成とすること。
第１段落には，今後の公立図書館が果たすべき役割として，あなたが重要と思うものについて書くこと。その際，文中に示された公立図書館の今後の可能性のうち，今，あなたが重要と考える事項を一つ取り上げ，本文中の言葉を用いて書くこと。
第２段落には，仮にあなたが図書館職員だとした場合，図書館において，第１段落で解答した姿を実現するために，どのような企画を提案したいかを記すこと。その際、企画の内容に加えて企画の効果についても記すこと。
条件３本文中から引用した言葉には，かぎ括弧（「」）を付けること。

仮にこのような問題を出した場合、理工系大学の学生を選抜するために適切な出題と言えるだろうか。かなり具体的な内容にすればするほど、すべての学部に共通した問題意識を維持することが難しくなる。

少し極端に言えば、理工系大学に入学する学生を選抜するのに、公立図書館の在るべき姿について考えることなど「必要ない」（かもしれない）。
　採点基準だけでなく、どのような課題を課すか自体が大学のアドミッション・ポリシーなのであって、採点基準だけを独立に議論するのは一面的すぎる。この点で国立大学協会の「論点整理」が

設問の中に構造化された能力評価の観点を踏まえつつ、各大学（学部）はアドミッション・ポリシーに基づき独自の採点基準を採用することができ、各大学（学部）の主体性が発揮できる。(p.3)

などと書いたのは明らかに不用意であったと言わざるを得ない。

採点という観点からみる

大学側に採点を委ねる方法を採点という観点でみたとき、国立大学協会の「論点整理」に出てきていないひとつの問題は、各大学の独自基準に任せた採点をさせると、出題側に十分なノウハウを蓄積するのが難しく、次年度以降の作問技術の向上に支障を来すのではないかという点がある。

自分たちで出題しそれを自分たちの眼と手で採点してこそ出題にあった問題点を認識し、次年度以降に生かせるのである。ばらばらな採点基準で採点されたものを紙やデータだけで後から見るだけではそうした効果が相当に減ぜられてしまう。

それでもやはり、私が最大の問題だと考える点は、国立大学協会の論点整理にある次の点だと言ってよい。

○センターによる採点基準の設定等
センターはどの程度の採点基準を示すのか。解答例や採点例まで示すのか。段階別表示の方法を含め、各大学における採点にどの程度の裁量を与えるのか。
○各大学における採点
自ら作成したものではない試験問題について、出題意図や採点基準の的確な把握と採点者間の共通理解の下に、責任ある採点ができるか。結局、作問も各大学が行う方が良いということにならないか。

そもそも記述式の場合、採点基準は具体的な答案を目にして議論せざるえをえない。これがマークシート式との決定的な違いのひとつであり、個々の具体的答案を見ないまま概括的な採点基準や正答例＆誤答例を示すだけでは、多様な答案に対応できずほとんど役に立たない。

　より重要なのは2点目だ。
　多くの大学教員は、自分の大学に入ってくる学生の能力をできるだけ正確に把握し、入学後の学びについてこれる学生を取りたいと考えているだろうし、そのために資すると考える問題を作って、自ら採点することでできる限り目的を達しようとしているわけだ。
それは自分たちで作り自分たちで採点することから生まれる責任意識やモチベーションがある、と少なくとも私は信じている。
　実際に答案が送られてくるまでどのような内容の問題であるかも知らされず、どのような答案が出てくる可能性があるかといったシミュレーションもできない、しかも自分の大学で学生に求めたい内容とはかけ離れた出題であった場合、率直に言って採点側にどういうモチベーションを期待できるだろうか。
　面倒だから白紙か何か書いてあるかで2段階評価でいいじゃないかというようないい加減な採点基準になるということだって想定されるだろう。自分たちで熟慮を重ねて作った問題ではないのだ。愛着もないし、単なる面倒な仕事をやっつけるだけになっても採点者を責められないように思う。

もちろん大学教員は学生のレポートを評価したり記述式試験を採点したりするという業務を行っている。しかし、入学試験での採点という点で重要なことは、採点者は1名ではなく、受験者一人の答案に少なくとも2名以上の採点者が付くこと、そして、採点者一人がすべての受験者の答案に目を通すとは限らないということだ。従って、採点にあたっては、複数の採点者が採点基準について合議し、共通了解に達しなければならないということである。この合意を取る作業というのは、単なる講義のレポートや講義の試験の採点と異なる点である。一人の採点者が自分の価値判断で採点基準を決められるわけではない。しかし、実際には合意を取る作業というもの自体が決して容易な作業ではないのである。

こういう観点は少しわかりにくいのかもしれないので、少し誤解をおそれず具体的な例を見てみたいと思う。
（念のため付言しておくが、私は大学入試の国語の採点など一切行ったこともないので本記事に書いていることはひとつ想像でしかない部分が多い。）

PISAの「落書き問題」を「採点」という観点でみる

記述式の問題が苦手であるという指摘は従来からあり、その際よく引き合いに出されるのがOECDのPISAだろう。
PISA型の問題が本来我々の目指すべき学力を担保し得るのかどうかについても議論が必要かもしれないが、PISAのすべての問題について総括的に議論したいわけではない。
ここで問題にしたいのは、

PISA型の問題で自由記述が苦手だという結果が出ているし、
記述式試験の導入しましょう、
採点は大学側にやってもらいましょう、
そうすればアドミンション・ポリシーに従って自由に採点できるでしょ

というような極めて安易な発想がどういう事態を意味しているのか、ということを採点という観点に絞って少し考えたい。

PISAの問題例として有名な問題に「落書き」の問題がある。他にも公開問題例はいくつかある。
また採点基準に加えて正答例や誤答例は、日本語の本「PISAの問題できるかな？OECDの学習到達度調査」で読むことができるし、OECDのページには英語版のpdfがある。

私がここでこの問題を取り上げる理由は、記述式問題の解答の多様さ、採点基準として示される概括的な記述の不十分さ、そして何が「論理的」あるいは「説得力がある」と評価されるべきかという基準の曖昧さをこの問題を通して体感してほしいからである。
たとえばこの問題とあとに述べる採点基準が送られてきて、あとはお前の大学のアドミッション・ポリシーに応じて採点基準を決めて採点せよ、と言われたらどういうことになるのか、ということを。

さて、落書きの問題とは次のような問題であった。

＊＊＊　ヘルガの手紙　＊＊＊

　学校の壁の落書きに頭に来ています。壁から落書きを消して塗り直すのは今度が4度目だからです。創造力という点では見上げたものだけれど、社会に余分な損失を負担させないで、自分で表現する方法を探すべきです。
　禁じられている場所に落書きするという、若い人たちの評価を落とすようなことを、なぜするのでしょう。プロの芸術家は、通りに絵をつるしたりなんかしないで、正式な場所に展示して、金銭的援助を求め、名声を獲得するのではないでしょうか。
　わたしの考えでは、建物やフェンス、公周のペンチは、それ自体がすでに芸術作品です。落書きでそうした建築物を台なしにするというのは、ほんとに悲しいことです。それだけではなくて、落書きという手段は、オゾン層を破壊します。そうした「芸術作品」は、そのたびに消されてしまうのに、この犯罪的な芸術家たちはなぜ落書きをして困らせるのか、本当に私は理解できません。　　　　　　　　　　　　　　　　　　　　　ヘルガ

＊＊＊　ソフィアの手紙　＊＊＊

　十人十色。人の好みなんてさまざまです。世の中はコミュニケーションと広告であふれています。企業のロゴ、お店の看板、通りに面して大きくて目ざわりなポスター。こういうのは許されるでしょうか。そう、大抵は許されます。では、落書きは許されますか。許せるという人もいれば、許せないという人もいます。
　落書きのための代金はだれが払うのでしょう。だれが最後に広告の代金を払うのでしょう。その通り、消費者です。
　看板を立てた人は、あなたに許可を求めましたか。求めていません。それでは、落書きをする人は許可を求めなければいけませんか。これは単に、コミュニケーションの問題ではないでしょうか。あなた自身の名前も、非行少年グループの名前も、通りで見かける大きな製作物も、一種のコミュニケーションではないかしら。
　数年前に店で見かけた、しま模様やチェックの柄の洋服はどうでしょう。それにスキーウェアも。そうした洋服の模様や色は、花模様が措かれたコンクリートの壁をそっくりそのまま真似たものです。そうした模様や色は受け入れられ、高く評価されているのに、それと同じスタイルの落書きが不愉快とみなされているなんて、笑ってしまいます。
　芸術多難の時代です。　　　　　　　　　　　　　　　　ソフィア

2通の手紙は、落書きについての手紙で、インターネットから送られてきたものです。落書きとは、壁などところかまわず書かれる違法な絵や文章です。この手紙を読んで問に答えてください。

問2：ソフィアが広告を引き合いに出している理由は何ですか。

問3：あなたは、この２通の手紙のどちらに賛成しますか。片方あるいは両方の手紙の内容にふれながら、自分なりの言葉を使ってあなたの答えを説明してください。

問4：手紙になにが書かれているか、内容について考えてみましょう。
手紙がどのような書き方で書かれているか、スタイルについて考えてみましょう。
どちらの手紙に賛成するかは別として、あなたの意見では、どちらの手紙がよい手紙だと思いますか。片方あるいは両方の手紙の書き方にふれながら、あなたの答えを説明してください。

この3つの問はPISAの公開問題例に現れる「記述式問題」の例である。無回答率の高さで日本が突出していたことで話題になった問題のひとつである。この問題についてはすでに多くの議論もあるのかもしれない。今回この記事を書くために少しだけ調べてみた。

皆さんはこの3つの記述式の設問にどう答えるだろうか。

問2（ソフィアが広告を引きあいに出す理由）

この問題は1点か0点（誤答と無答）で採点されることになっており、次のような採点基準が示されている。

正答（1点）

落書きと広告とを比較していることを理解している。広告は落書きの合法的な一形態という考えに沿って答えている。

広告を引き合いに出すことが、落書きを擁護する手段の一つであることを理解している。

誤答（0点）

不十分な答えもしくは漠然とした答えをあげている。

課題文の理解が不正確、または説得力のない答え、無関係な答えをあげている。

無答

この基準に従って次の答案例を見てほしい。皆さんが採点者だとして、次の答えを正答と誤答に分けてほしい。

広告は落書き同様に目ざわりだということをしめすため。
一部の人びとは、広告をスプレー絵画と同じく見苦しいものと考えているため。
彼女は、広告は落書きの合法的な一形態にすぎないといっている。
彼女は、広告は落書きに似ていると思っている。
広告看板を立てる人は、あなたの許可を求めていないから。
広告はわたしたちの許可を得ないで置かれているので、落書きと同じだ。
広告看板も落書きと同じようなものだから。
落書きは展示のもう一つの形態だから。
広告主はポスターを壁にはるのだから、広告も落書きと同じだと彼女は考えている。
広告も壁を使っている点で同じだから。
広告も落書きも、見た目が良いものもあれば見苦しいものもある点で同じだから。
広告は落書きと違って受け入れられているので、彼女は広告を引き合いに出している。
（広告のことを考えれば、）落書きは合法であることが判明する。
彼女が自分の考えを示すため。
彼女が一つの例として広告のことを述べているのは、自分がそうしたいから。
自分の考えを示す手段である。
企業のロゴや店の看板。
彼女は落書きについて説明している。
なぜなら広告に落書きするから。
落書きは広告の一種だから。
落書きは、ある特定の人や集団にとって広告だから。
落書きを正当化したかったので。
広告と落書きの共通点を挙げて落書きを擁護するため

PISAの採点では、14-21が誤答であり、1-14はすべて正答とされた。しかし直ちに次のようなことが考えられはしないだろうか。

「比較」といっても、広告と落書きに何が共通しているのか、という点について、正答例の中には様々なレベルがある。何が同じかを述べない答案もあるし、「見苦しさ」「許可を求めているか」「壁」などなど。実は、5には「広告と落書きを暗に比較している」、7には「最低限の答え。何が似ているのかは説明していないが類似性を指摘している」、12には「落書きと広告への人びとのそれぞれの態度を比較して、その類似性をそれとなく示している」というような注釈コメントがついている。では、これらの正答例をA,B,C,Dの4段階で評価してほしいと言われても困惑しないだろうか。
13は正答にされているが、ソフィアは「落書きは合法」と言っているだろうか。これも非常に微妙である。
誤答の方だと、14,16は言っていることは正しいが比較はしていない。15,17,18,19は明らかにおかしいのに比べてこれが0点で良いのかという気もする。
20,21はこのソフィアの文章の「コミュニケーション」という言葉遣いの真意がはっきりしないので、扱いが微妙だという気もする。この言葉の曖昧さについての指摘はあとでも触れる。

では22,23はどうだろう？これはあるウェブサイトで解答例として書かれていたものだ。（こういう態度には敬意を表したい。多くのウェブサイトは問題を紹介するだけで自分の解答例を述べないから。）
実は、私の意見もどちらかというと22に近い。もちろん、穏当に答えを書けと言われれば、私も、
「広告と落書きはどちらも受け手の許可を得ていないという点で同じであるにもかかわらず、広告は評価され、落書きは不愉快とみなされるのは不当だとソフィアは考えているから。」
というような答えを書くだろう。しかし、2人の手紙を読んだとき、落書きを擁護しようとするソフィアの議論には飛躍も多く、「笑っちゃいます」とか「芸術多難の時代です」など、冷やかし的な感じを持った。もちろんそう感じない人もいるだろう。
私にはソフィアの議論は、本来広告と落書きは一概には比較できないのに、広告を持ち出して議論をそらそうとしているようにも見える。無自覚にそうしているのかもしれないが、私はこの文体からだとどうしても意図的に議論をそらしているように見えてしまう。
そうすると、「落書きを擁護するために、同列には比較できない広告の話があたかも落書きと同じであるかのように錯覚させて議論をそらすため」のようなうがった答えも出てくるかもしれない。
そういう答えを他の答えと比較してどのように扱うべきか、ということを考え始めると採点基準は非常に難しい、と言わざるを得ない。

問3（どちらの手紙に賛同するか）

この問題も1点か0点かで採点することになっている。その基準はこうだ。「説得力のあるなし」が採点基準に挙げられていることに注目してほしい。

正答(1点)

片方または両方の手紙の内容に触れながら意見を述べている。手紙の筆者の主張全般（落書きに賛成か反対か）や意見の詳細に言及していてもよい。手紙の筆者の意見に対して、説得力のある解釈をしていること。課題文の内容を言い換えて説明しているのはよいが、何も変更や追加をせずに課題文全部または大部分を引用するのは不可。

誤答(0点)

自分の考え方の根拠が、課題文のそのままの引用に終わっている。（「」で囲ってあってもなくてもよい。）

不十分な答えもしくは漠然とした答えをあげている。

課題文の理解が不正確、または説得力のない答え、無関係な答えをあげている。

無答

答案例を見てみる。皆さんはどう採点するだろうか。

ヘルガに賛成する。落書きは違法であり、従って破壊行為だ。
ヘルガ。落書きは反対だから。
ソフィア。落書きアーティストに罰金を科しておきながら、その一方で彼らのデザインをコピーして金儲けをするのは偽善だと思う。
どちらにも賛成かな。公共の場で壁に落書きをするのは違法だが、そうした人たちはどこか別の場所で作品を描くチャンスを与えるべきだ。
ソフィア。彼女の方が芸術に関心をもっているから。
両方の意見に賛成する。私は偽善者になりたくないから、落書きも悪いけれど広告も悪いと思う。
私は本当に落書きが好きではないから、ヘルガの方。だけどソフィアの意見や、自分の信じることを実行する人を非難しない、という彼女の姿勢は理解できる。
ヘルガ。こんなことで若い人たちの評価が落ちるなんて本当に残念だから。
ソフィア。店にある、落書きを真似た（品物の）模様や色が、落書きは不愉快と見なしている人々に受け入れられているのは事実だから。
人々は、社会に余分の損失を生じさせないで自分を表現する方法を探すべき、というヘルガの意見に賛成だ。
ヘルガ。どうして若い人たちの評価が落ちるのだろう。
ソフィア。ヘルガの手紙には、自分の意見を裏付ける理由を述べていないから。（ソフィアは広告に対して自分の意見を述べている。）
ヘルガ。彼女の方が詳しく意見を述べている。
ヘルガに賛成する。
両方に賛成する。ヘルガの事情は理解できる。しかし、ソフィアも正しいと思う。
どちらかと言えばヘルガの方に賛成する。ソフィアは、自分の考えに自信を持っているようにみえない。
ヘルガ。彼女は、落書きをする芸術家の中には才能ある人もいると思っているから。
ヘルガの手紙がよい。ヘルガは、落書きの創造力を認めつつも、落書きをしないでと訴えている。理由として、落書きは社会に損失を与え、建物を台なしにすることを挙げている。一方のソフィアは、落書きは許されると述べている。しかし、理由は適切とはいえない。広告する場合は看板設置などの許可が必要である。公共の建物や他人の所有物に勝手に落書きはできない。壁の模様や色が洋服に真似されたからといって、落書きの行為が受け入れられたとはいえない。
ヘルガの手紙がよい。相手を認め、愚かな行為を気づかせようとしている。落書き者の創造力を、「見上げたものだ」としている。相手は好感をもちやすくなる。落書きにも通じる芸術という言葉を使っている。芸術作品である建物を台なしにすることは「悲しい」と述べ、共感を誘う。消されてしまう犯ざい的な落書きではなく、自己の表現方法を他に探してしてほしいと、相手の立場で提案している。

いくつか注釈が付いている。例えば2は「最低限の答え」とされ正答。8は「ボーダーラインの答え。課題文をそのまま引用している部分もあるが、別の文章内で使っている。」として正答。9には「課題文の文章を組み合わせて説明しているが、手を入れた文章からは内容をよく理解していることがわかる。」として正答である。10-17がPISAの報告書で示されている誤答例で、18,19はウェブサイトから拾ってきた解答例である。すぐに次のことが考えられはしないだろうか。

2を「説得力のある解釈をしている」と言えるだろうか。
4はどうだろう？ヘルガとソフィアを比べたとき、ソフィアの方が芸術に関心があるという「説得力のある解釈」はあるだろうか。
そもそもヘルガの議論とソフィアの議論のどちらが「論理的」と言えるだろうか。もちろん「論理的でない議論でも賛同できる」という可能性はあるが、例えば「ソフィアの議論は論理的だから賛成」というような答案が出た場合、それも正答だろうか。

3番目に述べたようなことを言うのには理由がある。

ベネッセ教育総合研究所のページにはこう書かれているのだ。

課題文を一読して分かる通り、落書き擁護派のソフィアの文章は明快な三段論法の手法をとっています。すなわち、(1)店の看板やポスターは広告というコミュニケーションの手段として許されている。(2)落書きもコミュニケーションの手段の一つ。(3)だから落書きも許されてよい。

この意見にみんな同意するだろうか。もしそうだとすると、「ソフィアの議論は明快な三段論法になっているから賛成だ。」のような答案を正答として扱う必要もあるかもしれない。しかし、実際には逆の意見もある。妹尾知昭氏の「PISA型「落書き J問題の解答に見る大学生の読解力の傾向」の中で、「彼女の主張には瑕疵が多く見受けられる」（p.44）として多くの問題点を指摘し、「芸術という言葉の中立的な意味合いにより落書き行為を免罪しようとしている」、「ソフィアの発言には規範意識そのものが欠け、好みのレベルでしか論じられていない」などと指摘している。私もこの意見に賛成である。上のベネッセの書き方でいえば、コミュニケーションの手段であるという点が同じでも、すべてのコミュニケーションの手段が容認されるべきとは言えない以上、三段論法は破綻していると考えるべきと思う。
しかしでは入試の現場で、「ソフィアの議論は三段論法に基づく論理的推論であるから賛成する」と書かれた答案に出会った場合、それを無答と同じ0点としてもよいかどうかとなると悩ましくはないだろうか。ベネッセの記事を書いたような人が採点者の中にいた場合、採点基準を統一するのにすさまじい労力を必要とする可能性はないだろうか。

問4（賛否を別にして手紙のスタイルはどちらがよいか）

この問題も1点もしくは0点で採点する。採点基準はこうである。

正答(1点)

片方または両方の手紙のスタイルについて意見を述べている。文体、議論の組み立て、議論の説得力、論調、用語、読み手に訴える手法などの特徴を説明している。「よい議論」と述べている場合、それについての立証が必要である。

誤答(0点)

筆者の主張に対する賛成または反対の観点から判断を下している。またはたんにないようを言い換えている。

十分な説明なしに判断をくだしている。

課題文の理解が不正確、または説得力のない答え、無関係な答えをあげている。

無答

では解答例を見てみよう。皆さんはどう採点するだろうか。

ヘルガの手紙。彼女は、問題点を色々提示している。それと落書きアーティストが引き起こす環境被害のことも言っており、これは非常に重要なことだと思う。
ヘルガの手紙は、落書きアーティストのことを直接問題にすることで、強い印象を与えている。
この2つの手紙ではヘルガの手紙の方が優れていると思う。ソフィアの手紙には偏りが多少あると思う。
ソフィアは、強い議論をしているが、ヘルガの手紙の方が構成がしっかりしている。
ソフィア。自分の議論を実際、誰に向けているわけではないから。
ヘルガの手紙の方が好きだ。ヘルガの方が意見をはっきり述べている。
ヘルガ。彼女の言っていることすべてに賛成する。
ヘルガの手紙の方がよい。彼女が述べている通り、落書きは損失であり、無駄である。
ソフィアの手紙が一番よい。
ソフィアの手紙が読みやすい。
ヘルガの方がよい議論をしている。
ヘルガの方がよく書けている。彼女は問題を一歩一歩しっかり把握したうえで、論理的に結論を出している。
ソフィア。彼女の手紙は最後まで自分の立場を貫いているから。
ヘルガの手紙は、ただ単に自分の意見を押し付けている気がします。
ソフィアさんの手紙は一般的な考え方と違う視点で考えていると思います。（中略）世間のルールにとらわれていないソフィアさんの手紙が良いと感じました。
ヘルガの手紙は一般的には正しいことを言っているのかもしれないが、自分の主張しか書いていない。（中略）落書きをすることが全面的に良いとは言えないが、人それぞれの個性を考えてもよいのではないだろうか。
なぜかというとヘルガの手紙は、自分が不愉快に感じていることばかりを主張して独善的に感じるからだ。その一方でソフィアの手紙は、人の落書きに対する考え方は十人十色であることを踏まえたうえで、自分の考えを主張しているからである。
ヘルガは自分の意見ばかりを強く主張し、反対意見に対しては否定しているように感じられるが、ソフィアはどちらの意見に対しても強く否定していない。

1-6がPISA報告書にある正答例で、7-11は誤答例として挙げられている。12-16は妹尾知昭氏の「PISA型「落書き J問題の解答に見る大学生の読解力の傾向」の中で、大学生の解答例として紹介されているものだ。すぐに考えられる点はいくつもある。

ヘルガの議論に出てくるオゾン層の破壊は少し唐突すぎて、それを根拠にしている1は正答とみなせるか。
3や6は立証したことになっているだろうか。12は、誤答とされ、「課題文の理解が不正確、または説得力のない答え、無関係な答えをあげている。」に分類されているが、3,6などと比べて明確な差異があるだろうか。
12-16の大学生の答案はどうだろう？これは立証なのか、それとも感覚的な議論なのか。

そもそも議論への賛否を別にして手紙のスタイルだけを論じることが本当にこの問題で可能だろうか。両者を分けられる場合もあるかもしれないが、重なり合う部分も多い。私は、このヘルガとソフィアの議論を見ると、どうやってもソフィアの議論の論理性を擁護できないので、なんとなくフランクに書いている文体そのものにやや嫌悪感がある。しかしそれが良いという人もいるかもしれない。ソフィアの議論には賛成できないが、「文体がフランクで若者向けだ」みたいな答案さえ書けるかもしれない。

問題は何か

　この「落書き」問題そのもに批判的な意見もある。翻訳のまずさや他の問題なども含め次のようにコメントしているブログを見つけた。

言えることは、こんな出題に「無答」で報いた（そうせざるをえなかった）日本の受験生が「批評精神が無い」と言われる筋合いはない、ということです。「批評精神が無い」のはどっちなのだ、と言ってもいいほどです。

私もこれに賛成せざるをえないというのが率直な感想である。
私がこのPISA「落書き」問題の例を通して言いたいことはこうだ。

　不用意に作問された記述式試験に、概括的な採点基準だけを与えられた状況で、入試の判定に使えるように＝学生の能力を差別化できるように採点基準を組むことは極めて困難な場合があり得る。
　それも自分たちで作った問題なら自分たちで責任を取ればいいが、作問と採点が切り離されてしまうと、他人の作った極めて質の悪い問題の採点基準を考えるという苦痛に満ちた作業を強いられる。
　どんなに温厚な先生でも、こういう形で他人のしりぬぐいをさせられることにモチベーションを維持できるとはちょっと考えにくいのではないか。
　ましてやこのような採点基準をつくることと大学のアドミッション・ポリシーを結び付けられるはずもない。
　また、上のような答案例を選別するのに、AIを使うということも私には想定しにくい。立証できているのかとか論理的か、説得力があるかということの基準を十分に言語化できないからだ。あるいは、上でも見たように、論理的であるかどうかとは別の観点で書かれた答案を扱わなければならない可能性もある。

　もちろんPISAは15歳の学生を対象にしたものだから大学入試問題と一概に比較することはできない。
　大学受験生が書く答案はもう少し趣が違うかもしれないし、実際に記述式として出題される問題は良い問題であるかもしれない。
　しかし上記のPISAの例は、記述式問題の採点がいかに難しく時間のかかり得る作業であるかということを普通の人でも理解できる良い例であり、バラバラの基準で採点して良いという作問と採点の分離は言うほど容易くないことも実感してもらえるのではないか、と信じたい。

他の例

PISAの例だけではなくもう少し受験用の問題そのものを議論するべきなのかもしれない。
以下では、ごく簡単な例を1つだけ指摘したい。

2016年度東京大学現代文第1問

　内田樹氏の「日本の班知性主義」から採られた文章が、東大入試の現代文として出題され話題になった。
　そもそもこの内田氏の文章には山形浩生氏による強い批判「反知性主義3 Part 1: 内田編『日本の反知性主義』は編者のオレ様節が痛々しく浮いた、よじれた本。」があり、出題者がこの批判について知っていて出題文に選んだのかどうか、といった論点はあり得る。また、アゴラでは松本徹三氏が「東大入試合格には「知性的」であってはいけないのか？」という文章を書き、この問題自体を批判している。しかし一方で、東京大学入試問題・国語1(評論)-たくろふのつぶやきには、「僕は個人的に内田樹の著作は眉唾ものが多いと見ており、正直なところ話半分に読む程度がいちばん良い距離感だろうと思ってはいるが、この東大入試に使用された文章を読む限り、それほど支離滅裂なことは言っていない。むしろ、東京大学がこの文章を評論文の読解問題に使用した意図がよく分かる。」との意見があり、２０１６年東大国語ズバリ的中報告･内田樹氏･『日本の反知性主義』-現代文最新傾向LABO 斎藤隆では「この論考(論点･テーマ)は、受験生の読解力を判定するのに適切」とのコメントもあるなど、内田氏の議論全体の評価はひとまずおいて、出題そのものを擁護する議論もある。

　ここで言いたい事は内田氏の文章の当否でもなく、またこの文章を出題した東大の意図でもない。
　内田氏の文章が論理的文章であると判断するかどうかやこの文章を入試問題として出題するべきか/適切な出題かといった点に議論の余地が大きいという事実があるということである。
　もし作問と採点を分離すると、新共通テスト終了後、この文章と採点基準（あるいはいくつかの解答例も？）と学生の答案が送られてきて、あとは各大学のアドミッション・ポリシーに応じて採点基準を作って採点しなさい、という話になるという状況が想定される。内田氏の文章を全く論理的文章と見なさない採点者と適切な出題であるという採点者がいた場合、両者の採点基準を調整できるだろうか。もし自分たちが出題者なら、この文章に論争的な点が多いという理由で出題をやめたかもしれないし、もし出題するとしても、どの場所を問うかなどを事前に議論するだろう。そして合意できる場所を出題するだろう。東大の場合はそうだったからこそ出題に至ったわけだろうが、それを50万人が利用する試験ですべての大学の採点者にも要求できるか、ということははなはだ疑問である。

　すべての問を概観することはしないが、例えば問1は、

｢そのような身体反応を以てさしあたり理非の判断に代えることができる人｣（傍線部ア）とはどういう人のことか、説明せよ。

という問題である。いくつかの解答例を見てみよう。これは誤答例ではなく、どれもこれが正答例だとおもって書いている答えであることに初めから注意しておく。

他人の話をわかったつもりならず、それに耳を傾け、その内容を実感して納得できたか否かを、自らの知の枠組みが揺らぐままに内省できる人。（河合塾解答速報）
他者の言葉を自らの内的感覚で受け止めうるか否かで判断し、知的枠組みをそのつど作り変えて未知なるものを捉えうる人。（駿台予備校解答速報）
他者の言説をいったんは受容し、それが引き起こす納得や了解などの全身的な感覚を通して物事の正否を判断し、自らの知を更新し続ける人。（代々木ゼミナール解答速報）
自説に固執せずに、他人がもたらす未知のものを受け入れ、自らの知的枠組みを刷新しながら、それが自分の内的感覚と適合するかどうかをもって目下の是非を判断する人。（東進ハイスクール過去問データベース）
他者の言葉がはらむ未知のものを、既成の知的枠組みを基準に裁断せず、自らの内的実感にかなえば受け入れて自己を新たにしようとする人。（旺文社全国大学入試問題正解）
納得や了解等の全身的な感覚を意識して物事の正否を判定する人。
自分の意見にこだわらず、謙虚に他説のうち自らは未知な内容を吟味内省し、清廉な判断を下す不随意運動の如く無意識の思考習慣を身につけた人。

　実際には東大入試の場合、本問は配点40点で、2行で字数制限のない記述が4問、120字程度の記述が1問、漢字の問題である。この1個の小問は少ない場合5点くらいということもありえる。あるいはそういうことは忘れて、じゃあA,B,C,Dの4段階評価で上の解答例を採点してくださいと言われて全部Aでいいのか、という問題である。

　私は傍線部にある「さしあたり」という表現をどう見るのかという点や、例えば河合塾のように「自らの知の枠組みが揺らぐままに内省できる」という表現が妥当かどうか、「実感」「内的感覚」「全身的な感覚」「内的実感」、「内省」といった言葉の選び方、「清廉」や「清廉な判断を下す不随意運動の如く無意識の思考習慣」という言葉の選び方など、さまざまな論点があるように思う。実際の受験生の答案は、これらに比べれば洗練されておらず粗削りだったり当を得ていないものもあるだろう。

　実際の答案は、千差万別だし、そうしたものがAIで理非を判断できたりクラスタリングできるかどうかもかなり怪しい上に、出題にかかわっていない人が、これらの問の採点基準を合議で簡単に決められるとも思えない。
　解答する受験生は試験時間の間だけ考えればよいが、出題する側は非常に多くの時間をかけて解答できる形に問題を練り、そして最後に出てきた答案を見ながら採点基準を決めていく。
　そうしたプロセスに関係していない人がいきなり問題と概括的採点基準と答案を見せられて、では3週間で採点してくださいと言われてもそれは非常に困難な作業ではなかろうか。

2016-08-26

続【新共通テスト記述式】氏岡真弓氏による朝日新聞の記事を批判する

入試国立大学協会大学大学入試センター教育新共通テスト朝日新聞

前回のまとめと補足

前回

という記事で、朝日新聞編集委員氏岡真弓氏の署名記事について批判した。

その要点は、氏岡氏の記事が、国立大学協会入試委員会の対応に関して、（意図的にせよ結果的にせよ）明らかな印象操作を行い、「新共通テストの記述式試験を大学側が採点する」という方法が極めて問題の多い案であるという事実を十分に報じないまま、この方法の採用を後押ししてしまっているという点にある。
いくつかのコメントに飛ばし記事であるとか文科省側のリークというような話が出ていたし、私自身もその可能性はあると考えている。
しかし、その一方で、私は文科省も国立大学協会も正しく状況をレクチャしたにも関わらず氏岡氏自身が（意図的か無意識かはともかく）内容や方向性の間違った記事を書いた可能性、つまり氏岡氏の持っていた見解やバイアスや資質の問題が今回のような記事を書いてしまった原因である可能性も留保している。
これらの点を詳らかにするためにも、氏岡氏は自分自身の言葉で今回の記事に関する経緯を説明してほしいと考えている。

今回批判したいこと

今回私が批判したいのは、8月19日付朝日新聞4面に掲載された

『＜解説＞大学に負担、利用未知数　新テスト記述案』

という記事である。

前回の内容は記事化の経緯に関する点であり、氏岡真弓氏に非があることは明らかであると（少なくとも私には）感じられる問題だったが、今回はもう少し論争的な部分を批判したい。

はじめに結論をかけば、氏岡真弓氏は今回の新共通テストに関する問題特に採点方法の問題を論じる/解説するにあたって、この問題に関する十分な見識を欠いているのではないかということだ。

私が特に重要視している記事の記述は次の2つの記述に集約されている。

国立大学協会入試委員会が示した大学採点案が採用されれば、これまでの記述式で中心だった文章を理解し説明する設問と違い、自分の考えを書く問題づくりが可能になる。

日本の子どもたちが、自由記述を苦手としていることは、国際学力調査でも明らかだ。本格的な記述式が導入されれば、多くの受験生の学習に影響を与え、高校教育改革の背中を押すことになる。それだけに、文科省の今後の検討が問われる。

この問題を論じるにあたって、国立大学協会入試委員会の提出した論点整理や文科省の有識者会議＝高大接続システム改革会議の出した最終報告は役に立つ。

記述式問題の形式

氏岡氏の8.19付解説記事の最初の記述について考えたい。

国立大学協会入試委員会が示した大学採点案が採用されれば、これまでの記述式で中心だった文章を理解し説明する設問と違い、自分の考えを書く問題づくりが可能になる。

私の批判の要点は、氏岡氏はこの記述の中で、記述式問題において何を問うかという点に関する検討・理解を十分に行わないまま独自解釈を述べていないか、ということである。
特に、「文章を理解し説明する設問」と「自分の考えを書く問題」とを明確に区別した書き方をし、大学側が採点する方法を採ることにより、後者が可能になったと断定している点である。
　国公立大学の二次試験の国語で問われている問題はおおむね前者にあたり、文章の記述の内容把握や根拠説明を要求するものになっている。一方小論文試験や国公立でも非常に僅かだが一部の大学*1の国語の試験には、課題文の内容理解を踏まえる形で「あなたの考えを述べよ」という「自分の考えを書く問題」が出題されている。
　では、新共通テストの記述式問題で本当に後者のような問題を出すことが想定されているのだろうか。
高大接続システム改革会議の最終報告には、

国語については、次期学習指導要領における科目設定等を踏まえ、知識・技能に関する判定機能に加え、例えば、言語を手掛かりとしながら、与えられた情報を多角的な視点から解釈して自分の考えを形成し、目的や場面等に応じた文章を書くなど、思考力・判断力・表現力を構成する諸能力に関する判定機能を強化する。(p.54)

とあり、ここにみられる「自分の考えを形成し」という語句は一見氏岡氏の記述に合致しているように見えるかもしれない。しかし、これは、例えば選択肢を選ぶのではなく自分の言葉で説明することを指していると通常は解釈するように思う。
実際、

「大学入学希望者学力評価テスト（仮称）」の記述式問題については、現在、国立大学の二次試験で行われているような解答の自由度の高い記述式ではなく、設問で一定の条件を設定し、それを踏まえて結論や結論に至るプロセス等を解答させる「条件付記述式」を中心に作問を行うことにより、問うべき能力の評価と採点等テスト実施に当たっての課題の解決の両立を目指す。(p.56)

と述べられていることを見落としてはいけない。最終報告のp.75に掲載されている図も見落とすべきではない。

f:id:rochejacmonmo:20160826110229j:plain

つまり、「解答の自由度の高い記述式」や「小論文」は、創造性・独創性・芸術性の評価も含む問題であり「個別入試になじむ」と整理されている。
仮に大学が採点することになるからといって、この整理を放り出して、「解答の自由度の高い記述式」や「小論文」を出題するとか、
「自分の考えを書く問題」を出題すると述べるのは、議論の成果である最終報告よりも明確に一歩踏み込んだ記述になっていると言わざるを得ない。

では国立大学協会の「論点整理」ではどのように記載されているだろうか。

解答文字数をふくめて出題の多様性の幅が拡大することである。また、設問の中に構造化された能力評価の観点を踏まえつつ、各大学（学部）はアドミッション・ポリシーに基づき独自の採点基準を採用することができ、各大学（学部）の主体性が発揮できる。

ここでいう「解答文字数をふくめて出題の多様性の幅が拡大する」という記述には、氏岡氏の言うような「これまでの記述式で中心だった文章を理解し説明する設問と違い、自分の考えを書く問題づくりが可能」という趣旨を読むことはできないと私は考える。
というのも、ここでいう「出題の多様性」という文章は、前半にある次の記述を受けてのものだからだ。

全国共通試験への記述式・論述式問題の導入は、多肢選択問題では測ることのできない能力を評価するための大改革であり、適切にその能力を評価するためには相当数の問題が課されるべきである。また、評価すべき能力が個々の設問の中に構造化されるわけであり、その観点からは、短文記述式（40-50 字）設問のみでは、改革の主旨に沿った十分な評価を行うことができないと言わざるを得ない。解答文字数を含めて出題の多様性が出来るだけ拡大されることが望ましい。短文記述式のみでは早晩パターン化し入試技術化する危惧もあり、持続可能性の観点からも、同様のことがいえる。

これは、「これまでの記述式で中心だった文章を理解し説明する設問と違い、自分の考えを書く問題」を出題するべきというよりは、文字数は40-50字の短文記述よりは長めで、個数は多めにするべきということである。個数を多めにというのは扱う内容の多様性を確保せよといっているように私には見える。50万人が共通して受験するテストの場合、題材が1つだけだとどうしても能力よりもその話題になにがしかの知見があるかどうかなどの運の要素も出てきてしまう。また問題数が少ないと受験者の能力を判定するために適切な分布が得られないなどの問題もある。十分な量の問題と十分な長さの解答要求をすることでしか「適切に能力を評価」することはできないだろうと言っているように見える。ここには、「これまでの記述式で中心だった文章を理解し説明する設問と違い、自分の考えを書く問題づくりが可能」というような観点は入っていない。氏岡氏の記述は国立大学協会の「論点整理」の文脈からもはみ出していると考える。

また、高大接続システム改革会議の最終報告の参考資料2には、今回の新共通テストの問題例が掲載されている*2。この中の「国語」の問題では、交通事故の発生件数・負傷者数・死者数の年度変化を示すグラフを掲げ、「交通事故の死者数が他よりも早く，平成2年（1990年）以降減少傾向になっていること」の理由について考えさせている。要求しているのは、資料から読み取れる内容の記述や自分の主張を裏付けるためにはどのような資料を見ればよいかを記述させることである。これは、「自分の考えを述べる」問題ではないことは明らかである。

また氏岡氏は自身のツイッターで次のように述べている。

入試改革を引っ張ってきた国大協の委員会ででた案。出題の幅がぐんと広がる。注目です。

「出題の幅」とはどういう意味なのかはっきりしない。最初に取り上げた4面の解説記事の2つ目の記述にもあるが、「自由記述」「本格的な記述」のような書きぶりにも現れているように、言葉の選び方が不用意で十分に検討したと思われない。

「入試改革を引っ張ってきた国大協の委員会」という書き方もフェアではないと感じる。入試改革を先導し、その内容について具体的内容をまとめてきたのは文科省の有識者会議である「高大接続システム改革会議」ではないのか。主体的に動いているのがどこなのかを錯覚させかねない記述は批判されるべきだ。

読売記事との比較

しかし一方で、氏岡氏の名誉のために、次のことは指摘しておくべきだろう。
読売新聞が8月20日付の記事『大学新テスト、英語「話す」で民間試験の活用案』の中で次のように記述している。

国大協は記述式の採点を、受験生の出願先の各大学が行う案を示した。（中略）国大協はテストを1月中旬に実施しても、各大学が採点すれば200字～300字程度の記述式が導入できると想定。大学による採点が難しい場合は、採点期間を国立大学前期試験直前の2月下旬まで延長する別の案も示した。

これも国大協が大学側が採点するという案を提示したという問題のある記述をしているのだが、それ以上に、国大協が「200字～300字程度の記述式が導入できると想定」などという「論点整理」には全く書かれていない話を登場させている点に注目したい。
　「40-50字の短文解答式」ではまずいという議論から、いきなり「200字～300字程度の記述式」というところへ直接は結び付かない。
上の最終報告にある問題例は、40字以内と80字以上100字以内の設問である。通常、短文解答式ではないものを、という点でみれば、いきなり200字～300字となるのではなく、80字～100字程度の文字数ということを考えるのが自然ではないだろうか？
　また国公立の二次試験を見ても、単独で200～300字の記述を要求する大学はむしろ珍しく、東大でさえ最大文字数の問でさえ100字～120字で述べさせる問題である。
　もちろんこの「200字～300字」というのが、たとえば小問3個での合計解答文字数というなら話は違ってくる。（1個の大問全体での記述量が500～600字程度ということは珍しくない。）読売記事がそのあたりの正確さを欠く記事になっていることは批判されるべきだ。

　しかもこの出題内容については、多くの意見があるのだろう。たとえば、高大接続システム改革会議の第9回（2016年12月22日）の配布資料の中には、最終報告には盛り込まれていない2つの国語出題例が記載されている。

ひとつは

「３つの文章で語られている状況，問題，解決法に関する共通点について考察し，選択式と記述式で構成・表現する問題。」

とされ、30字-50字の記述式問題である。

もうひとつは

1,400字程度の新聞記事を，一定の目的に添って読み取り，得られた情報を取捨選択したり，自分の考えを統合したりしながら，新たな考えにまとめ，200～300字で表現する問題。

であり、これが「自分の考えを書く問題」にあたる。

f:id:rochejacmonmo:20160826113201j:plain

この問題の是非は別として、読売記事がこれを根拠に、「国大協が各大学が採点すれば200字～300字程度の記述式が導入できると想定。」と記述しているとすれば、それはソースの誤りと言うほかはない。これは高大接続システム改革会議の配布資料だからだ。また、氏岡氏がこれを根拠に、「自分の考えを書く問題作りか可能」と記述しているとすれば、上でも述べたように、この問題例自体は最終報告に盛り込まれていないこと、自由度の高い記述式や小論文は個別入試になじむと整理されていたことが、今回の「大学側が採点」という方式にしただけで完全に吹っ飛ぶのはなぜなのか説明が必要だ。これは「新共通テスト」の「共通」ということの意義と「個別の大学が採点」という「大学の独自性」というのがそもそも矛盾していないか、という本質的な問題とも無関係ではない。

今回のまとめ

つまり考えられることはいろいろある。

国大協が「論点整理」とは別に何らかのレクチャを行って上記のような、「これまでの記述式で中心だった文章を理解し説明する設問と違い、自分の考えを書く問題づくりが可能」とか「200字～300字程度の記述式が導入できると想定」といった説明をしている。
文科省が「これまでの記述式で中心だった文章を理解し説明する設問と違い、自分の考えを書く問題づくりが可能」とか「国大協は200字～300字程度の記述式が導入できると想定している」といった説明をしている。
氏岡氏個人が自分の独自解釈や希望的観測で記事を書いている。

といったことだ。
　しかしどれであったとしても、氏岡氏の記事は、高大接続システム改革会議の最終報告からは乖離しているし、現状の国公立二次試験での国語の出題状況などについても十分把握しているとも言い難い。また19日時点では取材していなかったのかもしれないが、国立大学協会の「論点整理」とも乖離している。こうした点からも、署名記事を書いた氏岡氏はいったいどういう経緯と解釈でこの解説記事を書いたのか説明するべきだと私は考える。

　実は、国立大学協会の論点整理の中には、次のような記述もあることを付け加えたい。

そもそも、記述式・論述式問題に評価すべき能力をいかに構造化できるかは、根源的な課題である。評価すべき能力の構造化があって初めて、各大学（学部）はアドミッション・ポリシーの中に、記述式・論述式問題を適切に位置づけることができる。しかしながら、国立大学全体にも大学入試センターにも、そのための知識やノウハウの蓄積は未だ十分ではない。平成 32 年度実施に向けて能力の構造化に向けた記述式・論述式問題設計の理論構築、体系化が喫緊の課題といえる。国大協としても、過去の各国立大学の個別試験における記述式・論述式問題に関する実績を調査・分析することなど、この課題に積極的に取り組んでいきたい。

これは、どのような形式で何を問うかということについて、決して十分な知見があるわけではないことを述べており、すなわちこ（「学力の三要素」といった抽象論ではなく）具体的な設計レベルでみれば、新共通テストにおける記述式問題の形式や内容についていまだに十分合意が取れているとは言えない現状を示している。にも関わらず、「これまでの記述式で中心だった文章を理解し説明する設問と違い、自分の考えを書く問題づくりが可能」とか「大学が採点を担う国立大学側の独自案が具体化すれば、入試改革は実現に大きく近づく」などと断定する氏岡氏の記述に私は強い不信感を抱かずにはいられない。

*1:2016年度だと例えば滋賀県立大・静岡大・首都大学東京・島根大など。ほかにもあるかもしれない。

*2:ただし、あくまでも何を問いたいかを例示するためで直接試験で出題できる問題として掲載しているわけではないという注釈付き。

2016-08-26

【新共通テスト記述式】氏岡真弓氏による朝日新聞の記事を批判する

入試教育新共通テスト大学国立大学協会朝日新聞大学入試センター

朝日新聞8月19日付記事にかかわる経緯

2016年8月19日の朝日新聞1面および4面に、新共通テスト（センター試験の後継となる試験）の記述式問題の採点方法に関する記事が掲載された。これらはいずれも、朝日新聞編集委員氏岡真弓氏による署名記事だった。

8月19日付朝日新聞1面記事：新テストの記述式は各大学が採点へ　当面国語のみで検討
8月19日付朝日新聞4面解説：＜解説＞大学に負担、利用未知数　新テスト記述案

この1面記事のタイトルは新共通テストの採点方式は、各大学が採点する方式で行われることを示唆したものであり、本文の冒頭から、

大学入試センター試験に代わり２０２０年度に始める共通テストで導入する記述式問題について、文部科学省は、受験生が出願した大学が採点を担う方向で検討を始めた。国立大学協会入試委員会（委員長＝片峰茂・長崎大学長）の提案を受けた。

と書いている。さらに後半では、

一方、今回の改革について「検討に積極的に参画する」としてきた国大協も入試委で採点方法を議論。国語で出題▽入試センターはマークシート式の採点を担う▽記述式を利用する大学は受験生の記述式の解答をセンターから送ってもらい、採点する――という独自案をつくり、７月末に文科省も同席した会議で示した。

とある。

しかし、4面の解説記事の中では、

入試委員会は、文部科学省が検討してきた2案と独自案のそれぞれの長所と短所について論点整理をまとめ、近く公表する方針だ。

とある。そもそも文部科学省に提案したとか、文科省も同席した会議で示したにも拘わらず、それがその後で論点整理が行われるというのは奇妙な話ではないだろうか。

そして、国立大学協会入試委員会における論点整理は、この記事が掲載されたのを全く同じ日、8月19日に公開された。

大学入学希望者学力評価テストの実施時期等に関する論点整理～とくに国語系記述式試験の取扱いについて～

この文書の中で、

今回の文書は、表題の通り「論点整理」であって、特定の結論を述べているものではない。国立大学協会としては、今後の文部科学省「大学入学希望者学力評価テスト（仮称）」検討・準備グループの検討状況を見極めながら、真に意味のある改革が着実に実現されるよう、今後とも柔軟かつ積極的に検討していく用意があることを、最後に付言しておく。

とはっきり述べている。
しかもこの文書のp.5には、大学側が記述式試験の採点を行うことに対する論点と課題が9項目にわたって列挙されている。この文書は、大学側が記述式試験の採点を行うことを提案した文書ではない。

にも関わらず、8月19日付けの朝日新聞の氏岡氏の記事では、あたかも国立大学協会入試委員会が、大学側による記述式試験の採点という独自案を文科省に提案したかのような形の記述になっている。これは国立大学協会による論点整理の内容を明らかに踏み越えた表現であると言わざるを得ない。

しかも1面の記事の中では

　入試委は独自案について、各大学が２次試験の合格発表までに採点すればよく、時間に余裕があるので出題の幅が広がると判断。また、センターが示す共通の採点基準に加え、各大で独自の基準を採用できるとしている。
　同省幹部は入試委の案について「本格的な記述式の出題が可能になり、改革の理念を実現する道を開く有力な案」と話す。

としか言及せず、この方式に多くの問題点が残っていることに一切触れていない。4面解説記事の中で

独自案の課題は、どれだけの大学が採点の負担を負ってでも利用するかだ

とだけ述べているが、現実には、この方式は単に大学の負担の問題にとどまらない非常に多くの問題点があると国大協の「論点整理」は指摘しているのである。

朝日新聞は、国立大学協会の論点整理を受けて、翌日8月20日の誌面に次の記事を掲載した。

朝日新聞8月20日付記事：センター試験にかわる共通テスト、国大協が論点整理提出

この記事は氏岡氏の署名記事ではないことに一応注意しておく。
しかし氏岡氏は自身のツイッターの中で

センター試験にかわる共通テスト記述式、国大協が論点整理提出：文科省2案と国大協独自案の論点を表にしました。

と述べているのだから、この記事と無関係ではありえないだろう。
この記事の中には次のような記述がある。

いままで通り大学入試センターが採点を担うことを前提に文科省が検討していた２案（[1]１２月中旬などに前倒しして実施[2]現行通り１月中旬に実施）と、入試委の独自案（１月中旬に実施し、その後、受験生が出願した大学が採点を担う）の計３案について考察した。７月末以降、委員らの意見を集めてまとめた。

もし19日と20日の記事の通りだとすると、
国立大学協会入試委員会は、

7月末の会議で、「大学側が採点を担う」案を文科省に「提案」
7月末以降に委員の意見を集めて「論点整理」を行い、しかも「特定の結論を述べているわけではない」。

これは明らかに矛盾した対応である。「提案」したあとに「委員の意見を集めて論点整理」などというのは順番があべこべで、このような経緯はにわかには信じがたい。

しかも20日付の記事には、論点整理の表が付けられているものの、本文中では、

[1]案は「高校教育への負の影響」を指摘。[2]案については「極めて少数の短文記述式設問に限定される」とする一方、採点をマークシート式と別にして各大学に結果を知らせるのを２月下旬に延ばせば、第一段階選抜には間に合わないが、「相当程度の問題内容の充実が可能」とも記した。

　独自案については、「採点のための時間的余裕が生まれ、出題の多様性の幅が拡大する」「各大学で独自の採点基準を採用できる」とし、「大学の責任と物理的負担が極めて大きくなる」「大学によって対応が分かれる可能性」などとも指摘した。

と記述し、独自案のメリットとデメリットの部分を逆接で結ぶことすら避けている。[1]案へデメリット、[2]案にデメリットと逆接で結んでメリットを記述しているにもかかわらずである。

氏岡真弓氏は取材の経緯を説明するべきだ

以上の経緯のもとで、私は、氏岡氏が19日の記事を書いた経緯を説明する必要があると考えている。

具体的には以下の点だ。

【19日の記事における提案の内容把握】氏岡氏は19日の記事で、国立大学協会入試委員会が、独自案を文部科学省へ提案したと書いた。その提案が行われたとする7月末の文科省同席の会議とはどのような会議であったのか。またそこでの「提案」はどのようなものであったと把握しているのか。その会議では問題点などの指摘は国立大学協会側から何もなされなかったのか。
【19日の記事と「論点整理」の関係】氏岡氏が国立大学協会入試委員会による「論点整理」の内容を見たのはどの段階でなのか。19日を書く前に「論点整理」の内容について取材したのか。それとも19日の記事は「論点整理」の具体的な内容については一切取材をせずに書いたものなのか。また国立大学協会が19日に「論点整理」を公開することを記事を書く段階で把握していたのか。
【国立大学協会への取材の有無】入試委員会が「各大学が２次試験の合格発表までに採点すればよく、時間に余裕があるので出題の幅が広がると判断。また、センターが示す共通の採点基準に加え、各大で独自の基準を採用できるとしている。」と述べたとする記述は、国立大学協会の論点整理を見て書いたものか、あるいは事前に取材したものによるのか。特に文科省担当者からの伝聞情報によるものなのか、直接国立大学協会に取材したものなのか。もし直接取材したという場合、国立大学協会からは、「特定の結論を述べているものではない」との表明はなかったのか。
【19日と20日の記事の整合性】19日の記事にある「7月末の文科省同席の会議」と20日の記事にある「7月末以降、委員らの意見を集めてまとめた」との記述の整合性や事実関係をどう把握しているのか。
【20日の記事の記述】20日の記事において、国立大学協会が「論点整理」の中で「特定の結論を述べているものではない」としていることや「独自案」について、9項目にわたる論点と課題を付記していることに一切触れていないのはなぜか。

もし印象操作がなされているなら重大な信義違反だ

今回の氏岡真弓氏の19日付の記事には強い違和感がある。19日の記事の中で文科省担当者が「八方ふさがり」と述べていることが紹介されているように、新共通テストに関する多くの課題が指摘され、様々な点が先送りされている現状がある。記述式の出題という点を実施するためには、どのように採点するかという点のクリアは必須だが、現状の文科省の案には批判も多く実現困難な状況にあった。
そこに国立大学協会入試委員会に関する何らかの会議で「大学側が採点する」という案（？）が俎上に上った。様々な日程的な点からもそろそろ結論を出さなければならない時期である以上、多少問題がある案であっても国立大学協会が提案したということを免罪符に押し切ろうとする意図が文科省側になかったか。そして氏岡氏は意図的にせよ結果的にせよ19日の記事で、本来様々な検討に付している最中のものを、国立大学協会の独自案であると宣伝し、その路線を既成事実化するために一役かっていることになりはしないか。
しかも、19日4面の記事や氏岡氏自身のツイッターを見ると、この方針に概ね氏岡氏が賛成しているようにさえ見える。

入試改革を引っ張ってきた国大協の委員会ででた案。出題の幅がぐんと広がる。注目です。

このツイートでさえ「国大協の委員会ででた案」という非常に不正確な言葉が使われている。それはひとまずおくとしても、氏岡氏は自分の賛同できる案が出たために、その案を後押しする記述をしているとさえ見えなくもない。20日付けの記事で、論点整理の表の中では、独自案に○が2つ付けられている点や、先に指摘したように、記事本文の中で「独自案」に対する問題点の指摘に関する言及が一切なく、しかもデメリットの印象が薄められているかのような記述になっている。
4面の記事にある

大学が採点を担う国立大学側の独自案が具体化すれば、入試改革が実現に大きく近づくことになる。

国立大学協会入試委員会が示した大学採点案が採用されれば、これまでの記述式で中心だった文章を理解し説明する設問と違い、自分の考えを書く問題づくりが可能になる。

といった文言は氏岡氏がこの案に概ね賛成なのではないかと感じさせる。しかし、「国立大学側の独自案」とか「国立大学協会入試委員会が示した大学採点案」などというような記述は、明らかに「論点整理」のトーンとは異なるものである。

氏岡氏は、意図的であれ結果としてであれ、今回の「大学が採点を担う」という方法を、国立大学（協会入試委員会）が正式に提案し、しかもそれにはデメリットを上回る長所が多いかのような印象操作を行ってしまっているように見える。もしそれが意図的なものだとしたら重大な信義違反だと言わざるを得ない。

19日の報道が流れた後、もちろん多くの関係者がいろいろなコメントをしたように思う。しかし、大学関係者の中には、もし実際に採点するとなれば一番現実的な案はこれしかないのだろうとか、もうこの方向で動き出してしまったのだろうから変えるのは難しいのだろうというような、嘆息とも諦観ともつかないようなコメントも見受けられた。氏岡氏の記事が、意図的であれ結果論としてであれ、問題の多い案を採用するように後押しし、もう引き返せないという雰囲気づくりに加担したことは否めないと感じる。水漏れの多い方法のまま現場を混乱させるような形で見切り発車する形になりうることに対して、氏岡氏の記事は、十分な想像力と識見を欠いていると思う。

19日の記事と国立大学協会の「論点整理」を比較すると、19日の記事の具体的な内容にはさらに多くの問題があると考えるが、それは別の記事で指摘したいと思う。

2016-08-26

Hello

hello>all