こんな問題と採点で大丈夫なのか?-新共通テスト 試行調査 国語の記述式問題について-

 私は、新共通テストで記述式試験を課すことには、現時点では反対だが、すでに各大学ごとに新共通テストをどう選抜に利用するかが公表されるなど、実施に向けて大きく舵が切られてしまっている。そういう状況の中では、さしあたってあまりにおかしな問題や採点が行われることに警鐘を鳴らすためにも、実際に試行調査で出題されている問題を検討するべきだと考える。既に平成29年11月の試行調査の結果報告が出ている。

 そこで、平成29年11月に行われた大学入学共通テストの試行調査で出題された記述式問題のうち、数学(I・A)で扱われた問題について下記記事で、問題の内容や採点基準に懸念があることを述べた。

 選択式の問題に比べて記述式の問題の方がより理解度や思考力・表現力を正確に測定できるとする意見は根強くあり、共通テストとして記述式試験を課すことに肯定的な意見も広く存在することは確かである。しかし、上の数学に関する記事の中でも述べたように、実際には理解度や思考力・表現力を測るという目的からは大きく乖離した形で、極めて杓子定規な正答基準に基づいて、パターンマッチング的な採点が行われてしまう懸念がある。枚数・人員・採点者の能力・時間などの様々なコストの面から、そうした採点しかできなくなってしまう危険が非常に高い。それは、記述式試験を導入するための

記述式問題の導入により、解答を選択肢の中から選ぶだけではなく、自らの力で考えをまとめたり、相手が理解できるよう根拠に基づいて論述したりする思考力・判断力・表現力を評価する

という美辞麗句とは逆方向を向いていることになる。

 では、国語の記述式問題はどうか。この記事では、国語の記述式問題(国語第1問)について検討する。なお、数学はある程度何が正しいかが確定するが、国語は自分の持っている語彙や経験などにも強く影響されうるので、私の国語力の乏しさが暴露されるかもしれないが。

国語記述式問題の内容

 国語の記述式問題は第1問である。

 生徒会部活動規約第1条から第16条までの条文と3枚の資料をもとにした会話文を読んで問に答える形式である。

f:id:rochejacmonmo:20180524224500j:plain

f:id:rochejacmonmo:20180524224507j:plain

f:id:rochejacmonmo:20180524224514j:plain

問1(50字以内の記述)

 

f:id:rochejacmonmo:20180524224609j:plain

という会話文について、次のように問われている。

問1 傍線部「当該年度に部を新設するために必要な、申請時の条件と手続き」とあるが、森さんが新聞に載せるべき条件と手続きはどのようなことか。五十字以内で書け(句読点を含む)。 

 正答の条件は以下の通り。

f:id:rochejacmonmo:20180524225125j:plain

この問題は無答率は非常に低く、正答率は43.7%である。単純にこれが高いか低いかではなく、つぎのように、条件の一部を書き落とした答案が32.2%あったことに注意する必要がある。

f:id:rochejacmonmo:20180524225237j:plain

典型的な誤答例として挙げられているものは以下の通り。

f:id:rochejacmonmo:20180524225257j:plain

f:id:rochejacmonmo:20180524225303j:plain

私がこの問題について主張したいことを述べると次のようになる。

(1) そもそもこの問題自体が破綻していないか。

 現在同好会として「ダンス同好会」がない以上、まずは同好会を作らなければ部を新設する申請の俎上にのらないのだから、「ダンス部設立希望」に対する回答は、「まず同好会を作って3年活動してください」以上のものにはなりえない。「当該年度」という言葉遣いも奇妙である。当該年度とはいったいどの年度のことなのか。規約の中にある「当該年度」は明確で、3年以上活動している同好会が部としての新設を希望する年度のことだ。しかし、まだ同好会にもなっていないものに対して、「当該年度に部を新設するために必要な」というときの「当該年度」とはいったいいつのことなのか不明である。実際には、同好会を新設するにはどうすればいいかは規約文の中にはないので一体何年先の話をしているのかまったく不明である。ダンス部を設立して欲しいと要望しているのは1年生だが、いま同好会を作れるとしても、この1年生たちは部の新設を申請できるまでに卒業してしまうのである。

 

(2) 50字という制約条件がついているために正答の条件が歪んでいるのではないか。

 記述式問題でよく議論になる点として、いくつかの条件がある場合、それらをすべて書くのか、一部だけでよいのかという論点がある。「申請時の条件と手続き」を書く場合、規約に規定されている条件をすべて書くなら、「同好会活動3年以上」「部としての新設を希望する年度の4月第2週までに」「所定の様式に必要事項を記入」「生徒会部活動委員会に提出」の4点をすべて書かなければならないはずだ。しかし、それをすべて書くと50字には収まらない。だから、正答の基準では、「所定の様式で申請する」と「生徒会部活動委員会に申請する」ということのどちらかが書かれていることで正答扱いしようとしているわけである。しかしそうした省略が許容されるなら、

「同好会活動3年以上が条件で、部の新設を希望する年度の4月第2週までに、規約第13条の方法で申請する。」

という答案はどうなるだろう?丸めることが許されるとして、そのうちどれかを削ってもよいとするのか、それらは細部とみて規約を引用してよいのかの判断は難しい。

 私は、正答例の「4月第2週まで」という条件も本来なら上のように「部の新設を希望する年度の4月第2週まで」と書くべきだと思う。それが会話文の中にある「当該年度」という設定に引きずられて省略してもよいことにされている。それでも48字だからぎりぎりである。

 結果報告の文書の中では、「問い掛け(目的)に応じて情報を取捨選択することや、限られた字数で正確に記載することに慣れていない」とか「正答例のように「正答の条件」をすべて満たす文章にまとめるために、必要最低限の情報の抽出に迷った」などと受験者を総括しているが、端的に言って、本問の字数制限は厳しすぎる。誤答例を見ても、受験者側は文字数を削るために四苦八苦したあげく、曖昧な文面にしてしまったように見える。本来規約に無駄なことが書かれているわけもなく、それをさらに削って記述することを求めるのは適切とは言い難い。にもかかわらず、その省略の仕方を「正答の条件」のように強制するのは不当である。

 これは記述文字数を増やして採点業務を増やしたくないという事情もあると思われる。そうであるならば問い方を変えなければだめだ。

 

問2(25字以内の記述)

 この問題は正答率が73.5%と高いようなので、引用とだけに留める。

f:id:rochejacmonmo:20180524234048j:plain

 

 問3(80字以上120字以内の記述)

 これは次のような会話文に対する問である。

f:id:rochejacmonmo:20180524234327j:plain

問題は条件付きの記述で次のような4つの条件が付いている。

f:id:rochejacmonmo:20180524234509j:plain

正答の条件は次のように示されている。

f:id:rochejacmonmo:20180524235433j:plain

この問題の正答率は極端に低く0.7%である。ここでは正答率の低さに加えて、8割の答案が設定された正答の条件の複数を満たせていないことには注意が必要である。

f:id:rochejacmonmo:20180524235412j:plain

誤答について示されているのは次のような内容である。

f:id:rochejacmonmo:20180524235748j:plain

f:id:rochejacmonmo:20180524235754j:plain

f:id:rochejacmonmo:20180524235800j:plain

この問題について私が主張したいことは次の通りである。

(1) この問題も設定に不自然さがある。

 そもそも会話文の前段で「提案の方向性はいいと思うのですが、課題もあると思います。」と述べられているのだから、その後に続く部分で、わざわざ提案することに対する基本的な立場を再度示さなければならないのだろうか?普通は、イに入る文章は、「課題」について述べたものになるだろう。「確かに~」という文章は、「提案の方向性はいいと思うのですが」の前に入るならわかるが、イの中に入るのは不自然に見える。わざわざ二文などというような細かい条件を設定せず、「○○なので、提案の方向性はいいと思うのですが、課題もあると思います。というのも○○だからです。」と述べさせ、それぞれ○○の部分に文章を補わせる方が解答が明確になって自然に見える。

 結局この問題は、「確かに○○である。しかし○○である。」というようなテンプレートに答案を押し込むことが優先され過ぎているように見える。

(2) 提案を支持する具体的な根拠を2つに限定してよいか、またその根拠は適切か疑問である。

 正答の条件では、提案を支持する根拠を「部活動時間の延長の要望が多い」と「部活動時間の延長を認める高校も多い」の2つに限定し、それらが両方記載されていなければ誤答扱いしている。資料2があるので市内の他の高校との比較を盛り込んでほしいということはわかるが、「延長の要望が多い」の方は他の言い方もできるのではないか。「大会や発表会の準備のために時間を多く使いたい」や「部活動時間が短いと中学生の志望者が減る」という意見である。資料3でそのような意見を述べている生徒がいる。こうした点を盛り込んだ答案を誤答としてしまって良いのだろうか。会話文の中に「個人的な思いだけでは提案できません」とあるから、イには、個人の意見を反映せず「要望が多い」とまとめた答えを書かなければいけないのだろうか?「具体的な根拠」として何が許容されるのかが不明確で判断しづらい。蛇足だが、「要望が多い」という点も、資料3のアンケートでは全回答のうちの4割程度だが、資料1の要望で見ると全体の投函数148通のうち28通しかない。こうした点を踏まえて「要望が多い」とまとめていいのかも少々疑問である。「市内に延長を認める高校も多い」も書きぶりが微妙と感じられる。「白鳥総合高校」は延長なしで18時30分までできるので延長しなくても遅くまでできているわけだから、「青高以外の市内の高校は無条件もしくは条件付きで18時~18時30分まで活動できるから」というような書きぶりの方がより適切のようにも思える。また、「市内の他の高校は延長できるので」のような資料2の内容と微妙にずれているような書きぶりの場合はどう判断するかという点もあるだろう。

 

(3) 延長を提案することに対する「基本的な立場」の意味するところが曖昧に見える。「提案してみてもよいと思う。」とか、「提案すべきだと思う。」はどうなのだろう?これは次の述べる「提案がどのように判断されるか」という部分とのつながりの問題もある。また答案の中には、「延長を提案すること」に対する「基本的立場」と「延長すること」に対する「基本的立場」とが区別されていないものも出てくると思われる。「要望も多いし他の高校でも延長できるから賛成」のように何に賛成しているかはっきりしないものもありうる。このような曖昧さは、採点において基準のブレを生じる大きな要因になりうる危険な個所である。

 

(4) 延長という提案がどのように判断される可能性があるか、という問題文の「判断」の意味するところが曖昧に見える。正答の基準では、「延長は認められにくい」以外の「判断」を認めていない。しかし、もっと手前の段階として、「延長の提案は、生徒の安全確保を軽視していると判断される」とか「延長の提案は、青高の交通事情を十分に検討していないと判断される」といった内容もありえる。

 そもそも、イのあと「なるほど、そう判断される可能性がありますね。それでは、どのように提案していけばいいか、みんなで考えましょう。」と続くのだから、イの中で、「認められにくいのではないか」と書くのはつながり方が不自然に見える。「安全確保を理由に却下されると思うよ」と言われて「じゃあどう提案すればいいか考えよう」となるだろうか。要望や他校との比較だけで提案すると青高の特殊事情である交通安全確保について十分検討していないと指摘されるから、その部分の対策について考えようという文脈の方が自然に見える。

 

(5) 延長の提案に対する判断の根拠として交通に関する点を具体的根拠として挙げることが正答の条件になっているが、具体的な根拠として許容される範囲が明確か疑わしい。例えば、「生徒指導担当の織田先生が難色を示しているので、提案は却下されるだろう。」は「具体的な根拠」と認められるだろうか?もう少し踏み込んで「生徒指導担当の織田先生が安全確保の点から難色を示しているので、提案は却下されるだろう。」ならどうなるだろう?安全確保という単語は入っているが、安全確保の具体的な内容は記載されていない。こうした根拠記述の幅に採点者がどれだけ対応できるのかが非常に疑問である。

 

これは揚げ足取りだが、そもそも青高には、午前7時と午後6時に交通量がピークになって、歩道も確保できず、学生が集団で登下校すると安全上問題になるような道しか、通学路として確保できていないという設定は本当に自然なのだろうか?

 

補正について

結果報告の中では、検収作業や再検収作業で採点基準の明確化にともない補正した答案例がいくつか挙げられている。これらの答案では、設問で指定された形式への合致に疵があるが、概ね内容的には正答とみなせそうな答案がかなりあるように見受けられる。こうした答案をチェックする作業はかなり膨大になると予想され、やはり採点作業の困難さを指摘せざるをえない。(なお、実際には、これらの例の挙げ方もよくない部分がある。疑問箇所はわかるのだが、そこの判断を変更しても結局政党の基準に該当していないような例が多いのである。)

f:id:rochejacmonmo:20180525010551j:plain

f:id:rochejacmonmo:20180525010557j:plain

f:id:rochejacmonmo:20180525010800j:plain

f:id:rochejacmonmo:20180525010806j:plain

まとめとおまけ

ここで見てきたように、出題者側が問題文の中でかなり解答の方向性や形式を限定しようとしても、そのやり方が結果として曖昧だと、解答にかなりの幅がでて採点が難しくなると考えられる。今回の試行調査の問題は、解答を限定するやり方が不十分すぎると思われる。また解答字数が多すぎるために解答に幅が出てしまって採点が難しくなっているようにも見える。にもかからず、数学の場合と同様に採点基準は非常に狭く、そして杓子定規に適用されてしまっているように見えるし、数学に比べて国語の採点基準や答案に対する判断の根拠が不明確になりやすい。ここでも採点上の制約から部分点などのグラデーションを付けることが難しいという事情がある。今回のような50字や120字で部分点の判断を要求すると採点者にはかなりの負担がかかるし、よほど明確な正答が決まるものでない限り、多数の採点者が同一の基準で部分点を出そうとしても採点がブレて不公平に陥る危険が高い。そのために採点基準を過剰に狭く採り、正答か誤答かの二択で採点してしまうと、かなり明確にかけている答案でも誤答扱いにされてしまって適正な評価を得られない危険もある。

 

と諸々指摘してきたわけだが、生徒会の規約とか部活動をどうするとか、そういった文章を読ませて、いろいろ書かせるという問題、正直って、内容的にくだらないと思いませんか。現行のセンター試験でも、古文や漢文の扱いはどうかとか小説を読ませるのはどうかとか、逆に、契約書や操作マニュアルのようなものを読むことを取り上げることを称揚したりする意見も確かにある。しかし、出来上がった問題がこういう問題だと、内容的にあまりにもくだらないと思うのは私だけなのだろうか...。こういう問題が大学入学共通テストの問題として本当にふさわしいのだろうか。記述式試験の導入を推進する人たちは、本当にこういう問題を適切だと思うのだろうか。

 

 

 

 

 

こんな採点で大丈夫なのか?-新共通テスト試行調査 数学の記述式問題について-

高大接続改革の一環として行われている大学入試改革のひとつである「大学入学新共通テスト」は、記述式試験の導入をひとつの大きな柱として構想されており、文科省は、たとえば次のような形で、記述式問題導入の意義を説いている。

 

2.なぜ記述式問題を導入するの?
 記述式問題の導入により、解答を選択肢の中から選ぶだけではなく、自らの力で考えをまとめたり、相手が理解できるよう根拠に基づいて論述したりする思考力・判断力・表現力を評価することができます。

 また、共通テストに記述式問題を導入することにより、高等学校に対し、「主体的・対話的で深い学び」に向けた授業改善を促していく大きなメッセージとなります。大学においても、思考力・判断力・表現力を前提とした質の高い教育が期待されます。

 併せて、各大学の個別選抜において、それぞれの大学の特色に応じた記述式問題を課すことにより、一層高い効果が期待されます。

 http://www.mext.go.jp/a_menu/koutou/koudai/detail/1397733.htm

  私はさまざまな理由で、記述式試験の導入には反対であり、できるなら現行形式の戻った方が良いと考えている。できればまとまった形で整理したいが、

 のスレッドにも簡単にその理由を述べた。

 

 しかし、現状では既に、試行調査が実施されており、平成29年11月に行われた試行調査では、実際に記述式の問題が出題され、それらの採点などの調査結果が報告としてまとめられている 

 今回記述式問題が出題されたのは、数学と国語だが、この記事では数学の記述式問題とその採点基準について取り上げる*1

 

数学において記述式問題が出題されたのは数学I・Aの第1問と第2問のなかの3つの小問である。実は、どの問題も正答率が非常に低い*2

 

 問(あ)

 問題は以下の通り。

f:id:rochejacmonmo:20180523234806j:plain

誤答例として示されているのは以下の通り。

f:id:rochejacmonmo:20180523235010j:plain

そして正答率は、2.0%。ただし、無答と同じくらい誤答もあることに注意しなければならない。

f:id:rochejacmonmo:20180523235029j:plain

 

私の見解を箇条書きでまとめると次のようになる。

  • まず第一に、端的に問題の条件付けのしかたが良くない。頂点のy座標に関する不等式を用いてとあるが、実際には、判別式が正であることからx軸と相異なる2点で交わり、しかも下に凸であることから、頂点は3,4象限にしか存在できない。つまり頂点のy座標を明示的に求めなくても概形の説明で根拠記述になりえる。また頂点のy座標の不等式というのも範囲が不明確。「頂点のy座標<0」と書いてあればいいのか、y座標の明示式が必要なのかが読み取れない。
  • 従って第二に、理由をどこまで書くか/書かれたものを正答とみなすかのグレーゾーンが広く採点しにくい。例えば、単純に

    「a>0、b^2-4ac>0より頂点のy座標<0だから。」

     

    と書かれた場合、c<0といった記述はなくなるし、頂点のy座標の明示式もない。それでも正答とできるか疑問である。

    「x軸と相異なる2点で交わる下に凸なグラフだから、頂点のy座標<0となるので。」

     

    だったらどうだろう?にもかかわらず正答の条件が非常に狭く設定されている印象が強い。a>0かつc<0が明示的に述べられていなければ誤答とか、頂点のy座標が明示的に求められていなければ誤答といった具合に判断されているのではないか。
  • そして第三に、この程度の根拠記述を求める問題でさえ、根拠をどこまで遡って記述しなければならないかということは必ずしも確定的ではない。今回の問題のように、「a>0かつc<0」だから「頂点のy座標c-b^2/4a<0」なので「頂点は第3,4象限にのみ存在」というように複数のステップを踏む場合、最初の根拠記述を明示しなければいけないというルールを強制できるわけでもない。
  • 第四に、誤答例に示されている根拠と結論の順序が正しくないものも慎重に見る必要がある。答案がすべて「⇒」を使って書いていたわけでなく、おそらく採点者の側がそう読めると判断したものを誤答としたのだろう。しかしこれは答案の書きぶりをどう採点者側が判断するかという点にかなり大きく依存するので、多数の採点者が一致して採点できたかどうか危うい

 ところで、記述式の採点が行われたあと、別の検収者によって答案のチェックも行われている。その説明はこうだ。

f:id:rochejacmonmo:20180524001554j:plain

この補正というのが正答→誤答や誤答→正答といった判定の修正を伴うものであると予想できるが、たとえば、この問(あ)で検収の結果補正された答案の例は、どのような補正作業を行ったのか実際にははっきりしない。疑問点が付記されているだけだからだ。

f:id:rochejacmonmo:20180524001326j:plain

最初の例は単に書き間違えたのだろうと判断できるかもしれないが実際の採点で正答か誤答かの判断は迷う。2つの目の例は、そもそも2つほど不備があって、結果報告を作成する作成者がミスをしているのだと思うが、そこを無視すれば、場合分けして答えても根拠記述として全く正しい。

f:id:rochejacmonmo:20180524002752j:plain

しかしこれが補正にあがるということは、最初は誤答扱いにしていたものを正答にしたのだろうと推測できる*3。しかしこういう採点が行われていると、検収作業を行った抽出答案以外にもこの種の答案は多数あると思われるので、本番の場合には、検収作業の結果すべての答案を再チェックしなければならなくなる可能性が高い

 

問(い)

問題は次の通り。

f:id:rochejacmonmo:20180524003129j:plain

 

 誤答例は次の通り。

f:id:rochejacmonmo:20180524003203j:plain

そして正答率は4.7%。しかしこれも無答ではない誤答がかなりあることに注意しなければならない。

f:id:rochejacmonmo:20180524003218j:plain

これについての私の見解は次の通り

  • ここで挙げられた誤答例を誤答扱いするのは採点基準としてはあまり杓子定規すぎる。180°と書かなければならないのはわかるが、この設定で180が180°のことを表しているということは十分推定できる。-BC cosABCと書かれると、本問では、A,B,Cは確度の大きさとして認めるが、∠ABCとかかないと文字の三つ組みは角度を書いているとはみなさないということなのだろうが、書き方からみて、ABCは角度を表していると推定できる。3番目はさらにひどく、BCと-の間にドットが打ってあるのだから、( )がなくても、BC-cosBと書きたかったわけではないことくらい了解できる。疵はあっても、これを誤答とし、無回答と同じ得点しか与えない採点基準は、まさに杓子定規の一言に尽きる。
  • 少し挑発的に言ってしまうと、私が採点者で、正答か誤答かどちらかに分類せよと言われたら、正答に分類してしまうだろう。しかも正答率が非常に低いのだからなおさらだ。

 

問(う)

問題は次の通り。

f:id:rochejacmonmo:20180524004835j:plain

誤答例は次の通り。

f:id:rochejacmonmo:20180524004844j:plain

正答率は8.4%。これも無答ではない誤答がかなり多いことに注意が必要である。

f:id:rochejacmonmo:20180524004821j:plain

この問題は、この記述式のあとに実際に最も高い県を表す点を図の選択肢から選ばせる問題(2-ス)があり、その正答率は35~40%のようである。

f:id:rochejacmonmo:20180524005039j:plain

その意味では、選べるという部分とそれを根拠づけて説明するということのギャップを測っている問題ということができるのだろう。それを良い問題であるとする向きもあるのかもしれない。しかし補正作業についての結果などを見てみると、書きぶりをどう判断するかがかなり難しかったのではないかという印象が強い。

f:id:rochejacmonmo:20180524005159j:plain

f:id:rochejacmonmo:20180524005206j:plain

これらの例は、どれも概ね方法を正しく理解しているが、1,2,4番目はいささか言葉の選び方が適切でなかったり、言葉足らずであったりする。3番目の例は問題ないので、これを誤答にしてはいけないだろう。これも問(あ)と同じコメントになるが、この程度の答案で補正が必要になるところを見ると、本番では補正作業がかなり必要になることが予想され、チェック作業が非常に過重になる可能性も高い

 

まとめ

 これらの例をもとに私が主張したいことは次のようになる。

  • 答案の内容的/表現的ばらつきを減らさなければならないという要求のために付けられた設問の誘導が必ずしも数学的に本質的とは言い難い面があり、かえって正しく理解している答案を誤答扱いしてしまう懸念がぬぐえない。
  • 部分点を付けることは採点作業を極めて煩雑にするために困難であるという制約により、正答か誤答かの二択で採点せざるを得ないために、採点基準が極めて杓子定規に運用されてしまう懸念がある。これも非常に軽微なミスが過大に減点される危険をはらむ。
  • 採点枚数が非常に膨大(万単位)であるため、すべての答案を何度もチェックする作業が難しくなるという制約があり、全答案の中で内容的理解の度合を整列し、それによって得点にグラデーションを付けるという作業が不可能になってしまっている。そのため、無答とはまったく理解の度合いが異なる答案でも誤答としなければならなくなるという本末転倒に陥る危険性がある*4
  • 採点者の数が多く、統一的な基準で採点を行うことに相当な困難が伴うため、検収作業で原答案を逐一確認する作業が非常に大きくなると予想され、採点や検収に時間的なコストが相当発生すると思われる。
  • (追記)今回の数学の問題は無答率が概ね5割弱あるが、実際の試験では無答率はかなり減ると予想されるため採点にかかる時間や人員のコストは今回のものでは到底比較にならない。

万単位の記述式答案を、同一の基準で、短期間に、採点することが、冒頭で引用した

自らの力で考えをまとめたり、相手が理解できるよう根拠に基づいて論述したりする思考力・判断力・表現力を評価する

 という目的に資するものになっているのかどうか。実際の採点は、極めて教条主義的な採点基準が杓子定規に適用されてしまうことにより、むしろ逆の効果を生んでしまわないか、ということが問題の根源にあると思う。

 

おまけ

ちなみに次のようなことも言っている。

f:id:rochejacmonmo:20180524012146j:plain

いやいや、そんなことは試行調査をする前から全部わかとったことじゃろorz

わかりきってることなのにできてないから文句を言っているわけでござる

 

 

*1:国語の記述式問題も様々な問題点があると思うが、それは別の機会に譲る。

*2:もちろんこれは他の部分の難易度などの影響を強く受けるので、これだけで一概にどうこうできる話ではないことには注意が必要。

*3:まさか正答にしていたものを誤答にしたということは考えにくいだろうと思うので。

*4:個別の大学で課される二次試験なら枚数はせいぜい千のオーダーなので、全答案の出来具合を丁寧に調べ、理解のレベルに応じた整列が可能になる。

ランダム率について新井紀子氏に説明を望むこと

 新井紀子氏が中心となって行っているリーディングスキルテストについて、特に「ランダム率」の観点から2つの記事を書いた。

これらの記事に対してかどうかはわからないが、新井氏がツイッター上でランダム率についての追加説明を行っている。以下のツイートとその返答連鎖から読める。

 私は、これらの説明を読んでも、上の2つの記事で書いた疑問点は解消されないと考える。以下にまとめる。

 

 「同義文判定」におけるランダム率は、NIRAペーパーで公表された2016年のデータ、RSTパンフで公表された2018年のデータに比して、
NHK視点・論点」および著書『AI vs....』中で公表された2017年のデータが突出して高い値を示している。

 ランダム率を計算するモデルはまだ正式な論文とはなっていないようだが、
Proc. 39th Annual Cognitive Science Society Meeting (CogSci 2017) 1556-1561
に述べられている"RSG"の説明を参考にすると、2択問題の場合、回答数が十分に確保されていないと、正答率が高いにも関わらずランダム率も高い値になることが予想される。

 従って、2017年のデータには、少なくとも同義文判定問題に対するランダム率を算出するためには不十分な回答数しかない回答者が比較的多数いた可能性がある。

 新井氏は、ランダム率と回答数の関係については発表する際に注意をしていると述べているが、少なくとも「視点・論点」における説明の中にそうした注意喚起の文言はない。

 また新井氏は、統計的に不十分な項目については公表していないと述べているが、2016・2017・2018年のデータはいずれもペーパーや番組・著書、パンフなどで公表されたデータである。にもかかわらず、同義文判定におけるランダム率は、2017年のみ異常に高い。

 しかも新井氏は、「視点・論点」の中で、ランダム率に言及する際、回答数との関係でもっとも気を使わなければならないはずの2択問題を中心に構成される「同義文判定」カテゴリのランダム率に特段の言及を行い、「中学生の7割がランダムより良いとは言えない」と解説した。

 

 以上のことから、新井氏は、

 まず第一に、「視点・論点」および著書『AI vs. ...』の中で公表した2017年のデータにおいて、同義文判定問題に回答した回答者が十分な問題数を解答していることを示す根拠を示すべきである。

 第二に、もし2017年のデータにおいて、同義文判定問題の回答数が統計的に十分なだけ確保されているとするならば、2016年と2018年のデータとして公表されたものとの著しい乖離の原因が何であるのかについて十分な説明をするべきである。

 

 この2点が十分に説明されない限り、RSTの受検者、特に学生の受検者の能力について実態と異なる言明をしたことになり、その責任は重大である。特に教育政策や研究評価においてすでに十分影響力のある立場にいる新井氏が、不十分な議論や解釈に基づいた議論を行うことは問題が大きい。

 何点か付言する。
 新井氏は、正答率・ランダム率・能力値の3つの指標をつかっていると述べているが、少なくとも「視点・論点」の中では能力値については言及がない。
 また、たとえばランダム率を計算する際の棄却域を95%に設定するのか90%に設定するのかはある程度恣意的に選べる状況にある。こうした棄却域の設定次第でランダム率が大きく変化するようだと、ランダム率そのものの妥当性が疑われる。これはベースラインの設定についても同様である。
 新井氏が述べている「複数選択の場合、すべての選択の在り方を考慮してランダム率を計算すると、逆に実態とは大きく異なり、ランダム率が不自然に低く出ます。」というのは以前にも行われた説明を補充したものであるが、具体的にどういう状況がありうるのか全く例示がないのでどのように評価すればよいか不明である。
 新井氏は、いずれ統計班が論文を出すだろうとの見通しを述べているが、本来論文が公表できる段階になって初めてプレスリリースとなるべきではないのか。妥当性が十分に検証できない統計的なデータをもとに非常に強い主張をすることは研究者の発言として必ずしも看過できるものではない。社会的にも影響力のある立場であることを考慮して慎重な発言を望みたい。

 

 

少なくとも「中3の7割が、同義文判定で、サイコロよりましとは言えない」は撤回すべきでは?(ランダム率について)

新井紀子氏を中心としたグループが実施している「リーディングスキルテスト」の結果報告に記述されている「ランダム率」について、2月末から3月初めにかけて記事を書き、ツイッターを中心とした議論をした。そのときの経緯は次の記事に追記した。

今回、

https://www.s4e.jp/wysiwyg/file/download/1/22

に、リーディングスキルテストの2018年度版(?)のパンフレットがアップされていることを知った。その中に、「2017年度実施結果」と題された「ランダム率」の表がある。

f:id:rochejacmonmo:20180329203209j:plain

ここで示されているデータは、過去にNIRAのオピニオンペーパーに記載されたデータや、NHKの「視点・論点」および新井氏の著書『AI vs. 教科書が読めない子どもたち』(p.214)で示されたデータとも異なる新しいデータである。前述の2つのデータは上で書いた記事に引用したので、ここまでの推移を改めてまとめなおした表を掲げる。(今回は正答率は示されていない。)

f:id:rochejacmonmo:20180623225428j:plain

一目でわかるように、視点・論点」および著書『AI vs. ...』で示されたデータにおけるランダム率の高さは異常である。

奥村さんからご示唆頂いた「ランダム率」の計算方法についてのひとつの理解が以下のツイートにある。

 この計算法の場合、2択問題を10問回答すると8問以下の正答数の受検者はランダムよりよいとは言えないと判定され、20問回答すると14問以下の正答数の受検者はランダムよりよいとは言えないと判定されることになる。つまり、10問回答する受検者が多いとたとえ正答率が8割でもランダムよりましとは言えないと判断され、正答率に比してランダム率が高く出ることが考えられる。つまり、同義文判定という本質的に2択の問題の場合、回答数がある程度大きい受検者について議論しなければ、ランダム率の持つ意味を正確に理解できないと考えられる。従って、新井氏らの提示している「ランダム率」が意味あるものかどうかを検討するためには、単純な正答率だけではなく、少なくとも各受検者の回答数などの情報が与えられなければならないはずである。(もちろん、上で0.95としている棄却域を実際にはどう決めているかとか、各問題の難易度の評価などはどう反映しているかなど、計算方法の詳細もわからなければ議論できないのは当然である。)

 

そうであるにも関わらず、新井氏は、NHKの「視点・論点」の中で、同義文判定について特に言及して、

同義文判定の列を見てください。なんと、中学3年生の7割が「サイコロを投げるよりまし、とはいえない」のです。

 と述べている。

f:id:rochejacmonmo:20180329205657j:plain

上でも述べたように、このデータにおける同義文判定問題のランダム率の高さは明らかに異常に見える。回答数の少ない受検者が多く含まれている可能性が考えられる。このデータをもとに、中3の7割が、同義文判定において、サイコロよりましとは言えない、と判断するのは不当であり、少なくとも、この言及については撤回するべきではないか。

 

(参考)他のカテゴリのランダム率の変化は以下の通り。10%以上変化しているカテゴリや学年もあるが、それでも概ね一定の水準で推移しているように見える。2択よりも多い選択肢であれば、こうした数値の安定が見られるのは納得できる。

f:id:rochejacmonmo:20180329210012j:plain

f:id:rochejacmonmo:20180329210020j:plain

f:id:rochejacmonmo:20180329210029j:plain

f:id:rochejacmonmo:20180329210050j:plain

なおNIRAのデータでは(辞書と理数に)区分されていないので具体例同定のランダム率は省略した。具体例同定(理数)のランダム率がかなり高い理由はいまのところよくわからない。真に読解力に問題があるのか、そもそもリーディングスキルテストの問題に原因があるのか、検討が必要かもしれない。

 

 

「ランダム率」がわからない(ので教えてほしい)2018/3/1追記

新井紀子氏を中心としたグループが行っている「リーディングスキルテスト」(RST)の結果、日本の子どもたちの読解力について様々な問題があることが指摘されている。この結果の意味するところなどを適切な言葉で表現するためにどのような言葉を選ぶべきか、という点はかなり難しい部分もあると思うが、この記事では、「ランダム率」というトピックに絞って考えてみる。

現時点では、私には「ランダム率」の定義も、それがどのようにして計算および運用/解釈されるべきかもよくわからない。従って、この量をどのくらい真面目に取り扱ってよいかに確信が持てない。

 そのことを少し説明するのが本記事の目的である。できれば統計に造詣のある方に詳しく説明をお聞きしたいところである。

 

2018/3/1(追記)

2018/2/28に以下の記事を書いた後、

Reading Skill Test to Diagnose Basic Language Skills in Comparison to Machines
Noriko H. Arai, Naoya Todo, Teiko Arai, Kyosuke Bunji, Shingo Sugawara, Miwa Inuzuka, Takuya Matsuzaki, Koken Ozaki
Proceedings of the 39th Annual Cognitive Science Society Meeting (CogSci 2017) 1556-1561

の中に、ランダム率の定義と思われる記述を見つけました。

f:id:rochejacmonmo:20180301160648j:plain

f:id:rochejacmonmo:20180301160654j:plain

この定義だと同義文判定の二択問題は、正答率5割とくらべて有意に差があるかどうかを各受検者ごとに検定しているということになるのでしょうか?

これらをもとに以下の記事をお読みいただき、「ベースライン云々」の議論や私の持っている疑問(2016年と2017年で同義文判定問題だけランダム率が大きく上昇している理由)に妥当な説明が付けられるのか、造詣のある方からのご示唆が頂けるとありがたいと思います。

 →奥村晴彦さんから次のようなご示唆を頂きました。

 これで非常にすっきりしました。改めて奥村さんに御礼申し上げます。有難うございます。

これでランダム率に基づく新井氏の議論の妥当性について評価できる前提に立てたように思います。

 いまのところの私の判断は、次の通りです。

 特に、同義文判定のような二択の問題が出題されているカテゴリで、しかも正答率がそれなりに高い場合には、各受検者の回答する問題数がある程度大きくないと、ランダム率そのものの妥当性が危うくなってしまいます。従って、新井氏の分析にどの程度妥当性があるかは、実際の受検者の状況がはっきり公開されない限り、確たることは言い切れないように思います。今後公開される論文等でそうした点が明らかになるのかどうかはわかりませんが。

 

以下、2018/2/28に書いた記事も記録として残します。

 

§1 ランダム率というものについての新井氏による説明

RSTの結果を分析するにあたって、「ランダム率」と呼ばれる概念が導入されている。

の中で、新井氏は、

リーディングスキルテストの問題は、すべて選択式ですから、サイコロを投げて適当に答えを選んでも、一定の確率で当たります。そこで、「サイコロを投げて当てるよりも、まし、とは言えない受検者」がどれだけいるかを調べました。その結果が、この表です。数値が大きければ大きいほど、好ましくない結果です。

同義文判定の列を見てください。なんと、中学3年生の7割が「サイコロを投げるよりまし、とはいえない」のです。

 と述べている。しかし一方で新井氏は、

という記事の中で

推論は中学3年生の10人に7人、高校3年生の7人に4人がランダム回答よりも正答率が低かった。

と述べられている部分について、

この記者は「ランダム率」を理解していない。講演では「ランダムよりも良いとはいえない受検者の率」と正確に説明しました。

他社からも「ランダム率」(統計的に、ランダムに選択肢を選んだのよりもましとは言えない受検者の率)という概念が理解できないので、もっとわかりやすい指標はありませんか?と言われました。

大変残念だと言うより他ないです。

 と批判と苛立ちを表明している。

https://twitter.com/noricoco/status/926789340117663745

これに対して、結城浩氏の質問

「①統計的に、ランダムに選択肢を選んだのよりもましとは言えない受検者の率」と「②ランダム回答よりも正答率が低い受検者の率」は異なる概念なのでしょうか。日刊工業新聞の記事で②のように読み取ったのですがそれは「ランダム率」とは異なるのでしょうか。 

 に対して、新井氏は、

はい、異なります。
たとえば二択の場合、ランダム率は50%ですので、②の解釈の場合、「正答率が50%以下の受験者の率」になります。一方、統計では「ランダムより良いかどうか」を検定します。検定の結果、「ランダムよりも良い」とは言えなかった受検者の率が①になります。

と回答している。

 

 選択肢2個の問題を10問行った場合、ランダムに回答を選ぶと、正答する問題の個数の期待値は5問になる。そこで5問以下の正答率の受検者を「ランダムより良いとは言えない」と判定する、というのなら話は分かりやすい。おそらく上の日刊工業新聞の記者が使った表現や結城氏の②の記述はこれに当たるのではないかと思われる。しかし新井氏の言う「ランダム率」とは、この意味ではないように思われる。単なる期待値ではなく、統計的な検定を行うようである。

 

 ただ、新井氏が先ごろ出版した『AI vs. 教科書が読めない子どもたち』の中では

調査に使った問題はすべて選択式です。サイコロを振ったり当て推量で答えたりしても、正答率は四択なら25%、三択なら33%です。そこで、受験した各学校や機関の中で「ランダム並みよりもましとは言えない受検者」が何割いるか、ということを計算したのです。

「ランダム並み」ということは、当該の問題タイプが「多少できない」とか「できない場合がある」のではありません。「まったくできない」と解釈すべきでしょう。(p.214)

 と述べている。この文章だと、「ランダム率」と、「期待値よりも正答率が悪い受検者の割合」とがどう違うのかよくわからなくなる。

 

§2 具体的なデータをみてみる

 

実際に新井氏によって提示されたランダム率のデータを見てみる。

NHKの「視点・論点」の中で提示された正答率とランダム率のデータは次のようなものだった。

f:id:rochejacmonmo:20180228052037j:plain

f:id:rochejacmonmo:20180228052040j:plain

新井氏は、 同義文判定に関するランダム率の高さに言及していた。

しかし、この結果を見ると、たとえば高校2年生の同義文判定問題に対する正答率は81.0%であるにも関わらず、ランダム率は65.7%になっている。確かに同義文判定は問題の性質からして二択しかありえないため、正答率の期待値は他のカテゴリの問題よりも高くなる。それにしても、81.0%の正答率でランダム率65.7%は高すぎるのではなかろうか?

(仮に、ランダムより良いと判定された35%程度の受検者がみな満点だったとしても、平均の正答率が81%になるためには、少なくとも正答率70%程度の受検者が相当な数いて、しかもそれらの受検者は全員「ランダムより良いとは言えない」と判定されていることになる、ように思われる。)

 

 なお、『AI vs. 教科書が読めない子どもたち』の中にもより詳細なデータが載っている。

f:id:rochejacmonmo:20180228053843j:plainf:id:rochejacmonmo:20180228053845j:plain

 私がこうした疑問を抱くのは、NIRAオピニオンペーパーNo.31に新井氏と尾崎幸謙氏が執筆した「デジタライゼーション時代に求められる人材育成」という文章のデータと比較したからでもある。

http://www.nira.or.jp/pdf/opinion31.pdf

この文章の中で紹介されたデータは、次のようなものだった。

f:id:rochejacmonmo:20180228053431j:plain

 このデータでは、同義文判定のカテゴリで、中3でも正答率74.7%に対しランダム率41.8%である。

ランダム率というものをどのように計算しているのかはわからないし、データが増えていくにつれて正答率やランダム率が多少上下しうることはわかるが、この違いは大きすぎるのではなかろうか?

 

§3 新井氏とのやりとり

以上の観点について、新井氏に質問した。

https://twitter.com/RochejacMonmo/status/932325837482770432

新井氏からの回答は次のようなものだった。

お尋ねがあったのでお答えします。
RSTは半年に一回それまでのデータを全部再計算して結果を公表しています。そのため、発表時期によって、正答率、ランダム率は異なります。
ランダム率は、選択肢の数によりますが、複数選択の場合、真にランダム(ベースライン)を計算してもかえって意味がないことがあるため、解答状況を分析しつつ、「どのあたりをベースライン(ランダム)に設定するのが適切か」を統計的に検討した上で、ベースラインを定めた上で、それより統計的に有意によいかを検討しています。

 NIRAは2016年、視点・論点や『AI vs....』で述べられているデータはより新しい2017年のデータだということだと思うのだが、ランダム率が大きく乖離していることの説明として読み取れるのは、「解答状況を分析」するということだけに見える。よくわからなかったので、

同義文判定について、NIRAのペーパーと現在のデータとでは、解答状況に何らかの変化が生じ、ベースラインが上がったという理解でよいでしょうか?正答率はそれほど変化していないにも関わらずベースラインを大きく引き上げるような「解答状況」の変化とはどういうものなのでしょうか?

https://twitter.com/RochejacMonmo/status/932486980067213312

 などと再質問してみたが、いまのところ返答はないように思う。

 

§4 よくわからないので教えてほしい

新井氏が「視点・論点」の中で述べた

同義文判定の列を見てください。なんと、中学3年生の7割が「サイコロを投げるよりまし、とはいえない」のです。

は衝撃的だと思う。しかし上で見てきたことからは、少なくとも私は「ランダム率」というものをどう受け取ってよいか判断が付きかねている。同義文判定以外のカテゴリにおける「ランダム率」をどれだけ重大なこととして受け取らなければならないかが良くわからない。

新井氏は、『AI vs...』の中で、

私たちは「ランダム率」という新しい概念を編み出しました。(p.213-214) 

と述べている。もしこれが本当に今までにない新しい「量」なら、定義を厳密に述べてほしい。また単純な正答率ではなく、受検者の正答率の分布を示してもらう方が状況が理解できるようになるのではないか。

いずれにしても現時点では、私は「ランダム率」をどう扱えばよいかわからない。残念ながら私には統計的リテラシーがないので、造詣のある方から、何らかの示唆が得られると大変ありがたく思う。

 

 

 

京大の入試ミスに関する吉田弘幸氏の対応は、現時点では疑問だ

阪大と京大で音波の反射と干渉に関する物理の問題に出題ミスがあるとの指摘を受け、追加合格の措置をとるなどの対応が行われた。

両者のミスを指摘した吉田弘幸氏は、自身の見解と解説を説明する文書を作成している。

Dropbox - resume.pdf

(本稿は2/5にダウンロードしたレジュメから引用する。)

平成29年度大阪大学一般入試(前期日程)等の理科(物理)における出題及び採点の誤りについて【2月1日追記あり】 — 大阪大学

および

平成29年度京都大学一般入試 理科(物理)における入試ミスについて — 京都大学

でそれぞれの問題の出題側からの解説も読むことができる。

 現時点での私の考えは、

  • 阪大の問題やその解説は極めて不適切である。
  • 京大の問題は「解答不能」なのかどうかは疑わしく、この点を厳しく批判する吉田弘幸氏の議論が適切か疑問である。

 という2点にまとめることができる。以下、現時点での私の理解と意見を説明する。

 (なお今後、私の議論に重大な誤りが見つかれば訂正することがありうる。)

§0(前提)阪大の解説は論外

 阪大側の解説の要点は、当該問題の問4および問5は、「同位相振動モード」で考えることとして出題していたというものである。そうした振動モードが存在するとの論文まで引用している。しかし、当該問題では、A-Iのリード文の中に

音叉が音を発するときは,このように2本の腕は互いに逆向きに振動し,周囲の空気に圧力変動を与えている。

 と明確に「逆位相振動モード」で考えることが明示されており、当該問題中に他の振動モードを考えることを示唆する記述は全くなく、阪大側の解説は、自ら作成した問題文に書かれていない設定を持ち出していることになる。阪大側の主張通り、もともとそのつもりで出題していたというのならそもそも出題の仕方が拙い。あるいは、例えば、音叉から出る直接はの位相について考え違いをしてしまっていたことを糊塗するためなら、ますます悪質である。現時点で、阪大側の解説を受け入れられる余地はないと考える。

問5に関する吉田氏の評価は疑問

 阪大の問題の問5は、状況を厳密に考えず、求められている音速だけを計算するなら、問4の出題ミスでも答えが出てしまう。問題が不整合である理由は、具体的に整数値nを計算することにより露呈する。

もし「2d=nλ」という(阪大の想定とは異なる)問4の答で計算すると、1回目の測定では、λ=62、n=1.61...となり、2回目の測定では、λ=68、n=1.44...となるため、本来整数値であるべきnの値が整数値にならない。他方、「2d=(n+1/2)λ」という(阪大が想定した)問4の答で計算する場合、1回目の測定では、λ=62、n=2.11...となり、2回目の測定ではλ=68、n=1.94...となるため、前者と比べて整数値に近い値になる。従って、問4の本来正しい解答の場合には、問5の状況が矛盾していることになる。この点が出題ミスとされたもうひとつの理由である。

 この点について吉田氏は、特に京大の問題との比較の観点で次のように述べている。(赤字強調は引用者。)

大阪大学で出題された問題自体には致命的な不備はなく,寧ろ,教育的にも優れた問題であったと考えます。勿論,問4は,問題の流れに沿って音叉の振動を逆位相モードと考えた解答(当初の解答ではない方の解答)のみを正解とするべきです。その場合,問5の数値データとの整合性が悪いですが(しかし,実は当初の解答を採用しても,入試の問題としてはかなり誤差の大きいデータになっている。),実験データなので許容する余地もなくはありません。あるいは,壁ではなく膜などとして,反射による位相変化が不明であることを示唆しておくとよりよかったでしょう。その場合は,問4の正解として3つの可能性(実質的には2種類)が存在しますが,問5のデータに照らして一方に決定させることとなり,より優れた問題となったでしょう。

有効数字2桁で音速を求めさせる問題で、n=1.6と1.4を整数値と判断することを「実験データなので許容する余地もなくはありません」と評価することに私は同意できない。しかもこの問題の出題において実際に実験が行われたと推定するのは困難であり、出題者が何らかの意図をもってこのデータを想定したにすぎないと考えるのが自然である。実際のデータではない以上、この大きい誤差を許容する余地はないとするのが当然であろう。この点で、吉田氏の評価は、(後で述べるように京大の問題に対しては不当に厳しく)阪大の問題に対して寛容すぎると考える。

 

 §1 京大の問題についての要点

 まず、吉田氏が「検討問題2の問題点」として指摘する3点に沿って、京大の問題について整理する。

(1) 音源の構造

吉田氏の問題提起は次の通りである。

出題者は「音波は全方位に伝わる」との記述により,全方位に密度波として同位相の振動(変位波としては,それぞれ伝わる向きを変位の正の向きとすれば,同位相の振動になる)が伝わることを意図したのかも知れないが,やはり不明確である。

対する京大側の見解は次のようになっている。

本問題における音源は、「全方位に」という表現でも示されているように、等方的な音波を出す点波源を想定している。

(中略)

一般に、箱に収められていないスピーカーユニットや音叉などのような、より複雑な波源の場合は、特徴的な方向依存性が現れる。従って、そのような音源を扱う問題の場合はその性質が明記されるであろう。ここでは示されていないので、等方的な音波を出す点波源を想定するのが自然である。

 吉田氏はこれを受けてツイッター

「全方位に」の記述が「等方的な音波を出す」を意味するとあるが,必ずしもそのように解釈できるか。

 と述べているが、少なくとも私は、京大の説明にある「等方的な音波を出す点波源を想定するのが自然」との見解に同意する。これ以外にも自然に考えられる状況があるなら、そのことを具体的に明示するべきだ。「不明確である」というだけでは不十分である。

 

(2) 音波が強め合うとは「変位波」としてか「密度波」としてか

吉田氏はこの点について次のように述べている。(赤字強調は引用者。)

人間の耳が変位波と密度波のいずれに反応するのかは高校物理では学ばない。したがって,受験生には判断することが出来ない。この点は,マイクロフォンを使っても同様である。マイクロフォンには,構造により変位波を検出するものと密度波を検出するものと2種類ある。

 これに対し、京大側の説明は次のよう述べている。

ヒトの聴覚系は耳の鼓膜で圧力変化を検出していることが知られている。これは、鼓膜の後ろが閉鎖されている構造を持つことに起因している。また、多くのマイクロフォンも後ろが閉鎖された構造を持ち、圧力変化を検出している。しかし、マイクロフォンには、変位 (速度) を検出するタイプのものも存在する。このようなマイクロフォンは耳とは異なり、後方が開放された構造をもっている。
本問題においては、「運転手が音を聞く」という動作が記述されている。従って、耳の動作原理を理解している解答者が、「音波の強弱は圧力変化の大小を意味している」と考えることは自然である。

と述べ、さらに

本問題においては、「運転手が音を聞く」という観測動作が記述されている。耳が変位を検知していると仮定すると、固定端である壁に近づくと、音は聞こえなくなるはずである。経験上そういった現象は観測されないので、変位を観測しているとは考えにくい。

 とも述べている。この点については京大側の解説でも、問題文の説明に不十分さがあったことを認めており、それが今回の追加合格等の措置につながったことは間違いない。しかし、私の感覚では、京大側の解説には、耳の構造や日常の経験的な観察に照らして、耳が圧力変化を検出しているというのが自然であると判断できるに違いない、という意識が強く滲んでいるように思われる。

 また、ここでは、阪大の設定のような(構造の不明な)マイクロフォンではなく、「運転手が音を聞く」と問題文に明示があることも指摘しておくべきである。京大側の解説は、自ら作成した問題文に準拠しており、§0で指摘した阪大側の不適切な解説とは全く状況が違う

 もちろん吉田氏の指摘する「高校物理では学ばない」は正しいが、これらの点は慎重に考える必要がある。

 私はどちらかと言えば、京大側の「耳の動作原理を理解している解答者が、「音波の強弱は圧力変化の大小を意味している」と考えることは自然」との見解に同意する

 この点はあとでも検討する。

(3) 反射点、音源、運転手の位置関係

 吉田氏は

位置関係が結論に対して支配的であり,この点が不明のままではいずれとも判断できない。 

 と指摘するが、これは、検出するのが変位波か圧力波か不明な状況での議論である。京大側の解説が明示的に次のように述べている。

等方的な波を出す点音源を考え、観測者が音源の近くで圧力変化を観測する場合は、観測者と音源の位置関係によらず、一意的に干渉条件が導かれる。 

 おそらく吉田氏もこの点には同意するのではないだろうか。

(4) 壁における反射の取り扱い

圧力波が反射する場合の位相変化を考えることが受験生にとって容易であったかどうかは別として、この点については吉田氏も京大側の説明を受けて

反射の取り扱いについてはまったく疑義はない。

と述べている。

§2 高校物理で習わない事柄の取り扱い

 人間の耳が圧力変化を検出していることが高校物理の問題で出題されてよいかという問題はありうる。吉田氏はこの点について否定的であると思われる。

 この問題については、いくつかの観点がありうる。

 第一に、感覚器官としての人間の耳の構造は、中学理科第二分野で取り扱われており、耳の断面図などが提供されていると考えられる。高校物理で扱われる音波の性質や取り扱いと、中学理科での耳の構造についての説明、加えて、京大側が指摘するような日常的な経験(壁に近づくと音が聞こえなくなるということは起きない)に照らしてみたとき、受験生側からみて、人間の耳が圧力変化を検出しているという判断を持つことが本当にできないと断定できるか。

 第二に、すべての受験生に対して上記のような判断が可能ではないとしても、例えば京大はそうした判断ができる学生を選抜したいというアドミッション・ポリシーを持っていると主張することも可能である。もちろん入試である以上一定の制約はあるが、高校物理の枠内に一片の疑いの余地もなく完全に含まれていること(例えば全出版社の教科書に共通して記述されている内容)だけしか許容されないとも限らない。

 第三に、仮に「人間の耳が圧力変化を検出している」ことが、京大の物理の試験問題として、妥当な試験範囲から著しく逸脱しているとしても、それを「問題が破綻」と評価することは適切ではない。

 

§3 吉田氏の評価は行き過ぎだ

京大の問題についてまとめると、

  • 等方的な波を出す点音源を考えるのが自然
  • 運転手が耳で聞くとある以上、運転手が検出しているのは圧力変化であると考えるのが自然
  • 従って、壁・音源・運転手の位置関係によらず、音源に十分近い運転手にとっての干渉条件は一意的に定まる

というのが、京大側の説明であろうと思う。

最終的に京大側が追加合格等の措置をとったのは、

耳が圧力を検知していることを前提知識としないのであれば、問題文の「音波は強め合ったり弱めあったり」の意味を明らかにするために、音波の検知方法を明記する必要があった。

という結論に基づいている。少し京大側の意向に忖度して述べれば、

 出題側は問題文に明記された状況で最も自然に考えうる状況と日常的な経験と高校までの知識を前提とすれば、本問は十分解答できると考えたが、実際には、音波の検出方法についてより明示的に記述しておくほうがより適切であった

ということになると考えられる。現時点での私の考えは上記のとおりである。

 しかし、吉田氏の評価は

本問は,以上述べた正解を導くための3つの要素について,すべて不明な出題となっている。したがって,本問は解答不能と判断せざるを得ない。

京都大学の問題は,前述の通り,問題自体が破綻しており,完全な出題ミスと言わざるを得ません。

および

杜撰な考察を行うと議論の一貫性が失われ,誤った結論を導いてしまいます。大阪大学の出題ミスも,京都大学の出題ミスも,そのような点に問題があったものと予想されます。

となっている。

私は、これは誇大であると考える。

  • 阪大との比較において、(整数値となるべき値が整数値とみなせないような値になるという点で)問題が破綻しているのは阪大問5であり、京大の問題に少なくとも問題の設定と結果に矛盾が生じるような瑕疵はない。
  • 阪大側は問4だけで見れば、問題から自然に想定される状況のもとで本来正しい解答を不正解扱いにしたという採点上の瑕疵があるが、京大側は、問題文から自然に判断できると出題側が考えた状況のもとで導かれる正しい解答で採点したと考えられる。
  • 京大の問題では、人間の耳が圧力変化を検出しているということは正しい事実である。しかし、高校生に判断できるかどうかで出題側と解答側には判断の相違があるかもしれない。
  • 京大側の問題では、より明示的な記述を追加することで、状況の設定をより適切な形で提示できる箇所があった。しかし、京大の問題に「杜撰な考察」はなく、「議論の一貫性」も失われていないし、「誤った結論」もない。
  • しかも明示していないことが直ちに「不明瞭」とか「解答不能」となるのではなく、より自然な状況設定は何であるかを読み取ることも受験生に求められているという立場も十分可能である。

整数値になるべきものが到底そういう値にならなかったり、選択肢の中に適切なものがないという状況なら、問題が破綻しているとか解答不能という判断になる。しかし、京大の問題を「不明な出題」と判断した吉田氏の議論は、京大側の解説と比較すれば不十分と言わざるを得ない。少し極論すれば、結局、京大の問題の場合には、人間の耳が圧力変化を検出しているという点を受験生にどう要求するかということに対する見解の相違に還元されてしまう可能性すらある。これらを踏まえれば、吉田氏の評価は、阪大との比較の観点からも、京大の問題自体に対するものとしても明らかに行き過ぎであったと考える。

 

§4 社会的影響の大きさ

  吉田氏は今回の問題を、単に大学側への問い合わせだけに済ませず、文科省への通報も合わせて行っている。こうした問題を文科省マターにするということは、今回の件が、すべての(国立)大学へ波及する可能性に道を開くことになる。私は、現時点では、吉田氏の京大の問題に対する見解は行き過ぎであり、「解答不能」という評価は間違っていると考えている。もし、間違った評価に基づいて、全国の大学に新たな対応が課されるとすれば、その社会的影響は大きく、吉田氏の責任は重大である。

 今回の件を受け、文科省は解答例の公表などについて新たなルールを作ることを検討しているようである。吉田氏も今回のようなミスを防ぐために解答を公開することを積極的に求めているようだ。

 今回の件を受けた結果、

すべての(国立)大学に対して、すべての科目のすべての問題の解答例を(原則)公開すること

が義務付けられるという可能性もある。解答例の公表のあり方については様々な議論があり、ここではそれらについて個別に議論することは避ける。端的に3点指摘すれば次のようになる。

  • どのような種類の問題にどのような解答例を公開することが適切かは様々であり、問題ごとに十分検討されるべき。例えば、今回の阪大と京大の問題は、求値問題でかつ解答のみを記述させる形式や選択式の問題だったが、大学入試で出題される問題の形式は非常に多様で、たとえ求値問題でも解答はほぼ白紙の解答用紙に一からすべて記述するような数学科目の問題もある。国語では100字程度の記述式問題もある。解答例の公開にはメリットもあるが、デメリットも大きく、もし解答例を公開するならその方法を一定の範囲で選択できる(非公開もありうる)ように丁寧に議論しなければならない。しかし今回のような喧騒の下でそのようなことが可能とは考えにくい。
  • 解答例を公開することを義務付けることによる大学での事務作業の負担増は決して軽くない。どのような解答例を公開するか(記述式問題の解答例は一つではないためどの解答例を公開するかは選択が必要)の議論に始まり、公開する解答例にミスがないかどうか(単純なタイポだけでなく高校での学習内容に準拠した表現や記述になっているかどうかなども含めた全般的な)チェック作業、それに加えて、外部からの指摘への対応(おそらく全くおかしな指摘も寄せられる可能性が高い)など、次年度のための入試問題作成と旧年度の入試問題解答例の講評にかかる事務作業とを並行しなければならず、これはかなり手間がかかる。大学の入試業務はなにも学部一般入試だけに限らず、学部編入や大学院、それらの推薦入試など、様々な入試が行われている中で、さらに業務に負荷をかけることになる。
  • 今回のようなミスを防ぐ効果や学生へのデモンストレーションの効果などのメリットはあるが、多くの場合、入試問題にミスはなく、同じ問題が出題されるわけではないから学生への効果も限定的であることなども勘案しなければならない。 

 これらの点を考慮して、全面的な解答例の公開のコストとメリットの比較がなされなければならず、現時点では、私はどちらかといえばコストの方が大きく、少し極論すれば、近年の研究基盤の低下にあえぐ大学にとってむしろ悪影響も大きいのではないかと危惧する。

 

身体的な感覚の共有を求めること─高橋純子『仕方ない帝国』評─

エビデンス?ねーよそんなもん。」という衝撃的な一文で、高橋純子氏の『仕方ない帝国』(河出書房新社)が話題である。

日刊ゲンダイが高橋氏にインタビューした記事の冒頭

新聞記者は、ウラを取って書けと言われるが、時に〈エビデンス? ねーよそんなもん〉と開き直る。政治部次長だった時に書いた朝日新聞のコラム「政治断簡」をまとめた著書「仕方ない帝国」(河出書房新社)が評判だ。キチッとした優等生の文章が当然の朝日において、時に〈『レッテル貼りだ』なんてレッテル貼りにひるむ必要はない。堂々と貼りにいきましょう〉とあおり、〈安倍政権は「こわい」〉と言い切る。テンポ良く、小気味いいが、もちろん、炎上も数多い。

 が、どのような意図をもって書かれたものか、読者によっても受け止めがいろいろと異なるようだ。もちろん、日刊ゲンダイの書き方は非常に誤解を招きやすい書きぶりになっている。そもそもこの書き方だと、高橋氏の著書からの引用であることすらわかりにくい。

エビデンス?ねーよそんなもん。」は明らかに違和感がある。

 既にいくつか指摘が出ているように、高橋氏の著書で登場する文脈は、一見すると、「エビデンス?ねーよそんなもん。」という衝撃的な文から抱く印象とは違った形になっている。原文は次のような文面だ。

私は、読者はあくまでも読者で、「お客様」とは思っていない。ひとりでも多くの人に読んでほしいと書いているが、気に入られようとは思わない。嫌われたり読み捨てられたりしながら、読者の思考をちょっとでも揺さぶりたい。はい。きれいごとですよ、きれいごと。だけど、そこを曲げたら私のなかで何かが終わる。何かは何か。何かとしかいいようがない、何か。エビデンス? ねーよそんなもん。(p.19)

 実証的な根拠を提示するべき場面で「エビデンス?ねーよそんなもん。」と開き直っているという態度を取っていると想像していると、実際には違うように見える*1

例えば、池田信夫氏は次のように述べている

これは「私のなかで何かが終わる」という気持ちにエビデンスがないという意味で、朝日新聞が報道でエビデンスを出さないという話ではない。

 あるいは、

「読者はお客様ではないという信念を曲げたら、自分の中の何かが壊れてしまいそうという不安や恐怖があるけれども、そこにエビデンスがあるかと聞かれればそれはない」という意味だと僕は思いますが。

というQusAka氏の解釈もある

「何か」(=記者としての内的な行動規範や矜持)には「エビデンス」など無い(=それがもたらす効果の証拠は示し難い)

というwatcher氏の解釈もある。 

 この3つの解釈にさえ微妙な差があるようにも見えるが、いずれにしてもこうした読みは「大人の解釈」であろうと思う。

 

しかし、原文をよく読んでみると、違和感がある。

エビデンス」というのは、「根拠」「論拠」「証拠」の意味で、何らかの主張をした場合には、それを裏付けるためのデータや根拠が必要となることを前提に、「エビデンスはありますか?」などと問いかけられる。

では高橋氏の原文にある「エビデンス?」とはどういう意味だろう?なぜ疑問符がついているのか?誰かに「エビデンスはありますか?」と問いかけられ「エビデンス?ねーよそんなもん。」とこたえるならわかりやすい*2。しかし、「だけど、そこを曲げたら私のなかで何かが終わる。何かは何か。何かとしかいいようがない、何か。」と書いた(あるいは言った)とき、「エビデンスはありますか?」などという問いかけがなされるとは思えない。例えば、「何かって何ですか?」という問い返しならあり得る。でもそこに「エビデンス?ねーよそんなもん。」と応答するのはやはりおかしい。「何かって何ですか?」はその「何か」についてのさらに踏み込んだ説明や言い換え、言語化を求める問いかけであって、「根拠を示せ」という要求ではないからだ。

だけど、そこを曲げたら私のなかで何かが終わる。何かは何か。何かとしかいいようがない、何か。エビデンス? ねーよそんなもん。

という文章のエビデンス?ねーよそんなもん。」という部分が意味不明なのだ。どういう問いかけに対しての応答なのかがわからない*3。上で紹介した池田氏やQusAka氏、watcher氏の解釈も一見当を得ているようで、実のところ意味はよく分からない。「気持ちにエビデンスがある/ない」という言い方が奇妙だし、「何かが壊れてしまいそうな不安や恐怖がある」という言明に対して「そこにエビデンスはあるかと聞く」人は普通いないと思う。「エビデンス?」という部分は、「何か」に関することであって、そこを「(内的規範や矜持の)効果の証拠」と読むのも無理筋に見える*4

 

実際には、この「エビデンス?ねーよそんなもん。」は、次の文章との関連で読むしかないように思う。原文は段落を変えて次のように続く。

目には見えないものを大事に思うことで、この世界のある部分は成り立っているはずなのだけど、それを上手に説明したり理解したりしてもらうのは、昨今なかなか難しい。消費社会、経済の論理が全面化しているから。損か得か。結果だけ。数字がすべて。(p.19)

 この部分まで込めれば「何かは何か。何かとしかいいようがない、何か。エビデンス? ねーよそんなもん。」という文章は、私の中で終わってしまう「何か」について、これ以上言語化(≒目に見える)することはできません(するつもりはありません)という意味だとはっきりする。「目に見える形にする=エビデンスを示す」ということを拒絶しているのだ。そして「目に見える形」の代表例が、「数字」「結果」「損得」といった観点なのである。

 こうした考え方は、「第一章 深くねむるために」の中で繰り返し強調されている。例えば直後のp.20には、

ブラック企業は、過労自殺というような犠牲が出るまで可視化されずにはびこる。値段の割に美味しい。安い割にサービスがいい。そのために人間の生が切り詰められてることに、残念ながら私たちの想像力は及ばない。数字に負けちゃってるんだよね、人間が。 

 とか

目には見えない民主主義的価値があれもこれもと毀損されているこの時に、目先の損得を優先して動くなら、どんなに美辞麗句を並べたところで政治家としての一線を越えたと言わざるを得ない。

といった文章があり、その後に、「無形の蓄積」という吉本隆明の言葉を付された節があり、

目には見えない。人にも分からない。でも確実に、積み重なっている。

目の前の評価や損得といった、かたちのあるものばかりを追い求めるのをやめて、そういうふうに仕事や人生を捉えられたら、5年後、10年後の自分が楽しみになる。

生きていることがきっと、楽しくなる。

 と結ばれていたりする。

 

 可視化しにくいものや言語化しにくいもの、従って他者との間で共有することが難しいものという部分にも価値がある。それらの価値は、無理に可視化・言語化・数値化して表現したり、結果としての現れで評価してしまうことでかえって損なわれてしまう。

 というような考え方が時には一定の意味を持つことはありうる話だと思う。しかし、それをエビデンス」という言葉で括って表現する、その言語感覚に、私はついていけない。しかも「エビデンス?ねーよそんなもん。」という粗暴な語り口は、本来可視化や言語化が必要な場面でも、それらを拒否する態度を招きかねない危うさがあるように見える。確かに高橋氏の原文は、一見すると自分の内面的な気持ちをそれ以上言語化することはできないと言っているだけのようにも見えるが、その後の文と併せて読めば、「数値化」が「経済の論理」と呼応していることへの拒否感の表明などともあいまって、結局のところ「エビデンス」を提示することが必要な場面ですら、その土俵に乗ることを避ける文脈へつながるように見えるからだ。「エビデンス?ねーよそんなもん。」に脊髄反射してはいけないが、そうした脊髄反射的な反応で批判されている立場を高橋氏は結局のところ表明しているのではないだろうか?高橋氏は、実証的な議論が必要な場所では精緻に根拠づけられた議論を展開できる/するだろうか?私にはそれは疑わしく思える。

 

身体的な同調を求める「特徴的な文体」

 個人的な体験を語る。

著名な人物の発言や書物から引用する。

自分の考え方や感想をまぶす。

高橋氏の『仕方ない帝国』にはそうした文章が多くみられる。人によっては、それを情緒的に過ぎると批判するかもしれないし、逆の見方で見れば、ある種の作文法のようにも見え、場合によっては良いと評価する人もいるかもしれない。

例えば、日刊ゲンダイのインタビューの中で高橋氏は、

政治断簡は、ひとりでも多くの読者に自分の言葉が届いたらいいなと思って書いています。そのためには、もっともな内容をもっともらしく書いても、読者には届かない。読者に読んでもらうには身体性のある表現が必要だと思っています。

――身体性とは?

 極端に言うと、の精緻さよりも、筆者の感情を込めた文章です。筆者がこれだけ怒っているとか、うれしいとか悲しいとか、そういった表現が今の新聞には失われているように思います。社説を書いている時から、筆者の体温が感じられるように書くことが大切だと考えていました。

 と述べ、身体性の重要性を強調しつつ

安倍政権の振る舞いや政策を正面から論じても読者はピンとこない。政府もヘッチャラです。なぜなら、向こうは百も承知で「人づくり革命」「1億総活躍」をはじめとする、欺瞞的で、人間を道具扱いするかのごときキャッチフレーズを次々と繰り出してはばからないからです。欺瞞を正面から論破するのは難しい。だから「なんか嫌だ」「どっか気持ち悪い」などといった自分のモヤモヤした感情をなんとか言葉にして読者に伝えないと、権力に対峙したことにならないんじゃないかと思うんです。

と述べている。

「精緻な論」や「正面から論じる」こともできるが、それでは伝わらないので、別の文体を模索したというような流れになっているように見える。すると

「愚民共はこれぐらいかみ砕かないと分からないんでしょー」感がすげーんだよ
で、その見下した挙句出てくるレベルの文章が酷いんだよ
読者をなんだと思ってんだよ、あいつ

というすくすく。氏ような反応も出てくる。どうせ精緻な論や正面から論じるということをしても(やれと言われればできるが)読者には伝わらない(≒わからない)ので、身体的な感覚を述べる方が伝わるのだという意識が高橋氏の中にあるとみているわけだ。

 しかし、前節でも疑問を呈したように、高橋氏が「精緻な論」や「正面から論じる」ことがそもそもできるのかどうか疑わしいと思う。そうしたことができる人は、「自分のモヤモヤした感情をなんとか言葉にして読者に伝える」ことが大切だというような言い方をしないのではないか。間違いなく正しいと思える論があるなら、「なんか嫌だ」とか「どっか気持ち悪い」という感情にまかせた文章には、普通はならない。「なんか嫌だ」ではなく、「○○は××という観点から正しくない」という議論の仕方にならざるをえない。だが高橋氏の文章は到底そういう体裁には見えず、本人も「身体的な文章」でいいんだと「開き直っている」。何が嫌なのか、何が気持ち悪いのか自分にも説明できない(その身体的な感覚をそれ以上言語化しても政権にダメージを与えられるわけではないので価値がない)ので、「嫌だ」「気持ち悪い」という身体的な感覚を共有しましょう、むしろ可視化・言語化・数値化されないそうした身体的な感覚の方がより重要なのですと言っているだけにしか見えない。高橋氏は、精緻な論を組み立てることは最初から放棄している(あるいは組み立てができない)ように見える。そのうえで「エビデンス? ねーよそんなもん。」と開き直っているように見える。だとすれば脊髄反射的な批判にも結果的にそれなりの理があったようにも見える。

 一定の論理性とそれを裏付けるエビデンスを提示することは、(それへの賛否は別として)何が言いたいかを理解してもらうための最善に近い方法であると思う。高橋氏の文章に限らないことだが、身体的な感覚の表明された文章には様々なデメリットがある。

あいまいな引用に粗雑な言葉をまぶすこと

  第一に、その感覚を共有できない場合には、意味を汲み取るのが非常に難しい。高橋氏の『仕方ない帝国』も文意のよくわからない引用とそれへの自己流の解釈に溢れているというように見える。

 例えば、

 深くねむるために 世界は あり

 ねむりの深さが 世界の意味だ  

            鶴見俊輔「かたつむり」

たった26文字で構成されたこの詩の、途方もない余白の大きさ、圧倒的な奥行き。これぞ世界と思う。そして、現実世界の奥行きが、たった26文字にかなわないことの不思議を思う。数字とか、結果とか、目に見えるものだけでこの世界はできているわけじゃない。

あなたが、私が、深くねむるために。世界の余白に思いを馳せ、少しずつ、美しい色をのせていく。政権が変わろうが、社会のシステムが変化しようが、鉛筆を握っているのはけっきょく、私たちひとりひとりなのだ。あなたにしか出せない色で、さぁ、この世界を。(p.23)

 よくわからない。鶴見の詩が何を言いたいのかもよくわからないし、「現実世界の奥行きが、たった26文字にかなわないことの不思議」もよくわからない。それが「個性礼賛」のような文脈につながる論理もよくわからない。

 言葉は安易に振り回さない方が良い。わからないものはわからない、難しいことは難しいと言いながら、深く潜って、言葉をつかまえた方がいい。さて、どこに潜れば?ひとつ、心当たりがある。

「『今日の惨めさ』を、『明日のもしかしたら』にすり変えていく、その人々の志向の中に、ファシズムの芽が育まれる」

         (田中美津『いのちの女たちへ』)

いつしか私たちは「明日のもしかしたら」を為政者に委ねてしまってはいないか。自分の惨めさを引き受けることから逃げて、鼻先に「もしかしたら」のニンジンをぶら下げられ、為政者のために走る馬に成り下がってはいないだろうか。この国の、自分自身の惨めさの中に潜って潜って、言葉をつかみとりたい。それは「明日のもしかしたら」を自分自身のものにするための糸口となるはずだ。(p.82-83)

 ここも同じだ。やはり引用されている田中美津の言葉が良くわからない。どういう文脈で何を意図して発せられたものか、この引用では不明だ。後段の高橋氏の言葉もわからない。「『今日の惨めさ』を、『明日のもしかしたら』にすり変えていく、その人々の志向」と、「「明日のもしかしたら」を自分自身のものする」とのつながりが不明だ。「すり変える」と「自分自身のものにする」がどう違うのかがわからないといってもいい。

嗤われるのは、数の力という「現実」に抗し、理念や理想を語る者。所与の現実から最大限の利益を得ることに腐心する「現実主義者」にとって、理想なんて1円にもならないキレイゴトだから。しかしー。現実ってなんだ?

「現実とはこの国では端的に既成事実と等値されます。現実的たれということは、既成事実に屈服せよということにほかなりません。」

        (丸山眞男「『現実』主義の陥穽」)

そのように捉えられた現実は、容易に「仕方ない」に転化する。こうした思考様式がいかに広く戦前戦時の指導者層に食い入り、日本の「現実」を泥沼に追い込んだか。丸山はこう、言葉を継ぐ。「ファシズムに対する抵抗力を内側から崩して行ったのもまさにこうした『現実』観ではなかったでしょうか」。

既成事実への屈服が、さらなる屈服を生む。対米追従は仕方ない。沖縄に米軍基地が集中するのは仕方ない……。現状追認の無限ループ、そんな「仕方ない帝国」に生きてて楽しい?

嗤われたら笑い返せ。現実は「可能性の束」だ。私もあなたも一筋の可能性を手に、この世に生まれてきたのだ。(p.88-89)

 ここは丸山の言葉と高橋氏の言葉が入り乱れている。高橋氏の言葉を混ぜ込むから何が言いたいのかわからなくなる。「・・・」で書かれていない部分も結局のところ丸山の言葉をなぞっているのだ。高橋氏は、丸山の言葉をすべて正確に引用するべきだ。ここに一部があったので、引用する。前後の文脈もある程度確認できる。

現実とは本来一面において与えられたものであると同時に他面で日々造られて行くものなのですが、普通「現実」というときはもつばら前の契機だけが前面に出て現実のプラスティックな面は無視されます。いいかえれば現実とはこの国では端的に既成事実と等置されます。現実的たれということは、既成事実に屈伏せよということにほかなりません。現実が所与性と過去性においてだけ捉えられるとき、それは容易に諦観に転化します。「現実だから仕方がない」というふうに、現実はいつも、「仕方のない」過去なのです。私はかつてこうした思考様式がいかに広く戦前戦時の指導者層に喰入り、それがいよいよ日本の「現実」をのつぴきならない泥沼に追い込んだかを分析したことがありますが、他方においてファシズムに対する抵抗力を内側から崩して行つたのもまさにこうした「現実」観ではなかつたでしようか。「国体」という現実、軍部という現実、統帥権という現実、満洲国という現実、国際連盟脱退という現実、日華事変という現実、日独伊軍事同盟という現実、大政翼賛会という現実――そうして最後には太平洋戦争という現実、それらが一つ一つ動きのとれない所与性として私達の観念にのしかかり、私達の自由なイマジネーションと行動を圧殺して行つたのはついこの間のことです。

 高橋氏の著作にタイトルにもなっている「仕方ない」は、丸山の言葉であり、「戦前戦時の指導者層に喰入り、それがいよいよ日本の「現実」をのつぴきならない泥沼に追い込んだかを分析した」のも丸山である。高橋氏の文章はそこを曖昧にして、あたかも自分の言葉であるかのように書いてしまっている。精緻な論を展開する人は、こうした峻別には敏感であるはず/べきだと、少なくとも私は思う。

 また丸山はそのあとにも議論を続けている。

日本人の「現実」観を構成する第二の特徴は現実の一次元性とでもいいましようか。いうまでもなく社会的現実はきわめて錯雑し矛盾したさまざまの動向によつて立体的に構成されていますが、そうした現実の多元的構造はいわゆる「現実を直視せよ」とか「現実的地盤に立て」とかいつて叱陀する場合にはたいてい簡単に無視されて、現実の一つの側面だけが強調されるのです。

(中略)

 そう考えてくると自から我が国民の「現実」観を形成する第三の契機に行き当らざるをえません。すなわち、その時々の支配権力が選択する方向がすぐれて、「現実的」と考えられ、これに対する反対派の選択する方向は容易に「観念的」「非現実的」というレッテルを貼られがちだということです。

(中略)
 私達の言論界に横行している「現実」観も、一寸吟味して見ればこのようにきわめて特殊の意味と色彩をもつたものであることが分ります。こうした現実感の構造が無批判的に維持されている限り、それは過去においてと同じく将来においても私達国民の自発的な思考と行動の前に立ちふさがり、それを押しつぶす契機としてしか作用しないでしよう。そうしてあのアンデルセンの童話の少女のように「現実」という赤い靴をはかされた国民は自分で自分を制御出来ないままに死への舞踏を続けるほかなくなります。

 丸山が何を問題にしていたかは明晰だし、「現実的たれ」という警句に潜む危うさは、高橋氏の余計な文章を読むより、丸山自身の言葉をそのまま提示した方が、説得性は高いことは明らかだ。もちろん、戦前戦中の指導者が国策を誤ったことが、何に起因しているのか、どのような思考様式によるものなのかは、実証的な研究が不可欠であり、丸山の分析が当を得ていると言えるかどうか疑問の余地もあろう。しかしそうした疑問の余地が明示できるのも、丸山の議論が明晰だからに他ならない。

 丸山は、現実の「日々造られて行くもの」という側面を強調している。しかしそれを「可能性の束」などという安易な言葉でくくってしまってよいのか。戦前戦中の指導者たちは、対米戦において、圧倒的な国力の差という現実から目を背けて、一筋の可能性(とそれを支える精神論)に縋りついたのではなかったか。結局のところ、精緻な論でもって、見過ごされている別の現実を提示し、「可能性の束」の中から取りうる選択しを提示していくしかないし、それが政治の姿のはずだ。「理想」と「可能性」を称揚するだけでは何も生まれない。

 身体的な感覚の共有はむしろ伝わらない

 身体的な感覚の表明された文章のデメリットの第二は、まさにそれ故に、その身体的な感覚を共有できる人というのは、もとから筆者と一定の感覚の共有がある人に限定されやすい、ということだ。これは池田信夫氏が言うように

しかし彼女は「安倍政権は気持ち悪い」という感情をエビデンスもなしに下品な文章で書くので、話が読者に伝わらない。

となってしまう。あからさまな身体的感覚の表明は、その感覚を受け入れられない人にとっては何も共有できず反発を生むだけである。高橋氏は、多くの読者に気持ちを伝えることを目的として、そうした文体を採っていると開き直るが、結局、伝わるのは自分の仲間内だけということになってしまいがちだ。高橋氏は、身体的な感覚を表明する文章が、精緻な論や正面から論じることにくらべてより多くの人に伝わると思っているようだが、実態はその逆のように見える。

  そして身体的な感覚に基づく文章は、どうしても一貫性を欠き、ねじれてしまいやすい。端的に次の文章を読めば、高橋氏はダブルスタンダードだという批判を免れないと思う。

首相の「命を守る」の裏側には、自分ではない誰かの「命をかける」が張り付いている。1分35秒に1回、その誰かと死の距離は近づいている。問われているのは、憲法9条の歯止めを外して、日本を「戦争をする国」にするのか。しかもその歯止めを、閣議決定による政府の憲法解釈変更で外していいのかだ。

ところが首相はこの問いに正面から答えようとしない。「お父さんやお母さんやおじいさんやおばあさん、子どもたちを助けられない。それでいいのか」といった類の弁を繰り返すばかりだ。

レトリックというよりはトリック。覚悟も熱意も感じられない。これが、日本の平和国家としての歩みを根本から変えようとしている最高権力者の会見か。国民にわかってもらうことを重視したという。だとすると政権が想定する国民像は、論理的な説明よりも、お涙ちょうだいが効く人たちだということなのか。

首相は「敵」を批判したり、嘲笑したりするのは得意だが、他者に何かを伝えるのは下手だ。反対する人を説得しようという気がそもそもないからだろう。「身内」に「いいね!」と言ってもらい、最後は数の力で押し切る。会見には、首相のそのような政治観がにじんでいた。(p.108-109)

  高橋氏は、首相には、正面から答えることと論理的な説明と反対する人を説得しようとする意志を求める。しかし、自分は「読者に読んでもらうには身体性のある表現が必要だ」「エビデンス?ねーよそんなもん。」と開き直る。結局、高橋氏は、自らも首相と同じ手法を取っている、同じ穴の貉になっている。意図的か無意識かは別として。

  もう一々引用しないが、他にも高橋氏は、首相の所信表面演説中のスタンディングオベーションを気持ち悪いと批判したりしている。しかし十分な言葉を尽くさず「敬意」の共有を求める首相と、「身体性のある表現」で「感覚の共有」を求める高橋氏の文体は、結局同じ文体でしかないのではないか。

 作家の百田尚樹氏は「もし北朝鮮のミサイルで私の家族が死に、私が生き残れば、私にはテロ組織を作って、日本国内の敵を潰していく」「昔、朝日新聞は、『北朝鮮からミサイルが日本に落ちても、一発だけなら誤射かもしれない』と書いた。信じられないかもしれないが、これは本当だ。/今回、もし日本に北朝鮮のミサイルが落ちた時、『誤射かもしれない』と書いたら、社長を半殺しにしてやるつもりだ」とツイッターに投稿した。

あらタイヘン。そんな記事本当に書いたのかしら。「北朝鮮」「一発だけ」「誤射」でデータベースを検索したが、結果は0件。永遠のゼロ件。

百田氏の過去のインタビューなどから類推すると、おそらく2002年4月20日付朝刊「『武力攻撃事態』って何」のことだと思われる。

Q ミサイルが飛んできたら。

A 武力攻撃事態ということになるだろうけど、1発だけなら、誤射かもしれない。

北朝鮮を含め具体的な国や地域名は出てこない。一般論として、武力攻撃事態の線引きは難しいと言うことをQ&Aで解説する記事だった。(p.94-95)

  「一般論として」という書き方は曖昧だ。一般論という言葉が使われるときには、「例外がありうる」という場合と「すべてに通用する」という場合とがある。

  • 「一般論としては『一発なら誤射かもしれない』が、北朝鮮の場合は例外だ」
  • 「どの国からにせよ、従って北朝鮮からであっても『一発なら誤射かもしれない』」

百田氏は後者と解釈しているのだが、高橋氏は前者だと主張したいのか。上のQ&Aがどういう意味で、どのような一般論を主張していると高橋氏が解釈しているのか非常にあいまいである。

そして、高橋氏は、自分は「精緻な論よりも身体性のある文章を書く」と宣言しつつ、百田氏には過去の新聞記事を遡って検索して、その引用が正確ではないというエビデンスを提示して批判するのか。これは端的にダブルスタンダードだと言わなければならない。

 

 確かに、戦前戦中の指導者層は、様々な既成事実に屈服し、国策を誤ったかもしれない。しかし、身体的感覚の共有(理屈はいいから、「気持ち悪い」という感覚を共有しましょう)の先にだって、ファシズムは暗い口をあけて待っているのではなかったか。「アベは嫌い/気持ち悪い、個性万歳。」の先に、ファシズムの暗い入口は本当にないのか。批判しているつもりが、結局同じ穴の狢になってしまっているのではないか。 

エビデンス?ねーよそんなもん。」

 

*1:その点で、この文に対する脊髄反射的な反応の多くは原文をきちんと確認するべきだという批判を免れることはできない。

*2:その主張に説得力はなくなる可能性が高いが。

*3:美川憲一の「さそり座の女」も「いいえ。私はさそり座の女」と始まるが、この「いいえ」も、どういう問いかけに対する応答なのかわからない、のと似ている。

*4:「何か」が「内的規範や矜持」ではなく、「内的規範や矜持のもたらす効果」ならこの解釈にも妥当性があるが、「何か」は「効果」とは読めないように思う。