ここで働いています

2024年4月18日木曜日

身体性のない言葉をどう身に着け、どう使っているのか: ことばの習得過程とアブダクション推論から

  引き続き、言語学を助けに、いろいろ考えてみる。「言語の本質」1)で、ことばの習得過程について検討されているが、これを医学情報におけることばの習得過程、具体的には「

マスクが予防に有効というランダム化比較試験とそのメタ分析がある」とか「マスクが予防に有効というランダム化比較試験とそのメタ分析がない」とかいうことばの束の意味をどのように習得するかに重ねて検討してみる。

  「言語の本質」では、アブダクションという推論方法を基に、ことばの習得過程を明らかにしている。まずアブダクションについて説明しておこう。推論方法には演繹法、帰納法がある。それに加えて3つ目の推論方法としてアブダクションが挙げられている。まず以下に例を示そう。


演繹

マスクは感染を予防する

彼はマスクをしている

彼は感染しない


帰納

感染しなかった人は全員マスクをしていた

今日出会った人もマスクをしていた

マスクは感染を予防する


アブダクション

マスクは感染を予防する

周囲の人はみんなマスクをしている

彼はマスクをしている


 演繹は、その内部においては正しい。ただ前提の「マスクは感染を予防する」が間違っていれば、当然結論も間違う。自分の中では正しい論理が、外の世界では間違いとされるということである。

 帰納については、そもそもマスクをしていても感染する人が出てくれば正しくないことになる。前提の正しさを問わなくても、内部の推論としての結論に間違いの可能性がある。

 それではアブダクションはどうか。これはそもそも仮説生成に過ぎない。みんながマスクをしているからと言って「彼がマスクをしている」かどうかはわからない。「彼はマスクをしている」というのは仮説であって、そもそも正しいかどうかを問うてはいない。

 これをマスクに関する医学情報に繋げて考えてみる。「マスクを付ける」という判断をした人には、「マスクは感染予防に有効である」という前提がある。しかし、その前提は多くの人を集めて帰納的に得られた研究結果に基づくもので、今後別の研究で「有効でない」という可能性は常に残されている。さらに、重症者を見ている病院の医師の多くは、マスクをせずに重症化した人を多く経験し、マスクをしていて重症化するという経験から、感染していない人はマスクを付けているに違いないという間違いも犯しやすいだろう。

 逆に「マスクを付けない」という判断をした人も同様である。ここには「マスクは感染予防に有効でない」という前提がある。しかしそれも、マスクが有効という研究によって、覆される仮説にすぎない。さらに、アブダクションにより、私はマスクをしてなくても感染しなかったという経験と、周囲にマスクをしない人が増えても感染が減り続ける状況から、マスクは有効でない」という仮説を結論としてしまいやすい。

 こう書くとどうやっても間違えるしかないということになりかねない。しかし、言語の習得ということで言えば、この間違いの繰り返しが、接地しない抽象的な言語を習得するために必要不可欠なことだというのである。得られた結論は常に仮説にすぎない。疑ってかかりながら、日々暫定的に判断し、行動していくほかない。ただそれが言語習得を進歩させる。誤りこそが進歩をけん引していくのである。

 ここで重要なことは、ヒトはとにかく間違えるということである。帰納法も誤るし、アブダクションはそもそも仮説にすぎない。さらに演繹も機能やアブダクションから得られたものを基盤にしており、その前提が正しいとは限らない。論理的に考えることは間違えることだと言ってもいい。そしてその間違いを修正することで、言語が進歩し、科学が進歩してきたということである。このことが「言語の本質」の中で明確に指摘されている。

「人間はアブダクションという、非論理的で誤りを犯すリスクがある推論をことばの意味の学習を始める前からずっとしている。それによって人間は子どもの頃から、そして成人になっても論理的な過ちを犯すことをし続ける。しかし、この推論こそが言語の習得を可能にし、科学の発展を可能にしたのである」

 ここでは言語だけでなく、科学の進歩にまで言及されている。この部分を読んで、これこそ私自身が根拠に基づく医療:EBMを実践する中で、学んだことではなかったか、そう実感する。実感するというのは今日の文脈で言えば、身体化すると言ってもいい。

 抽象化したことばが身体に接地するためには、長い時間が必要だし、誤りを直し続ける必要がある。そして、それは言葉や科学に限ったことではなく、日々の生活そのものにも当てはまることではないだろうか。

1) 今井むつみ、秋田喜美 言葉の本質:ことばはどう生まれ、進化したか」 2023 中公新書


2024年3月30日土曜日

医学情報をどう「接地」させるか:認知心理科学者のハルナッドが問う「記号接地問題」 AIがヒトに近づいているわけではなく、ヒトがAIに近づいている


マスクを付けたほうがいいのか、付けないほうがいいのかを一つの例に、情報収集し、考え、判断をして、実際の行動に結び付ける中で、主に医学情報がどのように使えるのか、あるいは使えないのかを中心に取り上げ、医学情報だけで決めることなどほとんど困難であることを示してきた。そこで医学以外のということで、言語学を取り上げてきた。今回も前回少し紹介した言語学の「記号接地問題」を軸に、いろいろ考えてみたい。

まずは「記号接地問題」を再び説明することから始めよう。「言語の本質」1)には、この問題は当初人工知能:AIの問題として。認知心理科学者スティーブン・ハルナッドが提唱したとある。ハルナッドは言う。「記号を別の記号で表現するだけでは、いつまでたってもことばの対象についての理解は得られない。ことばの意味を本当に理解するためには、まるごとの対象についての身体的な経験を持たなければならない」。

AIは体を持たない。身体に結び付かないことばは、ことばとして理解している、あるいはそのことばが表すものを知っていると言えるだろうか。そういう問いである。さらにその問いを広げていくと、AIだけでなく、身体を持つヒトもことばを知っているというためには、身体経験が必要だろうかと問う。

この問いにはとりあえず簡単に答えることができるように思う。AIはことばの意味を本当には知ってはいない。またヒトも多くの言葉を身体に接地することなく使っていることも多く、大部分の言葉を本当に理解しているとは言えない。ただそこには明確な違いがある。AIは言葉を接地させる身体を持たないが、ヒトは、接地させるかどうかは別として、接地させる身体を持っている点だ。

日々使っていることばは、モノの名前のように実体と身体がリンクして理解しているものがある一方、この連載で取り上げてきた医学情報では、「相対危険0.7」とか、「危険率0.03」とか、「統計学的に有意である」とか、ことばが抽象化して、身体的な結びつきがはっきりしないものも多い。そうした抽象的なことばの理解についていえば、AIがヒトに近づいているというより、ヒトが身体性を失って、AIの言葉の理解に近づいているのが実態ではないかという気がする。

たとえば「マスクが予防に有効というランダム化比較試験とそのメタ分析がある」ということばは、自分自身がマスクを付けていいのかどうか判断するための身体的経験を持たない中で、AIが理解するようにそのことばを理解しているのではないか。情報が人工知能のように、脳にだけ接地しているといってもいい。脳に心地よい接地が、そのことばを理解したとして、日々使うようになる。エビデンス偏重という現象の一面は、そんな風に説明できるかもしれない。

その反面、自分はマスクをしたことはないが感染していないとか、自分の周りにはマスクをしていて感染している人も多いという経験をしている人も少なからずいる。こうした経験はたやすく身体に接地して、マスクを付けても効果はないという判断をしているのかもしれない。こうした経験を通して身体化した判断には安定性がある。しかし、これは経験に基づいて、身体に接地したことばによる判断だからよいという風にも言い切れない。

また、自分の周りには、マスクしてもしなくても、感染する人としない人がいて、経験だけでは判断できないということもある。予防医療はそもそも身体に接地しにくい部分がある。そういう人もまた、抽象的な「マスクが予防に有効というランダム化比較試験とそのメタ分析がある」とか、逆に「マスクが予防に有効というランダム化比較試験とそのメタ分析はない」とかいう情報に基づいて、身体に接地しないままに判断している場合が多いだろう。身体に接地しない判断は不安定であるが、ただこれも悪いばかりではない。自分自身の経験だけでは判断できず、他人の経験まで取り込んで判断するというのは、もともと不安定な問題で、少なくともことばそのものの意味ではなく、そのことばが置かれた不安定さを身体化している面がある。

ここで明らかなことは、マスクを付けるにしろ、付けないにしろ、ことばを通して、考え、判断するしかないという状況である。そして、そのことばとして押し寄せる情報の束と、自分自身の経験をことばにしたものと、それらの経験が体に接地するか接地しないという点で、考えることで、とりあえずの判断を出すことができるかもしれない。さらには、判断を出すよりも、それによってさらに考え続けることができれば、それがもっとも重要なことではないかと考えている。

1)今井むつみ、秋田喜美 言葉の本質:ことばはどう生まれ、進化したか」 2023 中公新書


2024年3月11日月曜日

言語の本質 ことばの持つ身体性、記号接地問題

  今回もまた言語学から医学情報を読み解いていく続きである。前回、データと事実には大きなギャップがあり、データとその解釈にもさらに大きなギャップがある点を指摘した。そして、データもその解釈も、ことばや数字によって表される。ことばを使う以上、言語学が重要で、その文節の恣意性を認識することが助けになるというのがここまでの要約である。

そこで今日も言語学である。ただソシュールから離れて、むしろソシュールとは真逆の考え方ともいえる言語学に沿って、身体性という視点でのデータ、情報とことばの違いについて、いろいろ考えてみたい。今回のもとになった本は「言語の本質:ことばはどう生まれ、進化したか」1)である。

ソシュールの言語学では、「文節の恣意性」とともに「対応の恣意性」ということがある。例えば「いぬ」ということばの文字の並びと実際の犬の間には何の関連もなく、恣意的に対応しているだけということである。

この「対応の恣意性」に対して、痛みに関する「しくしく」とか「きりきり」というようなオノマトペは、その文字の並びと実際の痛みが単に恣意的に対応しているというよりは、実際の身体の痛みの経験と文字の並びに関連があるように思われる。ここには対応の恣意性以外の要素がある。このことをもう少し一般化すると、ことばの「身体性」ということだが、ことばだけで知っていることとばだけでなく、身をもって経験として知っていることばがあるということでもある。今回はこのことばの「身体性」をキーに、マスクの効果についての情報について考えてみる。

たとえば「マスクの効果についてはランダム化比較試験と観察研究を合わせたメタ分析で統計学的に有意な効果が示されている」という「ことば」の身体性についてである。ここに身体性はない。実際の効果との間に恣意的な対応があるにすぎない。医学論文にしろ、生データにしろ、情報の受け手の経験とは遠いところにある。実際の研究に参加した人でさえ、ある人はマスクを着けても感染し、ある人はマスクを着けなくても感染せずという部分が必ずあり、「統計学的に有意な効果」と真逆な身体的経験をしている。ことばと身体には関連があるというより、対応すらない。ここにあることばは、身体性があることばに対して、単なる情報に過ぎない。この身体性がある「ことば」と身体性を欠く「情報」を対比しながら、この先を進めよう。

多くの「情報」はことばを使っていながら、身体性をもたない。身をもってわかるということがない。しかし、「情報」に身体性がないとしても、この情報を自分の身に近づけないとうまく使えない。身体性があってもなくても、情報で使われる「ことば」=「記号」を身体に「接地」しなければいけない。これが「記号接地問題」である。

前回まで取り上げてきた言語の恣意性は、「身体性を持たないことば」の性質そのもののように思う。恣意的であるがゆえに「接地」しないことばである。恣意性の認識だけでは問題は解決しない。恣意性を認識したうえで、恣意性によって「接地」困難な「情報」をどう「接地」させるか、それが問題である。

 それでは具体的な話題に入ろう。マスクは無効と判断するという「接地」と、マスクは有効と判断する「接地」の違いがどこにあるのか。あるいはこの「接地」は見せかけで、本当は「接地」などしていないのかもしれない。どうもそれが現実である気がする。どちらも情報そのものを「接地」させて判断しているというより、その他の身体的経験によって、「接地」させているのではないだろうか。そうだとすると「情報」そのものの恣意性は大した問題ではないかもしれない。真の問題は「情報」を基に判断しているように見えて、その背後で動いている、個別の経験、状況ではないか。それこそ「情報」の真偽とはまるで対応しない恣意的な判断かもしれない。

参考文献

1)今井むつみ、秋田喜美 言葉の本質:ことばはどう生まれ、進化したか」 2023 中公新書


2024年3月1日金曜日

恣意性の程度問題: 研究の恣意性、研究の読み手の恣意性

 私のように医学論文ばかり紹介していると、論文ばかり見ないで事実を見ろという批判がある。統計学的に検討された医学論文と言えど、事実を見ていないのはこれまで指摘してきた通りだ。研究者側が勝手に有意水準5%という基準を設けて有効といっているに過ぎない。しかし、それに対して研究ばかりでなく生のデータを見ろという人が事実を見ているかどうかと言えば、それもまた文節の恣意性から自由ではない。そこには研究よりもさらに恣意的な面がある。だから恣意的であるといってもまだ研究の方が恣意性の程度が低い場合が多く、その恣意性を系統的に吟味することもできる部分もあり、私自身は医学研究の結果の方に肩入れすることが多い。

ただそれも程度の問題で、どちらかというとということだし、恣意性から自由でない点で、医学論文も観察結果の生データも、たいして違いはないとも思う。

 そこで最も問題になるのが、恣意性の背景にある学問、理論である。恣意性の議論のスタートが、背景の学問を言語学に移して考えるとということであったので、また話が振出しに戻ったように思われるかもしれない。そうかもしれない。ただ、今はあらゆる学問の背景には、学問自体の勝手な理屈があり、恣意性の問題を常に考えなくてはいけないという前提の共通認識がある。そのうえで背景の学問についてもう一度考えてみたい。

 医学論文も生のデータも統計学的に扱われるが、その統計学の恣意性の程度についてまず考えてみる。統計学は日常的に使われる言葉だけでなく、数字を使用すし、数学を用いる。数字の理解に恣意性が入り込む余地は、一般的な言葉に比べれば小さい。ただそうはいっても、10%の差を大きいとみるか小さいとみるかという解釈のレベルでは、解釈する側の恣意性から逃れられない。さらにその10%の差というのが、どんな計算に基づいているか、数字の解釈の側では不明なことも多い。この連載で利用した四則計算だけであれば何とか理解可能かもしれない。相対危険減少で10%であれば、大した効果でないと感じるし、絶対危険減少で10%なら、かなり大きな効果と思うというように。しかしそれ以上の複雑な数学が使われると、多くの人はその部分はブラックボックスになる。さらに統計学的検定、信頼区間の計算となると、多くの人は吟味が困難で、どう計算されているのか理解するのはむつかしい。私自身もそうである。「多変量解析で交絡因子を調整した」と書いてあれば、それを信用するしかない。危険率が5%未満、95%信頼区間がいくつといくつの間だと言われれば、そこに恣意性があると認識しつつ、とりあえずそう受け止めるしかない。

信用するかしないかの境目は、有効/無効の境目よりもさらにあいまいで、恣意性が高い。情報そのものよりも、解釈する自身の恣意性の方がはるかに大きいというのが一般的だ。そこには正しいか正しくないかというより、信じるか信じないかというまさに恣意的というしかない状況がある。論文にしろ、生データにしろ、情報そのものの恣意性も問題だが、それよりなにより、使い手自身の問題が一番大きいのだ。

ここ3回にわたって、ソシュールの「言語の文節の恣意性」を基盤に、いろいろ考えてきた。わけがわからない。そうだと思う。でも、現実はそういうことなのだ。確実なデータも判断もない。データと事実にはギャップがある。事実が言葉や数字ですべて表現できるわけではない。どういう言葉を選び、どんな数字で表すかという恣意性が必ず入り込む。さらにデータと人の判断にはさらに大きなギャップがある。事実が何かなんてわかり様がない。それが身も蓋もない結論だ。しかし、だからこそ考える価値がある。事実が容易に認識できて、それによって正しい判断ができるというなら、何も考えることはない。迷いもない。逆にそこに困難、迷いがあるからこそ考えることができるし、その意味があるのではないだろうか。


2024年2月12日月曜日

マスクの有効性を測る境目: 恣意的な境目が判断の基準になる

  今回は再びマスクが新型コロナ感染症予防に有効かどうかという話題に戻ろう。それはすでに決着済みの話題だという人がいる。ある人はコクランレビュー1)を引用して無効であるといい、ある人はコロナを対象に限った観察研究を含むメタ分析2)で有効であるという。決着済みという人たちが正反対の決着で対立している。これだけを取り上げても、マスクの有効性について決着済みということはできない。

この対立の決着について、どちらかが正しいかということだと思う人が大部分かもしれないが、それは決着ではない。ここでは対立自体が事実かどうかを問題にしているわけではない。事実は手の届かない別のところにある。事実を通した認識を言葉にすることによって、両者の立場が表現されるが、それはどこまで行っても立場の違いに過ぎない。つまりこの対立は、前回取り上げたソシュールの文節の恣意性を考慮すれば、当たり前のことである。どんな情報を基にしようとも、その情報による有効/無効の区別は事実そのものでなく、人間の側で勝手に有効/無効に区別された様々な境目のうちの一つでしかない。有効/無効の境目は恣意的にしか決められず、当然いろいろな境目を主張する人たちが出てくる。

境目は、人間の側が恣意的に分節しているだけ。そこに事実としてあるのは、100%有効から100%無効へ向かうなだらかなグラデーションだけである。マスクの効果は100%有効ということでもないが、100%無効ということでもない。なだらかな変化のその途中にある。ただなだらかな変化にそもそも境目はない。虹が実際には7色に分かれて見えないように、マスクの有効性も有効/無効の2色には見えない。ただそれを有意水準5%未満で統計学的に有意/有意でないというランダム化比較試験やそのメタ分析の恣意的な基準を研究者側が利用して、有効/無効という2色であるように見せかけているというのが事実である。そして情報の受け手も、その見せかけ通りに有効/無効のどちらかを信じ込まされている面がある。

 それではここでもう一度、マスク着用が無効というコクランレビューの結果と有効というメタ分析の結果を並べてみてみよう。この結果が事実の側にあるのではなく、人間側の言葉の文節の恣意性の側の問題であると意識してみるとどんな風に見えるだろうか。コロナ感染予防についての相対危険と95%信頼区間を下記に示した。

 コクランレビュー:相対危険1.01(0.72~1.42) p>0.05

 コロナに限ったメタ分析:相対危険0.47(0.29~0.75) p<0.05

相対危険はマスク着用群と非着用群を比較するための指標で、マスク着用群の感染者数を非着用群の感染者数で割ったものである。1の時に両群に差がない。1未満の時に有効、1以上の時に無効・有害という結果である。まずその数字だけを見れば、コロナとインフルエンザの両者を含むコクランレビューでは1.01と1以上で効果はなく、わずかに感染を増やすという結果である。下段のコロナに限ったメタ分析では、1未満でマスク着用の効果ありという結果である。相対危険に注目する恣意性の元では、方や無効、方や有効という正反対の結果である。

さらに有意水準5%で統計学的検定という恣意性でみても、上は危険率が5%以上で無効、下は5%未満で有効と、相対危険の数字で見たのと同じということになる。しかし、両者の信頼区間でみると0.72~0.75の範囲で重なっており、この重なり部分に注目した恣意性でみれば、30%近く感染を予防するという似たような結果を示しているのかもしれない。

またこの信頼区間は5%の確率で効果はこの範囲外にある可能性を示しており、上の研究結果でさえ相対危険で0.7程度、相対危険減少で30%以上感染者を減らす可能性を残している。またその逆に1.5倍以上感染者を増やす可能性も捨てきれない。下の統計学的に有効という研究結果では、少ないながらもその上限が1を超えているかもしれず、効果がない可能性もある。信頼区間の上限の外に注目するという恣意性の中では、この2つの結果はどちらも無効という風にも読める。同じ研究結果も、様々な視点で解釈することができ、そのさまざまな見方が可能ということは、そこに恣意性があるということである。

 一方の研究を取り上げても、両方の研究を取り上げるにしても、有効/無効のいずれかが正しいとすることなどできない。どちらも間違っているともいえるし、どちらも正しいともいえる。そしてそれは情報を見る側の問題であり、見るときの基準は、客観的どころか、恣意的なものである。統計学的な結果そのものであっても、統計学の外に出れば、様々な切り口がある。統計学だけが解釈の道具ではない。ソシュールの言語学に倣えば、有効/無効の区別は常に相対的なものになる。現実の世界に境目などない。境目は人間の脳の内にある。

参考文献

1) Jefferson T, et al. Physical interventions to interrupt or reduce the spread of respiratory viruses. Cochrane Database Syst Rev. 2023 Jan 30;1(1):CD006207. doi: 10.1002/14651858.CD006207.pub6. PMID: 36715243.

2) Talic S, et al. Effectiveness of public health measures in reducing the incidence of covid-19, SARS-CoV-2 transmission, and covid-19 mortality: systematic review and meta-analysis. BMJ. 2021 Nov 17;375:e068302. doi: 10.1136/bmj-2021-068302. Erratum in: BMJ. 2021 Dec 3;375:n2997. PMID: 34789505.


2024年1月29日月曜日

言語の恣意性:文節の恣意性と医学情報 血圧はいくつ以上が高血圧なのか

 有意水準5%と同様、どこから効果ありとするかも恣意的に決めるほかない

  反証主義の哲学と同様、研究結果をどう個人に役立てるかを考えたときに、もう一つ決定的な影響を受けたのが言語学である。今回からは言語学を通して、研究結果を個人にどう生かすかを考えてみたい。

 私自身の言語学との出会いは偶然である。医学部の低学年だったころだろうか。親しくもあり、いろいろ多くの影響を受けてきた高校の同級生と会った時に、言語学者のソシュールを勉強しているんだがとても面白いという話を聞き、それが何となく気になっていた。それと前後して、大学の書店に「構造と力:記号論を超えて」1)という哲学書が平積みにされていて、これも偶然、手に取ったというところだと思うが、さっぱりわからず、そこで出てきた「構造主義」とやらがソシュールの言語学が元になっていると理解し、ソシュールについて勉強したいと思ったのがきっかけであった。

そのとき読んだのは「ソシュールを読む」2)という本だったが、久し振りにその本を手に取ってみると、ページの角に折り目がつけられていたり、線が引いてあったり、書き込みがあったり、何か他の本とは違った読み方をしていたようだ。医学書で、線を引いた記憶はあるが、ページの角を折ったり、何か書き込んだりしたという記憶はない。医学書よりも気合を入れて読んでいる跡がうかがわれる。今から40年前のことである。

 その後、医学部の高学年になるにつれ、医学以外の勉強から離れ、ソシュールについての興味も疑問も忘れ去られていた。そのソシュールが、根拠に基づく医療:EBMを臨床の現場で使うという時に、再びよみがえった。今から30年前のことだ。そして、今回はそのことについて書きたいと思う。

ソシュールの言語学の重要な要素の一つに「言語の文節の恣意性」がある。「恣意性」とはあまり使われない言葉だが、客観的でなく、むしろ主観的に、勝手にという意味合いである。世界は世界の側で分けられているわけではなく、言語によって、人間が主観的に、勝手に分節しているということだ。文節というのも聞きなれないが、境目を設ける、単に分けることと思ってもいいだろう。

例えば虹について考えてみよう。日本において虹は7色と思われているし、虹を絵に描いたりすると、7色に分けて塗り分けたりする。しかし実際の虹はどうか。実際の虹は7色には分かれていない。なだらかなグラデーションで徐々に色が変化していくだけであって、7色に分けられるようなはっきりした境目はない。虹が7色だというのは実際の虹の話ではなく、人間の認識側の問題で、その境目は人工的に、言語によって作り上げているに過ぎない。それを言語の文節の恣意性と呼んだ。事実言語によっては、虹の色を2色だったり、5色だったりする。境目は認識の側で、恣意的に決められているのだ。

 この「文節の恣意性」を高血圧で考えてみる。現在では上の血圧140mmHg以上を高血圧とする場合が多いが、その反面、ハイリスクの人では130mmHgとする場合もあるし、テレビコマーシャルでは「血圧130は高めです」と繰り返し言っている。また過去をさかのぼれば、30年前は160mmHgが高血圧というほうが一般的であった。さらにそれ以前では、上の血圧180以上、下の血圧120以上という基準も存在する。

これは正常血圧と高血圧の境目が、まさに恣意的に決められているということだ。それは今の時点に限っても色々な基準があるし、過去からこれまでの変化を追えば、現在とは基準が大きく隔たっている。高血圧の基準は、客観的なものでなく、その時々の社会との関係によって決められた恣意的なものだ。

その恣意的な決定の背景にあるものの一つが、高血圧に関する臨床研究、特にランダム化比較試験の結果である。高血圧の最初のランダム化比較試験は、1960年代に報告された退役軍人を対象にしたものであるが、この研究で使われた高血圧の基準は下の血圧が115~129mmHgで、その後1980年代になって、上の血圧160mmH以上の人が対象になり、2000年以降になって、140mmHg以上を高血圧とした臨床試験が行われるようになっている。

そのそれぞれの研究で、血圧を下げることで脳卒中や心不全が少なくなることが示され、その都度基準となった高血圧の境目が、実際の高血圧の基準として用いられたのである。高血圧の基準は、効果を示したランダム化比較試験の高血圧の基準との関係において、恣意的に決まっているということだ。

さらにそれぞれのランダム化比較試験で治療効果が示されたかどうかもまた恣意的に決められている。これはこれまでさんざん示してきた統計学的有意差というものである。有意水準、平たく言えば治療薬がまぐれで勝ったか可能性が5%未満なら有効という基準である。この5%未満という基準も恣意的である。有効かどうかの境目もまた、高血圧の境目と同様に恣意的に決まっている。

そこでいったい何がわかったか。私の中で明確になったことは、EBMのプロセスに沿って、今から30年前「降圧薬を飲めば脳卒中を予防できる」という説明が、必ずしも客観的な情報に基づくものではないということ、さらにそもそも客観的な情報などどこにもなく、恣意的に決められた高血圧の基準によって定められた人たちを対象に、恣意的に決められた有意水準5%で有効と判定された研究によって、恣意的に判定されていたに過ぎないということ、である。「8%の脳卒中が5%に減るというのは薬が効くということなのか」という患者からの問いも、その恣意的な判断という意味では、統計学的に有効というのと同列なのである。

言葉を使う以上、科学的に決められた客観的な定義も、恣意的なものに過ぎない。問題はその恣意性の程度であり、恣意性に影響する周囲の状況、周囲との関係性である。そう明らかになったところで、論文結果をどう生かすかということがどういうことなのか、訳がわからなくなった。そしてそれは今も訳がわからないままである。しかし、そのわけのわからなさについて、さらに言語学を助けに考え続けたい。

参考文献

1) 浅田彰 構造と力 記号論を超えて 1983 勁草書房

2) 丸山慶三郎 ソシュールの思想 1983 岩浪セミナーブックス


2024年1月18日木曜日

言語の恣意性:文節の恣意性と医学情報 血圧はいくつ以上が高血圧なのか 有意水準5%と同様、どこから効果ありとするかも恣意的に決めるほかない

  反証主義の哲学と同様、研究結果をどう個人に役立てるかを考えたときに、もう一つ決定的な影響を受けたのが言語学である。今回からは言語学を通して、研究結果を個人にどう生かすかを考えてみたい。

 私自身の言語学との出会いは偶然である。医学部の低学年だったころだろうか。親しくもあり、いろいろ多くの影響を受けてきた高校の同級生と会った時に、言語学者のソシュールを勉強しているんだがとても面白いという話を聞き、それが何となく気になっていた。それと前後して、大学の書店に「構造と力:記号論を超えて」1)という哲学書が平積みにされていて、これも偶然、手に取ったというところだと思うが、さっぱりわからず、そこで出てきた「構造主義」とやらがソシュールの言語学が元になっていると理解し、ソシュールについて勉強したいと思ったのがきっかけであった。

そのとき読んだのは「ソシュールを読む」2)という本だったが、久し振りにその本を手に取ってみると、ページの角に折り目がつけられていたり、線が引いてあったり、書き込みがあったり、何か他の本とは違った読み方をしていたようだ。医学書で、線を引いた記憶はあるが、ページの角を折ったり、何か書き込んだりしたという記憶はない。医学書よりも気合を入れて読んでいる跡がうかがわれる。今から40年前のことである。

 その後、医学部の高学年になるにつれ、医学以外の勉強から離れ、ソシュールについての興味も疑問も忘れ去られていた。そのソシュールが、根拠に基づく医療:EBMを臨床の現場で使うという時に、再びよみがえった。今から30年前のことだ。そして、今回はそのことについて書きたいと思う。

ソシュールの言語学の重要な要素の一つに「言語の文節の恣意性」がある。「恣意性」とはあまり使われない言葉だが、客観的でなく、むしろ主観的に、勝手にという意味合いである。世界は世界の側で分けられているわけではなく、言語によって、人間が主観的に、勝手に分節しているということだ。文節というのも聞きなれないが、境目を設ける、単に分けることと思ってもいいだろう。

例えば虹について考えてみよう。日本において虹は7色と思われているし、虹を絵に描いたりすると、7色に分けて塗り分けたりする。しかし実際の虹はどうか。実際の虹は7色には分かれていない。なだらかなグラデーションで徐々に色が変化していくだけであって、7色に分けられるようなはっきりした境目はない。虹が7色だというのは実際の虹の話ではなく、人間の認識側の問題で、その境目は人工的に、言語によって作り上げているに過ぎない。それを言語の文節の恣意性と呼んだ。事実言語によっては、虹の色を2色だったり、5色だったりする。境目は認識の側で、恣意的に決められているのだ。

 この「文節の恣意性」を高血圧で考えてみる。現在では上の血圧140mmHg以上を高血圧とする場合が多いが、その反面、ハイリスクの人では130mmHgとする場合もあるし、テレビコマーシャルでは「血圧130は高めです」と繰り返し言っている。また過去をさかのぼれば、30年前は160mmHgが高血圧というほうが一般的であった。さらにそれ以前では、上の血圧180以上、下の血圧120以上という基準も存在する。

これは正常血圧と高血圧の境目が、まさに恣意的に決められているということだ。それは今の時点に限っても色々な基準があるし、過去からこれまでの変化を追えば、現在とは基準が大きく隔たっている。高血圧の基準は、客観的なものでなく、その時々の社会との関係によって決められた恣意的なものだ。

その恣意的な決定の背景にあるものの一つが、高血圧に関する臨床研究、特にランダム化比較試験の結果である。高血圧の最初のランダム化比較試験は、1960年代に報告された退役軍人を対象にしたものであるが、この研究で使われた高血圧の基準は下の血圧が115~129mmHgで、その後1980年代になって、上の血圧160mmH以上の人が対象になり、2000年以降になって、140mmHg以上を高血圧とした臨床試験が行われるようになっている。

そのそれぞれの研究で、血圧を下げることで脳卒中や心不全が少なくなることが示され、その都度基準となった高血圧の境目が、実際の高血圧の基準として用いられたのである。高血圧の基準は、効果を示したランダム化比較試験の高血圧の基準との関係において、恣意的に決まっているということだ。

さらにそれぞれのランダム化比較試験で治療効果が示されたかどうかもまた恣意的に決められている。これはこれまでさんざん示してきた統計学的有意差というものである。有意水準、平たく言えば治療薬がまぐれで勝ったか可能性が5%未満なら有効という基準である。この5%未満という基準も恣意的である。有効かどうかの境目もまた、高血圧の境目と同様に恣意的に決まっている。

そこでいったい何がわかったか。私の中で明確になったことは、EBMのプロセスに沿って、今から30年前「降圧薬を飲めば脳卒中を予防できる」という説明が、必ずしも客観的な情報に基づくものではないということ、さらにそもそも客観的な情報などどこにもなく、恣意的に決められた高血圧の基準によって定められた人たちを対象に、恣意的に決められた有意水準5%で有効と判定された研究によって、恣意的に判定されていたに過ぎないということ、である。「8%の脳卒中が5%に減るというのは薬が効くということなのか」という患者からの問いも、その恣意的な判断という意味では、統計学的に有効というのと同列なのである。

言葉を使う以上、科学的に決められた客観的な定義も、恣意的なものに過ぎない。問題はその恣意性の程度であり、恣意性に影響する周囲の状況、周囲との関係性である。そう明らかになったところで、論文結果をどう生かすかということがどういうことなのか、訳がわからなくなった。そしてそれは今も訳がわからないままである。しかし、そのわけのわからなさについて、さらに言語学を助けに考え続けたい。

参考文献

1) 浅田彰 構造と力 記号論を超えて 1983 勁草書房

2) 丸山慶三郎 ソシュールの思想 1983 岩浪セミナーブックス

----------------------------------------

この原稿が発端となり連載が中止になった。

「私自身の言語学との出会いは偶然である。医学部の低学年だったころだろうか。親しくもあり、いろいろ多くの影響を受けてきた高校の同級生と会った時に、言語学者のソシュールを勉強しているんだがとても面白いという話を聞き、それが何となく気になっていた。それと前後して、大学の書店に「構造と力:記号論を超えて」1)という哲学書が平積みにされていて、これも偶然、手に取ったというところだと思うが、さっぱりわからず、そこで出てきた「構造主義」とやらがソシュールの言語学が元になっていると理解し、ソシュールについて勉強したいと思ったのがきっかけであった。」

上記の部分は単に私の経験に過ぎず、これはブログではないので前半部分は削除するという編集者に対して、削除を拒否、削除するなら連載終了でと反応したところ、それなら連載終了でということになった。

専門的過ぎる、わかりにくい、個人的な経験を書くな。

まあ何とかして私から連載をやめたいと言わせようとしていたのかもしれない。

で、結局編集者の言うように、原稿はブログになったわけだ。

ただこの部分はこの先の原稿とリンクしていて削除するわけにはいかない。

どうリンクするるかは、またこの先のブログで。

2024年1月12日金曜日

反証可能性と社会:有意水準5%をコインと野球の日本シリーズで考える

統計学的に医療行為が有効かどうか決める場合の有意水準についての話である。前回も書いたようにこの基準は5%未満の間違いは許容しようというものだ。この5%がどれほどに厳しい、あるいは緩い基準なのか、数字だけを眺めてみてもよくわからないというのが正直な反応だろう。そのあいまいさを日常的な出来事を例に説明してみたい。反証可能性を日常に落とし込んで説明しようというわけである。

以前デンマークで行われたランダム化比較試験の結果は、以下のように示されている。

絶対リスク減少 -0.3%、95%信頼区間-1.2~0.4、危険率0.38

相対危険 0.82,95%信頼区間0.54~1.23、危険率0.33

いずれも危険率が有意水準0.05,5%を上回っており、統計学的に有意な差は認められなかったという結果である。危険率とは差がないという仮説の正しさだ。つまり差があるという仮説の正しさは危険率を1から引くことで求められるが、これは絶対リスク減少では62%の確率で差がある方が正しいかもしれないし、相対危険では67%で正しいかもしれないという結果である。効果があるかないかという視点だけで見れば効果がある確率の方が高いのである。ただ効果が五分五分に近いようでは緩すぎる。そこで差がある仮説の正しさが95%、間違いの確率が5%に地点を基準しようというのが、医学論文では伝統的に採用されてきた。ここに科学的な基準はない。

そこでこの有意水準5%を日常に落とし込んで考えてみる。まずはスポーツのコートを選ぶかサーブを選ぶかをコイントスで決める状況を考えよう。ここでは紺の裏表がそれぞれ1/2の確率で出るコインでなければ公平とは言えない。このコインが公平なコインであるか判断するためにどうすればよいか。このコインを2回投げた時、2回とも表が出たとしよう。ここで表が出やすいコインかもしれないというふうに考えて、その確率を計算してみる。表の出る確率も裏の出る確率も等しく1/2だとすると、2回続けて表が出る確率は1/2×1/2=1/4、25%である。有意水準5%よりかなり大きい。そこでもう1回振ってみたところやはり表が出たとしよう。日常的にはこのあたりでもうこのコインは表が出やすいと判断するかもしれないが、この3回続けて表が出る確率は1/2×1/2×1/2=1/8、12.5%で5%よりまだ大きい。それでは4回続けて表ならどうか。1/2の4乗で1/16=6.25%とかなり5%に近づくが、まだ統計学的に有意な表が出るコインとは言えない。さらにコインを投げ続けて5回目もまた表だった時に1/32=3.125%とようやく有意水準5%を下回り、統計学的にも表が出やすいコインという判断になるのである。

それではもう一つ、野球の日本シリーズでも同様に考えてみる。今年の阪神、オリックスの日本シリーズは4勝3敗までもつれたが、これは統計学的に言うとどういうことなのか。阪神とオリックスの間に統計学的に有意な強さの差があるかどうかである。

まず阪神の方が何連勝したら統計学的にオリックスより強いと言えるか。コインの例でみたように5連勝しなければ統計学的にオリックスより強いとは言えない。両者に差がないとして、5連勝する確率は、1/2の5乗で3.125%である。4勝3敗では統計学的に阪神が強いとは言えないのである。さらにオリックスが何連勝したらオリックスの方が強いかも合わせて考えれば、同様に5連勝である。この確率も3.125%なので、どちらが強いかわからない前提で考えているので、両者を足すと6.25%と5%を超えてしまう。つまりどちらが強いかわからない状況で、一方の方が統計学的に強いというためにはどちらかが6連勝しなければ、有意水準5%で強さに差があるとは言えないということだ。

実際にどちらかが6連勝するまで戦い続ける日本シリーズを考えてみよう。おそらくなかなか決着はつかないに違いない。そういう意味ではかなり厳しい基準だといえる。逆に厳しすぎて差を見逃しているかもしれないと考える必要がある。

もう一度デンマークのランダム化比較試験の結果を見てみよう。危険率が30%を超えているので、マスクを着ける推奨がつけない推奨と比べて、2回続けて有効という結果を出すほどの差ではないということである。それでも4勝3敗で勝つ可能性は残る。そんなふうに考えると、この結果はなかなか悩ましい。4勝3敗でも勝ったと喜ぶ日本シリーズに対応させて言えば、デンマークの研究結果はマスクが勝ったということになる。4勝3敗で勝っても、勝った勝ったと喜ぶのが日常である。

日常的に差があると考えていることの中には、統計学を適応すればほとんど差がないと判断されるようなことが多い。このことは心にとめておいてもいいと思う。大体のことに大きな差はないのである。


2024年1月5日金曜日

 

反証可能性と統計学的手法

有意水準と検出力

 

 私の書くものに対して、「結局何を言いたいのかわからない」という批判がしばしば寄せられる。マスクの着用に関しても書いてきたこともその通りだと思う。結局どうすればよいかについては書いていない。根拠に基づく医療:EBMについて講演した後の質問でも同様だ。「結局あなたは治療を勧めるんですか、勧めないんですか?」と聞かれることも多い。

 この質問に対する私の回答は明確だ。「それをあなた自身が考えるための手法がEBMです。ご自身で考えてみてください」ということである。この連載も同じである。判断するより、調べよう、考え続けよう、そういうことを繰り返し書いてきた。 

判断というのは考えることをやめることでもある。判断と思考停止はどこが違うのか。思考停止は判断の一部である。そうしなければ判断できない。しかし、それは思考の一旦停止に過ぎない。判断はあくまで暫定的なものである。科学的な視点で言えば、「反証可能性」が科学を担保している。一旦正しいとされても、それが反証の余地を残していることが科学の要件であるという哲学者がいる。カール・ポパーである。

「反証可能性」が科学と科学でないものを区別するということについて、少し説明を加えよう。例えば「神は存在するか」という疑問に対して、「神はいる」「神はいない」とどちらをとるにしても、それを反証する手立てがない。これは科学的な言明ではない。信じるか信じないかというのは科学的言明ではないといってもいい。それに対して、「すべてのカラスは黒い」というのはどうか。これは「白いカラス」が発見されることによって反証される。したがってこれは科学的言明ということになる。

何かおかしな感じがするだろう。帰納法によって、「カラスは黒い」という観察の繰り返しが科学の正しさを支えているにもかかわらず、それが同時に、白いカラスの出現で反証され正しくないということになるのが科学だというのだ。これはある意味帰納法の否定である。統計学は機能的な手続きの代表である。ポパーの反証主義は統計学の否定という側面がある。しかしそうではない。統計学はこの反証主義を取り込むことによってこそ成り立っている。「有意水準」というものである。差があるという結果が間違っている可能性を許容する基準、あるいは検討する医療行為がまぐれでいいと出てしまった可能性をどこまで許するかといってもよい。学論文では通常5%が採用される。つまり統計学的に有意な効果を示した研究であっても、5%はは反証可能性が残っているということである。統計学は反証主義に反するどころか反証主義そのものなのである。

これに対して、効果がないという結果が示されたときにはどのように考えるか。これに対しては「検出力」という基準がある。有意水準は差がないときに差があるとしてしまう間違いでαエラーをも言われる。それに対して差があるときに誤ってないとしてしまうこともある。この間違いをβエラーという。これは有意水準より緩く、10%に設定されることが多い。差を見つけるために研究するという方向のバイアスに対して、間違って見つけるエラーに厳しく、間違って差を見逃すエラーには緩くなっているという背景がある。そのβエラーを1から引いたものが検出力である。差があるときに差があるといえる確率である。βエラーを10%に設定すれば検出力は90%になる。ここにも反証可能性が担保されている 

私が判断を避けて書き続けることに対して、「結論は出ている」と思う人が多いかもしれない。しかしそれは科学的な態度ではない。ましてや統計学的な検討には常に「反証可能性」がある。思考を停止しないためには、判断した後も考え続けなければいけない。科学的思考には一旦停止があるだけである。むしろ必要なのは判断停止の方である。

 マスクに対して結論が出ていると考える人も、もう一度その判断を停止して、勉強を継続するといいのではないだろうか。