ここで働いています

2024年3月30日土曜日

医学情報をどう「接地」させるか:認知心理科学者のハルナッドが問う「記号接地問題」 AIがヒトに近づいているわけではなく、ヒトがAIに近づいている


マスクを付けたほうがいいのか、付けないほうがいいのかを一つの例に、情報収集し、考え、判断をして、実際の行動に結び付ける中で、主に医学情報がどのように使えるのか、あるいは使えないのかを中心に取り上げ、医学情報だけで決めることなどほとんど困難であることを示してきた。そこで医学以外のということで、言語学を取り上げてきた。今回も前回少し紹介した言語学の「記号接地問題」を軸に、いろいろ考えてみたい。

まずは「記号接地問題」を再び説明することから始めよう。「言語の本質」1)には、この問題は当初人工知能:AIの問題として。認知心理科学者スティーブン・ハルナッドが提唱したとある。ハルナッドは言う。「記号を別の記号で表現するだけでは、いつまでたってもことばの対象についての理解は得られない。ことばの意味を本当に理解するためには、まるごとの対象についての身体的な経験を持たなければならない」。

AIは体を持たない。身体に結び付かないことばは、ことばとして理解している、あるいはそのことばが表すものを知っていると言えるだろうか。そういう問いである。さらにその問いを広げていくと、AIだけでなく、身体を持つヒトもことばを知っているというためには、身体経験が必要だろうかと問う。

この問いにはとりあえず簡単に答えることができるように思う。AIはことばの意味を本当には知ってはいない。またヒトも多くの言葉を身体に接地することなく使っていることも多く、大部分の言葉を本当に理解しているとは言えない。ただそこには明確な違いがある。AIは言葉を接地させる身体を持たないが、ヒトは、接地させるかどうかは別として、接地させる身体を持っている点だ。

日々使っていることばは、モノの名前のように実体と身体がリンクして理解しているものがある一方、この連載で取り上げてきた医学情報では、「相対危険0.7」とか、「危険率0.03」とか、「統計学的に有意である」とか、ことばが抽象化して、身体的な結びつきがはっきりしないものも多い。そうした抽象的なことばの理解についていえば、AIがヒトに近づいているというより、ヒトが身体性を失って、AIの言葉の理解に近づいているのが実態ではないかという気がする。

たとえば「マスクが予防に有効というランダム化比較試験とそのメタ分析がある」ということばは、自分自身がマスクを付けていいのかどうか判断するための身体的経験を持たない中で、AIが理解するようにそのことばを理解しているのではないか。情報が人工知能のように、脳にだけ接地しているといってもいい。脳に心地よい接地が、そのことばを理解したとして、日々使うようになる。エビデンス偏重という現象の一面は、そんな風に説明できるかもしれない。

その反面、自分はマスクをしたことはないが感染していないとか、自分の周りにはマスクをしていて感染している人も多いという経験をしている人も少なからずいる。こうした経験はたやすく身体に接地して、マスクを付けても効果はないという判断をしているのかもしれない。こうした経験を通して身体化した判断には安定性がある。しかし、これは経験に基づいて、身体に接地したことばによる判断だからよいという風にも言い切れない。

また、自分の周りには、マスクしてもしなくても、感染する人としない人がいて、経験だけでは判断できないということもある。予防医療はそもそも身体に接地しにくい部分がある。そういう人もまた、抽象的な「マスクが予防に有効というランダム化比較試験とそのメタ分析がある」とか、逆に「マスクが予防に有効というランダム化比較試験とそのメタ分析はない」とかいう情報に基づいて、身体に接地しないままに判断している場合が多いだろう。身体に接地しない判断は不安定であるが、ただこれも悪いばかりではない。自分自身の経験だけでは判断できず、他人の経験まで取り込んで判断するというのは、もともと不安定な問題で、少なくともことばそのものの意味ではなく、そのことばが置かれた不安定さを身体化している面がある。

ここで明らかなことは、マスクを付けるにしろ、付けないにしろ、ことばを通して、考え、判断するしかないという状況である。そして、そのことばとして押し寄せる情報の束と、自分自身の経験をことばにしたものと、それらの経験が体に接地するか接地しないという点で、考えることで、とりあえずの判断を出すことができるかもしれない。さらには、判断を出すよりも、それによってさらに考え続けることができれば、それがもっとも重要なことではないかと考えている。

1)今井むつみ、秋田喜美 言葉の本質:ことばはどう生まれ、進化したか」 2023 中公新書


2024年3月11日月曜日

言語の本質 ことばの持つ身体性、記号接地問題

  今回もまた言語学から医学情報を読み解いていく続きである。前回、データと事実には大きなギャップがあり、データとその解釈にもさらに大きなギャップがある点を指摘した。そして、データもその解釈も、ことばや数字によって表される。ことばを使う以上、言語学が重要で、その文節の恣意性を認識することが助けになるというのがここまでの要約である。

そこで今日も言語学である。ただソシュールから離れて、むしろソシュールとは真逆の考え方ともいえる言語学に沿って、身体性という視点でのデータ、情報とことばの違いについて、いろいろ考えてみたい。今回のもとになった本は「言語の本質:ことばはどう生まれ、進化したか」1)である。

ソシュールの言語学では、「文節の恣意性」とともに「対応の恣意性」ということがある。例えば「いぬ」ということばの文字の並びと実際の犬の間には何の関連もなく、恣意的に対応しているだけということである。

この「対応の恣意性」に対して、痛みに関する「しくしく」とか「きりきり」というようなオノマトペは、その文字の並びと実際の痛みが単に恣意的に対応しているというよりは、実際の身体の痛みの経験と文字の並びに関連があるように思われる。ここには対応の恣意性以外の要素がある。このことをもう少し一般化すると、ことばの「身体性」ということだが、ことばだけで知っていることとばだけでなく、身をもって経験として知っていることばがあるということでもある。今回はこのことばの「身体性」をキーに、マスクの効果についての情報について考えてみる。

たとえば「マスクの効果についてはランダム化比較試験と観察研究を合わせたメタ分析で統計学的に有意な効果が示されている」という「ことば」の身体性についてである。ここに身体性はない。実際の効果との間に恣意的な対応があるにすぎない。医学論文にしろ、生データにしろ、情報の受け手の経験とは遠いところにある。実際の研究に参加した人でさえ、ある人はマスクを着けても感染し、ある人はマスクを着けなくても感染せずという部分が必ずあり、「統計学的に有意な効果」と真逆な身体的経験をしている。ことばと身体には関連があるというより、対応すらない。ここにあることばは、身体性があることばに対して、単なる情報に過ぎない。この身体性がある「ことば」と身体性を欠く「情報」を対比しながら、この先を進めよう。

多くの「情報」はことばを使っていながら、身体性をもたない。身をもってわかるということがない。しかし、「情報」に身体性がないとしても、この情報を自分の身に近づけないとうまく使えない。身体性があってもなくても、情報で使われる「ことば」=「記号」を身体に「接地」しなければいけない。これが「記号接地問題」である。

前回まで取り上げてきた言語の恣意性は、「身体性を持たないことば」の性質そのもののように思う。恣意的であるがゆえに「接地」しないことばである。恣意性の認識だけでは問題は解決しない。恣意性を認識したうえで、恣意性によって「接地」困難な「情報」をどう「接地」させるか、それが問題である。

 それでは具体的な話題に入ろう。マスクは無効と判断するという「接地」と、マスクは有効と判断する「接地」の違いがどこにあるのか。あるいはこの「接地」は見せかけで、本当は「接地」などしていないのかもしれない。どうもそれが現実である気がする。どちらも情報そのものを「接地」させて判断しているというより、その他の身体的経験によって、「接地」させているのではないだろうか。そうだとすると「情報」そのものの恣意性は大した問題ではないかもしれない。真の問題は「情報」を基に判断しているように見えて、その背後で動いている、個別の経験、状況ではないか。それこそ「情報」の真偽とはまるで対応しない恣意的な判断かもしれない。

参考文献

1)今井むつみ、秋田喜美 言葉の本質:ことばはどう生まれ、進化したか」 2023 中公新書


2024年3月1日金曜日

恣意性の程度問題: 研究の恣意性、研究の読み手の恣意性

 私のように医学論文ばかり紹介していると、論文ばかり見ないで事実を見ろという批判がある。統計学的に検討された医学論文と言えど、事実を見ていないのはこれまで指摘してきた通りだ。研究者側が勝手に有意水準5%という基準を設けて有効といっているに過ぎない。しかし、それに対して研究ばかりでなく生のデータを見ろという人が事実を見ているかどうかと言えば、それもまた文節の恣意性から自由ではない。そこには研究よりもさらに恣意的な面がある。だから恣意的であるといってもまだ研究の方が恣意性の程度が低い場合が多く、その恣意性を系統的に吟味することもできる部分もあり、私自身は医学研究の結果の方に肩入れすることが多い。

ただそれも程度の問題で、どちらかというとということだし、恣意性から自由でない点で、医学論文も観察結果の生データも、たいして違いはないとも思う。

 そこで最も問題になるのが、恣意性の背景にある学問、理論である。恣意性の議論のスタートが、背景の学問を言語学に移して考えるとということであったので、また話が振出しに戻ったように思われるかもしれない。そうかもしれない。ただ、今はあらゆる学問の背景には、学問自体の勝手な理屈があり、恣意性の問題を常に考えなくてはいけないという前提の共通認識がある。そのうえで背景の学問についてもう一度考えてみたい。

 医学論文も生のデータも統計学的に扱われるが、その統計学の恣意性の程度についてまず考えてみる。統計学は日常的に使われる言葉だけでなく、数字を使用すし、数学を用いる。数字の理解に恣意性が入り込む余地は、一般的な言葉に比べれば小さい。ただそうはいっても、10%の差を大きいとみるか小さいとみるかという解釈のレベルでは、解釈する側の恣意性から逃れられない。さらにその10%の差というのが、どんな計算に基づいているか、数字の解釈の側では不明なことも多い。この連載で利用した四則計算だけであれば何とか理解可能かもしれない。相対危険減少で10%であれば、大した効果でないと感じるし、絶対危険減少で10%なら、かなり大きな効果と思うというように。しかしそれ以上の複雑な数学が使われると、多くの人はその部分はブラックボックスになる。さらに統計学的検定、信頼区間の計算となると、多くの人は吟味が困難で、どう計算されているのか理解するのはむつかしい。私自身もそうである。「多変量解析で交絡因子を調整した」と書いてあれば、それを信用するしかない。危険率が5%未満、95%信頼区間がいくつといくつの間だと言われれば、そこに恣意性があると認識しつつ、とりあえずそう受け止めるしかない。

信用するかしないかの境目は、有効/無効の境目よりもさらにあいまいで、恣意性が高い。情報そのものよりも、解釈する自身の恣意性の方がはるかに大きいというのが一般的だ。そこには正しいか正しくないかというより、信じるか信じないかというまさに恣意的というしかない状況がある。論文にしろ、生データにしろ、情報そのものの恣意性も問題だが、それよりなにより、使い手自身の問題が一番大きいのだ。

ここ3回にわたって、ソシュールの「言語の文節の恣意性」を基盤に、いろいろ考えてきた。わけがわからない。そうだと思う。でも、現実はそういうことなのだ。確実なデータも判断もない。データと事実にはギャップがある。事実が言葉や数字ですべて表現できるわけではない。どういう言葉を選び、どんな数字で表すかという恣意性が必ず入り込む。さらにデータと人の判断にはさらに大きなギャップがある。事実が何かなんてわかり様がない。それが身も蓋もない結論だ。しかし、だからこそ考える価値がある。事実が容易に認識できて、それによって正しい判断ができるというなら、何も考えることはない。迷いもない。逆にそこに困難、迷いがあるからこそ考えることができるし、その意味があるのではないだろうか。