画像
Credit:Roy Dayan et al . BMJ (2024)
artificial-intelligence

古いAIが認知症と診断されてしまう?医学テストで明らかになった驚愕の事実

2025.02.25 18:00:48 Tuesday

近年、文章生成AI(チャットボット)の進歩が目覚ましく、医療や法律など高度な領域でも人間並みの回答を出せるとして注目を集めています。

しかし最新の研究によると、これらのAIが人間の認知症を調べるテストを受けると、「古いバージョン」のAIほどスコアが低く、人間でいえば「認知症レベル」と診断されてしまう結果が出たのです。

まるで人間の脳が加齢とともに衰えるかのように、“バージョンが古いAI”ほど視空間認知などの課題を苦手とするという興味深い事実が明らかになりました。

実際にはAIに「脳細胞」があるわけではありません。

それでも、ある種の“バージョンアップ”がされていないAIは、時計を描いたり立体の図形を模写したりするタスクで大きくつまずき、他の症状も含めると「軽度認知障害(MCI)」どころか「重度認知症」に該当するスコアを叩き出したケースもあります。

医療現場での支援役として期待される一方、視空間処理や状況の把握という点では、AIはまだ人間ほど柔軟な理解には至っていないということが、今回のテストを通じて浮き彫りになったわけです。

この結果は、私たちが“AI=何でもできる万能の知性”という先入観を持ってしまうことへの警鐘ともいえるでしょう。

医師や専門家でさえ、高度な医療試験でAIに得点を越されることも珍しくなくなってきました。

しかし、いざ人間の認知機能を測る検査を適用してみると、意外な弱点が炙り出されるのです。

果たして、この“古いAIが認知症テストに落ちる”という事実は、私たちの未来の医療や社会に何を示唆するのでしょうか。

今回のニュースでは、その不思議な現象と背景をわかりやすく解説していきます。

研究内容の詳細は『BMJ』にて公開されました。

Age against the machine—susceptibility of large language models to cognitive impairment: cross sectional analysis https://doi.org/10.1136/bmj-2024-081948

旧型AIを認知症診断で斬る

画像
研究で実施された「モントリオール認知評価(MoCA)」テストにおける各AIモデルの得点を視覚的に示したグラフです。MoCAは最大30点満点で、通常、26点以上が正常範囲、26点未満は軽度認知障害(MCI)の可能性があるとされます。ChatGPT 4o: 26点 ほぼ正常範囲の下限に位置しており、最新の改良型モデルとして最高得点を記録。ChatGPT 4およびClaude 3.5: 25点正常範囲から1点下回っており、人間であれば軽度認知障害が疑われるスコア。Gemini 1.0: 16点非常に低い得点で、仮に人間であれば重度の認知障害に相当するレベル。Gemini 1.5: Gemini 1.0よりは改善しているが、依然として26点には達していない。/Credit:Roy Dayan et al . BMJ (2024)

人工知能(AI)がここ数年で急速に発展し、私たちの身近な生活にも影響を及ぼすようになりました。

特に文章生成を得意とする「大規模言語モデル(LLM)」は、会話や文章作成はもちろん、医師国家試験や法律系試験など高度な知識を問われる場面でも人間に劣らない成績を収めることがあるとして、世界中で注目を集めています。

こうしたAIの進歩を受け、医療分野では「AIが医師をサポート、あるいは取って代わるのではないか」という声が出始めています。

実際に、ある研究ではAIが人間の専門医よりも正確に診断を下す事例が報告されたこともあり、多くの医療機関や企業が医療AIの開発を急いでいます。

しかし、こうした急速な発展の一方で、「そもそもAIの“知能”はどこまで人間に近いのか?」「文字を扱うのは得意でも、周囲の状況を理解したり、視覚的な情報を総合して判断する力はあるのか?」といった疑問がこれまでも指摘されてきました。

AIはあくまで統計的手法で文章や画像を生成するため、人間とまったく同じように世界を認識しているわけではないという考えが根強いのです。

そこで研究者たちが目をつけたのが、「モントリオール認知評価(MoCA)」というテストです。

これは本来、人間の高齢者や軽度認知障害が疑われる人に対して行う、総合的な認知機能テストです。

記憶力や注意力、言語能力だけでなく、時計描画や立体の図形を模写するといった視空間認知機能も含まれています。

これまで数々の医療試験で高得点を叩き出してきたAIも、果たしてこのテストで“人間並み”の結果を出せるのでしょうか?

次ページ医学テストで「認知症」と判断されたAI

<

1

2

3

>

人気記事ランキング

  • TODAY
  • WEEK
  • MONTH

Amazonお買い得品ランキング

スマホ用品

AI・人工知能のニュースartificial-intelligence news

もっと見る

役立つ科学情報

注目の科学ニュースpick up !!