AI幻覚は悪化の一途を辿り今後も続く:o3モデルはなぜ間違いが多いのか?
AI幻覚は悪化の一途を辿り今後も続く:o3モデルはなぜ間違いが多いのか? / Credit:clip studio . 川勝康弘
artificial-intelligence

AI幻覚は悪化の一途を辿り今後も続く:o3モデルはなぜ間違いが多いのか?

2025.05.12 17:00:38 Monday

推論力は進化したのに、ウソまでパワーアップしてしまったようです。

2025年4月にOpenAIが発表した最新の大規模言語モデル「o3」と「o4-mini」は、これまで以上に長い“思考の連鎖”と高度なツール連携によってかつてない推論力を実現しました。

しかしその後のOpenAI社の調査によって、それら最新のAIがもっともらしく事実でない回答をしてしまう「幻覚(ハルシネーション)」の発生率が従来モデル(o1やo3-mini)より大幅に悪化していることが明らかにりました。

なぜより強力な推論能力を持つ最新モデルで、ハルシネーションが増加してしまったのでしょうか?

OpenAI o3 and o4-mini System Card https://cdn.openai.com/pdf/2221c875-02dc-4789-800b-e7758f3722c1/o3-and-o4-mini-system-card.pdf

巨大化の次は“思考強化”──推論エンジン誕生の舞台裏

巨大化の次は“思考強化”──推論エンジン誕生の舞台裏
巨大化の次は“思考強化”──推論エンジン誕生の舞台裏 / Credit:Canva

近年、AI研究の焦点は単純にモデルを巨大化することから、「推論力」を高める方向へとシフトしています。

従来のGPT-4系モデルがマルチモーダル(テキスト・音声・画像対応)や高速化を追求してきた一方で、OpenAIのoシリーズは複雑な問題解決や論理的思考、コード生成など「考える力」を強化するために設計された系統です。

なぜ推論力の強化が目指されたのでしょうか?

背景には、大規模言語モデル(LLM)が高度な知識を持ちながらも、複数ステップにわたる推論や論理的整合性を要する場面でミスを犯しがちだったことがあります。

モデルを大きくすれば精度は上がるものの、ある段階からは「考え方」を工夫しないと得られる成果に頭打ちが見え始めたのです。

その打開策として生まれたのが、モデル自身により長く深く考えさせるアプローチです。

各モデルの立ち位置と特徴のまとめ
各モデルの立ち位置と特徴のまとめ / Credit:OpenAI o3 and o4-mini System Card

o3やo4-miniでは回答を出す前に内部で長い「思考の連鎖 (Chain of Thought)」を巡らせ、あたかも人間が頭の中で段取りを踏むように結論を導き出します。

例えば数学の難問やプログラミングのデバッグといった多面的な分析が必要な課題でも、小さなステップに分解して推論するため、より正確な解答を出せるよう設計されています。

また、この新モデルはあらゆるツールを自律的に活用できる点も画期的です。

インターネットでの情報検索、Pythonスクリプトによるデータ解析、画像生成や画像認識といったツールを、必要に応じて自ら判断して使いこなすことで、複雑なタスクをエンドツーエンドで実行できるのです。

視覚情報についても、単に画像を説明するに留まらず「画像と一緒に考える」ことが可能になりました。

例えばホワイトボードに書かれた数式の写真を与えれば、画像を回転・拡大しながら内容を読み取って推論を進めるといった、人間さながらの問題解決も実現しています。

こうした推論力の強化により、最新モデルはさまざまなベンチマークで従来を上回る成績を収めています。

o3はプログラミング競技やビジネス分析などの難問で従来モデル(o1)より重大な誤りが減少し、特にプログラミングやコンサルティング、創造的発想の分野で「分析が緻密で新しい仮説を批判的に評価できる」と高く評価されました。

小型モデルのo4-miniも非常に効率が良く、o1よりプログラミングや数学のベンチマークで高い正解率を示しています。

このように、OpenAIが目指したのは人間のように道具を使いながら深く考え、難問に取り組めるAIです。

その目的は、高度化するユーザーのニーズに応え、より信頼でき有用なAIアシスタントを実現することにありました。

次ページo3モデルは「賢く」でも「間違いが多く」進化した

<

1

2

3

>

人気記事ランキング

  • TODAY
  • WEEK
  • MONTH

Amazonお買い得品ランキング

スマホ用品

AI・人工知能のニュースartificial-intelligence news

もっと見る

役立つ科学情報

注目の科学ニュースpick up !!