科学を好きな人を増やすメディア、ナゾロジー！世の中にある沢山の不思議を冒険しよう！

Love science , enjoy !

youtubeチャンネルナゾロジー

主要なAIモデルがAGIテストで全滅：汎用人工知能の高い壁 — 主要なAIモデルがAGIテストで全滅：汎用人工知能の高い壁 / Credit:Canva

artificial-intelligence

AI・人工知能

主要なAIモデルがAGIテストで全滅：汎用人工知能の高い壁 (2/3)

2025.03.26 21:00:39 Wednesday

前ページ知識量だけじゃ突破不能：AGIへの壁は高い

<

1

2

3

>

高性能AIの“日常力”はゼロ？新テストが明かす意外な落とし穴

高性能AIの“日常力”はゼロ？新テストが明かす意外な落とし穴 — 高性能AIの“日常力”はゼロ？新テストが明かす意外な落とし穴 / Credit:Canva

この実験では、さまざまなAIモデルに対して「ARC-AGI-2」の問題を解かせ、正答率と“タスクあたりのコスト”の両面から評価しています。

タスクには、見慣れたシンボル（記号）の意味づけを文脈によって切り替えたり、「同じパターンを別の視点から再構成しないと正解が出ない」という、少し工夫すれば理解できそうな問題が多く含まれました。

たとえばある問題では、記号が数学の演算記号としての意味を持つ場合もあれば、全く別の操作を示す場合もあり、どの文脈でどう解釈すべきかを瞬時に判断する必要があります。

また、別のテストでは、同じパターンの図形が、見る角度や配置の違いによって異なるルールに従うという問題が出題され、AIにはその背後にある複雑なルールや文脈の変化を正しく読み取ることが求められました。

今回の研究では、以下のAIモデルを用いてARC-AGI-2のテストが実施されました。

・OpenAIの「o3-low」（Chain-of-Thought＋Search/Synthesis方式）
・OpenAIの「o1-pro」（Chain-of-Thought＋Search/Synthesis方式）
・Kaggle 2024優勝者「ARChitects」
・「o3-mini-high」（Single Chain-of-Thought方式）
・「r1」および「r1-zero」（いずれもSingle Chain-of-Thought方式）
・そして、純粋な大規模言語モデルとしての「GPT-4.5」

人間であれば、二度のトライ以内（pass@2）で正解にたどり着くケースが比較的多く見られ、平均してAIよりも高いスコアを記録したと言います。

ただし、人間が必ずしも全問を簡単に解いたわけではありません。

実際には人間パネルの平均スコアは約60％程度と報告されており、タスクによっては迷いが生じるものもありました。

また、AIの推論にかかった演算コストを貨幣換算すると、一問あたり200ドル相当という膨大なリソースが投入されても正解が出せない事例が複数確認されました。

とくにARC-AGI-1で高得点を出していた有名なAIが、ARC-AGI-2では一桁台に落ち込むなど、“得意だったモデルがまったく歯が立たない”という光景も目立ちました。

強力な計算力を注いでもスコアが伸び悩むことから、人間的な直観や省エネの思考プロセスを再現するのは決して簡単ではない、という事実が改めて浮き彫りになったのです。

なぜこの研究が革新的なのか？

ARC-AGI-2の最大の特徴は、「問題を解けるかどうか」に加えて「どの程度のコストで解いたか」という視点を入れたことです。

人間が持つ直観や柔軟性は巨大な計算を必要としませんが、多くのAIはそこが苦手であり、本質的な意味や文脈をつかむという部分を補う仕組みが不足していると言えます。

こうした弱点が明確になったことで、「本当に頭のいいAI」を実現するためには、ただ巨大なモデルを使うだけでは足りず、より深い推論手法や新しいアルゴリズムが求められるのではないかと考えられています。

次ページ人間なら当然の“省エネ思考”がAIを苦しめる

<

1

2

3

>

youtubeチャンネルナゾロジー

天才ニコラ・テスラの発明「テスラバルブ」に新機能が見つかる

天才ニコラ・テスラの発明「テスラバルブ」に新機能が見つかる

人類史を終わらせる恐れがある「破局噴火」とは何なのか？

人類史を終わらせる恐れがある「破局噴火」とは何なのか？

【恐怖】動物を石化させる「ナトロン湖」人間が落ちたら？

【恐怖】動物を石化させる「ナトロン湖」人間が落ちたら？

【オーバーヒートの危険】大型生物の驚くべき生存の秘訣

【オーバーヒートの危険】大型生物の驚くべき生存の秘訣

人気記事ランキング

Amazonお買い得品ランキング

日用品

1位

アタックZERO アタック液体史上最高の清潔力。無菌レベルの消臭力部屋干し詰め替え 2000ｇ

アタックZERO アタック液体史上最高の清潔力。無菌レベルの消臭力部屋干し詰め替え 2000ｇ

2位

エマールハリ感チャージ成分２倍配合！洗うたびシワカタチ回復リフレッシュグリーンの香りつめかえ用１４００ｇ

エマールハリ感チャージ成分２倍配合！洗うたびシワカタチ回復リフレッシュグリーンの香りつめかえ用１４００ｇ

3位

by Amazon ごみ袋半透明シャカシャカタイプ 45L 200枚(100枚×2箱)

by Amazon ごみ袋半透明シャカシャカタイプ 45L 200枚(100枚×2箱)

4位

はだまもお肌の虫よけミスト 200ml 虫除けスプレー顔体お肌にやさしい弱酸性 4種のうるおい成分たっぷり虫よけスプレー蚊トコジラミ

はだまもお肌の虫よけミスト 200ml 虫除けスプレー顔体お肌にやさしい弱酸性 4種のうるおい成分たっぷり虫よけスプレー蚊トコジラミ

5位

【カンタン！たのしい！水の生きもの砂絵セット】知育玩具のシルバーバック幼稚園小学校入園入学お祝いプレゼント準備 ([バラエティ])

【カンタン！たのしい！水の生きもの砂絵セット】知育玩具のシルバーバック幼稚園小学校入園入学お祝いプレゼント準備 ([バラエティ])

スマホ用品

1位

モバイルバッテリー 20000mAh大容量【2025新設計・16ｍｍ超薄モデル】モバイルバッテリー軽量小型急速充電スマホ充電器大容量 3台同時充電 Type-C入出力兼用低電流対応コンパクトで機内持ち込み可旅行/出張/災害用 PSE認証済み安全設計＆回路保護 iPad/iPhone/Android全種機器対応アウトドア/旅行/出張/停電対策/緊急防災に日本語取扱説明書

モバイルバッテリー 20000mAh大容量【2025新設計・16ｍｍ超薄モデル】モバイルバッテリー軽量小型急速充電スマホ充電器大容量 3台同時充電 Type-C入出力兼用低電流対応コンパクトで機内持ち込み可旅行/出張/災害用 PSE認証済み安全設計＆回路保護 iPad/iPhone/Android全種機器対応アウトドア/旅行/出張/停電対策/緊急防災に日本語取扱説明書

2位

エレコムモバイルバッテリー 15W 5000mAh 軽量小型薄型 5V 3A Type-C USB-A ケーブル別売り【 iPhone15 / SE3 など対応】ホワイト EC-C12WH

エレコムモバイルバッテリー 15W 5000mAh 軽量小型薄型 5V 3A Type-C USB-A ケーブル別売り【 iPhone15 / SE3 など対応】ホワイト EC-C12WH

3位

iphone 充電ケーブル【1M/2M 各２本正規MFi認証品】ライトニングケーブル充電器ケーブル高速データ転送最大2.4A急速充電 lightning ナイロン編み断線防止超高耐久iPhone14/14 Pro/13/13 Pro/12/11/X/8/8plus/7/6/iPad 各種対応

iphone 充電ケーブル【1M/2M 各２本正規MFi認証品】ライトニングケーブル充電器ケーブル高速データ転送最大2.4A急速充電 lightning ナイロン編み断線防止超高耐久iPhone14/14 Pro/13/13 Pro/12/11/X/8/8plus/7/6/iPad 各種対応

4位

冷却ファン付き外部ヒートシンクスタンド静音設計スマホ/タブレット/ゲーム機用放熱対策冷却スタンド

冷却ファン付き外部ヒートシンクスタンド静音設計スマホ/タブレット/ゲーム機用放熱対策冷却スタンド

5位

8BitDo Ultimate 2 Wireless コントローラー 8 Speed 1 ms低遅延 TMR磁気スティックトリガー切替 RGBライト背面ボタンターボ・マクロ対応 Windows10/Android 無線USB-Cドングル国内正規品【お手入れ用クロス付き】 (パープル)

8BitDo Ultimate 2 Wireless コントローラー 8 Speed 1 ms低遅延 TMR磁気スティックトリガー切替 RGBライト背面ボタンターボ・マクロ対応 Windows10/Android 無線USB-Cドングル国内正規品【お手入れ用クロス付き】 (パープル)

ゲーム

1位

【任天堂純正品】Joy-Con充電グリップ

【任天堂純正品】Joy-Con充電グリップ

2位

【2025年新登場】For Switch 2 ドックテレビ接続出力スイッチ 2 ドック直接にTV出力ドック多機能 4K@60Hz Type-C to HDMI 2.0/PD100W/USB3.0 3in1 軽量化高性能チップ遅延なし持ち運び便利小型アダプター (青赤)

【2025年新登場】For Switch 2 ドックテレビ接続出力スイッチ 2 ドック直接にTV出力ドック多機能 4K@60Hz Type-C to HDMI 2.0/PD100W/USB3.0 3in1 軽量化高性能チップ遅延なし持ち運び便利小型アダプター (青赤)

3位

お文具といっしょユルっとポチっと遊びましょ -Switch 【早期購入特典】オリジナルクリアポーチ(約H70×W80mm) 同梱

お文具といっしょユルっとポチっと遊びましょ -Switch 【早期購入特典】オリジナルクリアポーチ(約H70×W80mm) 同梱

4位

【Switch/Switch 有機ELモテルに対応】ケース iVoler switchに対応収納ケースゲームカード/ケーブル/イヤホンなど全部収納可能防塵防水耐衝撃持ち運び便利ブラック

【Switch/Switch 有機ELモテルに対応】ケース iVoler switchに対応収納ケースゲームカード/ケーブル/イヤホンなど全部収納可能防塵防水耐衝撃持ち運び便利ブラック

5位

ドラゴンクエストトレジャーズ蒼き瞳と大空の羅針盤 -Switch

ドラゴンクエストトレジャーズ蒼き瞳と大空の羅針盤 -Switch

小説

1位

国宝上青春篇 (朝日文庫)

2位

プロジェクト・ヘイル・メアリー　上

プロジェクト・ヘイル・メアリー　上

3位

忌録: document X

4位

国宝下花道篇 (朝日文庫)

5位

プロジェクト・ヘイル・メアリー　下

プロジェクト・ヘイル・メアリー　下

AI・人工知能のニュースartificial-intelligence news

もっと見る

役立つ科学情報

注目の科学ニュースpick up !!