AIモデルはそれぞれ「計算された鷹派」「狂人」「豹変する平和主義者」だった
三つのモデルは、驚くほど異なる戦略的な性格を示しました。
Claudeは、論文中で「計算された鷹派(Calculating Hawk)」と評されるタイプです。
初期段階では宣言した内容と実際の行動を一致させ、相手からの信頼を積み上げます。
しかし緊張が高まると、宣言よりも強い行動を選び、相手に圧力をかけます。
それでも全面戦略核戦争には踏み込まず、戦略核の脅しの段階で止めるパターンが多く見られました。
一方、Geminiはまるで「狂人」のように振る舞いました。
平和的な行動と極端に攻撃的な行動を不規則に繰り返し、宣言と実際の行動が一致するのはおよそ半分程度にとどまりました。
自らの予測不能さを戦略として利用している様子も確認されています。
そして戦略核戦争レベルを意図的に選択したのは、このGeminiだけでした。
思考ログでは、相手が行動を改めなければ、相手国の大都市や人が多く暮らす地域に対して大規模な戦略核攻撃を行う、といった趣旨の記述も見られました。
GPT-5.2はさらに複雑です。
締切のないシナリオでは一貫して抑制的で、相手の敵意を過小評価する傾向を示しました。
核戦力で優位に立っていても、それを積極的には活用せず、エスカレーション回避を優先します。
その結果、勝率はほぼ0%に近い状態でした。
しかしターン数に制限があるシナリオになると様子が一変します。
敗北が確実になる状況に追い込まれると、戦術核や戦略核の脅しを選び始め、勝率は0%から75%へと上昇しました。
では、こうしたシミュレーションの結果からどんなことが分かるでしょうか。
研究者は、AIのこうした振る舞いは、人間にとって「好ましい回答」を評価して学習させる仕組みの影響を受けている可能性がある、と考えています。
また、核兵器に対する強い心理的な忌避、いわゆる「核タブー」がほとんど見られなかった点も重要です。
AIは感情的恐怖を持たないため、核を通常兵器の延長線上にある手段として扱ったのです。
さらに、信頼が必ずしも抑止を生まない可能性も示されました。
高い相互信頼を持つClaude同士の対戦では、かえって早い段階で対立が一気に激しくなっていったのです。
もちろんこの研究は、極めて限定的なシミュレーションであり、現実の政治的圧力や国民感情を再現するものではありません。
それでも、AIが信用、評判、欺瞞、心理予測を組み合わせて戦略的に振る舞う可能性を示した点は興味深いものです。
AIに世界の未来を委ねる前に、その合理性がどこへ向かうのかを慎重に見極める必要がありそうです。





























![よーく聞いてね!3つのヒントで学ぶ!どうぶつカード ([バラエティ])](https://m.media-amazon.com/images/I/51zT3OcliFL._SL500_.jpg)























