学習方法を自力で進化させるAI「DiscoRL」が誕生――AIがAIを育てる時代へ
学習方法を自力で進化させるAI「DiscoRL」が誕生――AIがAIを育てる時代へ / 進化するAIのイメージ/Credit:川勝康弘
artificial-intelligence

学習方法を自力で進化させるAI「DiscoRL」が誕生――AIがAIを育てる時代へ

2025.10.24 18:00:22 Friday

Google DeepMind(グーグル・ディープマインド)社で行われた研究によって、人工知能(AI)が人間の助けを借りずに、自分自身で新しい「学習の方法」を作る仕組みが構築されました。

この新たな学習アルゴリズムは「DiscoRL(ディスコRL)」と名付けられ、複数の古いビデオゲーム(Atari)を使った評価テストで、人間が設計した学習法を上回るスコアを記録しました。

また、このアルゴリズムは一度も経験したことのない新しいゲームにも高いレベルで対応できる柔軟性を見せています。

この研究はAIが自分自身で学び方を改善し進化させられる可能性を、つまりAIがAIを育てられる可能性を示した画期的な成果と言えます。

このAI自身が生み出した「学習法」は、いったいどのようにして誕生し、私たちの生活にどんな影響をもたらすのでしょうか?

研究内容の詳細は2025年10月22日に『Nature』にて発表されました。

Discovering state-of-the-art reinforcement learning algorithms https://doi.org/10.1038/s41586-025-09761-x

AIがAIのために自分で学習法を編み出す

AIがAIのために自分で学習法を編み出す
AIがAIのために自分で学習法を編み出す / Credit:川勝康弘

AIが自分の「先生」を作り出す——そんなSF小説のような日が現実に近づこうとしています。

AI(人工知能)は現在、囲碁やチェス、さらには画像認識や翻訳など、さまざまな分野で人間をしのぐほどの力を発揮しています。

ただし、AIが強くなるためには、人間があらかじめ決めた「学習方法」をAIに与える必要があります。

言ってみれば、AIはまだ「人間が書いた教科書」で学んでいる状態なのです。

一方、生き物の多くは生まれながらに学習機能を備えています。

自転車の乗り方や逆上がりのように、良い結果(成功)を得られた行動を少しずつ選んでいくことで、行動のやり方を改良していきます。

これは「強化学習」と呼ばれる仕組みで、動物が長い進化の過程で磨いてきた自然な学習方法です。

ところが現在のAIは、この自然な仕組みを完全に再現できているわけではありません。

AIが何かを学ぶには、人間が設計して与えた「学習ルール」(問題を解く手順)に従う必要があります。

例えば、囲碁の世界チャンピオンを破ったAI「AlphaGo(アルファ碁)」は大きな話題になりましたが、その背景には、人間の研究者たちが精密に設計した学習アルゴリズムがありました。

つまり、現在のAIには「自ら学び方を考える」という自由度はほとんどありません。

そのため、多くの研究者が「AI自身が最適な学び方を自分で発見する」ことを次の大きな課題と考えるようになっています。

この難題に挑んだのが、イギリスのAI研究機関であるGoogle DeepMind(グーグル・ディープマインド)社の研究チームです。

彼らが採用したのは「メタ学習」(学び方を学ぶ方法)という考え方です。

「メタ」とは「一段階上の」という意味で、「メタ学習」とは単に学ぶのではなく、「学習する方法そのものを学ぶ」というもう一つ上の仕組みのことです。

今回の研究チームは、このメタ学習を活用してAIが自分自身の「教師」(学習方法を教える存在)を作り出す仕組みを設計しました。

イメージとしては、AIが「生徒役」と「先生役」に分かれ、生徒役が問題を解いて成果を出すと、その結果を参考に先生役のAIが次の世代の学習方法を改良していきます。

この反復を重ねる仕組みは、まるで進化のようにより良い学習法が生き残っていく様子にもたとえられます。

コンピューターの中で「小さな改良」を繰り返し、実際に役立つ学習ルールだけを残していくというわけです。

この大胆な試みの結果、AIはいったいどのような「学習方法」を生み出したのでしょうか?

次ページ機械が自分の『先生』を作った日——AI学習革命の幕開け

<

1

2

3

>

人気記事ランキング

  • TODAY
  • WEEK
  • MONTH

Amazonお買い得品ランキング

スマホ用品

AI・人工知能のニュースartificial-intelligence news

もっと見る

役立つ科学情報

注目の科学ニュースpick up !!