科学を好きな人を増やすメディア、ナゾロジー！世の中にある沢山の不思議を冒険しよう！

Love science , enjoy !

youtubeチャンネルナゾロジー

学習方法を自力で進化させるAI「DiscoRL」が誕生――AIがAIを育てる時代へ — 学習方法を自力で進化させるAI「DiscoRL」が誕生――AIがAIを育てる時代へ / 進化するAIのイメージ/Credit:川勝康弘

artificial-intelligence

学習方法を自力で進化させるAI「DiscoRL」が誕生――AIがAIを育てる時代へ

2025.10.24 18:00:22 Friday

Google DeepMind（グーグル・ディープマインド）社で行われた研究によって、人工知能（AI）が人間の助けを借りずに、自分自身で新しい「学習の方法」を作る仕組みが構築されました。

この新たな学習アルゴリズムは「DiscoRL（ディスコRL）」と名付けられ、複数の古いビデオゲーム（Atari）を使った評価テストで、人間が設計した学習法を上回るスコアを記録しました。

また、このアルゴリズムは一度も経験したことのない新しいゲームにも高いレベルで対応できる柔軟性を見せています。

この研究はAIが自分自身で学び方を改善し進化させられる可能性を、つまりAIがAIを育てられる可能性を示した画期的な成果と言えます。

このAI自身が生み出した「学習法」は、いったいどのようにして誕生し、私たちの生活にどんな影響をもたらすのでしょうか？

研究内容の詳細は2025年10月22日に『Nature』にて発表されました。

Discovering state-of-the-art reinforcement learning algorithms https://doi.org/10.1038/s41586-025-09761-x

youtubeチャンネルナゾロジー

2つのブラックホールが合体すると？ホーキング定理、実証される

2つのブラックホールが合体すると？ホーキング定理、実証される

なぜ雪の結晶はすべて「六角形」なの？身近な疑問を解説

なぜ雪の結晶はすべて「六角形」なの？身近な疑問を解説

冷水よりお湯の方が早く凍る「ムペンバ効果」はなぜ起きるのか？ #shorts

冷水よりお湯の方が早く凍る「ムペンバ効果」はなぜ起きるのか？ #shorts

恐竜が絶滅した日、地球上では何が起きたのか？隕石衝突後…

恐竜が絶滅した日、地球上では何が起きたのか？隕石衝突後…

目次

AIがAIのために自分で学習法を編み出す

AIがAIのために自分で学習法を編み出す — AIがAIのために自分で学習法を編み出す / Credit:川勝康弘

AIが自分の「先生」を作り出す——そんなSF小説のような日が現実に近づこうとしています。

AI（人工知能）は現在、囲碁やチェス、さらには画像認識や翻訳など、さまざまな分野で人間をしのぐほどの力を発揮しています。

ただし、AIが強くなるためには、人間があらかじめ決めた「学習方法」をAIに与える必要があります。

言ってみれば、AIはまだ「人間が書いた教科書」で学んでいる状態なのです。

一方、生き物の多くは生まれながらに学習機能を備えています。

自転車の乗り方や逆上がりのように、良い結果（成功）を得られた行動を少しずつ選んでいくことで、行動のやり方を改良していきます。

これは「強化学習」と呼ばれる仕組みで、動物が長い進化の過程で磨いてきた自然な学習方法です。

ところが現在のAIは、この自然な仕組みを完全に再現できているわけではありません。

AIが何かを学ぶには、人間が設計して与えた「学習ルール」（問題を解く手順）に従う必要があります。

例えば、囲碁の世界チャンピオンを破ったAI「AlphaGo（アルファ碁）」は大きな話題になりましたが、その背景には、人間の研究者たちが精密に設計した学習アルゴリズムがありました。

つまり、現在のAIには「自ら学び方を考える」という自由度はほとんどありません。

そのため、多くの研究者が「AI自身が最適な学び方を自分で発見する」ことを次の大きな課題と考えるようになっています。

この難題に挑んだのが、イギリスのAI研究機関であるGoogle DeepMind（グーグル・ディープマインド）社の研究チームです。

彼らが採用したのは「メタ学習」（学び方を学ぶ方法）という考え方です。

「メタ」とは「一段階上の」という意味で、「メタ学習」とは単に学ぶのではなく、「学習する方法そのものを学ぶ」というもう一つ上の仕組みのことです。

今回の研究チームは、このメタ学習を活用してAIが自分自身の「教師」（学習方法を教える存在）を作り出す仕組みを設計しました。

イメージとしては、AIが「生徒役」と「先生役」に分かれ、生徒役が問題を解いて成果を出すと、その結果を参考に先生役のAIが次の世代の学習方法を改良していきます。

この反復を重ねる仕組みは、まるで進化のようにより良い学習法が生き残っていく様子にもたとえられます。

コンピューターの中で「小さな改良」を繰り返し、実際に役立つ学習ルールだけを残していくというわけです。

この大胆な試みの結果、AIはいったいどのような「学習方法」を生み出したのでしょうか？

次ページ機械が自分の『先生』を作った日——AI学習革命の幕開け

<

1

2

3

>

人気記事ランキング

Amazonお買い得品ランキング

日用品

1位

by Amazon ごみ袋半透明シャカシャカタイプ 45L 200枚(100枚×2箱)

by Amazon ごみ袋半透明シャカシャカタイプ 45L 200枚(100枚×2箱)

2位

ネピア鼻セレブティシュ華麗なる名馬パッケージ 400枚(200組)×30箱(3箱×10パック)【ケース品】FSC

ネピア鼻セレブティシュ華麗なる名馬パッケージ 400枚(200組)×30箱(3箱×10パック)【ケース品】FSC

3位

アメダス2000 420ml

4位

シルバーバック【カンタン！たのしい！水の生きもの砂絵セット】幼稚園小学校入園入学お祝いプレゼント準備 ([バラエティ])

シルバーバック【カンタン！たのしい！水の生きもの砂絵セット】幼稚園小学校入園入学お祝いプレゼント準備 ([バラエティ])

5位

[ＷＩＬＬ　ＣＬＥＮＳ] シューズパウダー日本製無香料シューケアキット靴消臭パウダー (1本)

[ＷＩＬＬ　ＣＬＥＮＳ] シューズパウダー日本製無香料シューケアキット靴消臭パウダー (1本)

スマホ用品

1位

USB-C ライトニングケーブル【2M ２本】純正 iPhone 充電ケーブル USB-C to Lightning PD急速充電高速データ同期あいふおん充電コード for iPhone 14/14 Pro/13/13Pro/12/11/XS/XR/8/8plus/iPad/AirPods/MacBookなど各種対応

USB-C ライトニングケーブル【2M ２本】純正 iPhone 充電ケーブル USB-C to Lightning PD急速充電高速データ同期あいふおん充電コード for iPhone 14/14 Pro/13/13Pro/12/11/XS/XR/8/8plus/iPad/AirPods/MacBookなど各種対応

2位

バッファロー充電器 20W 1ポート USB-C USB PD対応急速充電 GaN 窒化ガリウム折りたたみ式コンパクト携帯コンセントプラグ PSE適合【 iPhone 17 / 16 / 15 iPad Android 対応】 BSACPD2005C1WH

バッファロー充電器 20W 1ポート USB-C USB PD対応急速充電 GaN 窒化ガリウム折りたたみ式コンパクト携帯コンセントプラグ PSE適合【 iPhone 17 / 16 / 15 iPad Android 対応】 BSACPD2005C1WH

3位

GameSir X5s スマホコントローラー Iphone、Android、PC、スイッチ/スイッチ2 幅広い互換性のゲームコントローラー Bluetooth5.3接続 174g軽量高耐久ホールスティックドリフト防止 213㎜伸縮タブレットコントローラ ABXYレイアウト交換可能、ジャイロセンサー搭載、TURBO連射機能、HD振動、約11時間稼働840mAh電池搭載ゲーミングコントローラーグラウンドゲーミング/ストリーミングプレイで遊ぶ可能日本語説明書グレー

GameSir X5s スマホコントローラー Iphone、Android、PC、スイッチ/スイッチ2 幅広い互換性のゲームコントローラー Bluetooth5.3接続 174g軽量高耐久ホールスティックドリフト防止 213㎜伸縮タブレットコントローラ ABXYレイアウト交換可能、ジャイロセンサー搭載、TURBO連射機能、HD振動、約11時間稼働840mAh電池搭載ゲーミングコントローラーグラウンドゲーミング/ストリーミングプレイで遊ぶ可能日本語説明書グレー

4位

エアタグ紛失防止タグスマートトラッカー【airタグ同サイズ&GPS全球超強信号】 airタグ追跡タグ gps 小型バレないスマートタグ長寿命電池交換可能忘れ物防止鍵/財布/車両追跡盗難対策（Apple「探す」のみ対応）IOS専用技適認証 MFI認証済み日本語説明書

エアタグ紛失防止タグスマートトラッカー【airタグ同サイズ&GPS全球超強信号】 airタグ追跡タグ gps 小型バレないスマートタグ長寿命電池交換可能忘れ物防止鍵/財布/車両追跡盗難対策（Apple「探す」のみ対応）IOS専用技適認証 MFI認証済み日本語説明書

5位

Guardians Of The Galaxy (Original Motion Picture Soundtrack)

Guardians Of The Galaxy (Original Motion Picture Soundtrack)

ゲーム

1位

【任天堂ライセンス商品】太鼓の達人専用コントローラー「太鼓とバチ for Nintendo Switch」【Nintendo Switch対応】

【任天堂ライセンス商品】太鼓の達人専用コントローラー「太鼓とバチ for Nintendo Switch」【Nintendo Switch対応】

2位

式神の城トリロジー -Switch

式神の城トリロジー -Switch

3位

エレコム Nintendo Switch2専用セミハードポーチ EVA素材耐衝撃スリム設計ソフト収納ポケット付きダブルファスナーブラック GM-NS225EVSBK

エレコム Nintendo Switch2専用セミハードポーチ EVA素材耐衝撃スリム設計ソフト収納ポケット付きダブルファスナーブラック GM-NS225EVSBK

4位

ドラゴンクエストトレジャーズ蒼き瞳と大空の羅針盤 -Switch

ドラゴンクエストトレジャーズ蒼き瞳と大空の羅針盤 -Switch

5位

キングダム 68 (ヤングジャンプコミックス)

キングダム 68 (ヤングジャンプコミックス)

小説

1位

成瀬は都を駆け抜ける（「成瀬」シリーズ）

成瀬は都を駆け抜ける（「成瀬」シリーズ）

2位

忌録: document X

3位

変な地図

4位

爆弾【電子限定特典付き】 (講談社文庫)

爆弾【電子限定特典付き】 (講談社文庫)

5位

国宝上青春篇 (朝日文庫)

AI・人工知能のニュースartificial-intelligence news

もっと見る

役立つ科学情報

注目の科学ニュースpick up !!