AIがAIのために自分で学習法を編み出す

AIが自分の「先生」を作り出す——そんなSF小説のような日が現実に近づこうとしています。
AI(人工知能)は現在、囲碁やチェス、さらには画像認識や翻訳など、さまざまな分野で人間をしのぐほどの力を発揮しています。
ただし、AIが強くなるためには、人間があらかじめ決めた「学習方法」をAIに与える必要があります。
言ってみれば、AIはまだ「人間が書いた教科書」で学んでいる状態なのです。
一方、生き物の多くは生まれながらに学習機能を備えています。
自転車の乗り方や逆上がりのように、良い結果(成功)を得られた行動を少しずつ選んでいくことで、行動のやり方を改良していきます。
これは「強化学習」と呼ばれる仕組みで、動物が長い進化の過程で磨いてきた自然な学習方法です。
ところが現在のAIは、この自然な仕組みを完全に再現できているわけではありません。
AIが何かを学ぶには、人間が設計して与えた「学習ルール」(問題を解く手順)に従う必要があります。
例えば、囲碁の世界チャンピオンを破ったAI「AlphaGo(アルファ碁)」は大きな話題になりましたが、その背景には、人間の研究者たちが精密に設計した学習アルゴリズムがありました。
つまり、現在のAIには「自ら学び方を考える」という自由度はほとんどありません。
そのため、多くの研究者が「AI自身が最適な学び方を自分で発見する」ことを次の大きな課題と考えるようになっています。
この難題に挑んだのが、イギリスのAI研究機関であるGoogle DeepMind(グーグル・ディープマインド)社の研究チームです。
彼らが採用したのは「メタ学習」(学び方を学ぶ方法)という考え方です。
「メタ」とは「一段階上の」という意味で、「メタ学習」とは単に学ぶのではなく、「学習する方法そのものを学ぶ」というもう一つ上の仕組みのことです。
今回の研究チームは、このメタ学習を活用してAIが自分自身の「教師」(学習方法を教える存在)を作り出す仕組みを設計しました。
イメージとしては、AIが「生徒役」と「先生役」に分かれ、生徒役が問題を解いて成果を出すと、その結果を参考に先生役のAIが次の世代の学習方法を改良していきます。
この反復を重ねる仕組みは、まるで進化のようにより良い学習法が生き残っていく様子にもたとえられます。
コンピューターの中で「小さな改良」を繰り返し、実際に役立つ学習ルールだけを残していくというわけです。
この大胆な試みの結果、AIはいったいどのような「学習方法」を生み出したのでしょうか?


























![ラボン(Lavons) 柔軟剤 特大 シャイニームーン[フローラルグリーン] 詰め替え 3倍サイズ 1440ml](https://m.media-amazon.com/images/I/41ze0Blp9fL._SL500_.jpg)
![環境技研 お米保存袋極厚米ガード ~30Kg用 1枚入り [米 保存袋 食料備蓄 大容量タイプ]](https://m.media-amazon.com/images/I/41LQ9O7ELwL._SL500_.jpg)
![[WILL CLENS] シューズパウダー 日本製 無香料 シューケアキット 靴 消臭 パウダー (1本)](https://m.media-amazon.com/images/I/41m8Ig2XigL._SL500_.jpg)
![シルバーバック【カンタン!たのしい!水の生きもの砂絵セット】 幼稚園 小学校 入園 入学 お祝い プレゼント 準備 ([バラエティ])](https://m.media-amazon.com/images/I/515gZ4F-QYL._SL500_.jpg)

![[ハミィ] iFace Reflection スマホ 携帯ストラップ シリコン (ペールブルー)【スマホストラップ アイフェイス リング 携帯 iphoneストラップ】](https://m.media-amazon.com/images/I/21LcuCBOMqL._SL500_.jpg)




















