新しいAI「MuZero」は必要な情報だけをモデル化する
では、ルールを教えられていないMuZeroはどのようにルールを覚え、戦えるようになっていくのでしょうか?
大切なのはモデル化する情報を限定することです。
例えば、何も知らない幼児も、経験から「どうすれば雨に濡れないか」という点を自ら学びます。
もちろん、幼児たちは「降水確率の高い空気中の成分パターンすべて」を把握しているのではありません。
単純に「傘をいつも持っていて、雨が降ったときに傘をさせばよい」というシンプルな点を学んでいるだけです。
幼児の周囲には気候や道具などの膨大な環境情報が溢れていますが、目的に関係のあるシンプルな情報だけをモデル化しているのです。
同じようにMuZeroも、重要な意思決定プロセスだけをモデル化することで、ルールを素早く把握できるようプログラムされています。
続く部分でMuZeroがモデル化する環境要素と、MuZeroの実力について紹介しましょう!