大学レベルの数学問題を「解き」「説明し」「作成する」AIが開発!
人工知能技術の発展により、AIは人間の仕事の多くを代替できるようになってきました。
数学の分野でもAIの進展は目覚ましく、MAWPSやMath23kなどのAIは小学校レベルの算数問題では81%に及ぶ精度で解くことが可能になっています。
しかし最良のモデルであっても、小学生から高校生レベルの問題にしか答えることができず、常に正しい答えが得られるわけではありません。
問題文のみから正しい答えを導き出すために作られたAIでは、高校レベルの数学でも8%を超える精度を達成することはできませんでした。
以前の研究ではグラフニューラルネットを用いて大学レベルの問題を高い精度で回答することに成功していますが、問題解決まで1週間もの時間がかかってしまうだけでなく、回答されるのは答えの数値のみとなり、式展開など「解き方」を人間に提示することはできませんでした。
そこで今回MITの研究者たちは、人間用の問題文とそれをAI用のプログラムコードに変換した2種類の教材を用いてAIを訓練することにしました。
人間用の問題文から正しいAI用のプログラムコードを作成するのは非常に難しい作業です。
しかし、新たに開発されたAIでは人間用の問題文とAI用のプログラムコードの関係が学習されているため、全く知らない問題でもすぐにAI用のプログラムコードに書き直すことが可能でした。
AI用のプログラムコードが正しく生成されれば、コードを実行して問題を解くことが可能になります。
ただ、人間用の問題文をAI用のプログラムコードに単純に書き換えるだけでは、上手くいかない場合もありました。
AIは人間にとって常識となるいくつかの前提知識が抜けているからです。
たとえばポーカーやブラックジャックなどトランプを利用した問題を解いてもらう場合、AIにはトランプの構成や合計枚数を教える必要があります。
そのため一連の流れには、これらAIに欠けている常識を付け加え、問題文の情報を補強する手順も加えられています。
準備がととのうと、研究者たちは新規の問題をAIに提示しました。
提示される数学の問題は、MITの数学コースで使われているものと、数学的思考能力を調べるために使われているMATHデータセットとなります。
結果、上の図のように、AIは問題の答えを図やグラフなどを用いたさまざまな形式で出力することに成功します。
出力にかかった時間はわずか数秒であり、解き方などの詳細な情報も得られました。
この研究は、実際の大学の学部で用いられている数学の問題を解いた最初のものであり、回答精度を以前の8%から80%以上に引き上げることに成功しています。
しかし今回開発されたAIの能力は、単に問題を解くだけではなかったのです。