視覚的な推論能力は僅かに改善した
最後に研究者たちは、視覚的な推論能力の変化を調べました。
このテストでは、GPTに対して複数の図形が提示され、一致している図形を選ぶことが求められます。
結果、上の図のように、GPT4とGPT3.5の両方において3月に比べて6月ではわずかな性能向上がみられました。
ただGPT4においては、3月の時点で解けたパズル問題が6月になるとできなくなっているケースもみられました。
(※GPT3.5は3月でも6月でもできませんでした)
このパズルは3つの例を参考に4つ目の「?」のパターンを推測するものであり、人間にとっては簡単なものです。
視覚的な推論能力は全体的に上がっているにもかかわらず、一部の問題の解決能力が失われているというのは、非常に興味深い現象と言えるでしょう。
そのため研究者たちはGPTのような高度なAIについては、バージョンアップで起こる変化を細かく監視していく必要があると述べています。