chatGPTの性能が大幅に低下していると判明!検証された4つの能力の詳細を解説
chatGPTの性能が大幅に低下していると判明!検証された4つの能力の詳細を解説 / Credit:Canva . ナゾロジー編集部
artificial-intelligence

chatGPTが大幅性能低下!「数学正解率が98%から2%」検証論文を詳しく解説

2023.07.25 Tuesday

高度なAIはパッチを当てるのも難しいようです。

米国のスタンフォード大学で行われた研究によって、chatGPTのいくつかの性能がここ数カ月の間に大幅に低下している可能性が示されました。

また性能低下にともない、同じ質問に対して3月と6月の間で大幅に異なる結果が出力されていることも明らかになりました。

ビジネスや学問の場での活用が進みつつあるGPTに、いったい何が起きたのでしょうか?

今回はchatGPTの性能が低下しているとするスタンフォード大学の実験結果に加えて、性能低下は起きていないと主張するプリンストン大学の研究者たちの見解も同時に紹介しようと思います。

研究内容の詳細は2023年7月18日にプレプリントサーバーである『arXiv』にて公開されました。

Is ChatGPT’s Behavior Changing over Time? Researchers Evaluate the March 2023 and June 2023 Versions of GPT-3.5 and GPT-4 on Four Diverse Tasks https://www.marktechpost.com/2023/07/24/is-chatgpts-behavior-changing-over-time-researchers-evaluate-the-march-2023-and-june-2023-versions-of-gpt-3-5-and-gpt-4-on-four-diverse-tasks/
How Is ChatGPT’s Behavior Changing over Time? https://arxiv.org/abs/2307.09009

chatGPTの性能はバージョンアップにどう反応するのか?

chatGPTの性能はバージョンアップにどう反応するのか?
chatGPTの性能はバージョンアップにどう反応するのか? / Credit:Canva . ナゾロジー編集部

GPT-3.5 や GPT-4 などの大規模言語モデル (LLM)は、設計の変更だけでなく、データやユーザーからのフィードバックに基づいて、時間の経過とともに更新できます。

最近では、より高性能なGPT-4 が医学や法律などの専門分野の難しい試験に合格することが示されました。

ただし、GPT-3.5 および GPT-4 がいつ、どのように更新されるかは現時点では非公開であり、安定して仕事に使うには困難がつきまといます。

特に質問(プロンプト)に対する 答えの(精度や形式など が突然変化すると、続く質問を入力しても、内容の整合性がとれなくなってしまいます。

また更新の前後では一般に同じ質問に対してGPTが異なる内容を回答するため、答えの一貫性や再現性を維持することが困難になります。

さらに、そもそもGPT4 のような LLM サービスが時間の経過とともに一貫して「改善」されているかどうかも興味深い問題です。

というのも現在、chatGPTなどの生成型AIは社会的に大きく注目されるようになっており、AIに要求される項目は極めて多岐に及んでいます。

(※かつては会話を目的に開発されたかため「会話型AI」と呼ばれていましたが、近年では会話以外も多様な能力が発見されていることからから生成型AIと呼ばれるようになっています)

そのためAIの開発元がそれらの問題を回避するような「変更」を行った場合、AIの性能に不都合な結果を及ぼしかねません。

研究者たちも「いくつかの問題を改善するためのモデル変更が、他の機能に悪影響を与える可能性がある」と述べています。

chatGPTは人間の脳を模した疑似的な神経ネットワークによって構成されているため、通常のプログラムのように「パッチ」を当てても素直に機能が改善するとは限らないからです。

人間の脳も特定の情報を覚えれば賢くなるわけではないのと原理は同じです。

そこで今回、スタンフォード大学の研究者たちは、chatGPTに時間経過による性能の違いがあるかを調べることにしました。

調査に当たっては

数学的な能力

②男女問題などデリケートな質問に答える意欲

③プログラムのコード生成能力

視覚的な推論能力

の4つの能力が2023年の「3月」と「6月」の間でどのように変化したかを調査しました。

すると驚いたことに、結果は悲惨なものになりました。

次ページGPT4の「数学的な能力」は大幅に低下していた

<

1

2

3

4

5

6

>

人気記事ランキング

  • TODAY
  • WEEK
  • MONTH

Amazonお買い得品ランキング

AI・人工知能のニュースartificial-intelligence news

もっと見る

役立つ科学情報

注目の科学ニュースpick up !!