AIが生成したものをAIが取り込んで劣化していく「AI狂牛病」
生成AIモデルをトレーニングするためのデータは、インターネットから取得されることが少なくありません。
そのため現在のように合成データがネット上で急増すると、「AIモデルが過去に作られた合成データを取得 → それを元にAIモデルが合成データを生成 → 次世代AIモデルがその合成データを取得」というループが発生する可能性があります。
今回、バラニューク氏ら研究チームは、そのようなループの結果何が起きるかを、画像生成AIを用いて調査しました。
その結果、ループが繰り返されるにつれて、AIモデルが生成する画像の質が劣化していくと分かりました。
例えば、あるケースではループが繰り返されるうちに、生成された人物画像には、格子状の模様が強く現れるようになりました。
第1世代の生成画像は本物と見分けがつかないのに対し、第9世代の生成画像の方が明らかに画質が劣化してしまっています。
一方で、データの品質を維持しようとした場合、ループによって多様性が失われることが分かりました。
AIモデルは品質を維持するのに効果的なデータを選別するようになり、結果として生成される画像は、世代を重ねるごとにどんどん似てくるのです。
「手書きの数字」の画像を使ったテストでは、ループによって数字が徐々に判読不能になりました。
この悲惨な現象は、ウシにウシを与えることで生じた「狂牛病の蔓延」に類似していることから、研究者は「モデルオートファジー障害(Model Autophagy Disorder (MAD))」と呼んでいます。
現在、そして将来のAIの世界では、AIにAIを与えることで、まさに「AI狂牛病」とも言える現象が生じていくかもしれません。
(※「AI狂牛病」という名称は存在しません。研究者は狂牛病との類似性を指摘していますが、研究者はこの現象をMADと名付けています)
バラニューク氏も、この課題を何世代にもわたって放置すると、「インターネット全体のデータ品質と多様性が損なわれる」と指摘しています。
「生成AIモデルの開発」と「合成データの生成」が盛んに行われているまさに今、「AI狂牛病」は静かに広がっているのかもしれません。
真面目ぶってるけどぜったいMADの呼称から先に名前つけたやろwww
生成AIが優秀であればあるほどみんなが使うようになり、いずれオリジナルデータが枯渇する。
そして、かならずどこかの時点でそのAIは劣化が始まるということ?
狂牛病ってのもそうだけどアルジャーノン現象といってもいいかもしれない。
予想された結果だろ
AI絵が氾濫すれば当然学習するデータ元がAI絵になり画一化されていくと
よく分からないけど劣化を検知したら正常化するシステムを途中に挟むとか出来ないのかな?と思ったけどそれが多様性の損失ってやつか
長所の真似から来るから、自然な遺伝子の欠陥の近親交配による発現強調とは対極、ペット生物に見られる身体欠陥とも違う。目的と意味、効用と理解を缺いているから起きる点で、本物の知性、何より「情緒」がないのが原因で、身体を与えても駄目。
AI防止の透かしが効いてきてるだけだと思うけど。
あれはウイルスと同じでAIに風邪を引いた状態にする。
ネット上のイラストを無断で学習するAIがこれで一掃されればなぁ…