AGIは規模拡大だけでは達成できない

近年の人工知能は、画像を自動で生成したり、人間に近い精度で言語を理解・翻訳したりと、私たちの暮らしを大きく変えるほど進歩を遂げています。
特に「より多くのデータと大規模な計算資源さえあれば、人間相当かそれ以上の知能も獲得できる」と期待され、大型の言語モデルが注目を集めてきました。
この流れのなか、大手企業が巨額の資金を投入し、「規模拡大こそがすべて」という風潮が勢いを増しています。
しかし、これまでの研究を振り返ると、単に学習の規模を大きくするだけでは解決できない課題も多いことがわかってきました。
たとえば基本的な推論力や生活上の常識といった要素が、ただ拡大したモデルだけで身につくのかどうか、はっきりしないのです。
大学や研究所の専門家の中には、「いまの深層学習をただ大きくすれば足りる、という考え方に限界が見えはじめている」と指摘する声が増えてきました。
実際、一部の専門家は「一部の分野では性能が鈍化し始めた」と見る向きもあります。
そこで今回、大学・企業・公的機関といった多様な所属の研究者475名に対し、「現行の大規模アプローチだけで本当に汎用知能が得られるのか」という点を中心に意見を求めました。
特に焦点になったのは、「単にデータや計算資源を増やす方法で、どこまで“人間らしさ”に近づけるか」という問いです。
結果として、約76%が「その可能性は低い」と答え、大多数が拡大路線のみに頼る方法に懐疑的であることがわかりました。
また、「世間のイメージと実際のAI性能がどれほど乖離しているか」については、回答者の約80%が「実際よりも高く評価されすぎている」と感じていたのです。
特に大規模化したモデルは、文章や画像など特定分野ではすぐれた精度を示す反面、推論や常識的な判断が必要な場面では不安定だという声が多く上がりました。
たとえば文章応答モデルにおける「幻覚」現象――裏付けのない回答を本当のように作り出す――がその一例です。
もちろん最新モデルには対策も検討されているものの、こうした問題は「データ内のパターンを拾う」だけでは十分に解決しきれないという指摘が主流でした。
さらに「世界の知識をどう蓄え、状況に応じて取り出すか」も大きな課題とされます。
人間は幼児期から五感を通じて得た体験や文脈を総合的に扱うため、実環境とどう関わるかが知能の根幹になるという見方が強いのです。
文字・画像データを膨大に集めるだけで、因果や動機づけなどの深い理解まで獲得できるわけではないのでは、といった疑念が多くの研究者から挙がっています。
実際、ロボットが環境を操作しながらデータを得る研究は、大規模モデルとは異なる学習効果を示す例として注目を集めています。
たとえばアーム型ロボットで物体を押したり持ち上げたりしている実験では、行動と結果との対応を自らのセンサー情報から学びとることで、いわゆる“因果を推定する”ような処理が促されるという報告があるのです。
これは単なるデータ拡大とは異なるアプローチで、「行動→結果」を身をもって獲得している点が特徴とされています。
これらの意見はAGIが誕生するには規模拡大だけでなくAIに「肉体」を与えなければならない可能性を示しています。
もしかしたらAI開発の現場は将来的に、まるでオリンピックの室内競技場のような広い空間でロボットたちが肉体を動かしているのかもしれませんね。
AIと肉体の融合は日本の研究者が仮想空間上の肉体で進化を促すということをやられてるようですね。
今のAIはビッグデータ解析用のアルゴリズムの延長線上でしかないので、早い話が電卓がスーパーコンピュータになってそれを人工知能と呼ぶのと同じで、非常に抵抗がありました。しかしこういう言い過ぎは、研究費や開発費を呼び込む古典的な手法ですから、仕方ないのかもしれません。
データはあくまでデータでしかなく、それが現実でどういう意味を持つのかの本質を理解せず、集積されたデータベースからただ人間はそう考えることが多いという、確率論から分析して生成しただけのものだからね
ふわふわな甘いケーキを本質的に理解するには味覚や嗅覚、触覚、視覚、色々なデータが必要だけど、AIが与えられるのは人為的に与えた情報や収集されたネット上の話題などの又聞きの情報で、甘いとは何なのか?柔らかいとは何なのか?とも思わずに、知ったかぶってこれが美味しいと評判ですっておすすめするだけでしか現状はない
これではいくら処理能力上げてもレスポンスが早くなったり、データベースの収集処理が向上して正確性は上がるかもしれないけど、全く新たなものの生成は到底不可能で生物レベルにはなり得ない
AIも現実世界を体感しないとこれ以上の革命は望めないだろうし、そのためにAIへ入力するための五感の正確にデータ化できるようにする、触覚も同時に測れる必要があるし、喜怒哀楽や感苦楽などの感情もデータ化しないと生物とは言えない
ただそれを完成させることが良いものなのか、画竜点睛とはいうが、完全な生物として完成させるなら、圧倒的な存在と化したモノに飛びかかられる可能性も生みかねないし、なら敢えて未完成のピースを残して便利な道具で留めて置くほうが良いと思う
人が神に近づこうとするとバベルの塔は倒れ、英雄の蝋の翼は陽に溶けて墜されると語り継がれてるように、傲慢にならず身の程を知り適度な所で妥協点を見つけて現状を維持する技術の開発に全力を注がないと、遅かれ早かれ近い将来環境変動で逃げ場もない中で絶滅して原始の地球にリセットされるから延命措置しておいた方が末世思想でないなら良いと思うが
だろうね
今の機械学習は「○○はこういうもの」と機械的に出力してるだけ
「○○はこうやったらできる」とか「○○はなんでこんな形なのか?」とかそういう疑問は生まれないし考えることもない
あくまで人間が「○○を作ってくれ」と依頼してるだけなんだよね
メイドさんで例えるなら言われたことしか一切しないメイドって感じ
本物のメイドになるなら意志や人格を持たせなくてはならない
たとえ汎用に手が届かなくても…
次に繋がる何かが得られると良いですね
いつの話してるんだ?
LLMのAIは大量の呪文生成器で、生成した文章がプログラムを人が収穫する場合には非常に大きな強みを発揮する。
一方、LLMがAGIになれないのは、単に正誤を学習できないというだけではなく、文章に含まれない文脈の理解力が極めて低いからだ。その点で、身体を与えればいいのでは?という指摘が確かに一理ある。が、明らかにそれだけではない。「〇〇さんにお礼のメールを送っておいて」と指示を出しても、〇〇さんがどのような人か、本人とどういう関係があるのか、なんのお礼のメールを送るか、などの暗黙的な文脈情報を人とAIは、まだ共有できていない。
ではなぜビッグテックは今までの投資を継続しているのでしょうか?
なぜ新しいアーキテクチャーを同時に開発しないんでしょうか?
なぜCEOはポジティブなことしか言わないんでしょうか?
真実を語っても投資には結び付かないからでしょ。儲からなくなるし。
工学の世界で注文者と設計者は基準や理論の下に信頼と責任で承認したりしている。
機械学習やLLMでは結果に対する責任や信頼をどのように考えたら良いのだろう。ゲームの背景に用いるような画像と基準や理論の積上で作成した設計図面では何が違うのか。近年3Dで表現する設計が出てきたが詳細に照査できているのかもわからないがこれを機械学習ベースで設計図面とならないと期待する。
特に孫正義なんかのポジショントークの酷さ