ポケモンがKIを倒す:なぜ90年代のゲームが最新の人工知能を圧倒するのか、そしてこれが良い理由

Sakiko

当時はそんなに長く必要ありませんでしたが、AIはどんどん良くなります。 (画像:ゲームフリーク| Adob​​e FireflyでKIを生成しました)

人類には最新のAIモデルがあります3.7ソネットは、多くの人が確かに子供として争っていることをミッションに送りました。ゲームボーイ。結果は、以前のクロードモデルと比較して大きな進歩を示すことがありますが、さまざまな弱点も示しています。

クロードはポケモンの世界を通して戦います

2025年2月以来、AI会社人類によって開発されたAI Claudeは、ポケモンを演じようとしています。名前の実験クロードはポケモンを演じますなりますライブAUF Twitch翻訳され、すでに何千人もの観客を惹きつけています。

GoやDota 2のために開発されたシステムなどの専門的なプレーヤーKIとは異なり、Claudeはビデオゲームのために特別に訓練されていませんでした。

実験を特別なものにするもの:

  • クロードは世界とポケモンに関する彼の一般的な知識のみを使用しています
  • 死ぬ見ます人と同様のスクリーンショットを介したゲーム
  • システムは事前にポケモンゲームでトレーニングされていませんでした

人類の開発者であり、プロジェクトの責任者であるデイビッド・ハーシーは、IMに説明しますARS Technicaとのインタビュー

それは、クロードが世界がビデオゲームに適用されることについての異なる知識のみを使用しています。

推奨される編集コンテンツ

この時点で、Twitterの外部コンテンツがあり、これが記事を補完します。
ワンクリックで表示して再度非表示にすることができます。

Twitterのコンテンツが表示されることに同意します。

個人データは、第3パーティプラットフォームに送信できます。私たちのこれについては詳細です。

へのリンクTwitterコンテンツ

驚くべき進歩と苦い後退

古いクロードバージョンと比較して、最初のエリアからそれをほとんどできなかったクロード3.7は、いくつかのアリーナのリーダーを倒して注文を集めることができました。現在(2025年4月6日)、AIは最初の3つのアリーナ注文を取得しました。

人類によると、ブレークスルーは新しいものです拡張された思考- モダスこれにより、モデルが可能になります目標を覚えて、初期戦略が失敗した場合に適応することを計画する計画

しかし、ライブストリームをたどると、限界も確認できます。Claudeには、2Dゲームの世界をナビゲーションすることに大きな困難があります。特にモンドバーグは大きな挑戦を提示しました。

頻繁な問題

  • すでに完成したエリアでのクレイジーな方法の時間
  • 行き止まりに繰り返し詰まっています
  • 同じNPCとの無限の会話
  • 壁や障害を認識するのが難しい

最新の問題ただし、キャラクターが常に2つのフィールドを同時に移動するため、自転車の買収が作成されました。これは、以前は簡単な手順しか知られていなかったため、AIにとって大きな問題です。

Man and Ai:弱点は異なります

興味深いことに、クロードは人間のプレイヤーとは異なる長所と短所を示しています。ゲームボーイのピクセル化された表現は人間にとって簡単に解釈できますが、それはAIにとって大きな課題です、とハーシーは言います:

クロードは、画面に表示されているものを理解するのが特に得意ではありません。これらの8x8ピクセルの人々のスポットを見て、「これは青い髪の女の子です」と言うことができるのは、人間のこれらの楽しいことの1つです。

対照的に、クロードはゲームの仕組みとテキストベースの課題を理解するとき、驚くほど強いです。

  • ポケモンの種類とその弱点を認識します
  • 効果的な戦闘戦略を構築します
  • ゲームノートを記録して保存します
  • 長期チーム戦略を開発します

メモリの問題

別の基本的な問題:Claudes Limitedメモリ。 AIには200,000トークンのコンテキストウィンドウがあります。つまり、新しい情報を追加したときに古い情報を要約または削除する必要があります。

クロードは非常に長い間物事を追求するのが困難であり、それがこれまでに試したことに対して本当に気分が良い

誤った情報は大きな問題のようです。

過去に書き留められてきたことは、それが非常に盲目的に信頼しています。

この問題ははっきりと見えます、近い将来、AIがすでに3つの注文を取得しており、すでにMondbergを征服しているが、彼女はMondbergの前のルートに立って、再び山に行きたいと思っているため、近い将来にストリームを見ると。ただし、AIは上記の自転車を準備します。

AIが彼女がすでに試したことややったことをよりよく覚えていれば、彼女は数十時間節約したでしょう。

AIの将来にとってそれはどういう意味ですか?

面白い瞬間にもかかわらず、クロードは90年代の子供たちのために考えられたゲームメカニクスと戦うとき、ハーシーはこの実験をAI開発の重要なガイドと見なしています。

私にとって「それはできない」と「どういうわけか」の違いは、これらのAIのことで私にとって非常に大きなことです。何かができる場合、それは通常、私たちがそれを本当に良いものにすることにかなり近いことを意味します。

将来、彼は画像の理解とコンテキストウィンドウの拡張を改善する大きな可能性を考えています。長期間にわたって議論し、長期間にわたって物事を処理すること

AGIはまだ見えませんか?

Openaaiや人類などの大手AI企業がアプローチから人工的な一般情報(AGI)話 - ほとんどすべての考えられる領域で人間のようなスキルを達成するAI - この実験は、私たちがそれから離れることができる距離も示しています。

クロードは依然として人々にとって問題ではないタスクと戦っていますが、他の分野では驚くほど能力があります。空間的理解と記憶形成の組み合わせは、実際のAGIの開発に不可欠です。