評価額615億ドルのAI企業Anthropicが、AIモデル「Claude 3.7 Sonnet」を用いて『ポケモン赤』のライブ攻略配信をTwitchで実施している。開始から1か月が経過したものの、AIは「おつきみやま」を抜けるのに78時間を要し、進行は停滞気味だ。
Claudeは戦闘のようなテキスト主体の操作には一定の成果を見せる一方で、マップ移動など視覚的な要素に苦戦しており、人間の子どもなら数時間で突破可能なステージでも躓いている。AnthropicはAIが目標を記憶し学習する能力の向上を強調するが、汎用知能としての完成度には課題が残る。
Claudeはかつて基本操作すら困難だったが、2月にはタケシとカスミの撃破に成功した。進化の兆しはあるものの、151匹すべてのポケモンを捕まえる日は、いまだ見通せない状況にある。
Claude 3.7 Sonnetが示した技術的進化と限界

Anthropicが開発したAIモデル「Claude 3.7 Sonnet」は、かつて基本操作すら覚束なかった旧バージョンから一転し、『ポケモン赤』においてカントー地方のジムリーダー、タケシとカスミを攻略する成果を見せた。2024年6月時点でバトルから逃げ続けていたClaude 3.5とは異なり、3.7では先を見越した行動計画や、ナレッジベース構築、失敗からの学習といった高度な知的処理が可能となっている。これは大規模言語モデルの運用における自律性の向上を示す一例といえる。
一方、Claudeはゲーム内での視覚情報の解釈と空間把握には苦戦しており、「おつきみやま」通過に78時間を要するなど、人間のプレイヤーにとっては初歩的なステージで停滞している。ライブ配信では、AIが意図を言語化するプロセスがリアルタイムで表示されるため、視聴者にとっては興味深い知的実験となっているものの、AIの汎用性には依然として課題が残る。
Claudeの進化は確かであるが、言語処理と視覚的推論との間には依然として大きな非対称性が存在している。これは今後のAI開発において、マルチモーダル処理能力の強化が不可欠であることを示唆している。
AIエージェントはゲームを通じて何を証明しようとしているのか
Claudeによる『ポケモン赤』攻略の試みは単なる娯楽目的ではない。Anthropicはこのプロジェクトを通じて、AIがどこまで人間のように思考し、戦略を立て、反復から学べるのかを検証しようとしている。Claude 3.7 Sonnetは、ゲームの状況を視認し、適切なボタン入力をシミュレートしながら、過去の選択から学習しようとする能力を備えており、それは従来のAIには見られなかったアーキテクチャ上の変化である。
しかしながら、Claudeの進行が目に見えて遅れている現状は、AIの現実的な限界を浮き彫りにする。Redditでは「普通の子どもなら数時間で抜けられる」と評される場所でClaudeが足踏みを続けていることからもわかるように、知的処理が高度である一方で、柔軟な判断力や文脈的な理解、環境適応力には未熟さが残る。
AIがゲームを通じて獲得する知識やスキルは、将来的に他の分野へと応用可能であるとされるが、現在の段階では「タスク遂行能力の一部」に過ぎず、汎用知能への道のりは依然として遠い。Claudeがすべてのポケモンを捕まえるまでの過程は、その課題と可能性の両面を映し出す試金石となっている。
Source: Mashable