Googleは3月、次世代AIモデル「Gemini 2.5 Pro Experimental」を発表した。LMArenaやAIME 2025など主要なベンチマークで最高評価を獲得し、特に高度なコーディング能力が注目を集めている。発表動画では、わずか1分7秒で無限ランナー型ゲームを構築する様子が示され、開発支援AIとしての可能性が強調された。

このモデルはマルチモーダル性と100万トークンのコンテキスト処理に対応し、テキスト、画像、音声、動画、コードを統合的に理解できるのが特徴。ただし無料では提供されず、Gemini AdvancedユーザーやGoogle AI Studio経由での利用に限られる。料金体系の詳細は今後発表予定とされる。


ベンチマークでの圧倒的成績とマルチモーダル性能の進化

Googleが発表したGemini 2.5 Pro Experimentalは、AI性能を示す主要ベンチマークで際立った結果を残した。LMArenaのリーダーボードでは「大差でトップ」とされ、またGPQAやAIME 2025でも首位を獲得。これらの結果は、同モデルが従来のGemini 2.0を大きく上回る処理能力を備えていることを意味する。特筆すべきは、単なる数値評価に留まらず、その根幹にあるマルチモーダル処理能力の強化である。

本モデルは、テキスト・画像・音声・動画・コードといった複数の情報形式を統合的に理解し、最大100万トークンという極めて広範なコンテキストウィンドウを処理可能とされている。これは、長文の技術資料や複雑なソースコード群を前提としたタスクにも対応しうる設計であり、特定分野に限られない汎用的な応用が期待される領域である。ただし、「Experimental」という名称が示すとおり、本番環境への即時導入には慎重な検証が求められる段階でもある。

1分でゲームを構築するAIの限界と期待

Gemini 2.5 Pro Experimentalの公開に際し、Googleはそのコーディング性能を披露する動画を同時に公開した。プロンプト入力からわずか1分7秒で「無限ランナー型ゲーム」を自動生成する様子は、AIによる開発支援が現実のものとなりつつあることを印象付けた。シンプルながら動作するプロトタイプを短時間で構築できる能力は、開発工程の前段階における仮説検証やUIモック制作などに具体的な価値を提供し得る。

一方で、映像のカーソル動きがアニメーションのようであることから、実際の録画ではない可能性も指摘されている。つまり、Geminiによる自動開発の実力は限定的であり、現段階で複雑なMMORPGのような大規模構造を生成するには至っていない。ただし、これまでのAIが手間取っていた文脈の長いコード理解や、断片的な命令からの構造的アウトプット生成において、明確な進化が見られる。進行中の実験的モデルとしては、極めて意義深い前進と言える。

Source:Android Headlines