Googleは2025年3月25日、同社のAIモデル史上最も知的とする「Gemini 2.5 Pro」を発表した。わずか3か月前に登場したGemini 2.0を上回る性能を備え、テキストや画像、音声、コードといったマルチモーダル入力を高度に処理するほか、初期で100万トークン、今後は200万トークンに及ぶ広範な文脈理解を可能としている。
高度な数理推論ベンチマーク「GPQA」や「AIME 2025」、さらには人類の知識を問う「Humanity’s Last Exam」などで先進的なスコアを記録し、特にコーディング能力においてもGemini 2.0を凌駕。Google DeepMindはこの進化を「複雑な課題に対応するAIエージェントの鍵」と位置付ける。
急成長を遂げるDeepSeekやOpenAIとの競争が激化する中、GoogleはGemini 2.5 ProをGoogle AI StudioやGemini Advancedに投入。エンタープライズ向けAIの新たな基準となる可能性に注目が集まっている。
マルチモーダル処理と文脈保持の飛躍的進化

Gemini 2.5 Proは、テキスト、音声、画像、動画、さらに大規模なデータセットまでを同時に処理できるマルチモーダル設計を採用している。特に、コンテキストウィンドウの規模が飛躍的に拡張された点が注目される。初期段階で100万トークン、今後は200万トークンまでの文脈を保持可能とされており、過去の出力や入力を長期にわたって参照しながら精緻な応答を行うことができる。Gemini 2.0 Flash Thinkingで導入された「考えてから応答する」構造も引き継ぎつつ、その反応の正確性と深度がさらに洗練された格好だ。
コーディングにおいては、単一ファイルの解釈に留まらず、リポジトリ全体の構造を把握し、Webアプリケーションやエージェント型アプリの開発を視覚的かつ動的に支援できる能力を備えている。AI Studioを通じて提供される同モデルは、エンジニアリング分野における生産性向上の可能性を大きく広げているといえる。マルチモーダル処理と超長文コンテキスト保持の組み合わせは、次世代AIの基本設計として今後の開発指針を決定づける要素となる。
数理推論能力の進化とベンチマーク結果の意味
Gemini 2.5 Proは、推論能力の高さを示すいくつかのベンチマークにおいて顕著な成果を上げた。特に、数学・科学の専門知識を問う「GPQA」や「AIME 2025」で優れたスコアを記録した点は、汎用的な知的処理能力の水準が向上している証左である。加えて、いかなるツールにも依存せずに人間の知識と推論力を評価するためのデータセット「Humanity’s Last Exam」では、18.8%という先端的なスコアを達成。この数値は限定的ながら、従来モデルでは見られなかった領域への進出を意味する。
Google DeepMind CTOのKoray Kavukcuoglu氏は、この性能向上が「より複雑な課題に対応できるエージェント開発への橋渡し」と位置付けており、特にビジネスにおける非定型業務や専門分野への応用が現実味を帯びてきたといえる。ただし、スコアそのものはベンチマークの仕様に依存する側面もあるため、モデルの汎用性や応用力については、今後の実環境下での利用実績に照らして慎重に見極める必要がある。
激化するAI市場競争とGoogleの立ち位置
Gemini 2.5 Proの発表は、OpenAIやDeepSeekなどとの熾烈な競争環境の中で行われた。特にDeepSeek-R1は、限られたトレーニング資源で高性能を実現した点で注目を集めており、オープンソースモデルの台頭が従来の覇権構造を揺さぶり始めている。OpenAIもGPT-4.5を投入しており、Geminiシリーズはこれに対抗するGoogleの最前線として位置づけられている。加えて、2025年3月には小型モデルGemma 3も発表され、モバイル用途への対応も強化された。
GoogleがこのタイミングでGemini 2.5 Proを投入した背景には、短期間で技術優位性を示すことで市場の主導権を確保する狙いがあるとみられる。特に、AI StudioやGemini Advancedといった実験的環境での提供は、継続的なフィードバックを通じた進化を視野に入れており、開発速度そのものが競争力となっている。ただし、モデルの利用料金やレート制限の詳細は依然として未公開であり、今後の普及には価格戦略が重要な鍵を握ることになるだろう。
Source:VentureBeat