Googleが開発中とされるAIエージェント「Jarvis」は、ウェブブラウザ上でユーザーの代わりにクリックやテキスト入力を行う自動化ツールだ。Chromeを中心にリサーチ、ショッピング、予約など日常的な作業を支援することを目指している。
この発表は、先日Anthropicが発表したAI「Claude」がPC上でツールを操作できる新機能を搭載したことと時期を同じくすると報じられている。Googleは、12月にも「Gemini」などの強化されたAI機能を続々とリリースする見込みだ。
「Jarvis」の概要 ── ブラウザでの日常操作を支援する新AI
The Informationによれば、Googleが開発中のAIエージェント「Jarvis」は、ユーザーのブラウザ操作をサポートする目的で設計されている。プロジェクト名「Jarvis」は、映画『アイアンマン』のアシスタントAIを連想させるが、その役割もユーザーの指示に従い、クリックやテキスト入力といった基本操作を行うというものだ。
主にChromeブラウザに対応しており、ウェブ上での操作を自動化する機能を提供することが期待されている。Jarvisは、例えばショッピングの手順を代行したり、リサーチを補助したり、旅行の予約を行ったりと、ブラウザで行われる様々な日常的なタスクに対応可能であるとされる。
これにより、ユーザーは煩雑な作業から解放され、より効率的に時間を使うことができる。Jarvisはウェブ上の画面を頻繁にキャプチャし、その内容を解析することで次に行うべきアクションを判断する仕組みを採用しており、直感的な操作が可能である。
また、このプロジェクトはGoogleの次世代AI「Gemini」とも連携する可能性があり、AI技術のさらなる進化が期待されている。特に、12月には「Gemini」の新バージョンが発表される見通しであり、Jarvisもこの拡張の一環として位置づけられているようだ。
Googleはこの新技術により、AIが日常生活や仕事において、ユーザーの活動をサポートするレベルを一段と高めることを目指している。
利用シナリオ ── リサーチや予約など、具体的な対応範囲
「Jarvis」は、ウェブブラウザを用いた日常的な作業を自動化するために開発されている。これにより、ユーザーが通常行うリサーチ作業や旅行の予約、オンラインショッピングといったタスクをAIが肩代わりすることが可能である。
例えば、複数のウェブサイトを開いて製品情報を集めたり、最適なフライトや宿泊先を検索したりする時間が大幅に削減される見込みだ。このAIエージェントは、ユーザーからの指示を受けると、画面キャプチャを通じて現在の操作状況を把握し、適切なタイミングでクリックや文字入力といった動作を実行する。
これにより、ユーザーが手動で行っていた作業が自動化され、効率的に進められる仕組みである。特にリサーチや予約といった複雑な操作が求められるシーンでその利便性が発揮されると期待されている。Googleはこの技術によって、ユーザーがより便利にオンラインサービスを活用できる環境を提供しようとしている。
自動化の精度が高まるにつれ、Jarvisが幅広い分野での日常タスクをサポートすることで、ユーザーの作業効率が向上し、時間の節約にも貢献することが期待される。
競合の動向 ── Anthropicの「Claude」など類似サービスの登場
Googleの「Jarvis」に先駆けて、AI開発企業Anthropicは「Claude」というAIエージェントの新機能を発表している。この「Claude」はユーザーが日常的に使う標準的なツールやソフトウェアを操作できる能力を持ち、現在ベータ版での提供が開始されている。
この新機能により、ユーザーは自分のPCで一般的なツールを操作する際にAIのサポートを受けることが可能となり、作業の効率化が見込まれる。「Claude」は特定の操作に限らず、より広範囲なツールと連携できる点が特徴であり、Googleの「Jarvis」とは異なるアプローチを取っている。
例えば、「Claude」はGoogle DocsやExcelなど、ユーザーのPC上のアプリケーションに対応する一方で、「Jarvis」はブラウザ操作に特化している。そのため、両者は異なる使用シーンを想定して開発されているが、どちらも日常のタスクをサポートする点で共通している。
これにより、AnthropicとGoogleのAI技術の競争が一層激化することが予想される。今後も両社の技術がさらに洗練され、利用者が自由に選べる多様な自動化エージェントが市場に登場することが期待されている。
「Gemini」との関係 ── Googleの次世代AI戦略の一環
「Jarvis」はGoogleの次世代AI戦略の一環として開発されているプロジェクトであり、その中心には「Gemini」というAIモデルが存在する。「Gemini」はGoogleが独自に開発したAI技術であり、さまざまなアプリケーションに対応する柔軟性を持つ。
直近では「Gemini Live」が複数の新言語に対応し、Google MeetやGoogle Photosなど他のGoogle製品とも連携している。今後、「Gemini」のアップデートが12月に予定されており、それに合わせて「Jarvis」のプレビューが公開される可能性がある。
「Gemini」はGoogleのAI技術の中核を担う存在であり、Jarvisもそのエコシステムの一部として位置づけられていると見られる。これにより、ユーザーはさらに高度なAIサポートを享受できるようになる見通しである。Googleの次世代AI戦略は、ユーザーの日常生活における利便性向上を重視している。
特に、AIがユーザーの意思に基づいてウェブ操作を行うことで、単なる情報提供を超えた価値を提供することが期待されている。