OpenAIは、新たに「Responses API」とオープンソースの「Agents SDK」を発表し、開発者がAIエージェントを構築するための手段を拡充した。これにより、OpenAIの「Deep Research」や「Operator」などのエージェント技術を活用し、独自の自動化ツールを構築することが可能になる。
Responses APIは、従来の「Chat Completions API」と「Assistants API」を統合したもので、Web検索、ファイル検索、コンピュータ操作といった機能を組み込んでいる。また、Agents SDKはオープンソースとして提供され、AnthropicやGoogleなどの他社モデルとも連携できる柔軟性を持つ。
Responses APIの統合機能がAIの可能性を拡張

Responses APIは、OpenAIの従来の「Chat Completions API」と「Assistants API」を統合し、より高度なAIエージェント開発を可能にするものだ。特に、新たに追加された3つの組み込み機能が大きな注目を集めている。
1つ目の「Web検索」は、リアルタイムでインターネット上の情報を取得し、AIの応答精度を向上させる機能だ。従来のAIは事前学習データに依存していたが、この機能により最新情報の参照が可能となる。ChatGPTの検索機能と同じ技術を採用しており、信頼性のある検索結果を提供できる点が強みだ。
2つ目の「ファイル検索」は、ユーザーがアップロードしたドキュメントから関連情報を素早く抽出する機能だ。例えば、大量のPDFやWordファイルの中から必要な情報を自動的に検索し、最適な回答を導き出せる。料金は1,000クエリあたり2.50ドルで、1GBのストレージが無料で提供される。
3つ目の「コンピュータ操作ツール」は、GUIの操作をAIが自動化する技術だ。Webサイトのログインやデータ入力、予約システムの操作など、人間が手作業で行うタスクをAIが代行できる。これにより、APIが存在しない古いシステムにも対応できるのが大きな利点だ。
Agents SDKが開発者にもたらす自由度の高いAI環境
OpenAIは今回の発表で「Agents SDK」をオープンソースとして公開した。これにより、開発者は独自のエージェントを自由に設計し、異なるAIモデルと組み合わせることが可能になった。対応モデルにはAnthropicのClaude、GoogleのGemini、MetaのLlamaファミリーなどが含まれており、OpenAIの技術だけに依存しない柔軟な開発環境が提供される。
このSDKには、複数のエージェント間でタスクを引き継ぐ「インテリジェントなタスクの引き継ぎ」機能が搭載されている。例えば、あるエージェントがデータ分析を行い、その結果を別のエージェントが活用してレポートを作成するといった流れが可能になる。さらに、安全性を強化するための「入力検証」や「モデレーション機能」も備わっており、企業向けのAIソリューションとしての利用価値も高い。
また、AIの動作を監視し、トラブルシューティングや最適化を行う「トレーシングと監視機能」も提供される。これにより、開発者はエージェントの動作を可視化し、必要に応じて調整を加えることができる。こうした機能は、特に業務プロセスの自動化を進める企業にとって、大きなメリットとなるだろう。
OpenAIの新ツールがもたらす未来と競争環境の変化
今回のResponses APIとAgents SDKの発表により、AIエージェントの開発はより高度かつ柔軟なものとなった。しかし、AI市場においてOpenAIは唯一のプレイヤーではない。Google、Anthropic、Alibaba、DeepSeekなどの企業も独自のAIツールを提供しており、競争はますます激化している。
特に、中国企業の動きは注目に値する。AlibabaのQwenやDeepSeekなどは、独自の言語モデルを開発し、競争力を高めている。一方、米国勢ではAnthropicのClaudeが高性能なAIエージェントとして評価され、GoogleのGeminiも着実に進化を遂げている。こうした競争の中で、OpenAIがオープンソース化という選択をしたのは、開発者の支持を得るための戦略的な動きとも考えられる。
今後、Responses APIの拡張やAgents SDKのアップデートが続けば、より多機能なAIエージェントの開発が加速するだろう。例えば、プロンプトインジェクションの防止や、さらなる自律性を備えたエージェントの開発が進む可能性がある。開発者にとって、これらのツールは単なるAPIの追加ではなく、AI活用の新たなステージへの入り口となるだろう。
Source:VentureBeat