OpenAIは2024年9月24日、ChatGPTの高度な音声機能「Advanced Voice Mode」をすべてのPlusユーザーとTeamユーザー向けに提供開始しました。これにより、50以上の言語でより自然で感情豊かな会話が可能となり、ユーザーの感情を読み取って応答することができます。
サム・アルトマンCEOはX(旧Twitter)で、「高度な音声モードの展開が本日から始まります!待つ価値があったと思っていただけることを願っています」とコメントしました。実際、この新機能は7月から一部の有料ユーザーにアルファ版として提供されており、ユーザーからのフィードバックを基に改良が重ねられてきました。
さらに、アルトマンCEOは自身のブログ「The Intelligence Age」で、数千日以内に超知能が誕生する可能性を示唆し、AIが人類の未来を大きく変えると予測しています。では、AIはどこまで進化するのでしょうか?
ChatGPTの高度な音声機能が正式リリース
OpenAIは2024年9月24日、ChatGPTの高度な音声機能「Advanced Voice Mode」を正式にリリースしました。月額20ドル(約2900円)のChatGPT PlusおよびTeamユーザーが対象で、サム・アルトマンCEOはX(旧Twitter)で「待つ価値があったと思っていただけることを願っています」とコメントしました。
この新機能は2024年7月から一部の有料ユーザーにアルファ版として提供されており、ユーザーからのフィードバックをもとに改良が重ねられました。具体的には、カスタム指示やメモリー機能の追加、5つの新しい音声の導入、アクセントの改善などが行われています。
ただし、EUや英国、スイス、アイスランド、ノルウェー、リヒテンシュタインではまだ利用できず、対象ユーザーにはアプリ内で通知が表示されます。今回の正式リリースにより、AIと人間のコミュニケーションが新たな段階に進むことが期待されています。
50以上の言語で人間のような会話が可能に
新たな音声機能により、ChatGPTは日本語を含む50以上の言語で人間のような自然な会話が可能になりました。反応速度は平均0.3秒で、人間同士の会話に近いスピードを実現しています。また、ユーザーの声色や話す速度から感情を読み取り、応答内容を適応させることもできます。
英語以外の言語でも発音やアクセントが改善され、ネイティブに近い音声での対話が可能となりました。例えば、日本語を話す際のイントネーションやアクセントも自然になり、多言語間のコミュニケーションが円滑になります。
さらに、AIの発話中にユーザーが割り込んで話しかけることも可能となり、よりスムーズな会話が実現します。これらの機能拡張により、ビジネスや教育、医療など多岐にわたる分野での活用が期待されています。
サム・アルトマンCEOが語るAIの未来
サム・アルトマンCEOは自身のブログ「The Intelligence Age」で、AIが人類の未来を大きく変えると予測しました。彼は「数千日以内に超知能が誕生する可能性があります」と述べ、AIの急速な進化を示唆しています。この進歩の背景には、ディープラーニングの成功があると指摘しています。
アルトマンCEOは、AIが人類の課題解決に大きく貢献すると考えており、個人が様々な分野に通じたAIで構成されたチームを持つ未来を描いています。例えば、AI家庭教師による個別指導や、AIによる高度な医療、あらゆる種類のソフトウェア開発などが可能になると予測しています。
「技術は人類を石器時代から産業時代へと導きました。今後はコンピューティングやエネルギーによって、知能時代への道が開かれます」とアルトマンCEOはコメントし、AIの潜在的な影響力を強調しています。
AIは数千日以内に超知能へと進化するのか?
アルトマンCEOの「数千日以内に超知能が誕生する可能性」という発言は、ビジネス界にも大きなインパクトを与えています。超知能の誕生は、既存のビジネスモデルや市場構造を根本的に変える可能性があり、企業は対応策を練る必要があります。
しかし、AIの発展には膨大な計算資源とエネルギーが必要です。アルトマンCEOは「AIをできるだけ多くの人に届けるには、コンピューティングのコストを下げて大量の計算を実行する必要があります」と述べています。このため、大量のエネルギーと高度なチップ技術が不可欠となります。
AIが富裕層だけのツールにならないよう、インフラストラクチャーの構築と公平なリソース配分が課題となります。これらの問題に取り組むことで、AIは人類全体の繁栄に貢献できると期待されています。