AI企業Cohereは、多言語対応強化を目指す「Aya Expanse」シリーズの新モデルを発表した。この新モデルは、23の言語に対応し、AI分野における言語の壁を越える革新を目指すものだ。Cohereは、GoogleやMetaなどの競合を凌駕する性能を示し、データと文化的視点を融合させた新しいアプローチで注目を集めている。
Cohereの新モデル「Aya Expanse」とは
Cohereの新モデル「Aya Expanse」は、同社のAyaプロジェクトから登場した最新のAIモデルである。このシリーズは、8Bと32Bの2種類のパラメータを持つモデルを展開している。8Bは研究者がより簡単に利用できるように設計され、32Bは多言語対応の先端的な性能を提供する。
このモデルは、多言語に対応するAI基盤モデルの性能を高め、世界中の研究者と開発者にアクセス可能なものにすることを目的としている。Ayaプロジェクトは、Cohereの研究部門が中心となり、英語以外の言語に対するAIモデルの性能向上を目指している。
2023年2月に公開された13BパラメータのAya 101モデルがその先駆けとなり、101の言語に対応していた。今回のAya Expanseは、このAya 101モデルの技術をさらに発展させ、多言語対応において新たな基準を打ち立てるものとなる。これにより、各国のユーザーや開発者が言語の壁を意識することなく、AIを活用できる環境を提供することが期待されている。
多言語対応の進化 – 23言語への対応強化
Aya Expanseは、英語以外の多様な言語への対応を大幅に強化している。Cohereによれば、このモデルは23言語において高い性能を発揮し、英語中心であった従来のAIモデルの限界を打ち破ることを目指している。AIモデルの多言語対応は、通常、十分な訓練データの不足や、適切な評価基準の欠如といった問題に直面する。
しかし、Aya Expanseは、Cohereが独自に開発した「データ・アービトラージ」手法を使用し、多言語対応の精度を高めている。この手法は、さまざまな言語におけるデータのバランスを調整し、モデルが一部の言語に偏らないように設計されている。
また、Cohereはモデルに対し「グローバルな嗜好」を学習させることで、異なる文化や言語の特性に配慮した性能を提供している。この結果、Aya ExpanseはGoogleやMetaの同等モデルよりも高いパフォーマンスを発揮することができた。
データ活用と文化的視点の統合によるモデル精度向上
Cohereは、Aya Expanseの開発において、データ利用と文化的多様性の尊重を重視した。一般的にAIモデルの訓練には、シンセティックデータが多く使われるが、この手法には限界があり、特に低リソース言語では質の低い結果が生じることが多い。
Cohereはこの問題を回避するため、データ・アービトラージ技術を活用し、多言語環境でも高精度なモデルを提供することに成功した。また、モデルに対する嗜好の訓練では、従来の西洋中心のデータセットに起因する偏りを解消し、多文化的な視点を反映させることを重視している。
これにより、Aya Expanseは、単に安全性の向上にとどまらず、異なる文化的背景に対する理解も深めることが可能となった。Cohereはこのアプローチを「最後のきらめき」と称し、多文化対応AIの新しいスタンダードを打ち立てることを目指している。
他社モデルとの比較とCohereの今後の展開
CohereのAya Expanseモデルは、Google、Meta、Mistralといった競合の同サイズモデルを凌ぐ性能を示した。32BモデルはGemma 2 27BやLlama 3.1 70Bを上回る結果を出し、8BモデルもLlama 3.1 8Bを含む他のモデルより優れたパフォーマンスを発揮した。
特に、Aya Expanseは多言語対応の評価において、単なる翻訳の品質に依存するのではなく、各言語における実際の利用環境を考慮した評価を行っている点が特徴的である。Cohereは、今後も多言語対応における研究開発を継続し、グローバル市場においてAIの利用がさらに進むよう支援していく計画である。
さらに、同社は他分野にも拡張し、エンタープライズ向け製品である「Embed 3」に画像検索機能を追加するなど、RAGシステムの向上にも取り組んでいる。これにより、Cohereは単なるAI技術提供にとどまらず、幅広い市場での応用を見据えた総合的なサービスを提供していくことが期待される。