メタ・プラットフォームズがAIシステムの訓練に海賊版の書籍を利用していたとの主張が新たな局面を迎えた。作家タネハシ・コーツやサラ・シルバーマンを含む原告団がカリフォルニア州連邦裁判所に提出した資料によれば、CEOマーク・ザッカーバーグもこの事実を認識していたとされる。作家らは、同社が「LibGen」という海賊版データセットを使用していたことを示す内部文書を新たに提示した。

メタ側はフェアユースを主張するが、裁判官は一部主張の正当性に疑念を抱いている。この訴訟は、AI開発における著作権問題を巡る重要な事例として注目され、同様の訴訟が他の分野でも波及する可能性がある。

作家たちが提示した内部文書の具体的内容とは

原告団によると、メタの内部文書にはAIモデル「Llama」の訓練に使用されたデータセット「LibGen」が、海賊版作品を含むデータセットであることを同社が認識していたことが記載されている。このLibGenは、数百万点に及ぶ著作権で保護された書籍が違法に収集されたもので、主にピアツーピアネットワークを通じて共有されている。内部メールには、ザッカーバーグCEO自身がこのデータセットの利用を承認していたとする記録も含まれる。

メタはこれまで、AIの訓練に関する具体的なデータセットの内容や取得方法については明らかにしていなかった。しかし、この新証拠により、同社がデータの合法性を無視してAI開発を推進していた可能性が指摘されることとなった。これにより、メタは既存の著作権侵害訴訟に加え、さらなる訴訟リスクに直面することになる。

この問題は、AIモデルの透明性と責任の重要性を改めて浮き彫りにしたといえよう。著作権保護を軽視することは、短期的な技術的進歩を優先する反面、長期的な信頼や倫理基準を損なうリスクを孕んでいる。

AI開発とフェアユースの法的な境界線

メタはこれまで、自社のAIモデルにおけるデータ利用がフェアユースの範囲内であると主張してきた。フェアユースとは、著作権法の例外規定として、特定の条件下で著作物の無許可利用を許容するものである。研究や教育目的での使用が典型例とされるが、商業目的や大規模なデータ利用に適用されるかについては、法的な議論が続いている。

今回のケースでは、原告側がフェアユースの適用範囲を越えていると主張している点が焦点となる。LibGenのデータセットは、明らかに商業的なAI開発に使用されており、またデータセットの大部分が無断で収集された著作物であるため、フェアユースの要件を満たしていない可能性がある。裁判所がこの主張を認めるか否かは、今後のAI開発における著作権遵守の指針を示すことになろう。

この議論は、技術革新と法的規制のバランスをいかに保つべきかという問題に直結する。特に、企業がデータ活用の正当性を十分に示さない場合、規制強化を求める声がさらに高まることが予想される。

著作権問題がAI業界全体に及ぼす影響

メタを巡る著作権訴訟は、AI業界全体に広がる可能性がある。同様の訴訟は、OpenAIやGoogleなど、他の主要AI企業にも既に提起されている。特に、これらの企業が言語モデルや画像生成AIを開発する際に用いたデータセットが、いかなるプロセスで収集されたかが厳しく問われている。

AI技術の進展は、効率性や利便性の向上をもたらす一方で、創作者やコンテンツ制作者の権利保護を軽視する風潮を助長する危険性を含んでいる。現在進行中の訴訟は、AIが社会に浸透する中で、法的および倫理的枠組みを再構築する契機となるだろう。

企業に求められるのは、データ収集と利用において透明性を確保し、著作権者への適切な補償を行うことである。この問題を軽視すれば、業界全体の信頼性が揺らぎ、AI技術の進展が法的・社会的制約により停滞する可能性も否めない。