OpenAIとGoogleがYouTube動画を転写してAIモデルをさらに訓練したことが、著作権侵害にあたる可能性があるとニューヨークタイムズが報じた。この報道によると、メタを含むこれらのビッグテックは、AIモデルの訓練のために可能な限り多くのデータへのアクセスを得るために、ルールの隙間を利用した。

OpenAIは、Whisperという音声認識ツールを使用して100万時間以上のYouTube動画を転写し、そのトランスクリプトを最新のChatGPTのチャットボットが動作する強力なAIシステム、GPT-4に供給した。Googleも、所有するYouTubeの動画を転写して自社のAIモデルを訓練しており、両社による動画の転写は、動画のクリエイターの著作権を侵害している可能性がある。

YouTube動画の転写で著作権侵害の可能性

OpenAIとGoogleがYouTube動画を利用してAIモデルの訓練を行う過程で、転写された動画内容が著作権侵害につながる恐れがあることが指摘されている。ニューヨークタイムズの報道によると、これらの企業はAI技術の向上を目指し、大量のデータを蓄積するためにYouTube動画の転写に依存している。しかし、この行為はクリエイターの権利を無視し、既存の著作権法に抵触する可能性が高い。

OpenAIのWhisper利用とGPT-4への応用

特にOpenAIは、Whisperという音声認識技術を使用して100万時間以上のYouTube動画からデータを収集し、これをGPT-4の訓練に活用している。このプロセスは、高度なAIモデルの開発に不可欠な大量の言語データを提供するが、同時に著作権を持つ動画コンテンツの無断使用という法的な問題を引き起こしている。Googleもまた、自社プラットフォームであるYouTubeの動画を転写し、AIモデルの訓練に利用しているが、これらの行為がクリエイターの著作権を侵害していることに変わりはない。

Googleの方針変更とAI訓練への影響

Googleは2023年7月、公開されているオンライン資料をAIモデルの訓練に利用することを許可する方針へと変更した。これにより、GoogleドキュメントやGoogleマップのレストランレビューなど、公開データの利用範囲が拡大し、AI技術の発展に対する同社の取り組みが明らかになった。しかし、この変更は、著作権やデータのプライバシーに関する新たな議論を引き起こす可能性もある。特に、クリエイターの同意なしにコンテンツを使用することが、引き続き法的な懸念を生じさせている。

著作権問題とAI訓練の未来

AIモデルの訓練においてクリエイターのコンテンツを利用することは、著作権侵害のリスクを伴う。OpenAIやGoogleのような企業がYouTube動画を利用する際には、クリエイターからの許可を得ることが重要である。しかし、現状では許可を得ずに大規模なデータを収集し、AIモデルの訓練に使用しているケースが見られる。このような状況は、著作権やライセンスに関する訴訟を引き起こす原因となり、AI技術の発展と法的枠組みとの間でバランスを取る必要があることを示している。

AIの進化とクリエイター権利の綱引き

AIの飛躍的な進化は、かつての探検家が未知の大陸を発見するかのような興奮と期待をもたらしている。しかし、この未踏の地に足を踏み入れる過程で、クリエイターの権利という原住民の土地を無視する形となっている。OpenAIとGoogleがYouTube動画を用いてAIを訓練している現状は、まるで宇宙探索において、他の惑星の資源を勝手に利用している宇宙賊のようだ。

これらの技術企業は、AIの知識の海を航海する大船であり、その進路を決めるにあたり、著作権という羅針盤を見失っている。一方で、この進化の波に乗り遅れないよう、Googleは自社の方針を舵取りし、公開されたオンライン資料の使用を許可する新たな航路を開拓した。しかし、この新たな航海は、法的な嵐に遭遇するリスクを孕んでいる。クリエイターの権利を軽んじる行為が、最終的にAI技術の発展にとって足かせとなりうることを、私たちは忘れてはならない。この状況は、技術の進歩と倫理的な考慮の間の delicate balance を保つ必要性を強調している。

Reinforz Insight
ニュースレター登録フォーム

最先端のビジネス情報をお届け
詳しくはこちら

プライバシーポリシーに同意のうえ