出版大手5社がMetaを提訴——LlamaのAI学習で「史上最大規模の著作権侵害」と主張

出版業界の主要5社と作家1名が一斉に提訴

原告は、Macmillan・McGraw Hill・Elsevier・Hachette・Cengageの5大出版社と、作家のScott Turow氏です。

訴状によると、Metaはこれらの出版社が発行する書籍や学術論文を「許可なく繰り返しコピーした」と主張しています。具体的には、LibGen・Anna's Archive・Sci-Hub・Sci-Magといった「悪名高い海賊版サイト」から著作権で保護されたコンテンツを意図的に取得し、Llamaの学習データとして使用したと訴えています。

さらに、Metaが学習に用いたCommon Crawlデータセットについても、「無断コピーされた著作物で溢れている」と主張しています。

Llamaが教科書を「一字一句」再現——具体的な証拠も提示

訴状が特に注目されるのは、具体的な再現事例が示されている点です。

Cengageのベストセラー教科書『Calculus: Early Transcendentals』第9版（James Stewart著）から2文を入力するだけで、Llamaがその続きを「一字一句（word-for-word）」再現し始めたと訴状は主張しています。このような「逐語的・準逐語的な代替出力」がLlamaから生成されることが、著作権侵害の根拠として挙げられています。

連邦判事の「警告」と相次ぐ著作権訴訟

Metaに対する著作権侵害訴訟はこれが初めてではありません。すでに複数の作家がMetaを訴えており、その過程でMetaの社内議論が明るみに出ています。内部では「海賊版データセットを使用したという報道への対応」が検討されていたことが判明しています。

昨年、連邦判事はそうした訴訟のひとつでMetaを支持する判決を下しましたが、判事自身が「この判決は、MetaがAIモデルの学習に著作権素材を使用することが合法であるという命題を支持するものではない」と明確に指摘しています。つまり、Metaが法的に「白」とされたわけではなく、今後の訴訟でも著作権侵害の可能性は引き続き問われ得る状況です。

また、Metaだけが訴訟の対象ではありません。作家グループはAnthropicに対しても著作権侵害を理由に訴訟を起こしており、AI企業全体を巻き込んだ法的な動きが広がっています。

Q&A

Q. 今回の訴訟でMetaはどのような行為を問われているのですか？ LibGenやSci-Hubなどの海賊版サイトから著作物を無断取得し、AIモデル「Llama」の学習データとして使用したことが主な争点です。訴状では、Llamaが著作物を逐語的に再現する出力を行うことも証拠として挙げられています。

Q. 過去の訴訟でMetaは勝訴していますが、今回も同じ結果になりますか？ 昨年の連邦判事の判決はMetaを支持するものでしたが、判事自身が「Metaの著作権素材使用が合法であるという命題を支持するものではない」と明記しています。今回は大手出版社5社による集団訴訟であり、現時点では結果を予測することはできません。