Image Credit:Thousands of authors sign letter urging AI makers to stop stealing books

GPT-4は、Carmen MachadoやMargaret Atwood、Alexander Cheeのスタイルで文章を作るように指示すると、彼らの作品をトレーニングデータとして学習しているため、それなりにうまくできるでしょう。しかし、これらの作家たちを含む多くの作家たちは、この事実に満足していません。
小説、ノンフィクション、詩を書いている8,500人以上の作家が署名した公開書簡では、ChatGPT、Bard、LLaMaなどの大規模言語モデルを開発しているテック企業が、許可や報酬なしに彼らの文章を利用していることが問題視されています。
公開書簡には「これらの技術は、私たちの言語、物語、スタイル、アイデアを模倣し再現します。著作権がある数百万冊の本、記事、エッセイ、詩は、AIシステムにとっての『食料』となり、その請求書は存在しません」と書かれています。
AI開発者たちは、対象の作家たちの引用や模倣を証明しているにもかかわらず、これらの作品の出所について重要な問題を取り上げていません。本屋やレビューからスクレイピングしたサンプルを使用してトレーニングされているのでしょうか?図書館の本をすべて借りたのでしょうか?それともLibgenのような違法なアーカイブからダウンロードしたのでしょうか?
一つ確かなことは、彼らが出版社に行ってライセンスを取得したわけではないことです。おそらくこれは好ましい方法であり、おそらく法的にも倫理的にも唯一の方法です。作家たちは次のように書いています。
「最高裁判所が最近のWarhol v. Goldsmithの判決で明確に示しているように、商業性の高い利用は公正利用の主張に反する。また、違法な出所の作品をコピーすることを公正利用としては認めないだろう。私たちの文章をシステムに埋め込むことで、生成AIは私たちの仕事に基づいた平凡で機械的な書籍や物語、ジャーナリズムを市場に氾濫させることで、私たちの職業に損害を与えるおそれがある」。
実際、これは既に起こっています。最近、質の低いAI生成の作品がAmazonのヤングアダルトベストセラーリストで上位に登場しています。出版社は生成された作品で溢れており、このウェブサイト(そしてもうすぐこの投稿も)のコンテンツがSEOのためにアーカイブされ、餌として再利用されています。
これらの悪質な行為者は、OpenAIやMetaなどが開発したツール、API、エージェントを使用していますが、これらの企業自体もこの文脈では悪質な行為者と言えるでしょう。なぜなら、新しい商業製品のために数百万冊の作品を違法に盗むだけの企業はほかにいないからです(もちろん、Googleもそうですが、検索インデックシングはAIの摂取とは異なり、Google Booksには少なくとも専用のインデックスという言い訳がありました)。
大規模な出版の複雑さと狭い利益率のため、生計を立てるのが困難な作家が少なくなっているため、この公開書簡では特に新人作家や代表されないコミュニティの声に関して、この状況は持続不可能だと警告しています。
公開書簡では以下のことを企業に求めています:
1. 生成AIプログラムで私たちの著作権物を使用するための許可を取得すること。
2. 過去および現在の私たちの作品の使用に対して、作家に適正な報酬を支払うこと。
3. 現行法に違反するかどうかに関係なく、AIの出力に私たちの作品を使用する際にも、作家に適正な報酬を支払うこと。
この書簡では法的な脅迫は行われていません。The Author’s GuildのCEO(かつ署名者)であるMary RasenbergerはNPRに語ったとおり、「訴訟は大量の費用と時間がかかる。非常に長い時間がかかる」と述べています。そしてAIは作家にすでに害を及ぼしているのです。
どの企業が「はい、私たちは盗品を使ってAIを構築しました。そして謝罪します。そしてそれに対して支払うつもりです」と言うのでしょうか?誰にも判りませんが、そうするインセンティブはほとんどないようです。多くの人は、LLMが実質的に不正な手段で作成されており、著作権物が含まれ再現される可能性があることを知らないか、あまり気にしていません。アーティストの特徴的なスタイルを再現した生成画像で問題を抱える場合の方が、より明確な害が見えますし、反発もあります。
しかし、ジョージ・サンダースやダイアナ・ガバルドンの全作品をAIの「食料」として使うことの微妙な害は、多くの人を行動に駆り立てるでしょう。しかし、闘う準備ができている作家たちはたくさんいます。


Pexelsによる写真提供

GPT-4は、カルメン・マチャド、マーガレット・アトウッド、アレクサンダー・チーの作品のスタイルで文章を作るよう頼めば、それなりに上手くこなすでしょう。その理由は、おそらくこれらの作家たちの作品をトレーニングの過程で学習しており、それを自身の創造力に活かしているためです。しかし、これらの作家をはじめとする何千人もの作家たちは、この事実に満足していません。
小説、ノンフィクション、詩などの作品を執筆する8,500人以上の作家たちが署名した公開書簡では、ChatGPT、Bard、LLaMaなどの大規模言語モデルの背後にあるテック企業に対して、彼らの作品を無断で使用していることや報酬を受け取っていないことが問題視されています。
この書簡には、「これらの技術は、私たちの言語、物語、スタイル、アイデアを模倣して吐き出す。著作権のある何百万冊もの本、記事、エッセイ、詩がAIシステムの『食材』となり、支払いのない宴会になっている」と記されています。
これらのシステムは、対象の作家たちの引用や模倣を可能にしているものの、AIの開発者たちはこれらの作品の出典について本質的な議論を行っていません。これらのシステムは書店やレビューから収集したサンプルをトレーニングデータとして利用したのでしょうか?図書館で全ての本を借りたのでしょうか?それとも、Libgenなどの違法なアーカイブの一つをダウンロードしたのでしょうか?
一つだけ確かなことは、彼らが出版社に許可を得てこれらの作品を利用したわけではないことです。これはおそらく望ましい方法であり、法的かつ倫理的な方法とも言えます。「最近のWarhol v. Goldsmithの最高裁判決は、あなたが利用していることの高い商業性は公正な利用に反すると明示しています。また、不正に入手した作品をコピーすることを公正な利用として認めることはありません。私たちの文章をシステムに埋め込むことで、生成型AIは、私たちの仕事を基にした平凡で機械的な本、物語、ジャーナリズムを市場に氾濫させることによって、私たちのプロフェッションに損害を与えかねません」と、作家たちは述べています。
実際、我々はこれが既に起こっているのを目の当たりにしています。最近、非常に品質の低いAI生成の作品がAmazonのYAベストセラーリストで上位にランクインしました。出版社はAIによって生成された作品に埋もれかかっており、そして毎日、このウェブサイト(そして間もなく、この投稿も)はSEOのための産物に転用されるコンテンツとしてスクレイピングされています。
これらの悪意のある行為者たちは、OpenAIやMetaなどによって開発されたツール、API、エージェントを利用しており、それ自体がこの文脈では悪意のある行為者であると言えるでしょう。なぜなら、誰が何百万もの作品を盗んで新しい商業製品のエネルギーとすることを承知で行うでしょうか?(もちろん、Googleもそうですが、検索インデックスはAIの吸収とは意味合いが異なりますし、Google Booksには専用のインデックスを作成するための目的があったという言い訳もありました。)
大規模な出版の複雑さと狭い利益率により、生計を立てることが難しい作家が増えている中、この公開書簡では特に新しい作家や「代表されていないコミュニティからの声」を持つ作家たちにとって、この状況は持ちこたえることのできないものであると警告されています。
書簡では以下のことを企業に要求しています:
1. 生成型AIプログラムで私たちの著作物を使用するための許可を得ること。
2. 過去および現在の私たちの著作物の使用に対して作家に適正な報酬を支払うこと。
3. 現行の法律に違反しているかどうかに関わらず、AIの出力で私たちの著作物を使用した場合でも、作家に適正な報酬を支払うこと。
法的な脅しはなされていません。「The Author’s Guild」のCEOであり、この書簡の署名者でもあるメアリー・ラーセンバーガー氏は、NPRに対して「訴訟には莫大な費用がかかります。非常に長い時間がかかります」と語っており、AIは今も作家たちに害を及ぼしている、と述べています。
どの企業が「はい、私たちは盗まれた作品を元にAIを作りました。そして、謝罪し、それに代償を払います」と言うでしょうか?それは誰にもわかりませんが、そのようにする動機はほとんどありません。ほとんどの人々は、LLMが不正手段を用いて作成されていることや、著作権のある作品を含み、それを再生産することが可能であることについては気づいていませんし、関心を持っていません。アーティストの特異的なスタイルを再現する生成された画像の問題は、類似したものですが、ジョージ・サンダースやダイアナ・ガバルドンの全作品が自身のAIの「食材」となることのより微妙な害は、同じく行動する人々を刺激するには少ないかもしれません。しかし、多くの作家は戦う覚悟を持っています。

引用元記事はこちら
Thousands of authors sign letter urging AI makers to stop stealing books

error: Content is protected !!