一、2023年間,生成式AI 在圖片、語言等各領域爆發式成長,當年度著作權人也開始以集體訴訟的型態對生成式AI的開發商在全球同時提起侵權訴訟。加州北區聯邦地院在2023年底以兩件裁決表達美國法院對於利用著作物訓練通用AI 、以及AI生成的語言或者圖片是否構成侵權的意見。
二、相關訴訟背景
(一) AI圖片生成模型著作侵權爭議-Andersen v. Stability AI Ltd., 23-cv-00201-WHO (N.D. Cal. Oct. 30, 2023)
1. 2023年初,Sarah Andersen等藝術家在加州北區聯邦地院對通用AI生成圖像軟體開發商Stability AI、Midjourney,以及應用軟體供應商DeviantArt等公司提出世界首宗集體訴訟主張:
(1) 通用AI軟體開發商付費給LAION公司,在網路抓取50億個圖片,其中包括受著作權保護且從未尋求授權的圖像製作數據集,透過下載、儲存和創建原告作品的衍生品來「訓練」通用AI(Stable Difussion),直接侵害原告的之著作權。
(2) 應用軟體供應商將前述通用AI進一步應用在DeviantArt線上社群平台或DreamUp、DreamStudio、Midjourney Product等商業軟體,透過消費者提示後「生成具有各種藝術家風格之圖像」,也屬於原告作品之衍生作品,侵害原告對著作之改作及散布權,此一侵權是透過消費者為之,因此各該提供生成式AI程式之廠商,構成間接侵權,應負「代理侵害(vicarious infringement)」責任。
(3) 共同被告均涉有違反DMCA故意刪除或修改著作權管理資訊之規定;並有侵害原告公開發表權及不當競爭行為。
2. 共同被告均否認直接「重製」或者「壓縮儲存」原告作品,表示是以數學方程式和演算法「訓練」AI,並抗辯原告並未證明何等具體的生成圖像「實質近似」於原告作品,以及特定被告如何在訓練階段將原著作「重製並修改」為被訴之衍生侵權品,聲請以即決判決駁回原告之訴。
3. 2023年10月30日,加州北區聯邦地院法官William Orrick駁回共同原告的大部分請求,僅保留原告Sarah Andersen據其向著作權局登記之16件作品集,對通用AI開發商Stable Diffusion提起的著作直接侵權訴訟,要求原告補充起訴理由。
(二) AI語言生成模型著作侵權爭議-Kadrey v. Meta Platforms, Inc., 23-cv-03417-VC (N.D. Cal. Nov. 20, 2023)
1. 2023年中,美國喜劇演員Sarah Silverman與作家Christopher Golden及Richard Kadrey共同在加州北區聯邦地院對Meta起訴,主張被告未經同意,即從影子圖書館(shadow library)取得其等作品、用以訓練AI語言模型(LLaMA)。並提出ChatGPT生成的原告作品,及 Meta曾於2023年2月研究論文中解釋用於訓練聊天機器人語言模型的過程為證,與前述第1案類似,本案原告主張被告涉有以下著作侵權行為:
(1) 直接侵權:倘若未「提取」原告著作內容,語言模型就無法生成內容相同或類似的作品,可證明Meta在訓練LLaMA時直接重製原告的書籍。且通用AI保留了原告書籍中的表達方式,因此通用AI本身就是原告作品的衍生物,屬於侵權品。
(2) 間接侵權:LLaMA生成的作品都是透過消費者提示而生成原告書籍的衍生作品,Meta也構成間接侵權。
(3) 違反DMCA 、不正當競爭、過失侵權和不當得利。
2. 2023年11月20日,加州北區聯邦地院法官Vince Chhabria准依META 聲請,除保留過失利用著作侵權之主張准予修正外,駁回原告其餘主張。
三、加州聯邦地院的初步裁決顯示,法院將生成式AI涉及的侵權爭議,簡化成以下兩議題:
(一) 為訓練AI而收集大數據和預處理之階段,是否構成著作侵權
1. 在Andersen v. Stability AI Ltd.案,法院對唯一保留釋明機會之原告Sarah Andersen闡明:原告應再澄清是主張開發商「訓練」通用AI(Stable Diffusion)構成重製等直接侵權行為;或者主張「通用AI」包含了壓縮圖片,因此AI本身就是一個侵權的產物。如果是前者,而原告主張被告是以數學方程式或演算法等技術「壓縮副本」,構成「重製」侵權,應再提出合理事實支持此部份主張。希望原告「具體指明」被告如何儲存以及利用原告作品、如何培訓通用AI,以證明起訴之合理性。
2. 在Kadrey v. Meta Platforms案,法院除了維持前述第1案的立場,並特別在其裁決中指出,原告陳稱LLaMA語言模型本身是原告著作「衍生作品」的主張不成立。因為美國著作權法第101條規範的「衍生作品」是指,「基於一個或多個先前存在的作品」進行重鑄、改造或改編的形式,法院無法將LLaMA 模型本身理解為對原告任何書籍的重鑄或改編形式。
3. 根據以上兩件初步裁決,美國法院已經直接否定AI模型本身是一個侵權品,倘若無法進一步證明訓練過程是否的確涉有「重製」原告作品之行為,在美國現行司法體制下訓練AI的過程恐難被認定構成著作侵權。
(二) AI生成圖像階段:是否構成著作重製或改作侵權?
1. 在Andersen v. Stability AI Ltd.案,法院闡釋:證明AI生成圖片侵權首先必須指明AI生成的具體圖片,與原告哪張特定圖片作品構成實質近似。本件原告只是概括表示AI可生成與原告作品近似的圖片,不符法定「實質近似」之舉證責任。但鑑於原告有提出幾幀AI生成圖像與其部分作品幾近相同的資料,因此法院同意給予原告再補充起訴主張的機會,應個別舉證指明AI所生成的哪張特定圖片,與原告對應之哪個作品構成「實質近似」,或者包含其他另行「修改」之部分,以證明被告涉有「重製」侵權,或者侵害原告「改作權」。
2. 在Kadrey v. Meta Platforms案:
(1) 法院援引前述Andersen v. Stability AI Ltd.案,認定本案原告也未具體指明「直接侵害」改作權之部分。
(2) 就原告認為被告縱使未構成直接侵權,也構成間接侵權之主張也被駁回。所謂著作「代理侵害(vicarious infringement)」責任,是指雖非自己親自為直接侵害行為,但對他人之侵權行為有權且有能力加以控制,並自該他人之侵權行為獲有直接利益,因此對於該侵害無論是否知情,均應負代理侵害責任。代理侵權之主張既以有直接侵害行為之存在為前提,本案原告未提出任何「直接侵權」的證據,因此也無從認定AI語言模型構成「代理侵害」之間接侵權行為。
3. 以上兩裁決顯示,美國聯邦地院對於AI生成圖片是否構成侵權固守傳統之舉證責任法則,要求原告應提出實質以及具體的證據逐一釋明。
四、AI通用模型開發商的抗辯及美國法院初步裁決方向與本所先前報導之預測相同。AI模型的訓練以及應用,涉及利用演算法及數學方程式將語言或者圖片數據資訊抽象化拆解並重組的過程,此種新型態的技術手段未見於傳統司法審判實務。在大西洋彼岸同時進行的類似訴訟(Getty Image v. Stability AI),英國法院將透過證據開示程序,進一步釐清相關技術手段是否有直接根據著作權法規範之可能,而美國司法機構目前傾向要求原告方再盡其舉證責任。是否司法者會在後階段提出更有彈性的解釋,或者立法者會直接修法,很快將有答案。
◎ 相關報導
英國高院將對AI訓練過程進行證據開示(Getty Image v. Stability AI)
AI生成圖片涉及的著作侵權爭議介紹