最新消息

AI生成圖片涉及的著作侵權爭議

一、生成式AI的工作成效在近年不斷驚艷眾人,不僅曾擊敗世界圍棋高手、奪得美術比賽冠軍、獲攝影大賽首獎,2022年出世的語言模型ChatGPT、圖像生成器Midjourney,更將生成式AI推上世界矚目高峰。今年初,在美國著作權局透過「黎明的查莉婭」申請案,持續公告探討AI生成作品是否具有可著作性之同時;一群專業藝術家,在美國加州對Midjourney等AI圖像生成軟體開發商Stability AI公司提出世界首宗集體訴訟,主張用以「訓練」AI生成圖像的模型及其後生成圖片的過程均涉嫌侵害著作權(Andersen et al v. Stability AI Ltd. et al)。以下從如何養成AI 「生成」圖像能力的訓練過程介紹近期AI生成圖片涉及的著作侵權爭議。

二、如何訓練AI生成圖片?

(一) 以Stability AI的Stable Diffusion為例,它是2022年所發布AI深度學習文字生成圖像的模型,已被整合到許多軟體程式中,包括DreamStudio (由Stability開發)、Midjourney產品和DreamUp (由DeviantArt發布),用作目前市面上各類生成圖片平台嵌入圖像的底層生成引擎。訓練Stable Diffusion到生成圖片的方法,可簡單概括為以下四個步驟

1. 數據收集與預處理:首先需要收集與目標有關的大量數據,例如圖片或文字數據集,並對其進行預處理,包括圖片大小、亮度調整,文字的分詞等。以Stable Diffusion為例,Stability AI 公司使用 LAION-5B 圖像集的一個子集,抓取網路上可公開存取的圖像,利用文件和圖像對應建置的龐大數據資料,讓AI 學習圖像中的結構、成分和數據以及附隨的文句之間建立聯繫。

2. 選擇適合的AI生成模型:例如,「生成式對抗網路GAN(Generative Adversarial Networks)」、「變換方式之自動碼VAE(Variational Autoencoder)」等生成式機器學習演算法,用以產生並操作跟影像有關的非文字資訊。這些模型都有不同的優缺點,需要根據應用場景和目標選擇適合的模型。

3. 模型訓練:使用收集到的數據集對生成模型進行訓練。在訓練過程中,設置合適的超參數,例如訓練次數、損失函數等,以控制模型的學習過程。

4. 模型應用:用模型進行生成,例如輸入一張圖片,生成類似風格的圖片,或者輸入一段文字,生成相關的文章或回答等。

(二) Stable Diffusion模型訓練使用多種技術,包括擴散技術(diffusion technique)、隨機噪聲(random noise)和卷積神經網絡(Convolutional Neural Network)等。目前主要被指摘涉及著作侵權爭議部分在於其「擴散技術」,它是一種基於機器學習的圖像生成方法,歷經數度改良,Stable Diffusion利用「潛在擴散」技術生成的圖像已是高解析度、高寫實度的圖像,且可在不同解析度下操作,因此於2022年大放異彩。以下以Andersen et al v. Stability AI Ltd. et al 案例中,原告所援引2015年「擴散技術」最早在史丹福大學Sohl-Dickstein 論文使用的簡易螺旋圖像,介紹圖像擴散的兩階段:

1. 第一階段:此階段程式會在每個原始圖像中的像素逐步添加「噪聲(noise)」,使其變得越來越不清晰,直到最後圖像及其結構被破壞,像素擴散成隨機噪聲的狀態。AI在此階段理解所添加的「噪聲」如何改變圖像結構。

所稱「噪聲(noise)」是「看到」而非「聽到」的物體,但其內涵和噪音一樣;在圖像和信號處理中,「噪聲」通常指隨機干擾信號,它可以來自許多因素,例如電磁干擾、數據化過程中的量化誤差、傳輸過程中的衰減和失真等。

2. 第二階段:在此階段,程式會進行反向擴散或降噪訓練,逐步將噪聲從圖像中去除,使其恢復為原來的螺旋形狀。AI在此階段學習將隨機靜態中重新創建圖像。

3. 透過反覆進行前述兩階段的訓練,模型中的程式將逐漸學習找到某些單詞和圖像之間的統計關係,主要是特定標的相對於特定像素的定位顏色或位置。之後倘若已學會的元素與提示(prompt) 的單詞匹配,模型可逐漸將元素再聚焦起來完成原始圖像。在模型學會完美的恢復原始圖像後,也可用於創建新的圖像,主要根據使用者提示(prompt)的單詞,「隨機」根據資料庫中種子「噪聲」生成圖形。

4. 附帶言之,由於模組每次生成圖片都是程式「隨機」根據提示單詞組合的結果,使用者在不同時間提示相同的單詞組合,可能生成不同的組合圖像。例如,本文作者嘗試對「stable-diffusion」提示「a cat lying under a sakura tree, hd, natural light (一隻貓躺在櫻花樹下,高解析度,自然光)」三次,結果分別生成以下不同圖像。這也是美國著作權局認為「黎明的查莉婭」案件生成圖像不受著作權保護的主因。

三、生成式AI的著作侵權爭議

根據前述AI圖像生成過程,從收集數據集、訓練到AI具有生成圖像能力,有以下兩階段涉及著作權爭議:

(一) 訓練Stable Diffusion而短暫重製或利用原始數據集之行為是否涉及著作侵權?

1. Stable Diffusion收集圖像的主要來源是德國非營利組織開發的LAION-5B 圖像集,該網站包括5.85億個透過爬蟲等程式收錄來自Pinterest、Getty images 等世界各地的圖像數據集,Stable Diffusion利用該等圖像以及與圖像結合的文句標籤作為訓練AI學習的基礎數據集,有些原始圖像並未授權商業化利用,而Stability AI公司重製或者以各種方式利用原始圖像卻未曾向任何原藝術作品創作者取得任何授權。

2. Stability AI公司在訴訟中可能抗辯:

(1) Stable Diffusion雖是利用LAION-5B 子集LAION-Aesthetics中的圖像進行訓練,但原始圖像並未儲存在Stable Diffusion最終發布的版本,因此利用數據集以訓練AI的行為本身未構成著作重製行為。

(2) 至於訓練過程中即使有「暫時性重製」原始圖像的行為,也屬於美國判例法所承認的技術操作或傳輸中的中介操作,例如網路設備中的暫存等「合理使用」行為,性質類似於人類瀏覽網頁或利用搜尋引擎,用以訓練和開發AI新技術。

3. 大數據資料探勘行為涉及的資料庫保護爭議仍有待釐清:

LAION-5B 圖像集是建置在德國,由Andersen et al v. Stability AI Ltd. et al 爭議案外第三人根據德國相關法律以非營利目的所建置、以利用爬蟲等程式進行大數據圖像的「文本和數據挖掘(text and data mining)」。目前,在美國或世界其他各國,對於大數據的文本和數據挖掘行為是否合法之規範本即有別(例如:英國CDPA第29A目前仍限於非商業目的之研究行為;美國則依「合理使用」規範個案由法院判斷)、各大電子資料庫也各有其「使用者條款」 (例如:Getty Images使用者條款即禁止任何文本和數據挖掘利用行為)。在各國法律規範不一致、私人電子資料庫業者授權利用條款莫衷一是的狀態下,訓練生成式AI而利用原始數據集的行為是否構成侵害著作權?如有侵害,是否有「合理使用」抗辯的適用?仍亟待各國法院提出更具可預測性的判決。

(二) Stable Diffusion生成圖像,是否也涉及重製或改作侵權?

1. 在Andersen et al v. Stability AI Ltd. et al 案中,原告主張:Stable Diffusion只不過是21世紀的「拼貼工具」,不應稱為人工「智慧」,他們認為Stable Difussion技術實際上只是一種將圖像拆分成許多小塊,然後重新排列這些小塊以生成新圖像的方法,這種方法與傳統的拼貼工具非常相似,只不過使用了現代計算機技術和複雜的數學演算法來實現。因此,原告認為Stable Difussion並未創造出新的、具有原創性的作品,而是改作了既有著作權圖像的衍生作品。

2. Stability AI公司在訴訟中可能抗辯:

(1) Stable Diffusion雖是利用LAION-5B 中的圖像進行訓練,但原始圖像並未儲存在最終發布的版本。Stable Diffusion在訓練之後,其模型分析了 LAION-5B 中無數圖像之間的相似性,並儲存這些圖像中的相關模式或相似性的訊息,使其能過透過「提示」生成符合使用者期待的全新圖像。此點,類似於人類的記憶,或許無法完美的描繪出每個所見物體,但在看過許多類似的相同物體之後,可以學會描述特定物體的一般性特徵,並且將該物體與其他物體的圖像加以區分。

(2) 因此,Stability AI可能抗辯訓練過程完成後,Stable Diffusion不會直接複製原始資料庫(LAION-5B)中的任何圖像,而是會根據所訓練的內容(噪聲)以及使用者的提示創建新的圖像組合。因此,Stable Diffusion生成的圖像,至少其「表現」方式已不符合傳統意義上對於著作「重製」的定義(即直接再現原始著作物的行為)。且相關生成圖像的過程是由不特定的使用者所操作,並非Stability AI公司可事先掌控,Stability AI網站亦已公告依使用者指令生成的圖片,任何著作權利屬於使用者,因此Stability AI並未直接涉及任何著作侵權行為。

(3) 合理使用抗辯?

有論者認為美國法院曾經在「Google圖書」案例(Authors Guild v. Google, Inc.)判定Google掃描探勘2千多萬冊書籍資料以建構線上「Google圖書」資料庫,並未讓使用者取得書籍全文、只是提供關鍵字搜尋讓讀者可閱覽部分文字摘要,並提供可讓搜尋者檢查文字頻率、句法和主題書籤等的介面,讓人們更容易找到相關書籍,屬於具有高度轉化性的合理使用行為。此一近期案例可能被援引作為有利於Stability AI抗辯的立論。

惟Stable Diffusion生成的圖像仍然可以透過使用者「提示」簡單的詞彙以近乎重製的形式表現出大眾耳熟能詳的圖像。試以著作權已到期的維尼為例,提示「Winnie-the-Pooh in a suit, HD, dramatic lighting(穿著西服的維尼, 高解析度, 戲劇化燈光)」可以生成如下列表格上排的圖案,一般大眾很難分辨是否該等圖案為原創者的作品。倘若再分別提示以「Rembrandt(林布蘭)」、「Oscar-Claude Monet(莫內)」、「Vincent Willem van Gogh(梵谷)」等知名藝術家的「風格」呈現,則會生成如下列表格下排的圖案,對於原創者或者被加入「風格」的藝術家雙方都可能存有大量藝術作品被用以訓練AI致其產生「改作」能力之疑慮。

四、生成式AI的發展目前呈現拉鋸戰

(一) 對Stability AI的訴訟並非僅繫屬在美國,網路圖像資料庫供應商Getty Image也在今年初發布新聞稿,稱其已於倫敦高等法院對Stability AI英國總公司起訴,主張Stability AI 從未循正當授權管道即非法自行重製並處理數百萬受著作權保護的圖像,以及Getty Images 所擁有或代表用以創建日期、圖像大小或格式、作者、標籤、分類等相關「中繼數據(metadata)」,據以獲取鉅額商業利益,不僅損害圖像內容創作者的利益,也同時侵害Getty Images的商業利益。

(二) 由於越來越多的AI生成式作品爭議,導致英國政府不得不暫停原本擬於今年修法使大數據文本發掘商業行為合法化的構想。而數百位知名AI專家及企業家也於3月底公開連署,呼籲暫停開發和測試更強大的AI技術,各國政府將要如何協調兼顧各方利益並同時確保技術持續創新,可待持續觀察。

◎ 相關報導

   美國著作權局發布「包含AI生成資料的著作註冊指南」

回列表