實務報導

生成式AI對著作權的挑戰(上)

余惠如律師

一、生成式AI的定義及其應用

(一) 2022年底,ChatGPT旋風開始席捲全球,其神通廣大的「生成」內容,從產品分析、音樂詩歌創作、心理諮商到軟體編碼無所不能,也帶動各類生成式AI的科技及商業發展。本文匯集2020年至2023年間ChatGPT等生成式AI的發展對涉及的核心權利-著作權所帶來的挑戰和機會。

(二) 人工智能(Artificial Intelligence,下簡稱AI)涵蓋廣泛,根據任務類型可大致分為:弱AI(在特定領域執行單一任務,例如圖像識別、翻譯)和強AI(透過監督學習、強化學習等方式從廣泛數據中訓練,以完成多領域任務的通用AI系統)。其中,可以生成不同自主程度之文章、圖像、音頻或視頻等內容的通用AI系統,又被稱為「生成式AI (Generative AI )」(註1)

(三) 生成式AI的應用十分廣泛,包括但不限於以下技術(註2):(1)文本內容,如ChatGPT和寫稿機器人,能生成文章、轉換風格、創建對話;(2)語音內容,包括語音合成、語音識別、語音客服,使文本轉語音、編輯語音屬性;(3)非語音內容,如自動編曲、即興演奏、音頻生成,音樂生成、場景聲編輯;(4)圖像和視頻中的人物特徵,如美顏、深偽技術,人臉生成、替換、屬性編輯;(5)圖像和視頻中的非生物特徵,如畫質修復、配色,圖像生成、修復;(6)數字人物和虛擬場景,如元宇宙、數位分身,三維重建、模擬技術。

二、AI可否成為「著作權人」?

(一) 2022年,美國著作權局拒絕核准「接近天堂的入口(A Recent Entrance to Paradise)」圖畫作品的著作權註冊,表明不承認AI為著作權人。其他主要智慧財產國家也普遍與美國立場一致。

(二) 「接近天堂的入口」美國著作權申請案

1. Stephen Thaler的AI團隊不僅在全球挑戰AI作為「專利發明人」,還主張AI可以成為著作權人(註3)。2018年11月3日Thaler向美國著作權局提出名為「接近天堂的入口」的繪畫作品註冊申請,聲稱該作品是AI使用演算法自主創作生成。美國著作權局認為該作品缺乏人類作者的創造性參與,以不符法定資格為由核駁。

2. 美國官方意見

美國著作權審查委員會在2022年2月14日駁回Thaler對AI可為作品「作者」的覆議請求。主要論點為(註4)

(1) 美國著作權法第102(a)條雖然未對於「作者」明確加以定義,但根據判例解釋,受美國著作權法保護的作品範圍並非毫無限制。

(2) 以往判決已持續認定「非人類」的作品不受著作權法保護:

a. 1884年最高法院在Burrow-Giles Lithographic Co. v. Sarony 案強調:著作權是賦予「人類」智識構思成果專屬權利的制度。

b. 1973年最高法院在Goldstein v. California 案件認定,作品是作者對其思想的有形表達,必須具備原創性、建立在思想創造基礎上,並認定「人類創作」的作品是才受著作權法保護。

c. 聯邦巡迴上訴法院在猴子自拍案(Naruto v. Slater) (註5)認為:著作權法提到「作者」的「子女、遺孀、孫子」等法條用語都代表「人類」,解釋上「作者」必然排除了「動物」。並在Kelley v. Chicago Park Dist.,案中指出,爭議的「花園」形式和外觀大部分歸功於自然的力量(natural forces),也不受著作權法保護。

(3) 美國聯邦行政機關與法院有同樣的共識:

a. 20世紀70年代成立的「新技術使用國家委員會 (CONTU)」因電腦技術對著作權制度影響而討論「應用機器自動重置系統所創作的作品」,確認在現有司法解釋中,具有「原創性」的作品必須由人類創造,且現行著作權法律體系足以保護電腦創作,因此無需修改著作權法。CONTU強調作品是否受著作權保護,不僅取決於是否使用設備,還需要至少具備人類最低限度的創造性努力。美國著作權局持續遵循此原則。

b. 美國著作權局於1966年6月30日第68次年度報告中討論電腦創作的著作權保護時,強調電腦只是輔助工具,創作性的表達方式需由人類進行。基於此背景,美國著作權局發布了「實務彙編」手冊,要求註冊時必須以「人類」為作者。1984年二版的「實務彙編」仍然保留這一見解,第202.02(b)明確指出作者必須是人類,自然界、植物或動物產生的成果不具有著作權。雖然新的「實務彙編」提到多種應用非人類表達的創作方式(如:電腦自動翻譯、純機械製作的衍生物品、彩色動畫影像中的色彩選擇等),但仍堅持作者必須是人類的基本條件。即使「實務彙編」未明確涉及「人工智慧」,過去的政策和實務已確認「作者為人類」是獲得著作權保護的先決條件。

c. 美國專利商標局2020年「公眾對AI以及智慧財產政策的觀點」報告,其中大多數評論者亦認為,在現有法制及技術下,「人類」之參與仍然是發明或創作不可或缺的部分。

3. 前述美國著作權局的決定,在2023年8月18日再被美國哥倫比亞特區地方法院裁決支持(註6)

(三) 臺灣作品的主體亦限於自然人或者法人

1. 臺灣著作權法第1條明確規範其立法目的為保護「著作人」權益,同法第3條第1項第2款界定「著作人:指創作著作之人」,同法第11條及12條規範因僱傭或者出資聘用關係之著作權歸屬。搭配民法第二章對「人」的規範限於「自然人」或「法人」,解釋上前述法條用語「著作人」亦僅涵蓋「自然人」或「法人」。因此臺灣法律解釋上與美國觀點相同,不承認「AI」為「著作權人」。

2. 臺灣官方與前述美國著作權局的立場相同:

(1) 臺灣智慧局曾以回覆函(註7)。表示,著作必須係以自然人或法人為權利義務主體始有可能受到著作權的保護。AI並非自然人或法人,其創作完成之智慧成果非屬著作權法保護的著作,原則上無法享有著作權。但若其實驗成果係由自然人或法人具有創作的參與,機器人分析僅是單純機械式的被操作,則該成果之表達的著作權由該自然人或法人享有。

(2) 而智慧商業法院亦早在2009年的判決亦表達相似的立場,認為基於數運算得出的電腦軟體結果並非人類創作,不受著作權法保護(註8)

(四) 在一系列有趣案例背後,涉及到法律體系的重要問題。若承認AI可為法律保護之「主體」,將引起現有法律應用上的不確定性。因為法律機制涵蓋了權利主體的建構、對客體的支配權、權利的行使及移轉,以及調和權利主體間的爭議。倘若承認AI是權利的「主體」,就必須回答AI如何行使權利、可支配哪些客體、如何移轉權利,以及負擔何種侵權責任等,這些都是現行法律難以解決的議題。這可能是美國等智慧財產主要國家,在認同AI未來可能發展類似或者超越人類智能的同時,仍將其定義為輔助人類執行任務「系統」(註9)的原因。

三、生成式AI作品的可著作性及其權利歸屬

智慧財產主流國家雖不承認AI可逕行作為「著作權人」,惟認同利用AI運作的成果仍具有可著作性,介紹中國大陸和美國近期兩則案例如後供參。

(一) 中國騰訊機器人Dreamwriter案

2019年12月27日,中國大陸深圳南山法院審結首例承認AI生成作品具有著作權之案件(註10)。法院認定:原告團隊利用基於資料和演算法的Dreamwriter軟體,生成「午評:滬指小幅上漲0.11% 報2671.93點通信運營、石油開採等板塊領漲」股市資訊報導,並在官網註明「本文由騰訊機器人Dreamwriter自動撰寫」、表達文章屬於原告法人意志創作。其外在表現符合文字作品的形式要求,體現特定期日相關股市資訊、資料的選擇、分析、判斷,文章結構合理、表達邏輯清晰,具有一定的獨創性,滿足著作權法對文字作品的保護條件,著作權歸屬於發表涉案文章的原告公司。涉案被告在其運營網站通過網路向公眾傳播相同的報導內容,侵害原告之資訊網路傳播權。

(二) 美國「黎明的查莉婭」著作權註冊案

1. 美國著作權局在2023年從社群網站作者Kashtanova的自述中得知,先前在2022年註冊的「黎明的查莉婭(Zarya of the Dawn)」漫畫(註冊號# VAu001480196)圖片部分是由Midjourney生成。著作權局認為Kashtanova只對漫畫的「文字敘述」及「視覺元素之選擇、統整和編排」享有著作權。至於「Midjourney生成圖像部分」,並非人類創作,不受著作權法保護,因此撤銷原註冊,並明確將「AI生成部分」排除在本件作品著作權範圍之外,另核發文學作品之著作權證明(註11)

2. 美國著作權局認為, Midjourney的運作方式並非人類創作過程:

(1) Midjourney是由同名研究室開發的AI程式,使用者透過Discord等平台「提示」生成圖像,之後使用者可持續以「提示」單詞、短語、電腦程式語法、圖片的URL等方式,修改圖像直至滿意。Midjourney並非像人類那樣理解語法、文句結構,而是將單詞分析成更小的「標記(token)」,然後與其培訓數據庫比對以生成圖像(註12)

(2) 使用者對Midjourney的「提示」不同於一般創作者「發想/腦力激盪」過程

a. Midjourney根據「提示」而「隨機組合」生成圖像,使用者無法預知結果;雖然其後可再提示修改,但「提示」本身仍不指向特定創作結果。在不同時間提示相同的單詞組合,可能生成不同的組合圖像。例如,本文作者嘗試對「stable-diffusion」(註13)提示「A golden retriever is standing on the grass, hd, natural light (一隻站在草皮上的黃金獵犬,高解析度,自然光)」三次,結果分別生成以下不同圖像。

b. 本案申請人Kashtanova亦自述需經數百次至數千次「提示」修改中間圖像,以取得滿意的成果。著作權局據此認定:Midjourney生成圖像方式與一般人類作者將其發想、透過其他輔助工具經過腦力激盪、有意識地逐步修改不同。Midjourney的使用者對生成圖像欠缺相當的控制力、無法達到「創作者」的程度。

c. Kashtanova雖然也提出部分「中間」圖像有利用「Photoshop」修改的資料,但只顯示對臉孔圖像之嘴唇厚度或者臉部皺紋等修飾,修改程度十分微小,難以認定達到受著作權法保護之「最低創作性」門檻。

(三) 美國著作權局對於AI生成作品的立場

鑒於前述爭議,美國著作權局於2023年3月16日發布「作品中包含由AI生成資料的著作註冊指南(Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence)」(註14),以對公眾明確其立場,摘要如後:

1. 完全由AI自動生成的作品,不符合由「人類」創作的註冊門檻要求:

例如前述「接近天堂的入口」繪圖作品,完全是由機器自動生成、欠缺人類心智的創作,且「作者」並非人類。因此,美國著作權局直接駁回該申請。

2. 人類與AI 生成作品的混合,是否具可著作性需依個案判斷:

以「黎明的查莉婭」申請案為例,美國著作權局只承認人類創作的文字及其對漫畫版面之選擇及編排部分受著作權保護,而未及於由AI生成的圖片。著作權局強調:受著作權法保護的作品必須是人類的創作成果,且達到最低創意程度;純粹由機器運行產生、無人類參與的作品,不得註冊著作權。

3. 包含AI生成資料的作品屬於「人類心智創作的成果」或「純粹機械生產複製的資料」,應根據個案中人類參與的程度判斷:

(1) 純粹機械生成的資料:

例如「黎明的查莉婭」案,由AI生成個別圖片之部分,操作者未對系統生成結果有特定創意性的控制,即使操作者有提示,但成果是由機器自行運行輸出,產出的資料具有不可預測性。此種方式有別於系統操作者透過科技方式輸出或表達其創作力,較類似於委託外部藝術家創作,委託者只是指示,無法控制創作的過程。此外AI 系統也可能產生不受操作者控制的結果,類似ChatGPT曾出現杜撰事實的情形。因此,在AI生成的資料可能不受操作者控制、生成結果具有不可預測性的情形下,即不能謂純粹機械生成的資料即無法被認可為操作者(即人類)的創作成果。

(2) 含一定人類創作表現的AI生成內容:

另一方面,AI生成內容中倘若包含一定程度的人類創作表現,可獲准註冊。例如「黎明的查莉婭」案,AI 生成的繪畫被人類加以編排,使其整體具有創作性之部分。事實上,以往也有許多人類利用科技設備創作的案例,例如利用Photoshop編輯視覺圖像、透過音效處理改變吉他的聲音頻率,產生混音、合奏效果的音樂作品,已獲准註冊。因此,在利用科技設備創作的案例,被認同具有著作權的關鍵在於:人類對該作品創意性表達方式的可控制程度及可預測性。

(四) 臺灣

臺灣智慧局也採取與美國著作權局相同立場,曾於2018年之覆函表明:自動音樂系統所創作之音樂,如僅係該機器或系統透過自動運算方式所產生的結果,並無人類之原創性及創作性之投入,則非著作權法保護之著作(註15)。此一原則在作品含有AI生成內容時,亦應有適用。

四、生成式AI的侵權爭議

當美國著作權局持續公告探討AI生成作品是否具有可著作性之同時,生成式AI衍生的著作侵權爭議也同時開展,在本篇截稿之日,尚無任何司法判決具體判定權責歸屬,介紹幾則近期案例如後。

(一) AI生成圖片涉及的著作侵權爭議

1. 2023年初,一群專業藝術家,在美國加州對Midjourney等AI圖像生成軟體開發商Stability AI公司提出世界首宗集體訴訟,主張用以「訓練」AI生成圖像的模型及其後生成圖片的過程均涉嫌侵害著作權(Andersen et al v. Stability AI Ltd. et al ) (註16)

2. 對Stability AI的訴訟並非僅限於美國,網路圖像資料庫供應商Getty Image 也在今年初發布新聞稿,稱已於倫敦高等法院對Stability AI英國總公司起訴,主張Stability AI 從未循正當授權即非法自行重製並處理數百萬受著作權保護的圖像,並利用Getty Images 所擁有或代表的相關「中繼數據(metadata)」,例如用以創建日期、圖像大小或格式、作者、標籤、分類等的相關數據標籤,以獲取鉅額商業利益,不僅損害圖像內容創作者的利益,也侵害Getty Images的商業利益(註17)

(二) GitHub平台電腦程式著作侵權爭議

1. 除了AI生成的圖片引發著作權爭議外,AI訓練模型使用的底層電腦程式也引起了爭議(案例:DOE 1 et al v. GitHub, Inc. et al; Case No. 22-cv-06823-JST (註18))。4位匿名原告在今年於美國加州聯邦北區地方法院起訴微軟和OpenAI,主張後者的Codex和Copilot是基於GitHub平台上的開放原始碼數據所訓練,其中部分生成的代碼與GitHub上的程式碼相同。

2. 值得注意的是,原告並未直接主張作品被重製,反而主張被告等違反授權條款和刪除著作權管理資訊的行為違法。微軟和OpenAI則堅稱原告未提供足夠的法律理論和證據來支持其主張,提出駁回原告起訴申請(註19) (Motion to Dismiss)(註20)

3. 法院於今年五月間駁回了被告的逕行駁回起訴請求,認為原告提供了初步證據,足證明被告有刪除或修改著作權管理資訊的行為,這可能對原告的著作權造成損害,因此有必要考慮核發禁制令。法院將繼續審理此案中的合理使用等議題,這對於釐清AI著作權和合理使用的界限具有重要意義(詳後述)。

(三) 聊天機器人開發商因語言著作被集體主張侵權

1.  近日,美國喜劇演員Sarah Silverman與作家Christopher Golden及Richard Kadrey共同對OpenAI以及Meta在舊金山聯邦地區法院提起訴訟(Case 3:23-cv-03417 ),主張被告等未經同意,即從影子圖書館(shadow library)取得其作品、用以訓練ChatGPT及LLaMA等AI語言模型(註21),並提出ChatGPT生成的原告作品,及 Meta曾於2023年2月研究論文中解釋用於訓練聊天機器人語言模型的過程為證;Sarah等人在本案主張ChatGPT生成之內容是利用原始作品而獲利之衍生作品,請求損害賠償或其他補救措施。

2. 以上主張並非單一個案,本篇寫作時至少已有另兩件對OpenAI提起的類似訴訟。包括美國作家Paul Tremblay與Mona Awad也在美國舊金山聯邦法院對OpenAI起訴,指稱後者未經同意即非法下載30萬本受著作權法保護的書籍作品以訓練ChatGPT,使其具有生成文字能力,構成對著作的重製侵權等;支持原告主張的證據包括:OpenAI 在論文自承對GPT-3進行訓練的龐大數據集有15% 來自兩個網路圖書語料庫(影子圖書館),以及ChatGPT準確摘要書籍的能力本身,即足以作為輸出行為亦構成「重製」侵權的佐證(註22)

(四) 生成式AI著作侵權訴訟的核心議題

以上案例涉及生成式AI產生不同輸出結果的著作侵權糾紛。起訴方都初步證明底層模型在訓練中使用了大量有著作權的作品,因此只需輸入與訓練作品相似的關鍵字或標記,即可生成高度相似甚至完全相同的內容。儘管原告方都聲稱這可以輕易判斷生成式AI的開發者侵犯了著作權,但截至撰稿時尚無法院明快予以判決,學界和業界對爭議結果也未敢下定論。

這種情況在「GitHub平台電腦程式著作侵權案」中得到證實。在此案中,原告主張生成式AI的開發者「違反了平臺授權使用條款」和「非法刪除版權標示」。一般認為原告試圖迴避說明被告是否「重製」原告具體之著作內容,以及被告是否構成「合理使用」。問題的原因可以通過探究訓練AI到其生成內容的過程來解釋。

1. 如何訓練AI生成資料?

(1) 以Stability AI的Stable Diffusion深度學習文字生成圖像的AI模型為例,其訓練過程可簡述為以下四步驟:

a. 數據收集與預處理:首先,蒐集相關的大量數據,例如圖片或文字資料集。接著,對數據進行預處理,包括圖片調整尺寸、亮度調整,以及標註文字分詞等。Stability AI使用LAION-5B圖像集的子集,透過網路可存取的圖像建構龐大的數據集,讓AI能學習圖像結構、元素,以及與之相關的文字關聯。

b. 選擇適合的AI生成模型:根據需求,選擇合適的AI生成模型,如生成式對抗網路GAN、變分自編碼器VAE等。這些模型各自有優勢和限制,需依據使用情境和目標進行選擇。

c. 模型訓練:利用收集到的數據集對所選的生成模型進行訓練。這過程中需要調整超參數,如訓練次數、損失函數等,以控制模型的學習過程。

d. 模型應用:訓練完成後,可將模型應用於生成任務。例如,輸入一張圖片,生成風格相近的圖片;或輸入文字,生成相關的文章或回答等。

(2) Stable Diffusion在「模型訓練」階段使用多種技術,包括擴散技術和卷積神經網絡。其訴訟爭議主要集中於「擴散技術」,一種經過多次改進的機器學習圖像生成方法。Stable Diffusion運用「潛在擴散」技術生成高解析度、高寫實度的圖像,並可在不同解析度下運作,因此在2022年引起了廣泛關注。在前述第(一)項Andersen et al v. Stability AI Ltd. et al 案例中,原告援引了2015年史丹福大學Sohl-Dickstein論文中使用的簡單螺旋圖像作為「擴散技術」的首次示範,用以介紹圖像擴散的兩階段過程。

a. 第一階段:程式逐步向每個原始圖像的像素添加「噪聲(noise)」,逐漸使圖像變得模糊,最終導致結構破壞,像素轉變為隨機噪聲。AI在此過程中理解「噪聲」如何改變圖像結構。「噪聲」是指在圖像和信號處理中的隨機干擾,它可能源於多種因素,如電磁干擾、數據轉換中的量化誤差,以及傳輸過程中的衰減和失真。

b. 第二階段:程式進行反向擴散或降噪訓練,逐步去除圖像中的噪聲,使其回復為原來的螺旋形狀。AI在這一步學習如何從隨機靜態中重新創建圖像。

c. 透過這兩階段的重複訓練,模型逐漸學會找到特定單詞和圖像之間的統計關係,尤其是特定標的與像素的位置或顏色之間的關聯。一旦學會的元素與提示中的單詞匹配,模型就能重新聚焦這些元素,完成原始圖像的恢復。在模型完美恢復原始圖像之後,它還可以根據使用者給出的單詞提示,創建新的圖像,通過「隨機」生成資料庫中種子「噪聲」來生成圖形。

(下期待續)

※ 註釋 ※

  1.

歐盟議會於2023年6月14日通過的「人工智能法案(Artificial Intelligence Act)」,第28b(4)條。

  2.

中國大陸2023年「互聯網資訊服務深度合成管理規定」第23條參照。

  3.

Stephen Thaler團隊對於AI可為專利「發明人」之主張,在本文截稿時已為世界大多數國家專利主管機關及司法判決核駁,臺灣最高行政法院110年上字第813號確定判決亦採相同見解。主要理由可參考聖島國際法律事務所官網:「 美國專利商標局:AI機器不得列為美國專利申請案之發明人」。

  4.

美國著作權局在本案駁回覆議請求的理由文件可參閱,美國著作權局官方網站:「 A Recent Entrance to Paradise.pdf」,最後瀏覽日:2023年8月13日。

  5.

Naruto v. Slater案判決理由,參見聖島國際法律事務所官網:「 美國不承認猴子對其自拍照享有著作權」。

  6.

Thaler v. Perlmutter, D.D.C., No. 1:22-cv-01564。

  7.

臺灣智慧局2018年4月20日,1070420號電子郵件。

  8.

臺灣智慧商業法院98年度民著上字第16號民事判決。

  9.

參照美國專利商標局:「 公眾對AI以及智慧財產政策的觀點(Public Views on Artificial Intelligence and Intellectual Property Policy)」,最後瀏覽日:2023年7月25日。(該網頁適用瀏覽器: Firefox、Chrome、Opera、Edge)

 10.

中國大陸深圳南山法院(2019)粵0305民初14010號判決。

 11.

美國著作權局對「黎明的查莉婭」作品申請人於2023年2月21日之回覆函,最後瀏覽日:2023年7月28日。(該網頁適用瀏覽器: Firefox、Chrome、Opera、Edge)

 12.

  Midjourney官網對於使用者提示(prompt)以生成圖片的說明,最後瀏覽日:2023年8月14日。

 13.

stable-difussion」官網。

 14.

美國著作權局發布的「 包含AI生成資料的著作註冊指南」全文,刊載於其官網,最後瀏覽日:2023年7月28日。

 15.

臺灣智慧局2018年6月11日智著字第10700038540號函。

 16.

Andersen et al v. Stability AI Ltd. et al案起訴狀,最後瀏覽日:2023年7月31日。(該網頁適用瀏覽器: Firefox、Chrome、Opera、Edge)

 17.

Getty Images聲明稿,最後瀏覽日:2023年8月1日。(該網頁適用瀏覽器: Firefox、Chrome、Opera、Edge)

 18.

DOE 1 et al v. GitHub, Inc. et al 案兩名原告起訴書全文:最後瀏覽日:2023年8月8日。(該網頁適用瀏覽器: Firefox、Chrome、Opera、Edge)

 19.

微軟駁回起訴請求書全文 OpenAI駁回起訴請求書全文,最後瀏覽日:2023年8月8日。(該網頁適用瀏覽器: Firefox、Chrome、Opera、Edge)

 20.

關於本案背景及案件細節介紹,參見聖島國際法律事務所官網:「 生成式AI涉及的電腦程式著作侵權爭議」。

 21.

Sarah Silverman 等 v. OpenAI 等(Case 3:23-cv-03416)起訴書全文,最後瀏覽日:2023年8月2日。(該網頁適用瀏覽器: Firefox、Chrome、Opera、Edge)

 22.

其他類似案例介紹,參見:Haim Ravia & Dotan Hammer,Google and OpenAI Were Hit with Lawsuits on the Use of AI,最後瀏覽日:2023年8月2日。

-----------------------------------------------------------------------
以上內容僅為一般性之討論,非法律意見,不適用於具體事件。若有實際問題,請與我們聯繫。

回列表