實務報導

自Tremblay v. OpenAI之法院判決解析生成式AI的智權議題

廖嘉成律師

一、前言

根據資料,OpenAI在2023年的年度營收高逾13億美元,較其2022年的年度營收成長4543% (註1),其讓人乍舌的成長動力之一來自其成功的生成式AI商品ChatGPT,根據統計(註2),自2022年11月推出後,在短短5天內,ChatGPT就累積超過100萬名用戶,目前全球用戶共1.8億(美國用戶約占15%)、其網站(openai.com)每月有超過15億次的使用者造訪;在Fortune 500中,有超過92%的企業正在使用ChatGPT(註3),ChatGPT每月估計為OpenAI帶來8000萬美元的營收、並預計在2024年全年度為OpenAI挹注10億美元的收入(註4)

但在不斷締造新紀錄、新障礙的同時,OpenAI也因為ChatGPT的設計模式而遭到著作權人的團體訴訟,ChatGPT遭抨擊之處在於其開發過程中,OpenAI大量地利用了語料(註5),以讓ChatGPT透過解析龐大的語料後,能精準地解析出特定脈絡中文字如何與其他文字出現的關聯性,正確的預測相對應使用者提問內容最可能出現的文字(註6),但著作權人主張OpenAI在訓練的過程中,使用了他人的著作內容,該些著作之著作權人主張OpenAI未經同意使用其著作內容訓練ChatGPT,侵害了其著作權(註7)。自2023年6月開始迄今,OpenAI已累積12起遭控侵害著作權侵害的訴訟(註8),這當中,Paul Tremblay在2023年6月於北加州聯邦地院(U.S. District Court Northern District of California)所提出的訴訟係屬最早繫屬的一件,後續的起訴案件法律論述與其皆類似,該案某程度也是進度最快的一件集體訴訟,故以下擬簡析其案件進展與法院近期對駁回原告起訴(Motion to dismiss)的判斷,探討對生成式AI所相關的權利救濟,並評析可能策略。

二、Tremblay v. OpenAI Inc.案件背景

2023年6月28日,知名作者Paul Tremblay(註9)委託律師,對OpenAI提出了侵權訴訟,主張包含原告在內的其他作家之著作,皆遭到OpenAI的侵權, Tremblay主張OpenAI在訓練其ChatGPT語言模型時,未經過其同意,擅自將原告受美國著作權法保護之著作內容作為訓練ChatGPT的語料,故代表其他同樣遭侵權的作家提出侵權訴訟(註10)

三、法律分析

(一) 原告主張(註11)

在起訴狀中,原告方主張OpenAI開發ChatGPT生成式AI服務侵害了原告的著作權、構成了加州不正當競爭法(California Unfair Competition Law,下稱UCL)、過失侵權(Negligence)、以及不當得利(Unjust enrichment)。詳言之,原告主張:

1. 著作權直接侵權

OpenAI的ChatGPT是一種大型的語言模型,與一般工程師開發的軟體不同,此種大型的語言模型在開發過程中會透過大量的語料訓練,在訓練過程中,此語言模型除複製語料的內容外,也會從大量且多樣的語料內容中擷取語料中所蘊含表達的信息(expressive information),在透過分析運算無數的語料內容後,此語言模型得以根據其所分析的大量語料中,演算、尋找出相關性或模式(connection and pattern),因此,例如當使用者要求語言模型產出某一特定內容時(例如:產出A作家寫作風格的文本內容),語言模型可根據其訓練過程當中分析語料內容所得出之關聯性或模式(例如:就A作家語料內容的分析結果),以自然語言的方式產生相對應的內容(註12)

原告聲稱,OpenAI的ChatGPT能正確地產出特定著作內容的摘要,是因為在訓練過程中,該著作的內容已被作為訓練語料的一部分,被送進ChatGPT的語言模型中加以分析、運算,故當被指示將特定著作的內容作出摘要時(例如:提供A作家的某小說之摘要內容),ChatGPT可以做出正確的摘要內容(註13)。根據原告自己的測試、蒐證,當ChatGPT被指示將原告所撰寫的著作進行摘要時,除了少部分的細節有錯誤外,ChatGPT所輸出的摘要內容皆為精確,該些錯誤之處,原告主張是因為在訓練過程當中,ChatGPT有接觸其他來源的語料內容,故在分析輸出內容時,ChatGPT會混入其他來源內容,但大致而言,ChatGPT對書本內容摘要內容是屬精準,也就是說,ChatGPT對於其訓練語料中之原告著作已有了解,故能根據指示輸出類似的文本內容(註14)

據此,原告主張OpenAI未經其同意,在訓練其ChatGPT語言模型過程中,大量自公開的網際網路蒐集、重製了語料內容,此當中包含了原告數位化的著作,根據原告測試、蒐證的結果,OpenAI至少擅自重製了原告「The Cabin at the End of the World」、以及「13 Ways of Looking at a Fat Girl and Bunny」之語文著作。此外,因OpenAI的語言模型於輸出摘要內容時,係根據已內化於OpenAI語言模型中原告上述之著作內容,故原告進一步主張:OpenAI所訓練之「語言模型本身」就是根據原告受保護著作內容所產出的衍生著作,換言之,OpenAI除了擅自重製原告著作用於訓練外,該訓練的成果(即語言模型),也侵害原告製作衍生著作的專用權(註15)

2. 著作權間接侵權

進一步言,因整個OpenAI的語言模型即屬於侵害原告著作權的衍生著作,該語言模型根據使用者的指令所產出的每一「輸出內容」(即:摘要原告著作的內容),亦屬於侵害原告著作權的衍生著作,而既然該語言模型的輸出內容亦係受OpenAI管控,且OpenAI本身也因上該產出違法改作內容之行為而獲有利益,故OpenAI應就其語言模型輸出之違法改作內容負間接侵權之責任(vicarious copyright infringement)(註16)

3. 數位千禧年著作權法案(Digital Millenium Copyright Act)

除直接與間接侵權之外,原告亦主張OpenAI違反了數位千禧年著作權法案(下稱DMCA),在訓練語言模型時,OpenAI將原告著作中有關著作權管理資訊(copyright management information,下稱CMI)移除了,該CMI包含了原告的著作權版權通知、著作名稱、識別的訊息,使用條款等資訊,但在OpenAI訓練的過程當中,並未將原告著作中的CMI予以保存,故在該語言模型輸出原告著作之摘要內容時,也同樣沒有包含原告著作的CMI訊息。OpenAI應瞭解,當原告著作之CMI移除後再散佈其內容,某程度將更促進(facilitate)著作權侵權活動的發生,因OpenAI語言模型摘要輸出原告著作內容時,沒有包含原告的CMI訊息,而僅呈現從訓練語料中分析、整合後的內容,這讓該輸出內容本身屬於未經原告授權的衍生著作一事,難以被得知。因此,OpenAI另違反了DMCA的規定(註17)

4. 加州不正競爭法(Cal. Bus. & Prof. Code §§17200, et seq.)

除了屬於聯邦層級的著作權法,原告另主張OpenAI未經其同意,擅自將原告著作用於訓練語言模型並因此獲利之行為,違反了加州UCL,詳言之,OpenAI利用原告著作訓練其ChatGPT,不僅違反了著作權法,亦屬於不公平、違法、違反道德、且有害於消費者的行為,OpenAI所設計的ChatGPT在輸出原告著作之摘要內容時,未含有相關的來源標示,而OpenAI也透過此種行為獲得利益,當使用OpenAI的ChatGPT時,使用者並不會得知該語言模型係取自原告的著作,也不會知道ChatGPT的成功也歸因於原告著作,OpenAI蓄意且暗地裡利用原告之著作訓練其語言模型,並隱匿相關CMI資訊,欺瞞使用者,使其無法得知原告著作對於該語言模型之貢獻,構成對普遍大眾的一種欺騙。上述不公平、且欺瞞消費者的行為,原告認為違反了UCL(註18)

5. 過失侵權

原告更進一步主張被告OpenAI違反了對他人權益的基本注意義務,故構成過失侵權。析言之,該注意義務的依據係源自OpenAI就其所掌握資訊的權力、OpenAI對於該權力的行使、以及OpenAI的積極作為所致的損害而來,包含加州民法典要求所有人(包含OpenAI)對他人應有的合理行為的要求(act in a reasonable manner toward others)。在本案,原告主張OpenAI未經同意將原告著作用於訓練語言模型,有應注意但未注意之疏失;在蒐集原告著作後,用於分析訓練時,對於原告著作的權益保護未有留意;將原告受著作權保護之內容用於有損原告權益的用途等,皆屬OpenAI未對他人權益善盡注意義務之行為,構成過失侵權(註19)

6. 不當得利

最後,原告主張OpenAI將原告投入相當時間、精力所產出的著作內容,在未經同意的情況下,利用於訓練OpenAI的ChatGPT,藉此獲得利益,因OpenAI的行為,使得原告喪失了根據其著作能獲得之利益,若容許OpenAI持續保有透過上述侵害原告權利而得到的利益,屬於有失公平,故對原告等作者構成不當得利(註20)

(二) OpenAI駁回原告起訴之申請(Motion to Dismiss)(註21)

針對原告有關著作權的間接侵權責任、DMCA責任、過失侵權、不公平競爭、不當得利等請求,OpenAI於2023年8月28日根據聯邦民事訴訟法第12(b)(6)之規定,提出駁回申請(motion to dismiss),理由在於就算假定原告於起訴狀所載之事實皆為真,原告於起訴中所載事實也難以支持原告上述基於間接侵權責任、DMCA責任、過失侵權、不公平競爭、不當得利之請求,換言之,「原告起訴狀需載明足夠充分的事實,使該起訴所尋求之救濟在表面上足以有合理的支持」。根據此標準,OpenAI認為原告於起訴狀所載之事實,即便屬實,也無法支持原告除了直接侵權以外的請求(註22)

1. 間接侵權責任

具體言之,針對間接侵權的部分,由於涉及OpenAI對於他人的使用行為負責,故原告須舉證OpenAI對於他人的行為有監督管理的能力,以及OpenAI就該侵權活動有直接的利害關係。在此,原告間接侵權的理論,是「根據OpenAI的輸出是擷取自原告受著作保護的內容,故OpenAI的每一輸出本身即是一違法的衍生著作」而來,但原告並未特定直接侵權的存在,具體言,原告並未具體舉證究竟ChatGPT的哪一輸出內容與原告受保護之著作內容有實質近似,而僅泛稱每一個ChatGPT的輸出皆屬違法的衍生著作,因為該輸出是語言模型根據分析原告著作之內容而來。質言之,就算主張違法改作,根據應適用的法律,原告也必須具體指出究竟衍生著作的內容,與遭改作之著作受著作權保護的部分,彼此間有何實質近似,既然原告並未具體指出ChatGPT輸出的內容(即著作摘要)與原告之著作內容有何處實質近似,則顯然原告並未能具體舉證直接侵權,故間接侵權自然無法附麗;再者,OpenAI須對他人使用ChatGPT的行為負責的前提,是OpenAI對於他人之行為有監管的能力,但原告針對OpenAI究竟是如何能監管他人使用行為,並未指出相對應事實;何況,原告也未能具體指出究竟OpenAI是如何的獲益於他人的侵權行為,詳言之,此處的受有直接的利益,不能僅僅是舉證OpenAI因有償的提供相關使用工具而受有利益,而是必須更具體說明原告該受侵害的著作內容與OpenAI所獲得利益彼此間的因果關係,就此,原告僅泛稱OpenAI獲得商業上的利益,或第三人將被吸引至OpenAI以取得侵權內容等,皆未達應有證據門檻,未能說明究竟侵害原告著作權是如何直接導致OpenAI因此受得商業上利益,故同樣不可採,基此,原告間接侵權的理論不能成立(註23)

2. DMCA責任

在DMCA的侵權責任上,OpenAI主張原告同樣並未依照該法律規定之要件進行舉證,詳言之,若原告依據DMCA請求OpenAI為其移除原告著作之CMI訊息負責,則除了CMI訊息遭移除之外,原告至少仍須證明:1) OpenAI故意將該CMI訊息移除或變更;以及2) 在移除或變更原告CMI訊息時,OpenAI應可得而知其行為將會誘使或促進對於原告著作權之侵害行為。易言之,若僅是單純或誤將CMI訊息移除,並不當然會該當DMCA法規責任。在此法律架構下,OpenAI認為原告雖聲稱其部分CMI訊息例如作者姓名和出版年份係於OpenAI訓練其語言模型的過程當中移除,但原告本身於書狀提出的事實陳述就彼此矛盾,例如:原告一方面聲稱其著作之內容遭OpenAI全部重製(故理應包含CMI訊息),但一方面又聲稱部分CMI訊息在訓練過程中遭刪除,原告於訴狀中對於OpenAI是如何的能在訓練語言模型的過程當中將原告部分的CMI訊息刪除,未有任何說明或事實陳述;再者,若觀察原告於起訴狀所提出的測試證據,很顯然的,在利用ChatGPT摘要原告著作的內容時,ChatGPT的輸出內容會包含原告的姓名,若原告所述侵權理論為真(即OpenAI在訓練過程當中刪除了原告姓名),則輸出內容理應不會出現上述CMI資訊才對,更何況,就算原告所推論為真,OpenAI用來訓練語言模型的語料並非網路上公開資料,原告對於上述「CMI訊息遭刪除將誘發或促使侵權結果的發生」並無合理的事實陳述以支持其論點。原告雖聲稱OpenAI散布移除原告CMI訊息的輸出內容,也違反DMCA的規定,但OpenAI指出DMCA所禁止的行為態樣是被告將著作中CMI訊息移除後將該著作或該著作的重製物於網路上散布,而本案OpenAI的行為是利用原告的著作來產生一新的不包含原告CMI訊息的著作,性質上有所不同,故根據原告起訴狀所載事實,就算假定為真,也無法支持原告DMCA的請求(註24)

3. UCL責任

至於原告的UCL請求,OpenAI認為根據實務標準,至少原告需具體特定出違反法令(unlawful)、不公平(unfair)或欺罔(fraudulent)的商業行為,依據原告所指摘的行為態樣(違反法令、不公平、欺罔),需個別舉出相對應的事實證據作為支持,此外,也須說明上該行為造成原告經濟上的所失。在本訴訟中,原告係基於UCL中違反法令的類型,認為OpenAI因為違反了DMCA,故屬於「違反法令」的行為。但如上所述,因為原告於起訴狀中所載之事實並不能支持原告DMCA的主張,故也連帶使原告根據DMCA主張OpenAI違反UCL的請求失所附麗,再者,在原告的起訴狀中,OpenAI也認為無法確認原告究竟何種經濟上的利益遭受損傷,且該損傷與OpenAI的行為有因果關係,因為原告在DMCA的請求中僅泛稱OpenAI在訓練語言模型時將原告著作中CMI訊息移除,以及後續ChatGPT在輸出著作摘要內容時未包含CMI資訊,但並未具體說明到底原告受到的金錢損失為何。因此,OpenAI認為原告就UCL的請求並未滿足12(b)(6)的門檻(註25)

4. 過失責任與不當得利

針對原告的過失侵權(Negligence)以及不當得利(unjust enrichment),針對前者,OpenAI認為原告並未適當的描述究竟OpenAI對於原告負有何種注意義務,原告僅泛稱OpenAI持有、管控大量資訊,但原告並未敘明從OpenAI對其所持有的大量資訊如何推導出OpenAI因此對原告負有某種注意義務,或OpenAI與原告間具有何種法律關係而足以衍生OpenAI對原告的注意義務;至於不當得利的請求,OpenAI認為原告僅單方面聲稱OpenAI透過侵害原告著作權而獲有利益,而容許OpenAI繼續保有該利益係屬不當得利,原告並未敘明究竟OpenAI獲得了「甚麼樣」的利益,以及該獲益係基於「錯誤、詐欺或是脅迫」,質言之,原告不能在主張不當得利的場合,僅單純覆述其著作權侵權的事實基礎,二者的構成要件顯然不相同(註26)

5. 聯邦法優先適用

最後,OpenAI也主張原告基於過失侵權與不當得利的請求屬州法,與屬聯邦法層級的著作權法在「標的」與「權利的範圍」有競合關係,故應被排除適用(Preempted)。詳言之,在標的層面,原告基於過失侵權與不當得利的請求,皆係著眼OpenAI侵害原告著作權的行為,故原告的過失侵權以及不當得利之標的(原告的著作),與本案著作權法的標的(原告的著作)重疊;在權利範圍的層面,原告根據過失侵權與不當得利的請求,是在追究OpenAI重製其著作內容、並利用其著作內容開發語言模型的行為,但此正好落入著作權人透過其重製權而可控制如何利用其著作內容的範疇,因此,在標的與權利範圍兩個方面,原告的過失侵權與不當得利皆落入著作權法的規範範疇,故應被排除適用(註27)

(三) 法院判斷(註28)

本案承審法院於2024年2月12日做出了判斷,認為除了UCL請求外,原告並未在間接侵權、DMCA、過失侵權與不當得利等請求提出足夠的事實陳述,故未達起訴的門檻,裁示原告必須在2024年3月13前提出更正版的起訴(註29)

針對12(b)(6)的門檻,法院認為,原告於起訴狀所載的事實,必須具備表面的合理性,亦即,所述事實須充分到「讓法院得以從中合理的推論出被告須為原告所指稱的行為負責」之程度。在判斷原告是否符合此門檻時,雖然法院會從最有利於原告、且假定原告所述為真的立場,判斷原告訴狀是否符合此門檻,但對於原告結論式的陳述,則法院不予接受。

在上述理解下,就原告間接侵權的請求,法院認為OpenAI之抗辯有理,首先,著作權法賦予著作權人重製、改作、對公眾散布著作的權利,但著作權僅保護著作中具備原創性的元素;若主張直接侵權,原告須舉證其擁有一有效的著作權,以及原告的著作遭抄襲,針對抄襲的部分,則須說明接觸與實質近似;若主張間接侵權,原告則需先舉證直接侵權的存在,且舉證說明被告有能力管控該侵權行為,以及被告與該侵權行為有直接利益關係。法院聚焦在原告是否舉證直接侵權的存在,原告主張在本案不需要有實質近似的舉證,因為OpenAI直接抄襲了原告著作的內容,但法院認為從ChatGPT的輸出內容觀察,其所摘要的著作內容明顯無法直接與原告的著作內容相比較是否相似,故法院認為從原告所述事實中,無法推論出ChatGPT所輸出的書本摘要內容究竟何處與原告主張遭抄襲的著作內容有實質近似,故認為原告並未先就直接侵權的存在舉證,因而駁回了原告間接侵權的請求(註30)

針對原告DMCA請求,法院整理出有兩種態樣,一種為1202(b)(1),一種為1202(b)(3),1202(b)(1)是針對行為人「明知或可得而知」將CMI訊息刪除後將「促進、引誘或隱匿」著作權的侵權行為,但仍為之;1202(b)(3)則是針對行為人將CM訊息自著作刪去後予以散布。在第一種態樣,法院認為原告的主張須能顯示OpenAI對於「將原告CMI的訊息除去可能將促進、勸誘或隱匿對原告著作的侵權」一事處於明知或可得而知的狀態,此主觀要件為DMCA請求的前提要件,根據應適用法律,法院認為原告舉出積極的事證,例如:基於被告過去的行為模式或態樣,足以顯示被告對於著作日後遭他人侵權的影響有所認識或預見。在這裡,原告僅單純主張原告的CMI訊息在訓練語言模型時遭移除,但並未有任何事證做支持,相對的,根據原告自已的蒐證結果,當要求ChatGPT輸出原告著作的摘要時,ChatGPT的輸出實際上包含了原告自己的名字在內,這與原告的指述—原告著作的CMI訊息於訓練時遭移除—相互矛盾,且也與原告主張OpenAI將語言模型設計為不會保存CMI訊息相牴觸,再者,就算如原告所說,原告著作的CMI訊息於訓練中遭OpenAI移除,此訓練的語料也屬於OpenAI的內部資料,並未公開,無法從中推論出OpenAI如何因此預見或可得預見日後ChatGPT的輸出內容將誘使、促進或隱匿對於原告著作的侵權行為。在第二種態樣,原告雖另外主張ChatGPT的輸出屬於原告著作的衍生著作,故OpenAI將原告著作CMI訊息刪除後透過ChatGPT的輸出散布其衍生著作之內容,同樣違反DMCA,但法院在此認同OpenAI的見解,1202(b)(3)是針對行為人將某著作的CMI訊息刪除後散布該著作或著作之重製物,而本案原告並未具體指出其著作的何處有遭ChatGPT重製後輸出,故同樣未能達到DMCA的起訴門檻(註31)

在針對原告的UCL請求,法院逐一就「違背法令」、「不公平競爭」以及「欺罔」等三個態樣檢視是否符合加州商業及專業法。在違背法令的部分,因為原告的主張以OpenAI違反DMCA作為違背法令的前提,而原告對於DMCA的請求並未達到基本起訴門檻,故此部分的UCL請求同樣失所附麗,再者,因UCL規定請求人須特定出所受的財產損失,而原告僅泛稱其著作權因OpenAI移除CMI訊息的行為受有損害,但原告並未舉出任何OpenAI有重製或散布刪除CMI訊息之原告著作的事實,故法院認為此處原告此處所主張的損害,僅屬臆測,不足為採。類似的,在「欺罔」的類型,因為原告的指控是OpenAI將CMI訊息刪除對消費者產生誤導或欺騙,但如前所述,因原告對OpenAI是否有將CMI訊息刪除一事未有基本的事實陳述,故法院同樣認為原告基於「欺罔」的UCL請求同樣舉證不足。在「不公平競爭」的類型,法院則認為根據實務,法院對於「不公平」的適用範圍甚廣,其意旨在於給予法院在個案中充分的裁量空間,以判斷新的行為型是否有失公平之處,即便該行為尚未違法,在判斷是否有失公平,法院主要是權衡「受害者所受損失是否超過被告行為所生的益處」,在此,假定原告所述為真,即OpenAI利用其著作內容來訓練其語言模型以獲取商業利益,法院認為OpenAI的行為確實有可能屬不公平競爭,故允許原告此部分的請求續行(註32)

而針對原告的過失侵權,法院則認為就OpenAI注意義務的基礎,原告僅陳述OpenAI維持並掌控(maintain and control)包含原告著作內容的公開訊息,但並未敘明OpenAI因此對原告負有注意義務的法律依據,僅因OpenAI持有原告的著作內容,無由推導出OpenAI對原告權益負有何種注意義務(註33)

就原告的不當得利請求,法院也採認了OpenAI的論點,認為請求人主張不得得利,除了說明受益人有獲得利益外,也需敘明該所受利益係透過錯誤、詐欺或脅迫等不正行為而來,若僅單純受有利益,不代表該利益係屬於不正(unjust)利益。就此,原告於起訴內容中並未敘明OpenAI利用原告著作的行為獲得何種利益,也未敘明OpenAI係透過詐欺、錯誤或脅迫等不正手段獲得該利益,故原告就不當得利的請求部分,同樣未敘明足夠的事證,予以駁回(註34)

(四) 小結

基上所述,原告等對OpenAI提出的訴訟,除了著作權直接侵權與UCL不公平競爭的請求外,其餘皆因未敘明足夠的事證而遭法院駁回,但法院允許原告在2024年3月13日前補正,提出修正的起訴。

四、代結論—著作權人面對生成式AI的維權困境

生成式AI自從ChatGPT的成功,在過去幾年間成為科技與產業界的焦點所在,隨著運算、技術等相關軟硬體條件逐漸成熟,業者無不希望發展出更具特色的語言模型,但某程度上語言模型的精準度係仰賴訓練語料的質與量,在開發、訓練的過程當中,即難免會涉及到他人創作內容的部分,除了Tremblay外,近期紐約時代雜誌亦對OpenAI提起侵害著作權的訴訟,在科技創新急速的步履中,如何兼顧不踐踏原創者的權益,即屬重要,以下提出幾點訴訟的觀察。

(一) 生成式AI的技術有一定複雜性,難以事先調查、舉證

生成式AI的語言模型如何訓練,模式如何設計,可能屬於各廠商的業務機密,這也是不同廠商的語言模型,在針對相同的問項(prompt)會有不同的輸出(output)內容的原因。因此,雖然在邏輯上可知道AI業者在訓練語言模型時會輸入大量的語料作為分析、對照或是調整之用,但對於權利人而言,生成式AI僅係一使用者介面而已,在介面後的相關資料傳輸與運算過程,在沒有事先的證據保全,幾乎無可能取得客觀的資料以佐證著作內容到底是被如何的利用,更遑論AI業者諸如OpenAI背後可能有多重的業務分工,包含數個獨立存在的行為主體(註35),一份著作內容究竟是如何地被切分、利用,權利人僅能憑藉間接事證或公開訊息推敲,難以具體特定抄襲的行為人為何人(註36)、著作的何處遭抄襲、透過抄襲所生的內容為何、以及呈現原著作與抄襲著作彼此間有何實質近似(註37),故不論是採直接侵權理論或是間接侵權理論,若法院在起訴初期採嚴格的舉證責任分配法則,權利人在訴訟前階段面對AI業者的舉證要求,將較吃力(註38)

(二) 對於生成式AI的輸出內容在著作權法上如何定性,仍未確定

另一值得注意的是,在與OpenAI周旋的過程中,權利人似乎面臨侵權定性的難題,除了較明確的將著作內容作為訓練語料可能涉及重製的行為外,訓練後的生成式AI據此產出的內容,與原著作內容究竟有何關聯,似乎尚無定論。目前對OpenAI主張著作權侵害的權利人中,皆有主張改作,亦即某程度上將訓練後的產出視作原著作的衍生著作,但從著作權法改作的定義而論,似有疑義,蓋「生成的內容係根據某特定著作內容」並不當然構成「改作」,且改作成果(即衍生著作)的內容需與原著作內容有近似,甚者,衍生著作本身也屬於著作權,依照目前實務,應僅有自然人能作為創作人(註39),人工智慧運算、生成結果循此推論,應不能作為著作權保護標的,則權利人在OpenAI案件中主張ChatGPT的生成內容構成衍生著作,理論依據何在,亦值得商榷。法院並未直接以此為由駁回原告衍生著作的請求,在後續會否產生此論點爭議,亦值得關注。但無論如何,可以想見實務上對衍生著作的要件詮釋若趨於嚴格、保守,在無法主張衍生著作的情況下,勢必將更限縮權利人對生成式AI的維權選擇。

(三) 公平交易法作為救濟途徑的可能性

在美國,因為有聯邦法與州法的區別,故個案上有所謂排除原則,亦即在聯邦法的適用範圍內,州法將被排除,但在台灣並無此規定,從目前權利人與生成式AI業者初步交鋒的結果觀察,似乎從不公平競爭的角度著手,係相對較可行的救濟管道。例如,台灣公平交易法第25條亦有類似的UCL條款,規定「除本法另有規定者外,事業亦不得為其他足以影響交易秩序之欺罔或顯失公平之行為」,而針對公平法第25條的適用案型,主管機關公平交易委員會(下稱公平會)亦訂有「公平交易委員會對於公平交易法第二十五條案件之處理原則」,其中「榨取他人努力成果」類型,包含「利用網頁之程式設計,不當使用他人表徵,增進自身網站到訪率」、「抄襲他人投入相當努力建置之網站資料,混充為自身網站或資料庫之內容,藉以增加自身交易機會」(註40)等行為態樣,而生成式AI業者為了快速積累大量的訓練語料,往往會從公開的網站上透過爬蟲大量截取他人的資料庫內容,過去在智慧財產及商業法院即曾認定,透過程式快速擷取他人花費相當時間精力設置的網站內容,而做為增加流量或交易機會等,涉及公平交易法第25條之違反(註41),雖然該案係涉及「資料庫內容」遭抄襲,與Tremblay案OpenAI涉及利用個別著作人之著作內容或有不同,但基本上亦涉及利用著作人投入心血創作的成果,若對於市場競爭秩序有所妨害,在個案上或仍有適用公平法第25條「榨取他人努力成果」類型的空間(註42)

例如,在公處字第 111019號案件中,檢舉人悅夢床坊有限公司主張其「悅夢床墊」並未在任何電商平臺販,但發現在Google 搜尋引擎輸入「悅夢」作為關鍵字,搜尋結果出現連結至被檢舉人松果購物網站標題,說明文字載稱「人氣熱銷悅夢床墊口碑推薦品牌整理─松果購物」等內容。被處分人並未在松果購物網站銷售悅夢床墊,亦未委託 代理商購買「悅夢」作為關鍵字廣告。系爭搜尋結果網頁出現「人氣熱銷悅夢床墊口碑推薦品 牌整理─松果購物」等內容,是因為消費者曾在松果購物網站輸入「悅夢」作為關鍵字搜尋,松果購物網 站自動產出搜尋結果之網頁並留存於被處分人資料庫,其他消費者在 Google 搜尋引擎輸入「悅夢」作為關鍵字 搜尋時,即連結前述被處分人資料庫並顯示該搜尋結果之網頁(註43)

公平會認為「過往關鍵字廣告榨取他人努力成果之情狀,主要發生利 用與自己具競爭關係之表徵,誘引搜尋引擎使用者到訪。…惟購物網站以其販售商品多元、豐富為其主要營運模式,此時特定表徵並非招攬重點,而是塑造凡搜尋引擎使用者所欲購買之商品,均可在該購物網站購足之招攬方式,以誘引搜尋引擎使用者成為前往該購物網站之人流,方為營運重點。……該等程式設計雖非著重在特定表徵,但呈現搜尋結果與自身購物網站所販售商品不符,則不僅使消費者無法藉由連結自身購物網站獲得前述『特定表徵』商品之重要交易資訊,造成無謂之時間浪費,對於其他購物網站之 經營,亦形成不當方式攔截人流之不公平競爭行為。…此等程式誘引方式並未再採取確保網頁標題或內容真實、完整且無誤導性之措施,反而對於可能錯誤之結果,…任令其發生,亦屬以顯然有失公平之方法從事競爭」(註44)

針對松果購物此種並非利用競爭同業商標或名稱關鍵字,而是透過搜尋引擎優化的技術利用有關他人公司或商品訊息而營造與真實不符的搜尋結果,公平會闡釋:「搜尋引擎之功能,原本就是為了提供網路使用者與鍵入關鍵字『相關』(而非「相同」)之搜尋結果而設計,當網路使用者於搜尋引擎輸入特定表徵作為搜尋之關鍵字,其心裡所欲搜尋之目標,未必僅限於該表徵所代表之事業,還可能包含與該表徵有類似特徵之所有資訊。越豐富多元且具相關性之搜尋結果,越有利於網路使用者取 得更充分資訊,作為點選連結、瀏覽網站,或作成交易決定之憑藉,而有助於降低消費者之搜尋成本…然而,若事業利用網頁之程式設計,不當使用他事業之名稱、商標、其他營業表徵或相關資訊以提升事業之網站連結搜尋引擎搜尋結果頁面(SERP)排序之位置,並藉以增加自身網站之到訪率,不僅誤導搜尋特定商品之消費者以為搜尋結果頁面之連結存有重要交易資訊,點選後才發現事業網站並未販售該商品,更會攔截該資訊所 涉及事業網站之流量,妨礙有提供該等商品販售所在之任何相關網站之交易機會,構成顯失公平之行為,倘足以影響市場交易秩序,則違反公平交易法第 25 條規定。」(註45)

從上述論理,可知公平會在分析公平法第25條之案型,並不限於處理原則第七點所述的類型,且並不拘泥檢舉人與被檢舉人間是否具備競爭關係(例如:是否同業),而係從宏觀的角度觀察,自該利用行為(即:利用他人商品訊息增加自身網站流量)對於整體市場交易秩序的影響(例如:是否將妨害市場中其他業者的營運、對於消費者的誤導或搜尋時間的浪費)、利用行為本身的可非難性(例如:是否會讓其他業者群起效尤、降低市場競爭效能)等來判斷,而生成式AI業者如OpenAI的利用方式,除了同樣是利用他人著作內容多元化自身網站而增加流量外,且所生成的內容也可能是有誤導或偏離事實的情形,進而可能妨害了對各著作權人原先可能獲得之認識、關注或交易機會((註46)

要之,在AI的新紀元,除了典型的著作權法外,公平交易法對於AI業者於市場競爭行為的規制,容有發揮空間,在生成式AI相關案例中可扮演的角色,值得吾人關注。

※ 註釋 ※

  1.

OpenAI on pace for $1.3 billion in 2023 revenue, up 4543% from last year (最後到訪日:2024.2.28) (該網頁適用瀏覽器: Firefox、Chrome、Opera、Edge)

  2.

Number of ChatGPT Users (Mar 2024)(最後到訪日:2024.2.28)

  3.

ChatGPT Statistics — User Demographics (March 2024)(最後到訪日:2024.2.28)

  4.

同前註。

  5.

根據OpenAI,語料來源包含網際網路上公開的資料、獲得第三人授權之資料、以及OpenAI使用者及訓練人員所輸入的資料,參:How ChatGPT and our language models are developed(最後到訪日:2024.2.28)

  6.

這某程度與輸入搜尋引擎關鍵字時自動完成(auto-complete)的功能相類似。

  7.

ChatGPT Creator Faces Multiple Lawsuits Over Copyright & Privacy Violations(最後到訪日:2024.2.28)

  8.

參考:OpenAI and ChatGPT Lawsuit List(最後到訪日:2024.2.28)

  9.

Paul Tremblay為驚悚小說作家,其暢銷作品「世界盡頭的小木屋」(The Cabin at the End of the World)在2023年改編為電影「敲敲門」(Knock at the Cabin)。參:M. Night Shyamalan 全新驚悚電影《敲敲門 Knock at the Cabin》釋出最新預告(最後到訪日:2024.2.28)

 10.

Authors file a lawsuit against OpenAI for unlawfully ‘ingesting’ their books(最後到訪日:2024.2.28)

 11.

可參起訴狀內容(最後到訪日:2024.2.28)

 12.

起訴狀,頁4。

 13.

起訴狀,頁7-8。

 14.

起訴狀,頁8;以其起訴狀附件B(Exhibit B)(最後到訪日:2024.2.28)

 15.

起訴狀,頁11。

 16.

起訴狀,頁11。

 17.

起訴狀,頁12。

 18.

起訴狀,頁12-13。

 19.

起訴狀,頁13-14。

 20.

起訴狀,頁14-15。

 21.

參:駁回動議申請通知及理由(最後到訪日:2024.2.28)

 22.

OpenAI駁回申請,頁5-6。

 23.

OpenAI駁回申請,頁8-11。

 24.

OpenAI駁回申請,頁11-18。

 25.

OpenAI駁回申請,頁19-20。

 26.

OpenAI駁回申請,頁20-22。

 27.

OpenAI駁回申請,頁22-24。

 28.

法院裁定(最後到訪日:2024.2.28)

 29.

法院裁定,頁1。

 30.

法院裁定,頁3-5。

 31.

法院裁定,頁5-8。

 32.

法院裁定,頁8-10。但法院也特別說明,OpenAI並未主張UCL遭著作權法排除適用(preemption)的抗辯,法院也認為若OpenAI主張,原告的UCL請求有可能會與著作權法規定競合而遭排除,參法院裁定,頁10,註腳6。

 33.

法院裁定,頁10-11。

 34.

法院裁定,頁11-12。

 35.

根據起訴狀,被告共包含七個相關企業主體,包含:OpenAI Inc.、OpenAI L.P.、 OpenAI OPCO L.L.C.、OpenAI Startup Fund GP I, L.L.C.、OpenAI Startup Fund I, L.L.C.、OpenAI Startup Fund Management, L.L.C.等。

 36.

例如:「按當事人主張有利於己之事實者,就其事實有舉證之責任,民事訴訟法第277條前段定有明文。又各當事人就其主張有利於己之事實,均應負舉證之責,故一方已有適當之證明,相對人欲否認其主張,即不得不更舉反證。原告於起訴原因已有相當之證明,被告對其主張,如抗辯不實並提出反對之主張者,則被告就反對之主張,亦應負證明之責,此為舉證責任分擔之原則。本件上訴人主張其於110年4、5月間發現「佛山軒佛俱」網站上登載如附表1所示編號C-1015(3尊),「佛美佛藝社」網站上登載如附表1所示編號C-1015,「林新發神桌、神像、佛像、佛俱用品、木雕藝術」網站上登載如附表1所示編號C-1015(3尊)、WB系列福壽著作等,並提出上開商店之網頁資料為證…被上訴人對上開事實固不否認,惟否認曾提供前開著作予前揭商店使用,是上開商店網頁所使用之著作究竟從何而來,是否為被上訴人提供,自應由上訴人負舉證責任。上訴人就前開事實自原審審理時迄至本院言詞辯論終結前,均未舉證證明,則其主張被上訴人違反系爭合約第1條第4項約定云云,自屬無據」(智慧財產及商業法院 111 年度民著上字第 18 號民事判決)

 37.

又語文著作包括詩、詞、散文、小說、劇本、學術論述、演講及其他之語文著作,受著作權法保護之語文著作,必須其內容具備作者創意表達或創作性格,始有原創性要件。倘無著作物之內涵與表達,不足表現出作者之個性與獨特性,不具原創性,並無語文著作之保護要件。次按著作權法雖未對抄襲加以定義,但著作權法保護之著作祇須具有原創性,即著作人之獨立創作,非抄襲自他人之著作即可,是一著作雖與他人之前之著作雷同,但如非抄襲前一著作,而係自己獨立創作者,仍具有原創性,而受著作權法之保護,故主張他人之著作抄襲自己之著作,而構成著作權侵害者,應先證明他人之著作有直接或間接抄襲自己著作,且二者間有其關聯性。即主張權利者應證明他人曾接觸其著作,且其所主張抄襲部分,與主張權利者之著作構成實質相似。所謂接觸,指依社會通常情況,可認為他人有合理機會或可能見聞自己之著作而言。所謂實質相似,則由法院就爭執部分著作之質或量加以觀察,為價值判斷,認為二者相似程度頗高或屬著作之主要部分者,始足當之(最高法院99年度台上字第2314號判決意旨參照)。

 38.

例如在另一個受矚目的生成式AI案件,權利人也受到類似的挫敗,在創作人控告AI圖像大廠Stability AI、Midjourney等侵害著作權的場合,法院最後也僅允許直接侵害著作權的請求有滿足起訴門檻,而駁回了大部分原告基於間接侵權、UCL等請求。針對Midjourney直接侵權的部分,法院認為原告須特定起訴的根據是Midjourney使用了來自Stability AI的圖庫進行訓練、還是Midjourney自己本身取得的圖像資料進行訓練,還是二者兼有。(Sarah Andersen et. al. v. Stability AI LTD. et al,Order on Motion to dismiss and strike)

 39.

智慧財產及商業法院107年度民公訴字第4號民事判決

 40.

公平交易委員會對於公平交易法第二十五條案件之處理原則第七、(二)、4之規定。

 41.

例如:智慧財產及商業法院109年度民公上字第2號民事判決。

 42.

畢竟,此處針對榨取努力成果之類型,僅為例示。公平交易委員會對於公平交易法第二十五條案件之處理原則第八點規定:「第六點第三項及前點第二項規定,僅係例示若干常見之欺罔及顯失公平行為類型,違反本條規定之情形不以此為限,仍須就特定行為處理原則(或規範說明)及個案具體事實加以認定」。

 43.

公平交易委員會公處字第 111019 號處分書,頁2-3。

 44.

同前註,頁4-5。

 45.

同前註,頁6。

 46.

這在著作人本身是出版社或新聞媒體的案型可能更有適用。例如在紐時的起訴中,即主張OpenAI的行為可能造成訂閱其內容的讀者流失,或喪失可能的交易機會。見其起訴狀第59頁。

-----------------------------------------------------------------------
以上內容僅為一般性之討論,非法律意見,不適用於具體事件。若有實際問題,請與我們聯繫。

回列表