最新消息

近期開源軟體涉及的著作權爭議探討

一、開源軟體(Open Source Software,簡稱 OSS)是指公開原始程式碼的軟體。但「公開」不代表可以完全自由利用,近日臺灣發生幾件因誤解開源軟體而產生的法律爭議,報導探討如後。

二、兩則新聞

(一) 博士生公開分享語料集事件

2025年初一博士生從開源平台取得可供大型語言模型訓練使用的資料集,並整理出繁體中文語料集分享在臉書社團,供公眾查詢及下載。結果中央通訊社對之提起著作侵權告訴,主張該等資料中包含2011年至2021年間、約14萬筆來自未經該社授權利用的新聞內容,博士生則稱:其只是抱持讓AI更懂繁體中文的立場無償公開分享研究所得,雙方最終以和解結案,引發台灣新聞界的報導及討論。

(二) 衛服部委外開發軟體授權爭議

1. 今年4月間,有工程師在社群平台發文指出,衛服部委託工研院進行「次世代數位醫療平臺專案辦公室」開發計畫,結果於上架官網的「臺灣醫療資訊標準大平臺」健保申報規則原始碼,完全複製了美國醫療照護研究及品質機構(Agency for Healthcare Research and Quality, AHRQ)的開源專案CQL-Testing-Framework程式碼、README說明檔,再據以改作,但卻刪除原始授權聲明與來源資訊,被質疑涉嫌抄襲或者違反授權協議。隨後,另一個名為「TW Core IG」的國家級醫療電子病歷交換標準專案,亦被指摘私自更改該專案開源授權條款的授權限制,聲稱著作權屬於衛服部,卻片面基於所謂「商業與技術安全考量」明文禁止特定工程師及其所屬公司使用該標準,而未提供法律依據。

2. 事件曝光後,衛福部於4月19日表示尊重智慧財產權,已要求進行調查;工研院於4月20日晚間發表公開道歉聲明,針對第一項授權聲明不清的問題表示歉意並啟動補正措施,對第二項剝奪特定用戶使用權的爭議,則移除禁用條款、開放予民眾。事件引發輿論關注,工研院後續公佈專案內控強化方案,表示將控管和改善往後團隊利用開源軟體之授權議題。

三、開源軟體涉及的法律爭議

(一) 開源軟體可以隨意利用嗎?

1. 早在1984年間,理查·史托曼(Richard Stallman)即因反對大型企業對作業系統軟體的壟斷、啟動GNU計畫(「GNU」即是「GNU's Not Unix」的遞迴縮寫),目標是開發一個完全自由且類似Unix的作業系統,隔年成立的「自由軟體基金會(Free Software Foundation, FSF)」,推動自由軟體運動,主張程式必須保障使用、研究、修改與再散布的自由,並倡議「Copyleft」強制授權以確保軟體自由得以延續。其學生李諾斯·托瓦德斯(Linus Torvalds)於1991年釋出Linux個人電腦作業系統核心(Kernel),承襲自由軟體原則,結合GNU計畫提供的工具,形成現在廣泛使用的GNU/Linux作業系統。

2. 軟體產業之後產生反動,認為開發商所投注的資本、時間、勞力及智力同樣是促進資訊發展不可或缺的基石,而在軟體產業的開源倡議中產生不同的開源軟體利用授權折衷方案、以期適度填補開發商的商業利益,迄至現今授權公眾利用之軟體隨不同的「開源協議標準」而有所別。

3. 1998年成立的OSI(Open Source Initiative,開放原始碼促進會),明確定義「開源軟體(Open Source Software)」之概念,對外公開其認可的「開放原始碼授權清單(Approved Licenses)」,並對於符合其「開源軟體」定義的授權條款授予認證,以期促進程式碼公開及軟體品質,並兼顧實用與商業接受度。OSI目前已成為國際公認的開源協議標準制定與認證組織,其所認證之開源授權條款眾多,舉例而言,涵蓋較嚴格的「GPL公共授權條款(GNU General Public License)」,及「PSL(寬鬆類授權條款,Permissive Software license)」:

  • GPL的核心特點在於「Copyleft」強制開源條款:使用GPL授權的軟體及其衍生作品,必須於再散布時採用相同的GPL授權條款。亦即任何基於GPL軟體修改或衍生之軟體,同樣必須開源並提供原始碼,不能採用更嚴格或封閉的授權方式,以確保軟體的自由與開源精神延續。此外,修改後的程式需明確標示變更部分並保留原著作權聲明和GPL授權條款。此系列的授權條款之後亦衍生不同版本,最常見的是GPLv2和GPLv3,後者針對現代軟體的挑戰(如專利、硬體限制)加以強化。Linux 核心即採用GPLv2授權。
     
  • 至於PSL則允許使用者在保留原作者著作權及授權聲明的前提下,可自由使用、修改、散布軟體,亦可將修改後的衍生軟體採用更嚴格或專有的授權方式發布。此類授權對使用和再授權的限制較少,為軟體開發商提供更大的彈性。包含:Apache 2.0、MIT授權和BSD 授權等均屬之。

4. 自由軟體與開源軟體的區別:

兩者常被合稱為Free and Open Source Software (FOSS),其核心在於原始碼公開、自由使用及分享,並鼓勵改作者以同樣方式共享軟體,以促進社群共榮。因「free」一詞在英文有「自由」與「免費」的雙重涵義,其後往往有誤以為所有自由軟體或開源軟體都是免費的,但事實並非如此,自由軟體強調自由運用,而部分開源軟體之進階功能需要付費,即使是GPL授權模式下的軟體,也可能因為採用多重授權(dual-licensing)模式而搭配商業授權協議,此外授權細節上也有差異。

5. 開源軟體演變至今,已不當然代表可無限制免費利用、修改,即使非商業用途亦同,有意利用開源軟體者,應留意根據個別軟體所源自的授權協議條款進行。原則上,利用該軟體者即代表同意接受該軟體發布者公告之授權協議,而無論採用哪一種協議,基本上都應保留原作之著作權聲明及揭示作品來源。以前述「衛服部委外開發案」為例,產生爭議的原因是工研院利用了Apache 2.0授權標準的軟體,卻未對應標示其出處及原始授權聲明,而有違反該協議之虞(作者按,根據工研院的公開說明,目前已經採取補正措施)。

(二) 利用開源軟體訓練AI模型,是否屬於著作合理使用?

1. 前述博士生公開分享語料集的爭點在於:博士生認為其無償公開分享自己從開源軟體清整後的語料集,並未商業利用、亦無侵害著作權之意圖,而中央社則認為未經其同意而大量利用該社報導,無論主觀意圖如何,已涉及著作侵權。

2. 新聞報導的內容雖然是就公眾時事加以報導,其中「單純傳達事實」之部分,依著作權法第9條第1項第4款不受著作權法保護,但記者論述取材的內容倘若涉及評論、分析、社論等內容具有原創性部分,則仍受著作權法保護,使用時須取得著作權人之授權或符合合理使用之規範。

3. 本件爭議可延伸討論者為,將開源軟體取得的資訊集用以訓練AI模型是否屬於「合理使用」? 台灣司法迄未有判決訊息,而在美國加州,近期已連續有兩則判決討論此議題。在美國,「合理使用」屬於著作侵權訴訟中的抗辯事項,應由訴訟雙方各自就所主張者負舉證責任,著作權人首應證明大型語言模型確實利用著作內容訓練AI,而被控AI開發商則應再就「利用之目的及性質(包括係為商業目的或非營利教育目的)、被利用著作之性質、所利用之質量及其在整個著作所占之比例,以及利用結果對著作潛在市場與現在價值之影響」等因素向法院釋明屬於合理使用。法院對於「合理使用」抗辯之審查享有極大的裁量權,在Andrea Bartz etl. v. Anthropic PBC 案例中,法院認為:非法取得的資訊,即便只是單純儲存在被告系統的中央資訊部,尚未用以訓練AI也不構成合理使用。在 Kadrey v. Meta 案件,法院則傾向,原作品的市場倘若未因AI生成內容而受稀釋,則可能構成合理使用。臺灣著作權法第65第2項亦有類似前述美國著作權法之合理使用衡量基準,因此前述美國法院審查方式在未來亦可能被臺灣司法引為借鏡,擬在台灣開發利用開源軟體訓練AI者,仍宜留意訓練數據集之來源是否合法,以適度降低訟爭風險。

(三) 違反開源授權協議的法律風險

1. 若未遵守開源軟體授權條款,根據各該授權協議之約定,可能導致授權自動終止,並使後續使用者或開發者失去合法利用該軟體的權利。過去各地不乏因未遵守開源授權協議導致的訟爭,例如2013年間德國 FreeAdhocUDF 案件中,Bochum法院支持LGPL-3.0的執行力,強調即使免費授權,權利人仍可主張損害賠償,而近期中國大陸法院也以速審之方式連續認定利用開源軟體而未履行授權條件即構成侵權。

2. 此外,在政府所發包的資訊服務相關標案,相關政府採購契約,通常亦明文約定承包廠對於所提供之服務涉及智慧財產權爭議的相關責任。以前述工研院承包平台開發案為例,依113年12月26日版之「行政院資訊服務採購契約」範本第16條第(三)項規範:承包廠若使用開源軟體,必須依授權規範提供原始碼、授權條款聲明及開源清單等,並交付機關完整資料清單與權利聲明;如承包廠商違反其授權合規之義務,而致第三人對機關索賠時,承包廠商應以自己之名義承受訴訟,並賠償政府機關相關損失。因此,企業無論擬自行利用開源軟體進行數位轉型計畫或者承包政府標案等,都宜同時留意其合規性,以適度降低法律風險。

◎ 參考資料

   美國:訓練大型語言模型(Claude & Llama)構成著作合理使用首二例

回列表