一、生成式AI帶來的快速變革與其涉及的侵權事件已非新聞,2024年2月間,OpenAI再發表Sora,以文字生成媲美電影畫質的視頻,持續驚豔世界、卻也加劇了文創產業和高科技公司的對峙。目前爭議態樣再演變為多起AI生成聲音侵權論辯。美國知名女演員史嘉蕾·喬韓森 (Scarlett Johansson)近日稱ChatGPT的開發商OpenAI在徵詢其為ChatGPT4.0新系統「發聲」被拒絕後,仍擅自將其聲音使用於新系統中名為「Sky」的機器語音,該系統具有可與用戶即時對話的音訊功能,即使是朋友或者新聞媒體人員都無法分辨「Sky」是否為史嘉蕾本人的聲音。OpenAI否認所有指控,稱新系統的聲音源於另一名專業女演員,基於對音源隱私權之保障無法透露身分,但OpenAI隨後向路透社(Reuters)記者表示,該公司基於對史嘉蕾知名度的尊重,將會先暫停使用爭議語音,並就雙方溝通歧見表達歉意。史嘉蕾仍感不滿,公開呼籲應正視生成式AI的透明度問題,並考慮立法管制。
二、北京互聯網法院- 中國首例AI侵害女配音員聲音案
(一) 在好萊塢仍在探討如何推動美國聯邦政府因應生成式AI的發展加強保障名人形象特徵「商業利用權(Right to Publicity)」之際,中國大陸法院已於2024年4月23日為首例AI生成聲音侵權宣判。
(二) 案件背景
1. 原告為配音員,經朋友告知多個知名APP廣泛流傳的作品與其聲音類似,經調查發現爭議作品中的聲音源自被告1(某北京智能科技公司)運營平台之「文本轉語音」產品,平台用戶透過輸入文本、調整參數,可實現文本轉化成語音的功能。
2. 原告曾接受被告2(某北京文化傳媒公司)的委託錄製錄音製品,約定被告2為錄音製品的著作權人。其後被告2將原告的錄音製品音頻提供給被告3(某軟體公司),允許後者以商業或非商業用途使用、複製、修改數據,以應用於其產品及服務。被告3將原告的錄音製品進行AI化處理,生成涉案文本轉語音產品並在被告4(某上海網絡科技公司)運營的雲端服務平台對外出售。被告1與被告5(某北京科技發展公司)簽訂在線服務買賣合同,由後者向被告3下單採購,其中包括了涉案文本轉語音產品。被告1採取應用程式介面形式,在未經技術處理的情況下,直接調取並產生新的文字轉語音產品在其平台中使用。
3. 原告在北京互聯網法院對前述五被告起訴,主張被告等的行為侵犯其聲音權益,被告1(平台運營者)及被告3(軟體公司)應立即停止侵權、賠禮道歉,五名被告應當賠償其經濟及精神損失。
(三) 法院判決
1. 利用人工智慧合成的聲音,如果能讓一般社會公眾或相關領域的公眾根據其音色、語調和發音風格,關聯到該自然人,可認定為具有可識別性。本案中,因被告3(某軟體公司)係僅使用原告個人聲音開發涉案文本轉語音產品,且經當庭勘驗,該AI聲音與原告的音色、語調、發音風格等具有高度一致性,能夠引起一般人產生與原告有關的思想或感情活動,並將該聲音連結到原告本人,進而辨識出原告的主體身分。因此,原告聲音權益及於涉案AI聲音。
2. 被告2(某北京文化傳媒公司)對錄音製品享有著作權等權利,但不包括授權他人對原告聲音進行AI化使用的權利。被告2與被告3(某軟體公司)簽訂資料協議,在未經原告本人知情同意的情況下,授權被告3將原告聲音AI化使用的行為無合法權利來源。
3. 判決:
(1) 被告1(侵權平台運營公司)及被告3(將錄音作品AI化之軟體公司)向原告賠禮道歉。
(2) 被告1、被告4、被告5主觀上不存在過錯,不承擔損害賠償責任。被告2(逾越錄音作品著作權範圍外擅自利用音訊之文化傳媒公司)及被告3(侵權軟體製作公司)應向原告賠償損失;綜合考量被告侵權情節、同類市場產品價值、產品播放量等因素,對損害賠償予以酌定共計人民幣25萬元。
三、判決研析
(一) 迄至本篇截稿時止,前述判決之理由書尚未公告,但宣判過程及其視頻已迅速在中國大陸經各大媒體大幅報導,引起廣泛關注。一般評論認為,中國大陸民法1023條將自然人聲音之保護參照適用肖像權的相關規定,以之為特殊人格利益加以保護,因此前述中國大陸判決是據其民法第1023條為裁判基礎,以相關領域一般聽眾能否辨識為判斷標準,在具備「可辨識性」的前提下,認定自然人聲音權益的保護範圍可及於AI生成聲音。前述判決並昭告一般民眾,取得錄音作品之著作利用授權,不代表當然及於AI化利用該音頻內容,逾越授權範圍內之利用行為,仍可能構成對音訊主體人格權之侵害。
(二) 在臺灣,近期已有針對深偽技術變臉犯罪依刑法認定妨害名譽及違反個人資料保護法之相關刑事判決,民事部分亦有民法第195條保護人格法益之請求權依據1,該等規範內容與前述中國大陸民法之規範基本相似,因此倘若在臺灣不法利用他人語音,在法理上亦可參照前述中國大陸判決援引臺灣類似規範加以保障。困難點在於透過AI生成特定爭議聲音前,輾轉經過蒐集、訓練、製作甚至合成等數階段,各個階段可能涉及不同之行為主體,且彼此間甚至毫無主觀聯繫或者客觀上的關聯性,倘若無法追溯爭議聲音之來源,權利人在蒐證及舉證方面恐將面臨與前述美國女演員史嘉蕾·喬韓森聲音爭議一樣的困境。因此,利用AI生成之內容,無論是文字、影像或者聲音,推動AI生成之結果及其應用揭露公眾知悉,並且管制其發展範圍,已是目前世界各國行政管理及立法趨勢。
1 臺灣民法第195條規定:不法侵害他人身體、健康、名譽、自由、信譽、隱私、貞操或其他人格法益而情節重大者,雖非財產上的損害,仍得請求賠償相當的金額。