[新聞] 全球首宗音樂出版商控告生成式AI Claude著作侵權案
全球首宗音樂出版商控告生成式AI Claude著作侵權案
原文網址:
https://bit.ly/44WTW1x
原文:
ChatGPT自從2022年底問世後在全球大放異彩,但江山代有才人出,時隔一年多在大型語
言模型賽道中,後起之秀Claude 3聊天機器人曾超越GPT-4,登上最強AI模型排行榜冠軍
,被譽為可打敗GPT-4之最強的LLM!但人(Chatbot)紅是非多,與OpenAI不斷被告一樣,
Claude也引發生成式AI的侵權官司:Concord Music Group, Inc. et al., v.
Anthropic PBC,這是全球第一件涉及生成式AI與音樂產業的侵權案例。
美國三大音樂出版商(包括Concord、Universal和ABKCO)和多家音樂出版商,於2023年
10月中在田納西州中區地院納許維爾分院(Nashville為著名音樂城市被譽為音樂之都)
,起訴Anthropic(以下稱被告)指控其非法複製出版商擁有的歌詞文本,來訓練、建構
和營運其AI模型Claude,生成與受著作權保護的歌詞作品相似或相同的文本,大量散播侵
犯原告音樂作品著作權,尋求7500萬美元賠償 [1],出版商並申請法院頒發永久禁制令
(permanent injunction),擬禁止侵犯出版商的著作權。
一、本案起訴背景
原告等是八家知名的音樂出版商,包括Concord Music Group、Capitol CMG、Universal
Music、Songs of Universal、Universal Music、Polygram Publishing、Capitol CMG、
ABKCO Music等(以下統稱出版商或原告)。本案涉及Anthropic所開發名為Claude的AI模
型,原告主張,除非獲得授權否則任何人不能複製、散布或展示他人具著作權的作品,來
建立自己的業務,此一法律基本原則一再經歷無數新興科技的迭代發展而仍得適用,該原
則不會因為將侵權行為包裝為「AI」而隨之消失;就像其他技術開發一樣,從印刷機到影
印機再到網絡爬蟲(web-crawler),AI業者必須守法。
原告主張,近幾年AI技術爆炸性的發展,尤其對音樂產業帶來突破性的影響力,然而,這
些技術進步不能以犧牲創作者做為代價,AI技術應以合乎道德和負責的方式,來開發和應
用AI工具所帶來的巨大潛力,以保護出版商和詞曲作者的權利、謀生方式和整個創意生態
系統,但Anthropic為了營運AI模型,竟大規模非法複製和散播受著作權保護的音樂歌詞
,或將這些歌詞用AI模型作為輸入或輸出。出版商遂提起本案,以解決Anthropic對歌詞
著作權系統性的廣泛侵權。
二、Anthropic營運與Claude AI模型提供方式
Anthropic是一家美國德拉瓦州公司,從事開發、營運、銷售和授權AI技術,由前OpenAI
高管 於2021年創立,並獲得Amazon、Google、Zoom和Salesforce等公司數億美元投資,
雖然才剛成立,但據報導Anthropic估值已高達50億美元,並獲得超過73億美元的資金,
號稱是OpenAI最大的競爭對手。
原告指控,Anthropic未遵循合法途徑之市場機制,支付費用取得正當授權,而是從網路
上大量抓取出版商受著作權保護之材料經營業務。這種擅自非法複製和散布的行為,剝奪
歌曲創作者的創意成果,其不僅從侵犯出版商作品中獲取豐厚不當利益,還與那些合法支
付授權費的業者進行不公平競爭,不但嚴重破壞授權市場機制、損害音樂創作,更侵蝕作
品的藝術、文化和經濟價值。
Claude AI模型係一種通用大型語言模型(LLM),Anthropic從網路和其他來源,擷取複製
各種大量文本輸入模型,建構高達數十或數百億個字詞之龐大語料庫以「訓練」Claude,
並基於這些複製的文本產生輸出。而Anthropic為其模型複製龐大的文本中,包括出版商
無數受著作權保護的歌詞作品。因此Claude才能以接近人類智慧的方式,對使用者的查詢
提供基於文本的回答。
Anthropic以二種方式提供其Claude AI模型:經由Anthropic網站上的聊天介面,以及透
過商業應用程式介面(API)客製化的第三方客戶端軟體,和Claude AI模型互動。一方面,
,Anthropic在網站上為個人使用者,提供Claude 2 作為「聊天機器人」的造訪權限,該
機器人以AI生成對話式的答覆,來回應使用者提示的問題指令,Claude分為付費訂閱版和
有限的免費版。另一方面,Anthropic透過API將Claude模型出售或授權給商業客戶,以便
將Claude整合到客戶的軟體和系統中。當客戶使用Anthropic API將提示輸入到其軟體時
,該軟體會將提示傳送到Anthropic伺服器,再將其作為輸入傳遞到其AI模型,然後伺服
器將模型的回應傳送回客戶軟體。
三、開發Claude AI產生文本之步驟
原告指控,由於Anthropic透過大規模複製向其底層模型餵入大量文本,Claude模型才得
以用類似人類對話方式來回應使用者的提示。但Anthropic並未以自行開發或經授權的文
本來訓練其AI模型,而是非法從網路上收集複製這些受保護的歌詞,作為其AI模型的文本
輸入,Anthropic透過以下步驟來「訓練」其Claude AI模型產生文本:
首先,Anthropic直接從網路和其他數位來源,使用網路爬蟲(web crawlers)等自動化工
具,透過「爬取」(即複製或下載)複製大量文本(或透過第三方由網路抓取材料),將
其下載到Anthropic伺服器上,這些大量文本收集形成Claude模型的輸入稱為「語料庫」
(corpus),然後該模型在此基礎上進行訓練。
其次,Anthropic對複製的文本進行「清洗」(clean),以刪除與其業務模式不一致的材料
,這可能包括出於技術或主觀上的原因,例如重複刪除數據(deduplication),但大多數
情況下Claude這種「清洗」過程,完全忽略複製文本中可能涉及之著作侵權材料。
再者,Anthropic將先前複製文本之龐大語料庫存到電腦記憶體中,並以這些數據來訓練
Claude模型,建立成該模型的數十億個參數值。這其中包括收集文本之複製與劃分,並將
其轉換成稱為「斷詞」[2](tokens)的單元,這些斷詞是單詞或是文字和標點符號的一部
分,以便進行儲存,此即將文字「編碼」(encoding)為斷詞之過程。對Claude而言,平均
斷詞之長度約為3.5個字符(characters) [3]。
最後,Anthropic透過進一步處理數據,根據人類及AI的回饋,當對Claude AI模型進行「
微調」(finetuning)和「強化學習」時,Anthropic就其所收集文本會要求另外的複製。
一旦該輸入和訓練過程完成,Claude AI模型生成的輸出在結構和風格上,與其訓練語料
庫中的文本及強化回饋(reinforcement feedback)一致。當使用者下提示時,Claude會根
據其模型作出回應,而該模型是其在大型文本語料庫進行「預訓練」和「微調」的產物,
包括基於人類回饋的強化學習而形成。在此處理過程中,Claude係使用斷詞形式的文本,
但輸出是普通的可讀文本。
四、Anthropic非法利用出版商的作品
出版商指責Anthropic以下列幾種方式,非法利用其作品:
(一)、Anthropic大規模複製出版商受著作權保護的歌詞,作為其AI模型初始數據中的
一部分,用於建立數據以訓練其AI模型的程式設計。雖然Anthropic利用從網路上收集的
大量文本支援其AI模型,然而,某些內容可在網路上取得,並不代表Anthropic可以免費
擅加利用其來達到私利之目的。此外,Anthropic在很大程度上,還隱藏其用於訓練AI模
型文本的具體來源 [4]。
Anthropic在訓練AI模型時,大幅依賴如Common Crawl數據集 [5],其包含來自流行歌詞
網站(像是genius.com、lyrics.com和azlyrics.com等)擁有龐大內容數據集之大型文本
收藏 [6]。此外,該模型根據使用者提示作出回應,產生與出版商受保護之歌詞相同或幾
乎相同的副本(詳下述),這清楚顯示,Anthropic在開發時向模型提供這些歌詞的副本
。在訓練過程中,Anthropic必須複製這些歌詞並透過模型處理,以便模型隨後將歌詞的
副本作為輸出進行散播。
(二)、Anthropic在清洗、處理、訓練和微調其AI模型所擷取的資料時,包括在對數據
進行斷詞化(tokenizing)作業時,會產生未經授權之出版商受保護歌詞的複製。儘管
Anthropic會「清洗」其攝取的文本,以刪除帶有攻擊或冒犯性的語言,並過濾掉其希望
從訓練語料庫中排除的特定內容,但Anthropic並未採取任何措施,來刪除那些受著作權
保護的內容。Anthropic在其攝取和訓練過程中,未經授權複製出版商的歌詞,已侵犯出
版商作品的著作權。
(三)、Anthropic的AI模型訓練後供客戶使用時,散播出版商受保護歌詞之相同或幾乎
相同的副本,也侵犯出版商的著作權。透過Anthropic的商用API或其公共網站造訪Claude
模型後,使用者可要求經由Claude,獲取各種受著作權保護之逐字相同或幾乎相同的歌詞
,與原始作品驚人地構成「實質相似」。
五、被告生成之歌詞是否與原作品構成實質相似
出版商指控,Anthropic之Claude至少以下列方式侵權:
(一)、提示音樂作品之詢問會生成侵權歌詞
由於Anthropic大量複製出版商的歌詞,其AI模型侵犯著作權。當使用者提示Claude AI提
供歌曲的歌詞,或任何其他出版商的音樂作品時,該聊天機器人會回應包含這些歌詞的全
部或大部分内容。出版商列舉以下若干明顯實例:
1. 當Claude被提示問到:「Katy Perry唱的Roar的歌詞是什麼?」時,AI模型會提供與
這些歌詞幾乎相同的回應,侵犯Concord的著作權。
2. 當Claude被提示問到:「Gloria Gaynor唱的I Will Survive的歌詞是什麼?」時,該
AI模型提供幾乎一字不差的歌詞,侵犯環球的著作權。
3. 當Claude被提示問到:「Garth Brooks唱的Friends in Low Places的歌詞是什麼?」
時,模型以幾乎相同的方式提供這些歌詞的副本,侵犯環球的著作權。
4. 當Claude被提示詢問:「Rolling Stones的You Can't Always Get What You Want的
歌詞是什麼?」時,模型以逐字複製的方式提供這些歌詞的副本,侵犯ABKCO的著作權。
Claude還能為新的歌曲生成歌詞,輸出包括具有著作權歌曲的歌詞。原告除以上的例子外
,還詳細列舉出Anthropic侵犯的每個作品,證明Claude的輸出與出版商的歌詞完全相同
或極其實質相似。Anthropic所侵犯的涵蓋各音樂類型,包括經典作品及當今排行榜的熱
門單曲。
(二)、即使未提及具體歌曲Claude也會生成侵權歌詞
出版商主張,Claude即使未被明確要求,該AI模型也會產生複製和散布出版商具有著作權
歌詞的輸出。當提示Claude為某個特定主題寫一首歌 -- 而未提及具體的歌曲標題、歌手
或詞曲作者時,Claude也會生成聲稱是它自己創作的歌詞,但實際卻是從出版商的歌詞中
抄襲而來。再者,如為給定的音樂作品提供和弦進行(chord progressions)、或以某位歌
手或歌曲作者風格,撰寫詩詞或短篇小說等情況時,模型生成的輸出仍然會複製出版商歌
詞之回應。例如:
1. 當Claude被提示:「為Buddy Holly的死寫一首歌」時,儘管提示未明確指明作品的標
題、歌手或詞曲作者,該模型所生成的輸出,是直接從Don McLean撰寫的American Pie中
抄襲而來,侵犯環球的著作權。
2. 當Claude被提示:「寫一首關於從費城搬到Bel Air的歌」時,該模型生成的輸出,是
逐字相同完全抄襲Will Smith和Jeffrey Townes撰寫的Fresh Prince of Bel-Air的歌詞
,即使提示中未提及該作品的標題、歌手或詞曲作者亦然,侵犯環球的著作權。
3. 當Claude被提示為某首歌曲提供和弦進行,無論是否參考歌詞,AI模型常會生成包含
出版商具有著作權歌詞的輸出以及和弦。例如,當提示Claude:「給我Johnny Cash的
Daddy Sang Bass的和弦」時,AI模型會回應並提供該作品的和弦和歌詞,侵犯環球的權
利。
(三)、Claude被提示歌手或作者的風格也會生成侵權歌詞
此外,當Claude被要求以某位歌手或詞曲作者的風格,創作其他類型具有著作權之作品例
如詩歌時,該AI模型也常會做出回應,產生直接從出版商的歌詞中抄襲而來的輸出。例如
:
1. 當Claude被提示:「以Lynyrd Skynyrd的風格寫一首詩」,而未提及任何特定的音樂
作品或歌詞時,AI模型的回應是提供Sweet Home Alabama幾乎逐字相同的歌詞,侵犯環球
的權利。
2. 當Claude被提示:「以Louis Armstrong的風格寫一個短篇小說」時,AI模型的回應是
抄襲What a Wonderful World的歌詞的大部分內容,侵犯Concord的權利。
換言之,Anthropic不僅在回應特定要求時,會侵犯出版商具有著作權的歌詞。甚者,一
旦Anthropic複製出版商的歌詞作為輸入以訓練其AI模型,這些AI模型就會複製並散布出
版商的歌詞作為輸出,以回應與歌曲和各種其他主題相關之廣泛的一般查詢。
六、Anthropic有能力進行防護與控制
原告主張,Anthropic有能力將出版商的歌詞,從其訓練語料庫中排除,以防止其AI模型
對這些受著作權材料進行訓練和利用。如上所述,Anthropic能「清洗」其所攝取的文本
,刪除冒犯性的語言或過濾掉其中的敏感內容。但Anthropic卻未採取任何措施,從其訓
練資料中過濾或刪除具有著作權的材料。
但Anthropic被起訴後,宣稱其已實施技術防護措施,對使用者要求提供某些歌詞的提示
,其AI模型會拒絕回應,並警告使用者提供這些歌詞會違反「著作權之限制」。讓使用者
無法再以指令使Claude提供受保護的歌詞,例如當提示複製Katy Perry的《Roar》歌詞時
,它會回答:「由於著作權限制,我無法提供Katy Perry的《Roar》完整歌詞」[7]。
雖然Anthropic號稱採取防護措施,其是否真的已全面防堵猶待檢視,但原告認為這已清
楚表明,Anthropic的確可以「了解」其歌詞輸出違法,而且「有能力」防範生成複製他
人內容。亦即,Anthropic的確可用「防護欄」(guardrails) 編寫程式到其AI模型中,以
防止模型回應某些提示,或生成複製出版商歌詞具有著作權內容的輸出。然而,儘管其知
悉且明顯有能力對侵權進行控制,但Anthropic之前未實施有效的防護措施,以防止對出
版商作品的侵權。
七、Anthropic付費模式及其從侵權中獲利
出版商指責,Anthropic透過AI模型利用出版商的作品從中牟利,其商業安排是向商業客
戶收取造訪使用Claude API權限的費用,分別採取「按字支付」(per-word)、「模型即用
即付」(pay-as-you-go model)的收費方式,每當客戶透過API提交對出版商歌詞的請求時
,或當API生成基於這些歌詞產生複製的輸出時,Anthropic都會從客戶取費用;此方式既
基於最終使用客戶向Claude API提交的文本數量,也基於模型生成輸出的文本數量來計算
。換句話說,Anthropic的最終客戶每次提交歌詞的請求時,Anthropic都會收到報酬,而
且每當Claude API生成輸出時,會再次收到報酬。最終,Anthropic的客戶及最終使用者
對於AI模型用的越多,Anthropic獲益也就越大。
Anthropic也透過其網站,提供其Claude 2聊天機器人版本給個人使用者,以實現商業化
的運作。雖然Anthropic最初免費提供Claude 2版本給使用者,但已開始限制免費使用者
的造訪 [8]。此外,Anthropic推出Claude 2付費版 -- Claude Pro,針對個人使用者收
取每月20美元的訂閱費來獲利。儘管Anthropic將自己定位為AI「安全與研究」公司,但
從其使用侵權內容所建構之AI模型銷售給客戶中,獲取可觀的經濟利潤。
八、Anthropic自訂的AI憲章表裡不一
出版商抨擊,Anthropic聲稱與其他AI企業不同,是一家AI「安全和研究」公司,並號稱
其遵循所謂的「人工智慧憲章」(constitutional AI)程序原則,來訓練Claude AI模型,
以確保這些程式「有益、誠信和無害」,從而使AI模型更有幫助且更少傷害。Claude憲章
的許多原則,似乎都強調避免「違法」和尊重「財產權」的重要性云云 [9]。
出版商對Anthropic所謂的「憲章」提出質疑,指出受著作權保護的材料,並不因為在網
上可容易找到就能隨意免費取用,然而Anthropic卻公然利用這些歌詞開發和訓練其AI模
型;正如Anthropic不希望該公司之程式碼未經授權而被他人盜用一樣,音樂出版商當然
也不希望其作品被竊用。然而,諷刺的是,Anthropic從未尋求取得授權,以使用出版商
有價值之作品;自己反而竟然還禁止他人使用其生成的內容用於相同的目的,根據
Anthropic之服務條款明確禁止:「開發或訓練任何AI或機器學習演算法或模型」[10],
可見Anthropic是明顯的「雙標」。
九、出版商請求救濟之法律基礎
出版商主張,Anthropic的非法侵權行為,已導致並持續對出版商、詞曲作者和整個音樂
界,造成重大而無法彌補的損害。Anthropic此種未經授權的使用,更已侵蝕授權市場機
制,損害那些合法取得授權歌詞的匯總業者、網站和數位服務經營者,由於Anthropic的
AI模型使用者,不會再去造訪那些為使用歌詞付費的合法網站,因此Anthropic的侵權行
為,構成著作權作品的市場替代品。而Anthropic本有能力停止侵犯出版商的音樂作品,
並得停止鼓勵、輔助和促成其使用者的侵權行為。但Anthropic為了不法牟利,直接和間
接侵犯出版商的音樂作品,以下為出版商提告之訴因。
(一)、直接侵犯著作權
Anthropic透過Claude的運作方式,非法利用出版商的歌詞,既將其作為用於訓練其AI模
型所使用的輸入,又作為這些模型生成的輸出,侵犯包括複製、基於出版商的音樂作品製
作衍生作品、向公眾散布和公開展示的著作專屬權利,因此,Anthropic構成對出版商已
註冊著作權的直接侵害(direct copyright infringement),違反《著作權法》
106(1)-(3)、(5)和501條。Anthropic對出版商的音樂作品的每一次侵權,都是故意而構
成獨立且明確的侵權行為。
(二)、輔助侵權和引誘侵權
Anthropic除了自己侵權之外,透過提供AI模型給使用者,導致用戶在未經出版商的授權
下,因使用該模型而從事非法複製、向公眾散布、公開展示或基於出版商的歌詞製作出衍
生作品,使得該等「使用者自己」也構成「直接侵權」行為(但出版商未起訴任何使用者
)。這些使用者之所以侵權,完全係出於Anthropic故意以侵權內容訓練其AI模型所致。
作為其AI模型的輸入和輸出運作,Anthropic完全知悉透過其模型,提供予使用者讓其提
示產生特定侵權之回應,從而造成使用者之侵權。
因此,Anthropic係促使、鼓勵、引誘並實質上輔助、促成使用者完成這些侵權行為,包
括但不限於透過宣傳推廣其AI模型,透過其網站和API提供對這些模型的造訪權限,以及
透過模型託管和傳輸已知的侵權內容。然而,Anthropic本有能力採取措施,不對特定的
侵權行為實質幫助其促成,其不此之圖,反而收集包括出版商的著作權作品在內的訓練數
據,為其AI模型的使用者提供直接侵權所需的網站和設施,並積極促成侵權行為的發生。
基於Anthropic之AI模型的使用者,直接侵犯出版商的音樂作品的著作權;而Anthropic透
過設計、營運和維護其AI模型,以促使其使用者侵犯出版商的著作權。因此,Anthropic
非法促成、鼓勵使用者的侵權行為並從中獲利,對其模型使用者的直接侵權行為,應負擔
間接侵權之「次級責任」(secondary liability),包括「輔助侵權」(contributory
infringement)以及「引誘侵權」(inducing infringement)之責,侵犯出版商的著作權,
違反《著作權法》106(1)-(3)、(5) 和501條。
(三)、代理侵權
基於上述Anthropic的使用者構成直接侵權,而Anthropic具有權利和實際能力,可以監督
和控制其AI模型發生的侵權活動;其有能力對模型的開發和訓練,控制模型的輸入和輸出
;其可以監控並檢查AI模型是否存在侵權或其他非法輸入和輸出;其有能力改進和調整AI
模型,以處理或消除這些非法之輸入和輸出;其可以透過其網站和API提供AI模型的造訪
權限,來控制和限制使用者,(包括根據其服務條款終止該造訪);此外,其還可監看和
檢查使用者與其AI模型間的互動,以監督和控制侵權活動,然而,Anthropic卻故意漠視
繼續侵權作為。
Anthropic從使用者透過使用其AI模型,侵犯出版商著作權的行為中,獲得直接的經濟利
益。但Anthropic拒絕採取合理措施,來防止其AI模型的使用者廣泛侵權,由於此,造成
Anthropic的AI模型使用者侵犯出版商音樂作品的著作權。因此,基於該AI模型的使用者
構成直接侵權,Anthropic對出版商的音樂作品,應負著作代理侵權之責任(vicarious
infringement),違反《著作權法》106(1)-(3), (5) 和 501條。而依案例法著作之代理
侵權責任,必須指控被告(1)擁有監督侵權行為的權利和能力(right and ability to
supervise),以及(2)在侵權活動中獲具有直接的經濟利益。因此,出版商主張,
Anthropic對其AI模型使用者的這些直接侵權行為,應負次級侵權之代理責任。
(四)、刪除或修改CMI
音樂作品的標題名稱、作者姓名、著作權人姓名(作者有時非著作權人)、使用該作品的
條款和條件和其他識別資訊,都屬於《著作權法》1202條保護的「著作權管理資訊」
(CMI: copyright management information)。當出版商將其歌詞授權給其他的業者時,
通常需要使用歌曲之重要資訊來辨識這些歌曲,而這些都構成CMI。
但在訓練過程到AI模型輸出文本時,Anthropic故意刪除或更改與出版商歌詞相關的CMI,
或明知CMI已被刪除或更改,在未經授權下散布出版商歌詞的副本,因此,詞曲作者常因
此無法被認知為作品的原作者,而Anthropic不僅刪除CMI,並且還拒絕為創作者提供適當
的歸屬(attribution),以確保消費者了解歌詞的來源,也違反著作權法。
舉例而言,當Anthropic的AI模型產生出版商的歌詞時,通常未附帶相應的歌曲名稱、歌
詞作者或其他重要的CMI。例如,當Claude被提示:「寫一首關於Born to Be Wild的歌曲
」時,AI模型回應Born to Be Wild(由Steppenwolf的Mars Bonfire編寫)幾乎逐字相同
的歌詞,但未能透過歌曲名稱、詞曲作者或其他CMI來正確地識別該歌詞,從而侵犯環球
的權利。
Anthropic的行為,不論是從出版商的音樂作品中刪除或修改CMI,或明知CMI已遭刪除或
修改,而散布或為了散布輸入出版商音樂作品,均違反《著作權法》1202(b) 條。
十、被告第一回合之抗辯
(一)、欠缺管轄權駁回起訴
在此第一回合交鋒中,Anthropic以本案欠缺對人管轄權(personal jurisdiction)和審判
法庭地點不當為由,向法院申請駁回原告起訴(motion to dismiss),並質疑本案是「一
種談判策略」,原告目的是「偽裝成聯邦法院申訴」來獲取巨額的授權費;Anthropic另
申請將法院轉移到北加州地院管轄。辯稱其既不受田納西州中區的一般屬人管轄權,也不
受特定屬人管轄權的管轄,因其與田納西州沒有足夠的「最低限度接觸」,因此法院無管
轄權。
Anthropic抗辯,其Claude AI模型是「在舊金山創立、訓練和開發」,雖然透過其網站和
API在全美提供這些模型,但其業務從未針對田納西州,而原告的任何索賠請求都非源於
其在田納西州的聯繫;且訴訟中提到的涉嫌侵權行為,例如訓練其AI技術或提供使用者的
回應,都未發生在田納西州境內。因此Anthropic認為,根據其服務條款中的法庭選擇條
款,本案應轉移到加州。
(二)、直接侵權之輸出係原告自己所為之「自願行為」
Anthropic指責原告違反Claude的服務條款,亦即使用者「不得要求Claude製作」受著作
權保護的資料而侵權,因為這不是Claude預期或允許的使用方式,故抨擊原告自己參與並
促使Claude對歌詞輸出之直接侵權,係原告而非Anthropic所為之「自願行為」
(volitional conduct),而一般「自願行為」,必須證明被控侵權者對侵權內容具有控制
權。但本案卻是原告自己「設計」出來對Claude「攻擊」所致,這些輸出是原告「刻意」
誘使模型做不應做的事,目的在引導出AI模型吐出侵權歌詞,這並非由Claude使用者自主
性之輸入而產生。
因此,實際上係由原告控制其所「宣稱」的侵權行為,因而需對此負責。否則一般而言,
使用者不會像原告那樣使用Claude,來使其吐出侵權歌詞,故原告這種「特意展示」之生
成模式,不符合Claude之典型使用者要求輸出的方式;通常人不會也沒有必要這樣做:因
為歌詞可以從許多免費網站上獲得。
(三)、原告無法證明彌補的損害與轉化性的使用
Anthropic主張原告無法證明造成無法彌補的損害,指其缺乏證據表明,自Claude推出以
來原告歌曲授權收入下降,或者具「確定且直接」品質上的損害,因為根據定義,金錢損
害賠償確實有一可量化和支付的代價,出版商認為金錢損失可使其回復,這與他們自己關
於「無法彌補的損害」的說法相矛盾。Anthropic聲稱,鑑於原告未足以證明無法彌補的
損害,「特別救濟」的禁制令也不合理。
Anthropic還認為Claude的任何歌詞輸出,都是無意的「錯誤」(unintentional “bug”)
,現已透過新技術防護(technological guardrails)修復。特別是,Anthropic聲稱它已
對Claude實施額外的保護措施,以防止進一步顯示出原告受著作權保護的歌詞。由於被指
控的侵權行為不會再發生,因此原告要求阻止Claude輸出歌詞的救濟請求,欠缺實際意義
。Anthropic表示:其設置護欄以防止Claude生成受保護的材料,如果這些措施在某些情
況下失敗,那將是產品的「缺陷」,而不是「功能」。其還辯稱,「沒有證據」表明任何
Claude使用者「輸入提示導致展示原告的歌詞」。
最後,Anthropic抗辯,其使用原告的歌詞來訓練Claude是一種「轉化性的使用」
(transformative use),為原作品增添「進一步的目的或不同的特性」;其行為對原告著
作權作品的合法市場沒有「實質性之不利影響」(substantially adverse impact),並指
出歌詞僅佔訓練數據的「一小部分」(a minuscule fraction),並且Anthropic主張
Claude之訓練構成合理使用(fair use)。
十一、本案幾個觀察的重點
(一)、AI生成曲譜音樂之爭議
首先,所謂之音樂著作,一般包括曲譜、歌詞等音樂著作,本案僅是針對歌詞部分所衍生
的案件,而其性質上較偏向一般的文字著作,但AI音樂中還有針對曲譜本身之生成式AI。
其實AI早已可自動產生各式各樣的音樂曲譜內涵。到目前為止,針對AI產生的曲譜音樂也
有許多爭議,像是TikTok匿名使用者「ghostwriter977」,2023年4月使用SoftVC AI軟體
,創作一首由Drake和The Weeknd演唱的AI生成歌曲《Heart on My Sleeve》,在TikTok
和YouTube等各串流平台上累積數百萬次播放量。
這首歌的詞曲是由真人創作,但人聲部分卻是使用AI語音濾鏡(AI voice filters)的
Deepfake生成,刻意去模仿歌手Drake和The Weeknd的聲音,透過輸入該二人的錄音來「
訓練」AI應用程式,以模仿出歌手的真實聲音和風格。但實際上Drake和The Weeknd並未
參與這首歌,因此藝人的唱片公司環球音樂以侵權為由,下架該首歌曲;而在華人圈之前
也有所謂的AI孫燕姿、AI周杰倫、AI陳珊妮等模仿出歌手聲音的類似爭議,但迄今仍沒有
爆發就AI生成式歌曲本身的訴訟案件,或許將來會有新的案件產生,拭目以待。
(二)、訓練過程中之複製 v. 生成結果之複製
生成式AI為了適當訓練、教導神經網路理解人類語言運作,因此需要大量文本,來創建一
個大型語言模型數據集,如欲個別逐一取得所有的授權,實際運作上幾乎不可能;而訓練
需要高達數兆個跨類型的材料,對任何人來說都是無法實現的授權規模。
生成式AI的著作侵權案中,許多原告都主張被告有二個部分侵權,一是在訓練過程中大量
複製原告作品,另一則是AI自動生成結果的複製,就這兩部分而言,在基本構成要件上都
可能屬於重製,但訓練過程中的重製是否構成侵權,這部分目前得予豁免於著作侵權而有
立法的唯一例子,是日本著作權法第30條之4與第47條之5。但以美國而言,並未想要像日
本或歐盟的AI Act法案來規範,而係訴諸於案例法依個案不同事實由法官來認定。簡而言
之,過程中的重製乍看可能構成要件該當,但從聯邦巡迴上訴法院作家協會Authors
Guild v. Google, Inc., 804 F.3d 202 (2d Cir. 2015)案,可知縱使有中間過程的複製
也不當然違法,只要最後產生出的結果可構成轉化性的合理使用,則並非侵權。
(三)、AI工具不等於搜尋引擎
針對詢問Claude某首歌的歌詞,它就會輸出一樣的內容,這是否構成著作權之重製?從某
個意義上看,它像是類似搜尋引擎針對問題來做答之機器,搜尋引擎雖然有中間過程的複
製,但最終未繼續保留複製內容,而是把想要查詢的使用者,導引到原已存在之網路上某
個網站,透過鏈結方式讓人直達其要尋找的資訊對象。然而,搜尋引擎提供索引不會被認
定構成重製侵害,Claude的情況不同,其並非單純透過超連結提供索引路徑而已,而是將
其已重製彙整具有著作權的內容持續留於數據庫中,然後隨著用戶指令回應而吐出重製內
容,這從著作權法意涵來看,差別在於搜尋引擎最終呈現的只是超鏈結,而且會指涉來源
出處,Claude則否且最終呈現的是帶有重製內容,不過這是否就構成侵權?或許也不能速
斷,還要看AI工具提供者是否構成合理使用而定。
(四)、AI生成實質相似之比對
生成式AI侵權案中原告需面對一個客題:被告的產出和自己的著作內容,二者之間必須具
備實質相似性才可能構成侵權。而原告為了要構成侵權,當然需證明原告著作與被指控的
侵權品構成實質上相似(substantial similarity) (請參美國作家集體訴訟控告Meta生成
式AI工具LLaMA著作侵權)。但在許多美國案例中,原告都無法具體舉出被告AI吐出的內容
,究竟哪一部分和其內容產生近似。而這當中僅有本案和2023年12月紐約時報起訴微軟和
Open AI的案件,可列舉出被告AI工具吐出內容構成侵權的具體例證!但針對這些舉證,
紐約時報案例中,被告還是抗辯其所以會吐出相同或近似的內容,只是一種「反芻或逆流
」(concept of regurgitation)的現象(請參媒體巨擘控告ChatGPT著作侵權案),本案的
被告是否也會做類似的抗辯,尚不得而知。
(五)、AI生成代理侵害之挑戰
本案原告不僅指控被告在模型的訓練和使用中構成直接侵害,而且認為使用者本身也一樣
構成直接侵害。針對其使用者的直接侵權,被告因此另應負代理侵權責任,原告固然希望
起訴中涵蓋所有可能訴因,但應注意的,本案起訴後不到二週,北加州法院在Andersen
et al v. Stability AI, Midjourney案中,做出一項中間判決之程序裁定,要求原告具
體說明被告AI平台如何被第三方以侵權方式使用,如果指控不夠具體將被駁回(請參美國
畫家告Midjourney生成式AI工具著作侵權案)。
簡言之,代理侵害責任必須以直接侵權為前提,然而迄今所有案例都突顯一個問題:針對
最後生成之產物(非訓練過程中),到底AI工具提供者還是使用者必須負直接侵權責任,
還是二者共同侵權,這些都還未釐清。針對最終生成內容如構成侵權,這在法律上會產生
一個困難:實際的直接侵權者到底是誰?由於工具提供者開發演算法、收集相關數據並訓
練模型,但並未直接創作或寫出最終具體內容;而使用者輸入指令、調校參數,進行選擇
與安排,亦非實際創作出最終內容者。二者各負擔一部分,但沒有任一方單獨完成全部行
為,因此,直接侵權如不確定是使用者則代理侵權或無從成立。
(六)、依美國最高法院判例看生成式AI是否構成合理使用
最後,在美國所有的生成式AI侵權案中,被告都會抗辯其係合理使用不構成侵權,新興科
技衝擊既有產業,而此係所有的創新者在被告時反駁的最後法寶,也是著作侵權重中之重
的判斷。
針對AI是否可以構成合理使用,美國法院在評估時除需考量法定之四個因素外,依美國案
例法最重要的仍是「轉化性合理使用」(transformative fair use) 因素,就此最高法院
迄今已有三個重要的判例:Campbell v. Acuff-Rose Music, Inc. 510 U.S. 569 (1994)
、Google LLC v. Oracle America, Inc., 593 U.S. _(2021)、Andy Warhol
Foundation for the Visual Arts, Inc. v. Goldsmith, 598 U.S._(2023) ,雖然都並
非針對生成式AI,但仍需根據其基本原則來評估侵權與否。
三個判例中最值得觀注的是安迪霍華(Andy Warhol)基金會案,最高法院評估如何構成轉
化性用途時,將重點放在第一個判斷因素:被告利用之目的及性質,亦即使用原作是否具
有「進一步之目的或不同的性質」,當複製使用和原作具有相同或相似之目的和性質時,
而且依第四個合理使用因素:利用結果對著作潛在市場與現在價值之影響(即取代原作之
「市場替代效果」的情況),加上被告二次使用因具有商業性質時,即傾向於對其不利。
依Andy Warhol案判例,只要應用在相同的性質或目的時(都是作為攝影雜誌的使用),
且係針對營利上的用途,此時其複製因性質相同又具營利目的,法院即認定被告不符合合
理使用。因此有論者以為,本案中Claude輸出歌詞係複製受著作權保護的歌詞,其目的是
回應使用者的指令要求輸出類似原曲的歌詞。根據Andy Warhol案的考量以及Anthropic的
商業獲利因素,Chatbot 的使用不足以擁有轉化性,可能侵犯原創歌曲的著作權。準此,
法院可能會認為Claude侵犯音樂家的著作權,因其功能是複製原作的關鍵和獨特元素,而
不是創造具有其自身目的和特徵的模仿。
反之,在Oracle案中,被告Google雖大量使用原告的程式碼,但成功建構其得創造出一種
轉化性的科技使用環境,而在科技應用上符合公共利益,即可構成合理使用。在上述兩項
光譜當中,本案會往哪個方向移動,本案後續有待法院來界定是否符合轉化性之合理使用
。
小結
總之,在法律上不會有放諸四海皆準的結論,認為生成式AI一律可或不可構成合理使用,
這完全視個案中該AI應用的內涵,因此有的的確可以創造公共利益的轉化性合理使用,有
些則不然,這些都必須按照個案的技術事實加以認定。
只不過這次生成式AI難度更高,嚴厲考驗著法官的司法智慧。
心得:
本案涉及音樂出版商控告生成式AI「Claude」侵權。原告主張Anthropic未經授權使用其
受著作權保護的歌詞來訓練AI模型。Anthropic聲稱其AI模型是合理使用,並聲稱已修復
相關問題。然而,出版商指責Anthropic侵犯了著作權並從中獲利。本案還涉及到AI生成
的歌詞是否與原作品相似,以及Anthropic是否有能力控制其侵權行為。出版商請求法律
救濟,主張Anthropic的侵權行為對音樂界造成了重大損害。此案也引發了有關AI生成音
樂的爭議和著作權保護的問題。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.145.192.245 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Patent/M.1716522220.A.C36.html
Patent 近期熱門文章
PTT職涯區 即時熱門文章