[新聞] AI與畫家智財訴訟案例系列3:美國畫家告M

看板Patent (專利)作者 (H)時間8月前 (2024/03/08 07:50), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/1
戰程序判決吞敗 原文網址: https://bit.ly/4c7EVwI 原文: 自ChatGPT崛起造就AIGC (AI Generated Content)的百花齊放,導致許多新創公司站在AI 浪尖上聲名大噪,像Midjourney和Stability AI推出的穩定擴散(Stable Diffusion)圖像 生成(還有OpenAI的DALL-E),可讓使用者以文生圖、以圖生圖,自動產生媲美專業畫家 的圖像,讓Midjourney夯到不行,是目前業界頂尖的龍頭代表。 但也正因太火而產生智財爭議訴訟,美國三位藝術家對Stability AI、DeviantArt和 Midjourney所開發之生成式AI工具,於2023年1月向北加州聯邦地院提告著作侵權 [1], 而各被告都提出駁回原告起訴之動議(motion to dismiss,被告於案發初始階段,主動 要求法院直接駁回起訴,目的在省卻曠日費時之冗長程序,如成功即可提早終結官司), 業經法院於2023年10月底,做成中間判決性質之程序裁定。本刊前已介紹Stability AI和 DeviantArt部分,本文續對Midjourney進行分析。 本案涉及之Midjourney產品 Midjourney公司總部位於舊金山,其於2022年7月推出的Midjourney產品,初期以測試版 形式問世隨後轉型為商業產品。Midjourney的AI工具能根據文本提示(prompt)生成專業水 準的圖像。起初是在Discord社群建立機器人,隨後快速轉向商業應用,短短半年內吸引 超過千萬付費註冊帳戶,成為引人矚目年營收達1億美元的企業(但這家傳奇性的公司正 式員工僅11人)。 原告聲稱,Midjourney產品是一款線上AI圖像生成器,透過不同迭代版本使用穩定擴散技 術,根據文本提示生成圖像。目前版本是在圖像子集上使用穩定擴散進行訓練,該圖像產 生器以文本提示輸入,生成數位圖像輸出,係完全依賴穩定擴散作為其生成圖像的基礎軟 體引擎,再向網路聊天系統Discord的線上使用者及透過應用程式之提供來收費。 Midjourney的執行長曾表示,該公司使用大型開放數據集,已「暗示」使用LAION數據集 進行訓練,2022年8月Midjourney發布使用穩定擴散之測試版。 本案涉及之擴散技術原理 原告起訴狀指出,「擴散」(diffusion)是一種特定機器學習應用的模型技術,以軟體生 成與訓練數據中圖像相似之輸出圖像,該模型存儲訓練數據集中每個項目的壓縮副本。此 擴散技術係由史丹佛大學Jascha Sohl-Dickstein領導的一組研究人員於2015年發明,並 在其論文中介紹「使用非平衡熱力學(Nonequilibrium Thermodynamics)的深度非監督式 學習 (Deep Unsupervised Learning)」,該技術可應用於任何類型的數據,但該論文是 集中在數位圖像之應用。 擴散分二個階段進行,第一階段是攝取圖像,並透過系列步驟逐漸向其添加更多雜訊( noise即噪聲,指看到的而非聽到的東西,係混亂和無結構的隨機波動(random fluctuations)),在每個步驟中,程式會添加噪聲(addition of noise,即「加噪」) 來改變圖像;到最後一步驟,圖像已經「擴散」成本質上隨機式的噪聲(random noise)。 第二階段與第一階段相似但次序相反,透過眾多步驟將特定圖像變成噪聲的過程後再回溯 運行,亦即,將隨機噪聲以相反順序應用這些步驟,隨著逐漸去除噪聲數據(denoises, 即「去噪」),程式最終還原重新組合成該原來之圖像。起訴狀中摘自Sohl-Dickstein論 文,使用螺旋圖像作為訓練數據說明擴散過程的二個階段如下圖。 https://imgur.com/a/9c0cd79 第一行(藍色螺旋)從左到右讀取,描繪擴散第一階段,噪音逐漸添加到螺旋圖像中(其 未顯示當中的每個步驟)。中間的圖像顯示擴散過程中途的螺旋,最右邊的圖像顯示擴散 過程結束- - 螺旋變成一隨機噪聲場域。 第二行(紅色螺旋)從右到左讀取顯示相反過程:隨機噪聲(最右邊的圖像)逐漸取消擴 散,透過反轉第一階段學習步驟的次序來「去噪」。中間的圖像顯示中途點(halfway point)的去噪過程,第二行最左邊的圖像,顯示去噪過程的最終結果:原始螺旋再次回復 出現。 原告指控被告之AI生成工具,即以上述運作方式複製其著作權圖像來自動生成侵權圖像。 原告對Midjourney直接侵權之指控 原告指控:Midjourney的訂閱者可透過造訪其Web應用程式,然而問題在於,它是依賴盜 用藝術家創作之數百萬張圖像,並將這些圖像用作訓練圖像,因此是從他人受著作權保護 的作品中,重新混合組裝和拼貼產生侵權圖像。當被問及Midjourney如何使用數據集時, Midjourney的執行長僅回答:「這是網路上的一個大規模掃描,我們使用已發布的開放數 據集進行訓練。」 原告針對Midjourney的直接侵權理論為: (1) 透過抓取(即複製)受保護的作品,用於為Midjourney產品訓練圖像所製作出圖像, 而構成直接侵權; (2) 透過發行包含訓練圖像壓縮副本的穩定擴散,作為Midjourney產品的一部分而構成直 接侵權; (3) 透過製作和發行Midjourney產品而構成直接侵權,該Midjourney產品本身就是侵權之 衍生作品; (4) 生成並發行屬於侵權衍生作品的輸出圖像。 針對原告指控Midjourney工具訓練數據集用來輸出圖像,包含接受訓練之受著作權保護作 品的壓縮副本,但Midjourney反駁這是不合理而難以置信的,因為50億張圖像龐大,不可 能被壓縮到一個可執行的程式。針對第一個理論,與關於同案被告Stability AI在LAION 中的角色,以及Stability AI抓取然後在穩定擴散中,使用訓練圖像做聯繫的詳細指控不 同請參本刊:美國畫家控告Stability AI生成式AI工具著作侵權之程序判決出爐,原告對 於Midjourney為其品進行哪些訓練,竟然並無任何事實之陳述。唯一提及的是Midjourney 首席執行官的評論,即Midjourney是使用開放數據集(原告假設這些數據集來自LAION) ,並且在這些數據集上進行訓練。然而,原告宣稱Midjourney所使用穩定擴散之方式,如 :「穩定擴散已在多個程式中被用作軟體庫(software library),包括Midjourney產品」 ;「作品是指用於訓練任何穩定擴散版本的任何圖像,該圖像由被告直接提供或合併到另 一個產品中」云云。 北加州地院對直接侵權之程序裁定 但法院認為以上說法,就原告究竟是基於Midjourney使用穩定擴散,還是基於Midjourney 自己獨立使用訓練圖像來訓練產品,還是二者兼而有之?其主張都太含混不明需要澄清。 因此,法院認為原告對Midjourney的直接侵權指控不夠清楚,原告也未提供事實說明 Midjourney對其AI平台進行哪些訓練,因此在缺乏事實的情況下,法院無法確定 Midjourney是否不當使用原告受著作權保護的圖像。另外,原告對Midjourney的衍生作品 責任理論也有缺陷,原因與法院在討論DeviantArt案時所指出的原因相同請參本刊:美國 畫家控告DeviantArt生成式AI著作侵權首輪程序判決被告占上風。據此,法院核准 Midjourney所聲請駁回直接侵權的動議,但允許原告可予以修改(with leave to amend) 。 法院進而表示,原告除應添加被告產品使用受著作權保護之壓縮副本的事實外, Midjourney將來可能會對直接侵權主張進行更針對性的攻擊。例如,不清楚的是,穩定擴 散是否僅包括可應用於建立圖像的演算法和指令,而這些圖像只含有受著作權保護之訓練 圖像的一小部分元素(a few elements);當Midjourney僅透過其應用程式和網站,將穩定 擴散作為「文庫」(library)提供客戶使用時,其為何需要負直接侵權之責?凡此種種法 院都認為不確定。然而,法院並未完全排除原告可辯護這一指控的可能性,特別指出原告 如能合理地主張,被告的AI產品可讓使用者,透過引用原告姓名的作品來創作新作品,以 及原告受保護的內容究竟係如何、以及有多少留在穩定擴散中被AI最終產品所使用的,則 其立論可能會更堅強。 原告對Midjourney代理侵權之指控 原告指控,使用者透過被告AI圖像工具,輸入原告姓名後就會產生冒充藝術家原作的圖像 ,這些使用者可謂是「冒名頂替者」,而其依賴藝術家的原作品,輸入含有特定藝術家姓 名的提示回應,所產生的冒充圖像就是「偽造品」。因此,被告應知悉其AI工具的功能容 易用來生成偽造品。冒名頂替者出售偽造品使原告因受損,因而被告從AI工具中,直接或 間接地從冒名頂替者的侵權行為中獲利,故其應對第三者的侵權行為,承擔代理侵權 (vicarious infringement)責任。 但法院認為,法律上要對代理侵權行為負著作侵權責任,原告必須指控被告(1)擁有監 督侵權行為的權利和能力(right and ability to supervise),以及(2)在侵權活動中 獲具有直接的經濟利益。參Perfect 10, Inc. v. Visa Int'l Serv. Ass'n, 494 F.3d 788, 802 (9th Cir. 2007)。但問題在於,本案原告針對三位被告之起訴,無分軒輊地將 其看成一體、籠統指控其全都構成代理侵權,但具體上哪個被告基於第三人的何種行為, 得以構成代理侵權卻並未明確指出,且其起訴狀中對不同被告間無區別的指控,常將三位 被告混為一談,難以釐清每個被告究竟誰實際從事何項確切行為,導致法律上可造成間接 侵害,完全混淆不明。 Midjourney因而抗辯,原告指控其代理責任之主張應被駁回,因為依Sound & Color, LLC v. Smith案例,No. 222CV01508ABASX, 2023 WL 2821881, at *16 (C.D. Cal. Feb. 28, 2023),被告不能對自己的直接侵權,承擔間接侵權中之次級責任(secondary liability)。因而,當使用被告的生成式AI產品構成侵權時,只有在對每個被告提出的直 接侵權主張充分表達後,法院才能確定,原告是試圖讓被告對自己的直接侵權承擔次級侵 權之代理責任,還是讓被告對他人使用其產品的直接侵權來負間接侵權之責,凡此,原告 之主張都含糊不清應被駁回。 北加州地院對代理侵權之程序裁定 法院認為,原告基於「冒名頂替者」使用被告工具產生「偽造品」的代理侵權主張,還存 有其他重要問題。因原告的訴狀中未能指控,被告以原告作品製作出基於該作品實際存在 的「偽造品」為何。反之,原告自己起訴狀中還承認:「根據擴散過程的運作原理,一般 而言,對於特定文本指令提示所回應產生由穩定擴散輸出的圖像,不太可能與訓練數據中 的任何特定圖像相匹配而近似(close match)」。亦即原告無法舉出被告AI工具,能生成 任何「實際上」與其構成相同或近似的「偽造品。可見得,原告已不依賴具體作品之實質 相似理論,只能轉而攻擊所有輸出圖像都是衍生侵權作品,然後再補充指控:被告輸出圖 像與原告畫作的「風格」(in the styles)或藝術認同(artistic identities)相似關於風 格相似是否侵權請參本刊「Midjourney與Stability AI擴散模型自動生成引爆著作侵權疑 雲?-- 圖形影像篇」,以至於亦構成「偽造品」。 由於原告並未能對Midjourney提出充分之直接侵權的主張,而有待之後的修改,則法律上 即無從對其提起代理侵權的主張,因為代理責任需要直接侵權行為存在做為基礎。參見 Perfect 10, Inc. v. Yandex N.V., 962 F.Supp.2d 1146, 1158 (N.D. Cal. 2013), as amended (Sept. 6, 2013)。法院指出,由於原告未能釋明被告AI平台,如何被第三方 以侵權方式使用,以致該代理侵權之主張仍存有缺陷。因此,針對原告指控代理侵權之主 張被法院駁回,但法官也網開一面,允許原告進行修正以澄清其理論。 法院特別要求原告修正其理論時,針對這些副本如何在提供給第三方的Midjourney產品中 ,以違反著作權法保護權利的方式呈現、存在或引用,原告必須提供明確和合理的指控, 敘明Midjourney對其產品被第三方使用而承擔代理責任的情況。例如,就他人使用被告AI 工具生成偽造品時,被告為何因此會間接侵權而產生代理責任。此外,法院還提醒原告修 改時,應列出每個被告就其所從事的行為詳細陳述,而不能再將所有的「被告」混為一談 。 此外,Midjourney在其動議聲請中力爭,不應允許原告就其依著作權法中,所規定的表演 權之違反請求提出修正,因為在圖畫作品中不存在所謂之表演權,且原告在反對意見中未 反對Midjourney之駁回聲請。而庭審中,原告請求允許保留其表演侵權理論之指控,法院 雖允許但也明示,在接下來可能的駁回動議中,法院將不會像在這一輪那樣慷慨地允許修 正,法院希望對每項指控及支持指控的每個被告行為,提供更具體的資訊。 本案原告提交修改後之起訴狀 為回應法院的糾正,原告於2023年11月底提交修改的起訴狀,但已和與原來起訴大相逕庭 ,增加七名新的個人原告和一名被告:Runway AI(另一家生成式AI工具公司),原告重 新架構新的主張,刪除著作代理侵權指控(vicarious copyright infringement claim), 代之以著作誘導侵權請求(inducement of copyright infringement claim);還刪除公開 權(right of publicity)和不公平競爭之請求,並添加二項商標法《蘭納姆法Lanham Act 》請求 - - 虛假認可(false endorsement) [2]和替代理企業外觀侵權(vicarious trade-dress infringement)。修改後的起訴書,還提供有關原告聲稱穩定擴散包含「壓 縮副本」或「受保護表達內容」的更多細節,並提供學術論文和Stability AI人員的引用 ,聲稱這些內容支持原告主張,即模型包含受著作權保護的表達。 結論一 - - AI擴散模型對著作侵權認定帶來新的挑戰 最後,就法院對本案三位被告所下的程序判決,總結一些觀點。 擴散模型在圖像、視頻和語音生成領域受到廣泛應用,其技術原理如前述,就是將一副畫 慢慢透過高斯噪聲(Gaussian noise),逐步以添加雜訊方式消除該畫面中的細節(即加噪 ),使原來清晰的圖畫一直拆解到最後變成純噪聲,而無法辨識原圖案的情況,然後再逆 向操作這種分解過程,由後向前回溯慢慢再透過去除雜訊方式(即降噪或去噪),逐漸導 引還原為當初原始清晰的圖案,運行這種反向操作過程,AI就會掌握所有雜訊的特徵,透 過訓練神經網絡完全掌握畫作中的所有相關數據,從而可任意自噪聲中合成數據,畫出任 何所需要的圖像,因為所有資訊特徵都已被AI提取而盡入其囊中。 但也因此,所畫出的東西可能會與原作不相同,但卻又可能保留原畫中一些風格上的相似 ,本案擴散模型的運用,就是產生看似不同但風格相近的圖案,除了訓練過程中進行之中 間複製外,也會涉及著作權另二項核心議題 -- 1. 風格上相似是否可能構成實質相似而 侵權;2. 此種擴散模型被告可否主張構成合理使用而不侵權。 換言之,和傳統著作侵權類型大相逕庭,因為AI運作下之生成創作,已產生新興科技所帶 來前所未見的衝擊,因此如何舊酒裝新瓶是一大挑戰,尚待法院進一步認定。然而對業界 言,著作權法在被修改前,仍必須按照既有遊戲規則,因此設計AI工具就不能出於僥倖, 而應注意如何在過程中多布幾道防線避免踩到侵權地雷。反過來看,如被告能針對新興科 技之應用,創造出符合公共利益促進人類福祉的「轉化性的合理使用」(Transformative Fair Use),依美國過去如第二巡迴上訴法院Authors Guild v. Google, Inc.案、最高法 院Google v. Oracle America案,仍可能豁免於侵權,但究竟是否可以構成,業者必須要 有足夠睿智來判斷以免承擔法律責任請參本刊「Midjourney與Stability AI擴散模型自動 生成引爆著作侵權疑雲?-- 圖形影像篇」。 結論二 - - 北加州地院連續二個AI官司原告都踢到鐵板 值得觀察的是本案之後,同樣北加州地院針對生成式AI的著作侵權案Kadrey, Silverman & Golden v. Meta Platforms, Inc.請參本刊:美國作家集體訴訟控告Meta生成式AI工具 LLaMA著作侵權之程序判決出爐,原告第一回合程序上也吃了敗仗。 這二案原告之所以首戰皆鎩羽而歸,似乎犯了一些錯誤!例如著作權登記,一般作者可能 不會每完成一件作品後都去登記,但當決定起訴時,此基本前提應妥善準備。本案三位原 告的畫作眾多,但最終卻只有其中一位的16幅畫適格作為審理依據!其次,本案原告起訴 狀中雖洋洋灑灑,卻未詳細說明每一被告究竟何處又如何構成侵權?其具體行為如何?針 對三位被告的侵權說明含混不清,由此可見,對他人起訴確不容易。 本案程序判決中法院似想要釐清:被告可否區分為:參與抓取、複製和使用受著作權保護 的作品,來訓練AI模型的公司像Stability;以及將擴散模型程式整合到自己產品中,但 卻未參與抓取、複製經註冊訓練圖像的公司像DeviantArt和Midjourney;抑或是該後二者 也實際參與複製等行為(此皆待釐清);再來則是,此三者法律上為何可能構成間接侵權 ,凡此種種,應是嗣後任何生成式AI侵權訴訟所必須面對的重要課題。 最後要強調的是,AI新興科技所衍生的侵權態樣,和傳統的型態雖有不同!但即便如此, 傳統訴訟所要求的舉證方式,並不會因為是AI而有所改變。換言之,原告起訴必須具體說 明被告究竟產出何種作品,侵害原告哪些著作的哪些內容,而且在原作和侵權品之間,需 建構實質相似性,這是所有著作侵權案件的鐵律,原告不應誤以為在AI的浪潮下,可繞道 避開這方面的舉證!當然,如原告在起訴狀中所提,被告生成式AI產出的圖像,不會和原 告原來畫作相似,則原告只能將焦點置於訓練過程中的大量複製行為,但此仍取決於最終 生成結果是否屬於合理使用,如肯定則該過程中的複製亦不構成侵權! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.145.192.245 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Patent/M.1709855400.A.BA9.html
文章代碼(AID): #1bwbAekf (Patent)
文章代碼(AID): #1bwbAekf (Patent)