[新聞] AI與畫家智財訴訟案例系列3：美國畫家告M

看板Patent (專利)作者stpiknow (H)時間2年前 (2024/03/08 07:50)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串1/1

戰程序判決吞敗原文網址: https://bit.ly/4c7EVwI 原文: 自ChatGPT崛起造就AIGC (AI Generated Content)的百花齊放，導致許多新創公司站在AI 浪尖上聲名大噪，像Midjourney和Stability AI推出的穩定擴散(Stable Diffusion)圖像生成（還有OpenAI的DALL-E），可讓使用者以文生圖、以圖生圖，自動產生媲美專業畫家的圖像，讓Midjourney夯到不行，是目前業界頂尖的龍頭代表。但也正因太火而產生智財爭議訴訟，美國三位藝術家對Stability AI、DeviantArt和 Midjourney所開發之生成式AI工具，於2023年1月向北加州聯邦地院提告著作侵權 [1]，而各被告都提出駁回原告起訴之動議（motion to dismiss，被告於案發初始階段，主動要求法院直接駁回起訴，目的在省卻曠日費時之冗長程序，如成功即可提早終結官司），業經法院於2023年10月底，做成中間判決性質之程序裁定。本刊前已介紹Stability AI和 DeviantArt部分，本文續對Midjourney進行分析。本案涉及之Midjourney產品 Midjourney公司總部位於舊金山，其於2022年7月推出的Midjourney產品，初期以測試版形式問世隨後轉型為商業產品。Midjourney的AI工具能根據文本提示(prompt)生成專業水準的圖像。起初是在Discord社群建立機器人，隨後快速轉向商業應用，短短半年內吸引超過千萬付費註冊帳戶，成為引人矚目年營收達1億美元的企業（但這家傳奇性的公司正式員工僅11人）。原告聲稱，Midjourney產品是一款線上AI圖像生成器，透過不同迭代版本使用穩定擴散技術，根據文本提示生成圖像。目前版本是在圖像子集上使用穩定擴散進行訓練，該圖像產生器以文本提示輸入，生成數位圖像輸出，係完全依賴穩定擴散作為其生成圖像的基礎軟體引擎，再向網路聊天系統Discord的線上使用者及透過應用程式之提供來收費。 Midjourney的執行長曾表示，該公司使用大型開放數據集，已「暗示」使用LAION數據集進行訓練，2022年8月Midjourney發布使用穩定擴散之測試版。本案涉及之擴散技術原理原告起訴狀指出，「擴散」(diffusion)是一種特定機器學習應用的模型技術，以軟體生成與訓練數據中圖像相似之輸出圖像，該模型存儲訓練數據集中每個項目的壓縮副本。此擴散技術係由史丹佛大學Jascha Sohl-Dickstein領導的一組研究人員於2015年發明，並在其論文中介紹「使用非平衡熱力學(Nonequilibrium Thermodynamics)的深度非監督式學習 (Deep Unsupervised Learning)」，該技術可應用於任何類型的數據，但該論文是集中在數位圖像之應用。擴散分二個階段進行，第一階段是攝取圖像，並透過系列步驟逐漸向其添加更多雜訊（ noise即噪聲，指看到的而非聽到的東西，係混亂和無結構的隨機波動(random fluctuations)），在每個步驟中，程式會添加噪聲（addition of noise，即「加噪」）來改變圖像；到最後一步驟，圖像已經「擴散」成本質上隨機式的噪聲(random noise)。第二階段與第一階段相似但次序相反，透過眾多步驟將特定圖像變成噪聲的過程後再回溯運行，亦即，將隨機噪聲以相反順序應用這些步驟，隨著逐漸去除噪聲數據（denoises，即「去噪」），程式最終還原重新組合成該原來之圖像。起訴狀中摘自Sohl-Dickstein論文，使用螺旋圖像作為訓練數據說明擴散過程的二個階段如下圖。 https://imgur.com/a/9c0cd79 第一行（藍色螺旋）從左到右讀取，描繪擴散第一階段，噪音逐漸添加到螺旋圖像中(其未顯示當中的每個步驟)。中間的圖像顯示擴散過程中途的螺旋，最右邊的圖像顯示擴散過程結束- - 螺旋變成一隨機噪聲場域。第二行（紅色螺旋）從右到左讀取顯示相反過程：隨機噪聲（最右邊的圖像）逐漸取消擴散，透過反轉第一階段學習步驟的次序來「去噪」。中間的圖像顯示中途點(halfway point)的去噪過程，第二行最左邊的圖像，顯示去噪過程的最終結果：原始螺旋再次回復出現。原告指控被告之AI生成工具，即以上述運作方式複製其著作權圖像來自動生成侵權圖像。原告對Midjourney直接侵權之指控原告指控：Midjourney的訂閱者可透過造訪其Web應用程式，然而問題在於，它是依賴盜用藝術家創作之數百萬張圖像，並將這些圖像用作訓練圖像，因此是從他人受著作權保護的作品中，重新混合組裝和拼貼產生侵權圖像。當被問及Midjourney如何使用數據集時， Midjourney的執行長僅回答：「這是網路上的一個大規模掃描，我們使用已發布的開放數據集進行訓練。」原告針對Midjourney的直接侵權理論為： (1) 透過抓取（即複製）受保護的作品，用於為Midjourney產品訓練圖像所製作出圖像，而構成直接侵權； (2) 透過發行包含訓練圖像壓縮副本的穩定擴散，作為Midjourney產品的一部分而構成直接侵權； (3) 透過製作和發行Midjourney產品而構成直接侵權，該Midjourney產品本身就是侵權之衍生作品； (4) 生成並發行屬於侵權衍生作品的輸出圖像。針對原告指控Midjourney工具訓練數據集用來輸出圖像，包含接受訓練之受著作權保護作品的壓縮副本，但Midjourney反駁這是不合理而難以置信的，因為50億張圖像龐大，不可能被壓縮到一個可執行的程式。針對第一個理論，與關於同案被告Stability AI在LAION 中的角色，以及Stability AI抓取然後在穩定擴散中，使用訓練圖像做聯繫的詳細指控不同請參本刊：美國畫家控告Stability AI生成式AI工具著作侵權之程序判決出爐，原告對於Midjourney為其品進行哪些訓練，竟然並無任何事實之陳述。唯一提及的是Midjourney 首席執行官的評論，即Midjourney是使用開放數據集（原告假設這些數據集來自LAION），並且在這些數據集上進行訓練。然而，原告宣稱Midjourney所使用穩定擴散之方式，如：「穩定擴散已在多個程式中被用作軟體庫(software library)，包括Midjourney產品」；「作品是指用於訓練任何穩定擴散版本的任何圖像，該圖像由被告直接提供或合併到另一個產品中」云云。北加州地院對直接侵權之程序裁定但法院認為以上說法，就原告究竟是基於Midjourney使用穩定擴散，還是基於Midjourney 自己獨立使用訓練圖像來訓練產品，還是二者兼而有之？其主張都太含混不明需要澄清。因此，法院認為原告對Midjourney的直接侵權指控不夠清楚，原告也未提供事實說明 Midjourney對其AI平台進行哪些訓練，因此在缺乏事實的情況下，法院無法確定 Midjourney是否不當使用原告受著作權保護的圖像。另外，原告對Midjourney的衍生作品責任理論也有缺陷，原因與法院在討論DeviantArt案時所指出的原因相同請參本刊：美國畫家控告DeviantArt生成式AI著作侵權首輪程序判決被告占上風。據此，法院核准 Midjourney所聲請駁回直接侵權的動議，但允許原告可予以修改(with leave to amend) 。法院進而表示，原告除應添加被告產品使用受著作權保護之壓縮副本的事實外， Midjourney將來可能會對直接侵權主張進行更針對性的攻擊。例如，不清楚的是，穩定擴散是否僅包括可應用於建立圖像的演算法和指令，而這些圖像只含有受著作權保護之訓練圖像的一小部分元素(a few elements)；當Midjourney僅透過其應用程式和網站，將穩定擴散作為「文庫」(library)提供客戶使用時，其為何需要負直接侵權之責？凡此種種法院都認為不確定。然而，法院並未完全排除原告可辯護這一指控的可能性，特別指出原告如能合理地主張，被告的AI產品可讓使用者，透過引用原告姓名的作品來創作新作品，以及原告受保護的內容究竟係如何、以及有多少留在穩定擴散中被AI最終產品所使用的，則其立論可能會更堅強。原告對Midjourney代理侵權之指控原告指控，使用者透過被告AI圖像工具，輸入原告姓名後就會產生冒充藝術家原作的圖像，這些使用者可謂是「冒名頂替者」，而其依賴藝術家的原作品，輸入含有特定藝術家姓名的提示回應，所產生的冒充圖像就是「偽造品」。因此，被告應知悉其AI工具的功能容易用來生成偽造品。冒名頂替者出售偽造品使原告因受損，因而被告從AI工具中，直接或間接地從冒名頂替者的侵權行為中獲利，故其應對第三者的侵權行為，承擔代理侵權 (vicarious infringement)責任。但法院認為，法律上要對代理侵權行為負著作侵權責任，原告必須指控被告（1）擁有監督侵權行為的權利和能力(right and ability to supervise)，以及（2）在侵權活動中獲具有直接的經濟利益。參Perfect 10, Inc. v. Visa Int'l Serv. Ass'n, 494 F.3d 788, 802 (9th Cir. 2007)。但問題在於，本案原告針對三位被告之起訴，無分軒輊地將其看成一體、籠統指控其全都構成代理侵權，但具體上哪個被告基於第三人的何種行為，得以構成代理侵權卻並未明確指出，且其起訴狀中對不同被告間無區別的指控，常將三位被告混為一談，難以釐清每個被告究竟誰實際從事何項確切行為，導致法律上可造成間接侵害，完全混淆不明。 Midjourney因而抗辯，原告指控其代理責任之主張應被駁回，因為依Sound & Color, LLC v. Smith案例，No. 222CV01508ABASX, 2023 WL 2821881, at *16 (C.D. Cal. Feb. 28, 2023)，被告不能對自己的直接侵權，承擔間接侵權中之次級責任(secondary liability)。因而，當使用被告的生成式AI產品構成侵權時，只有在對每個被告提出的直接侵權主張充分表達後，法院才能確定，原告是試圖讓被告對自己的直接侵權承擔次級侵權之代理責任，還是讓被告對他人使用其產品的直接侵權來負間接侵權之責，凡此，原告之主張都含糊不清應被駁回。北加州地院對代理侵權之程序裁定法院認為，原告基於「冒名頂替者」使用被告工具產生「偽造品」的代理侵權主張，還存有其他重要問題。因原告的訴狀中未能指控，被告以原告作品製作出基於該作品實際存在的「偽造品」為何。反之，原告自己起訴狀中還承認：「根據擴散過程的運作原理，一般而言，對於特定文本指令提示所回應產生由穩定擴散輸出的圖像，不太可能與訓練數據中的任何特定圖像相匹配而近似(close match)」。亦即原告無法舉出被告AI工具，能生成任何「實際上」與其構成相同或近似的「偽造品。可見得，原告已不依賴具體作品之實質相似理論，只能轉而攻擊所有輸出圖像都是衍生侵權作品，然後再補充指控：被告輸出圖像與原告畫作的「風格」(in the styles)或藝術認同(artistic identities)相似關於風格相似是否侵權請參本刊「Midjourney與Stability AI擴散模型自動生成引爆著作侵權疑雲？-- 圖形影像篇」，以至於亦構成「偽造品」。由於原告並未能對Midjourney提出充分之直接侵權的主張，而有待之後的修改，則法律上即無從對其提起代理侵權的主張，因為代理責任需要直接侵權行為存在做為基礎。參見 Perfect 10, Inc. v. Yandex N.V., 962 F.Supp.2d 1146, 1158 (N.D. Cal. 2013), as amended (Sept. 6, 2013)。法院指出，由於原告未能釋明被告AI平台，如何被第三方以侵權方式使用，以致該代理侵權之主張仍存有缺陷。因此，針對原告指控代理侵權之主張被法院駁回，但法官也網開一面，允許原告進行修正以澄清其理論。法院特別要求原告修正其理論時，針對這些副本如何在提供給第三方的Midjourney產品中，以違反著作權法保護權利的方式呈現、存在或引用，原告必須提供明確和合理的指控，敘明Midjourney對其產品被第三方使用而承擔代理責任的情況。例如，就他人使用被告AI 工具生成偽造品時，被告為何因此會間接侵權而產生代理責任。此外，法院還提醒原告修改時，應列出每個被告就其所從事的行為詳細陳述，而不能再將所有的「被告」混為一談。此外，Midjourney在其動議聲請中力爭，不應允許原告就其依著作權法中，所規定的表演權之違反請求提出修正，因為在圖畫作品中不存在所謂之表演權，且原告在反對意見中未反對Midjourney之駁回聲請。而庭審中，原告請求允許保留其表演侵權理論之指控，法院雖允許但也明示，在接下來可能的駁回動議中，法院將不會像在這一輪那樣慷慨地允許修正，法院希望對每項指控及支持指控的每個被告行為，提供更具體的資訊。本案原告提交修改後之起訴狀為回應法院的糾正，原告於2023年11月底提交修改的起訴狀，但已和與原來起訴大相逕庭，增加七名新的個人原告和一名被告：Runway AI（另一家生成式AI工具公司），原告重新架構新的主張，刪除著作代理侵權指控(vicarious copyright infringement claim)，代之以著作誘導侵權請求(inducement of copyright infringement claim)；還刪除公開權(right of publicity)和不公平競爭之請求，並添加二項商標法《蘭納姆法Lanham Act 》請求 - - 虛假認可(false endorsement) [2]和替代理企業外觀侵權(vicarious trade-dress infringement)。修改後的起訴書，還提供有關原告聲稱穩定擴散包含「壓縮副本」或「受保護表達內容」的更多細節，並提供學術論文和Stability AI人員的引用，聲稱這些內容支持原告主張，即模型包含受著作權保護的表達。結論一 - - AI擴散模型對著作侵權認定帶來新的挑戰最後，就法院對本案三位被告所下的程序判決，總結一些觀點。擴散模型在圖像、視頻和語音生成領域受到廣泛應用，其技術原理如前述，就是將一副畫慢慢透過高斯噪聲(Gaussian noise)，逐步以添加雜訊方式消除該畫面中的細節（即加噪），使原來清晰的圖畫一直拆解到最後變成純噪聲，而無法辨識原圖案的情況，然後再逆向操作這種分解過程，由後向前回溯慢慢再透過去除雜訊方式（即降噪或去噪），逐漸導引還原為當初原始清晰的圖案，運行這種反向操作過程，AI就會掌握所有雜訊的特徵，透過訓練神經網絡完全掌握畫作中的所有相關數據，從而可任意自噪聲中合成數據，畫出任何所需要的圖像，因為所有資訊特徵都已被AI提取而盡入其囊中。但也因此，所畫出的東西可能會與原作不相同，但卻又可能保留原畫中一些風格上的相似，本案擴散模型的運用，就是產生看似不同但風格相近的圖案，除了訓練過程中進行之中間複製外，也會涉及著作權另二項核心議題 -- 1. 風格上相似是否可能構成實質相似而侵權；2. 此種擴散模型被告可否主張構成合理使用而不侵權。換言之，和傳統著作侵權類型大相逕庭，因為AI運作下之生成創作，已產生新興科技所帶來前所未見的衝擊，因此如何舊酒裝新瓶是一大挑戰，尚待法院進一步認定。然而對業界言，著作權法在被修改前，仍必須按照既有遊戲規則，因此設計AI工具就不能出於僥倖，而應注意如何在過程中多布幾道防線避免踩到侵權地雷。反過來看，如被告能針對新興科技之應用，創造出符合公共利益促進人類福祉的「轉化性的合理使用」(Transformative Fair Use)，依美國過去如第二巡迴上訴法院Authors Guild v. Google, Inc.案、最高法院Google v. Oracle America案，仍可能豁免於侵權，但究竟是否可以構成，業者必須要有足夠睿智來判斷以免承擔法律責任請參本刊「Midjourney與Stability AI擴散模型自動生成引爆著作侵權疑雲？-- 圖形影像篇」。結論二 - - 北加州地院連續二個AI官司原告都踢到鐵板值得觀察的是本案之後，同樣北加州地院針對生成式AI的著作侵權案Kadrey, Silverman & Golden v. Meta Platforms, Inc.請參本刊：美國作家集體訴訟控告Meta生成式AI工具 LLaMA著作侵權之程序判決出爐，原告第一回合程序上也吃了敗仗。這二案原告之所以首戰皆鎩羽而歸，似乎犯了一些錯誤！例如著作權登記，一般作者可能不會每完成一件作品後都去登記，但當決定起訴時，此基本前提應妥善準備。本案三位原告的畫作眾多，但最終卻只有其中一位的16幅畫適格作為審理依據！其次，本案原告起訴狀中雖洋洋灑灑，卻未詳細說明每一被告究竟何處又如何構成侵權？其具體行為如何？針對三位被告的侵權說明含混不清，由此可見，對他人起訴確不容易。本案程序判決中法院似想要釐清：被告可否區分為：參與抓取、複製和使用受著作權保護的作品，來訓練AI模型的公司像Stability；以及將擴散模型程式整合到自己產品中，但卻未參與抓取、複製經註冊訓練圖像的公司像DeviantArt和Midjourney；抑或是該後二者也實際參與複製等行為（此皆待釐清）；再來則是，此三者法律上為何可能構成間接侵權，凡此種種，應是嗣後任何生成式AI侵權訴訟所必須面對的重要課題。最後要強調的是，AI新興科技所衍生的侵權態樣，和傳統的型態雖有不同！但即便如此，傳統訴訟所要求的舉證方式，並不會因為是AI而有所改變。換言之，原告起訴必須具體說明被告究竟產出何種作品，侵害原告哪些著作的哪些內容，而且在原作和侵權品之間，需建構實質相似性，這是所有著作侵權案件的鐵律，原告不應誤以為在AI的浪潮下，可繞道避開這方面的舉證！當然，如原告在起訴狀中所提，被告生成式AI產出的圖像，不會和原告原來畫作相似，則原告只能將焦點置於訓練過程中的大量複製行為，但此仍取決於最終生成結果是否屬於合理使用，如肯定則該過程中的複製亦不構成侵權！ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.145.192.245 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Patent/M.1709855400.A.BA9.html