OpenAI在不斷拓展技術邊界的同時,AI涉及的版權(quán)歸屬再起爭端。
2023年12月,《紐約時報》狀告OpenAI版權(quán)侵權(quán)。2024年1月,非虛構(gòu)作者群體發(fā)起同樣的訴訟。在積極應對的同時,OpenAI加快了與多家內(nèi)容出版商討論授權(quán)許可。
內(nèi)容出版商與大模型技術公司的糾紛愈演愈烈,而壓力已經(jīng)來到各國版權(quán)局。過去一年,頭部科技公司與版權(quán)局積極溝通,電廠在翻閱相關文件發(fā)現(xiàn),大模型帶來的版權(quán)問題不比技術本身容易理清,且與探索大模型落地應用的公司和個人息息相關。
版權(quán)問題可以被粗略地分解到兩個環(huán)節(jié),大模型訓練輸入和大模型創(chuàng)作輸出。輸入環(huán)節(jié)的糾紛是掌握版權(quán)和掌握技術的頭部力量“神仙打架”,輸出環(huán)節(jié)的糾紛往往是與個體相關的“人間真實”:利用大模型創(chuàng)作的作品是否應該受到版權(quán)保護,以及版權(quán)應該歸誰?
根據(jù)國內(nèi)外現(xiàn)有的訴訟案例,最常被想到的判決結(jié)果都出現(xiàn)過,版權(quán)歸創(chuàng)作者個人、歸大模型(即無法授予版權(quán))、歸訓練大模型的一方。

相異的判定結(jié)果
大模型輸出的文字、圖片、視頻三類內(nèi)容當中,圖片內(nèi)容的版權(quán)糾紛在目前是最復雜的。由于生成式視頻技術還難以輸出具備作品價值的內(nèi)容,暫時沒有可參考的案例出現(xiàn)。對待生成式文字、圖片內(nèi)容,不同國家的態(tài)度各不相同。
早在2020年,騰訊公司發(fā)起的一起訴訟中,法庭判定AI軟件Dreamwriter生成的作品具有版權(quán)。由于AI不是自然人和法人,因此版權(quán)歸軟件開發(fā)公司騰訊所有。
另外在2023年11月27日判決的國內(nèi)“AI文生圖*案”中,原告使用AI軟件Stable Diffusion創(chuàng)作的作品被被告挪用,法院判決被告侵權(quán)。在有關報道中,主審法官稱考慮了案件對(AI)產(chǎn)業(yè)的影響。可以預見,短期國內(nèi)有關使用AI生成的內(nèi)容能夠得到法律保護,未經(jīng)授權(quán)的情況下使用這些內(nèi)容可能構(gòu)成侵權(quán),權(quán)利方歸軟件使用者所有。
在這起案件中,原告多次向AI軟件輸入提示詞調(diào)整輸出結(jié)果,這一過程被法庭認為表現(xiàn)出了對作品的構(gòu)思編排,因此圖片構(gòu)成一件作品,AI軟件的角色僅是創(chuàng)作作品的工具。
然而,類似的情況在美國可能截然不同。著名的AI畫作《空間歌劇院》嘗試了624個提示詞,耗時80多個小時制作,并且在藝術競賽中奪得頭獎,結(jié)果被美國版權(quán)局(USCO)拒絕簽署版權(quán)。

USCO對AI畫作一直持否定態(tài)度,從2022年至今四次拒*AI畫作簽署版權(quán)。電廠在翻閱USCO給部分申請人的回函中發(fā)現(xiàn),USCO確定版權(quán)時要求作品必須是人類作者創(chuàng)作,必須具備創(chuàng)造力。USCO對作品的創(chuàng)造力有*限度的要求,且強調(diào)這個要求“可能只有一點點”。因為作者無法控制或預測AI生成作品的結(jié)果,USCO認為就版權(quán)目的而言,在AI軟件提示詞方面的工作,僅憑“一點點”的提示,就得到一個復雜的輸出,這個過程中缺乏人類的作者身份。
生成式AI技術普及之后,USCO接收到大量有關版權(quán)的申請和問詢,于是在2023年3月16日發(fā)布了一份AI生成內(nèi)容的版權(quán)注冊指南。指南列出了幾條要點,比如“版權(quán)只能保護人類創(chuàng)造力產(chǎn)物的材料”,“焦點在于AI內(nèi)容來自于‘機械復制’,還是作者自己的心智構(gòu)思及其表達”。
這些要點強調(diào)了作品的“人類作者身份”,把由AI創(chuàng)作的內(nèi)容排除在外。AI作畫需要人來輸入提示詞,但人在其中并不構(gòu)成作者身份,而是基于數(shù)據(jù)訓練的“機械復制”。如果AI生成的作品中有足夠證據(jù)證明“人類作者身份”的參與,那么版權(quán)將僅保護該作品的人類創(chuàng)作部分。比如漫畫《黎明查莉婭》中,圖畫部分使用AI創(chuàng)作,USCO拒*此授權(quán),但單獨對作者寫的文字劇情簽署版權(quán)。

可以看到,版權(quán)授予的過程中存在一些模糊的標準,USCO引用了首例照片訴訟案進一步明確立場。
1884年,美國最高法院裁決照片作品《奧斯卡·王爾德第18號》可以受到版權(quán)保護,因為它們“代表了作者原創(chuàng)的智力概念”。這一案件將版權(quán)保護范圍首次擴大到攝影。當時反駁的觀點認為,照片僅是“某些自然物體或某人的精確特征在紙上的復制品”。但最高法院強調(diào),如果一張照片僅是一個“機械復制”的過程,“沒有人類攝影師的新穎性、發(fā)明性或*性”,那么“在這種情況下,就不受版權(quán)保護”。
USCO暗示,人通過AI輸出內(nèi)容,這個過程中缺少“新穎性、發(fā)明性或*性”,并進一步舉例稱“猴子拍攝的照片無法被授予版權(quán)”,版權(quán)只保護人類創(chuàng)作的作品。不過,USCO并沒有進一步討論AI生成作品的作者是不是AI,這可能將版權(quán)的受益方導向AI開發(fā)商。

科技公司的不同態(tài)度
2023年8月,USCO就AI版權(quán)問題公開征求意見,多家提供AI服務的科技公司參與其中。電廠發(fā)現(xiàn),各個公司對待AI作品的版權(quán)主張也不相同。
Adobe發(fā)布了生成式圖片大模型Adobe Firefly,并公開保證訓練數(shù)據(jù)完全合規(guī)。即便如此,Adobe仍然主張AI輸出內(nèi)容不受版權(quán)保護。Adobe認為用戶輸入的提示詞僅僅代表用戶的想法,Al通過解釋這些提示輸出了內(nèi)容。換句話說,是AI創(chuàng)造了關于這些想法的表達,而不是人類。不過,隨著多模態(tài)技術應用,如果用戶將自己的作品作為提示輸入,那么輸出的內(nèi)容應該受到版權(quán)保護。
持類似觀點的還有谷歌和OpenAI。雙方都認為現(xiàn)有的版權(quán)法足以解決AI作品的授權(quán)問題,沒有理由將版權(quán)保護擴大到AI生成的作品。OpenAI還強調(diào),生成式AI技術還在快速發(fā)展,會刺激創(chuàng)意產(chǎn)業(yè)實踐快速變化,目前嘗試制定有針對性的解決方案還為時過早。同時,OpenAI不對其生成式AI產(chǎn)品的輸出主張任何所有權(quán)。
?
三家巨頭的觀點并非無跡可尋。Adobe的數(shù)據(jù)顯示,F(xiàn)irefly大模型一個月產(chǎn)生了10億張圖片。如果這些圖片獲得版權(quán)許可,Adobe建立的版權(quán)商業(yè)將受到?jīng)_擊。谷歌和OpenAI則希望規(guī)避法律風險的同時,不希望有太多針對AI的法規(guī)出臺。

然而微軟有不同意見,它呼吁版權(quán)保護使用AI的創(chuàng)作者。與OpenAI不同之處在于,微軟提供了眾多AI應用,并直接服務用戶的工作和商業(yè)活動。微軟把大模型比作人類創(chuàng)作作品的助手和工具,強調(diào)人類控制著創(chuàng)作過程并決定最終的創(chuàng)作。
微軟用代碼生成模型GitHub Copilot舉例。GitHub Copilot用戶所編寫的代碼行數(shù)占比越來越高,今年年初為46%,微軟預計未來幾年將增至80%。微軟稱,Copilot使開發(fā)人員能夠?qū)W⒂趧?chuàng)造過程,而不是搜索文檔和案例。開發(fā)者還因此可以控制整個開發(fā)過程,比如程序的結(jié)構(gòu)、提示Copilot提出建議、迭代編輯建議。微軟認為如果沒有版權(quán)的保證,使用AI工具制作的作品的商業(yè)可行性就會受到損害。

確權(quán)為時尚早
AI作品能不能得到版權(quán)保護,除了法律技術方面,還有一些待解決的問題。
在輸入端,大模型訓練數(shù)據(jù)的版權(quán)糾紛尚未明確,那么就版權(quán)確認而言,輸出端的內(nèi)容合法性就存在質(zhì)疑。這種情況下,面對大量的申請需求,USCO拒絕授權(quán)的態(tài)度就理所應當了。
生成式圖片軟件Midjourney創(chuàng)始人David Holz在接收《福布斯》采訪時公開承認,訓練Midjourney所用的圖片沒有獲得原作者的許可。他表示,“確實沒有辦法獲得一億張圖像并知道它們來自哪里。如果圖像中嵌入了有關版權(quán)所有者的元數(shù)據(jù),那就太酷了,但沒有這種東西。”
由于沒有相關的判決,David Holz因此可以公開表達并暫時無責。OpenAI對此則更加謹慎,在給相關機構(gòu)的意見中,OpenAI認為對于眼下這種不明確的局面,“OpenAI和其他人工智能開發(fā)商面臨著巨大的法律不確定性和合規(guī)成本。”
電廠了解到,版權(quán)賦權(quán)要考量合法性,也要考量權(quán)責關系。這可能也是科技公司主張AI作品不受版權(quán)保護的原因之一。具體來說,商業(yè)公司創(chuàng)造和編程了工具,用戶僅輸入提示詞,如果AI生成的內(nèi)容侵犯版權(quán),應當由哪一方承擔責任?
輸出端內(nèi)容的侵權(quán)問題是提供AI服務和工具的商業(yè)公司考量的重點之一,在這一問題上與所服務的用戶“相愛相殺”。
一方面,為了打消用戶顧慮,谷歌、微軟、OpenAI、Adobe等都曾宣布,將承擔客戶因生成式內(nèi)容而產(chǎn)生的訴訟和賠償費用,并提供法律支持。這些服務主要面向企業(yè)客戶,微軟特別強調(diào)“客戶必須實施我們提供的必需防護措施和緩解措施,才有資格獲得所承諾的服務”。
另一方面,類似于社交媒體公司規(guī)定的,用戶在社交網(wǎng)絡上的賬號歸社交網(wǎng)絡運營商所有。OpenAI在ChatGPT的《使用條款》中明確,用戶使用ChatGPT輸出的內(nèi)容屬于OpenAI轉(zhuǎn)讓的權(quán)益,并支持用戶在遵守一系列條約的情況下使用。如果用戶非法使用,OpenAI可以追責。而Midjourney的類似規(guī)定僅針對付費用戶,非付費用戶不被允許商業(yè)使用。
在給USCO的回復意見中,幾家科技公司進一步表態(tài),認為如果AI生成作品存在侵權(quán),原因通常是在用戶的提示下發(fā)產(chǎn)生的。微軟稱“用戶必須按照設計負責任地使用這些工具”,OpenAI建議“評估與AI輸出相關的侵權(quán)索賠時應該從用戶開始,畢竟,沒有用戶的提示就沒有輸出,并且輸出的性質(zhì)直接受到提示的影響?!?/p>
據(jù)了解,大模型訓練通常使用元提示(meta-prompt)、分類器(Classifier)等技術調(diào)整輸出結(jié)果,從而減少有害內(nèi)容??萍脊菊J為這些措施已經(jīng)極大避免了可能存在的侵權(quán)。
歐盟版《人工智能法案》在2023年12月出爐,被認為是全球首部指導人工智能全面監(jiān)管的法案。相關分析認為,美國類似的法案出臺之前,USCO在版權(quán)問題的堅持對于科技公司來說不是好的信號。
版權(quán)問題的“拖延”也在限制大模型技術的能力,OpenAI提到,與版權(quán)所有者進行合作可以獲取其他方式無法訪問的材料,“并以超出預期的方式顯示它們”??梢灶A見,大模型能力的后續(xù)迭代與醞釀中的法案息息相關。


275701/22








