在作家協會的組織下,包括喬治·R·R·馬丁在內的十多位作者本週起訴了 OpenAI,指控 “大規模系統性盜竊”,聲稱該公司 “未經許可或考慮” 就複製了作者們的作品,並使用這些內容來訓練如 ChatGPT 這樣的語言模型。
他們認爲 OpenAI 應該在獲得作者的許可後方可使用他們的作品訓練大模型,作者也應該得到補償。OpenAI 的一位發言人告訴媒體,它正 “與世界各地的許多創作者進行富有成效的對話,包括作家協會,並一直在合作理解和討論他們對人工智能的擔憂。”
作家協會主席 Maya Shanbhag Lang 說 “這起案件僅僅是我們保護作者免遭 OpenAI 和其他 AIGC 偷竊戰鬥的開始…… 我們不會輕易提起訴訟。我們是來戰鬥的。”
根據起訴書的內容,作家協會指出 OpenAI 用於訓練 ChatGPT 的書籍 “是從盜版電子書庫下載的,然後複製到 GPT 3.5 和 GPT 4 中”。
案件棘手的地方在於世界上大多數國家還沒有專門針對人工智能的新法律。
本月早些時候,Michael Chabon、David Henry 等創作者在舊金山起訴 OpenAI “明顯侵犯知識產權”。在上月的另外一些類似案件的訴訟過程中,OpenAI 要求加州法院駁回原告的侵權指控,稱相關主張 “誤解了版權的範圍,沒有考慮到限制和例外(包括合理使用)),使大型語言模型等現在處於人工智能前沿的創新失去了適當的空間。”
其他內容版權領域也在進行類似的指控,比如全球最大圖片版權公司 Getty 正在起訴 Stable Diffusion,稱其開源的文生圖服務在未經許可或未提供補償的情況下,引用了 Getty 數據庫中的 1200 萬張圖像訓練大模型。(龔方毅)