近日,科技巨頭meta在一場(chǎng)備受矚目的法律糾紛中遭遇了重大挫敗。據(jù)《連線》雜志報(bào)道,一群作家指控meta在訓(xùn)練其人工智能模型時(shí)侵犯了他們的版權(quán),而法院的最終判決對(duì)meta極為不利。
在這場(chǎng)漫長的法律較量中,法院不顧meta的反對(duì),公開了詳細(xì)的指控信息。據(jù)稱,meta利用了一個(gè)名為Library Genesis(LibGen)的盜版書籍資源,該資源以提供非法下載的書籍而聞名,且源自俄羅斯。這一指控的曝光,無疑給meta帶來了極大的輿論壓力。
Kadrey等人對(duì)meta Platforms提起的訴訟,是針對(duì)科技公司在AI訓(xùn)練實(shí)踐中涉及版權(quán)問題的早期案例之一。此案的判決結(jié)果,以及美國法院正在審理的數(shù)十起類似案件,將深刻影響科技公司使用創(chuàng)意作品訓(xùn)練AI的合法性。這不僅關(guān)乎科技公司的利益,更可能重塑AI領(lǐng)域的競(jìng)爭(zhēng)格局。
加利福尼亞州北區(qū)聯(lián)邦地區(qū)法院的法官文斯·查布里亞(Vince Chhabria)在周三的裁決中,要求meta和原告提交一批文件的完整版本。他批評(píng)meta對(duì)文件的刪減方式過于荒謬,并指出在大多數(shù)情況下,這些簡(jiǎn)報(bào)中的內(nèi)容都不應(yīng)被封存。查布里亞法官的裁決,進(jìn)一步揭示了meta在這場(chǎng)法律糾紛中的被動(dòng)局面。
根據(jù)Chhabria法官的裁決,meta推動(dòng)刪減這些材料并非出于保護(hù)商業(yè)利益的考慮,而是為了避免負(fù)面宣傳的影響。這些文件自去年年底提交以來,一直未以未刪減的形式公開。然而,隨著法院裁決的公布,這些文件的內(nèi)容逐漸浮出水面。
在Chhabria法官的命令中,他引用了meta員工的一句內(nèi)部引言。這句引言透露出meta員工對(duì)于使用盜版數(shù)據(jù)集的擔(dān)憂,他們擔(dān)心如果媒體報(bào)道了meta使用LibGen等盜版數(shù)據(jù)集的消息,可能會(huì)破壞meta在與監(jiān)管機(jī)構(gòu)談判中的地位。
面對(duì)這一法律糾紛,meta選擇了沉默,拒絕發(fā)表任何評(píng)論。然而,這并未阻止輿論對(duì)meta的指責(zé)和質(zhì)疑。2023年7月,小說家理查德·卡德雷(Richard Kadrey)、克里斯托弗·戈?duì)柕牵–hristopher Golden)以及喜劇演員莎拉·西爾弗曼(Sarah Silverman)首次對(duì)meta提起集體訴訟,指控meta未經(jīng)許可使用他們的版權(quán)作品訓(xùn)練其語言模型。
meta在辯護(hù)中強(qiáng)調(diào),使用公開可用的材料訓(xùn)練人工智能工具受到合理使用原則的保護(hù)。他們認(rèn)為,在某些情況下,未經(jīng)許可使用版權(quán)作品是合法的,例如使用文本對(duì)語言進(jìn)行統(tǒng)計(jì)建模并生成原創(chuàng)表達(dá)。然而,這一辯護(hù)并未能說服法院和原告。
在這起訴訟中,meta還試圖反駁原告的指控,認(rèn)為這些指控毫無根據(jù)。然而,隨著法院裁決的公布和未刪節(jié)文件的曝光,meta的辯護(hù)顯得越來越蒼白無力。
值得注意的是,在這些文件公開之前,meta曾在一份研究論文中披露,它已使用Books3數(shù)據(jù)集訓(xùn)練了其Llama大型語言模型。Books3是一個(gè)從互聯(lián)網(wǎng)上抓取的約196,000本書的數(shù)據(jù)集。然而,meta并未公開承認(rèn)它直接從LibGen下載數(shù)據(jù)。
然而,這些新近未刪節(jié)的文件卻揭示了meta員工在調(diào)查過程中的交流情況。例如,一位meta工程師告訴同事,他們猶豫是否要訪問LibGen數(shù)據(jù),因?yàn)閺墓竟P記本電腦上下載這些數(shù)據(jù)感覺不妥。這些文件還聲稱,關(guān)于使用LibGen數(shù)據(jù)的內(nèi)部討論已上報(bào)給meta首席執(zhí)行官馬克·扎克伯格(在調(diào)查期間移交的備忘錄中稱為MZ),并且meta的AI團(tuán)隊(duì)被批準(zhǔn)使用盜版材料。
這一系列的曝光和裁決,無疑給meta帶來了巨大的挑戰(zhàn)。如何在這場(chǎng)法律糾紛中挽回局面,將是meta接下來需要面對(duì)的重要問題。
與此同時(shí),這場(chǎng)法律糾紛也引發(fā)了人們對(duì)科技公司在AI訓(xùn)練實(shí)踐中涉及版權(quán)問題的廣泛關(guān)注。未來,隨著類似案件的增多和判決的公布,科技公司在使用創(chuàng)意作品訓(xùn)練AI時(shí)將面臨更加嚴(yán)格的監(jiān)管和審查。
無論如何,這場(chǎng)法律糾紛已經(jīng)給meta帶來了深刻的教訓(xùn)。對(duì)于科技公司而言,尊重版權(quán)、遵守法律法規(guī)是發(fā)展的基石。只有在這個(gè)基礎(chǔ)上,科技公司才能在AI領(lǐng)域取得更加長遠(yuǎn)的發(fā)展。