近日,一名圖書作者向法院提起訴訟,矛頭直指科技巨頭meta,指控其未經(jīng)授權(quán),擅自下載了海量盜版電子書,用于人工智能模型的訓(xùn)練。
據(jù)泄露的內(nèi)部郵件顯示,meta承認(rèn)曾獲取過一個備受爭議的大型數(shù)據(jù)集LibGen,該數(shù)據(jù)集內(nèi)含數(shù)千萬本盜版書籍。這一行為迅速引發(fā)了廣泛關(guān)注和爭議。
法庭文件進一步揭露,meta通過一個名為“安娜的檔案”的渠道,下載了至少81.7TB的數(shù)據(jù),其中來自知名盜版網(wǎng)站Z-Library和LibGen的內(nèi)容就占據(jù)了35.7TB。更令人震驚的是,meta還被指曾從LibGen額外下載了80.6TB的數(shù)據(jù)。
這位圖書作者強調(diào),meta的這一行為不僅構(gòu)成了非法的電子書庫種子下載,而且所揭露的數(shù)字可能只是其盜版行為的冰山一角。據(jù)作者估算,這些盜版電子書庫可能僅占meta盜版版權(quán)作品總量的0.008%,暗示其盜版規(guī)模可能遠超當(dāng)前已知情況。
郵件內(nèi)容還透露出meta內(nèi)部員工對這一行為的法律風(fēng)險的擔(dān)憂。2023年4月,meta的研究工程師尼古拉·巴什利科夫在郵件中表示,使用公司筆記本電腦下載BT文件感覺不妥。到了2023年9月,巴什科夫的擔(dān)憂進一步加劇,他咨詢了法律團隊,并明確指出,使用Torrents意味著對文件進行“播種”,即對外共享內(nèi)容,這在法律上是不被允許的。
然而,盡管存在法律風(fēng)險和內(nèi)部員工的抗議,meta仍決定繼續(xù)其下載行為,并試圖通過將數(shù)據(jù)集下載到非meta服務(wù)器上來規(guī)避被追溯的風(fēng)險。這一舉動無疑加劇了輿論對其盜版行為的質(zhì)疑和譴責(zé)。
此次事件不僅揭示了meta在版權(quán)保護方面的嚴(yán)重疏忽,也引發(fā)了公眾對于科技巨頭在數(shù)據(jù)使用和隱私保護方面的廣泛擔(dān)憂。隨著調(diào)查的深入,更多關(guān)于meta盜版行為的細(xì)節(jié)或?qū)⒅饾u浮出水面。