開源數(shù)據(jù)集因侵權(quán)問題,慘遭下架。如LLaMA、GPT-J等,都用它訓(xùn)練過。如今,托管了它3年的網(wǎng)站,一夜之間刪除了所有相關(guān)內(nèi)容。這就是Books3,一個(gè)由將近20萬本圖書組成的數(shù)據(jù)集,大小將近37GB。丹麥一家反盜版組織表示,在該數(shù)據(jù)集中發(fā)現(xiàn)了150本其成員的書籍,構(gòu)成侵權(quán),所以要求平
......
本文由站長(zhǎng)之家合作伙伴自媒體作者“量子位公眾號(hào)”授權(quán)發(fā)布于站長(zhǎng)之家平臺(tái),本平臺(tái)僅提供信息索引服務(wù)。由于內(nèi)容發(fā)布時(shí)間超過平臺(tái)更新維護(hù)時(shí)間,為了保證文章信息的及時(shí)性,內(nèi)容觀點(diǎn)的準(zhǔn)確性,平臺(tái)將不提供完全的內(nèi)容展現(xiàn),本頁面內(nèi)容僅為平臺(tái)搜索索引使用。需閱讀完整內(nèi)容的用戶,請(qǐng)查看原文,獲取內(nèi)容詳情。
(舉報(bào))