NVIDIA正緊鑼密鼓地訓(xùn)練其未向公眾發(fā)布的AI項目,內(nèi)部代號為Cosmos。
Cosmos項目專注于建立一個整合光學(xué)傳輸、物理和智能模擬的尖端視頻模型,為下游應(yīng)用提供支持,例如Omniverse 3D世界生成器、自動駕駛汽車系統(tǒng)和數(shù)字人產(chǎn)品。
泄露的內(nèi)部文件顯示,NVIDIA從Youtube和其他來源收集訓(xùn)練數(shù)據(jù),以訓(xùn)練其AI產(chǎn)品。
為了獲取訓(xùn)練視頻,NVIDIA員工采用了開源的YouTube視頻下載器yt-dlp,并通過刷新虛擬機IP地址來規(guī)避平臺的反爬蟲措施。
NVIDIA利用20到30臺虛擬機,每天抓取相當(dāng)于80年時長的視頻,引發(fā)了有關(guān)版權(quán)法和平臺服務(wù)條款的擔(dān)憂。
對此,NVIDIA回應(yīng)稱其做法合法,但谷歌和奈飛均表示未與NVIDIA達成內(nèi)容提取協(xié)議,并明確禁止在服務(wù)條款中抓取內(nèi)容。
(舉報)