站長之家(ChinaZ.com) 1月9日 消息:人工智能公司OpenAI日前對《紐約時報》提起的版權(quán)訴訟做出公開回應(yīng),稱利用公開文章等數(shù)據(jù)訓(xùn)練AI系統(tǒng)屬于“合理使用”。
在今天下午 OpenAI 官方博客上發(fā)布的一封信中,該公司重申了其觀點(diǎn),即使用網(wǎng)絡(luò)上的公開數(shù)據(jù)(包括《紐約時報》等文章)來訓(xùn)練人工智能模型是合理使用。換句話說,在創(chuàng)建像GPT-4和DALL-E3這樣的生成式人工智能系統(tǒng)時,OpenAI 認(rèn)為它不是“從數(shù)十億個藝術(shù)品、電子書、論文等示例中“學(xué)習(xí)”以生成類似人類的文本和圖像”。不需要許可或以其他方式支付這些示例的費(fèi)用——即使它從這些模型中賺錢。
OpenAI 寫道:“我們認(rèn)為這一原則對創(chuàng)造者公平,對創(chuàng)新者必要,對美國競爭力至關(guān)重要?!?/p>
圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney
OpenAI 還在其字母反流中解決了這種現(xiàn)象,即生成式 AI 模型在以某種方式提示時逐字(或接近逐字)輸出訓(xùn)練數(shù)據(jù),例如生成一張與著名攝影師拍攝的照片相同的照片。OpenAI 認(rèn)為,使用來自單一來源(例如《紐約時報》)的訓(xùn)練數(shù)據(jù)不太可能發(fā)生反流,并讓用戶有責(zé)任“負(fù)責(zé)任地行動”并避免故意促使其模型反流。
OpenAI還反駁了“訓(xùn)練數(shù)據(jù)反芻”的指控,稱單一信息源的數(shù)據(jù)不太可能被AI模型逐字輸出。該公司批評紐時“操縱”提示讓模型“抄襲”,其實(shí)AI生成的內(nèi)容與原文有明顯區(qū)別。
此番言論與部分專家意見相左,后者展示AI系統(tǒng)確實(shí)會在未提示下重復(fù)訓(xùn)練素材。調(diào)查也顯示,多數(shù)公眾支持媒體公司在此案中的立場。目前,OpenAI正面臨來自版權(quán)方和公眾的壓力,要求其改變使用他人內(nèi)容的做法。
OpenAI與《紐約時報》之間圍繞AI訓(xùn)練數(shù)據(jù)的版權(quán)爭議繼續(xù)升級。這場關(guān)乎AI倫理和創(chuàng)新的法律大戰(zhàn),其結(jié)果或?qū)Q定未來語言AI的發(fā)展方向。
(舉報)