文章概要:
1. 紐約時(shí)報(bào)、CNN、路透社等新聞媒體開(kāi)始屏蔽OpenAI的GPTBot網(wǎng)絡(luò)爬蟲(chóng),限制它繼續(xù)獲取這些媒體的內(nèi)容。
2. GPTBot可能會(huì)掃描網(wǎng)頁(yè)內(nèi)容來(lái)幫助改進(jìn)OpenAI的人工智能模型,如ChatGPT。
3. 媒體擔(dān)心內(nèi)容被AI訓(xùn)練,但Google建議可自動(dòng)獲取媒體內(nèi)容,除非它們選擇退出。
繼紐約時(shí)報(bào),CNN、路透社等在內(nèi)的多家主流新聞媒體也開(kāi)始在其網(wǎng)站上屏蔽OpenAI的GPTBot網(wǎng)絡(luò)爬蟲(chóng),限制它繼續(xù)獲取這些媒體的內(nèi)容。
The Verge最先報(bào)道《紐約時(shí)報(bào)》在其網(wǎng)站上屏蔽了 GPTBot?!缎l(wèi)報(bào)》隨后發(fā)現(xiàn),其他主要新聞網(wǎng)站,包括 CNN、路透社、芝加哥論壇報(bào)、ABC 和澳大利亞社區(qū)媒體 (ACM) 品牌似乎也禁止了該網(wǎng)絡(luò)爬蟲(chóng)。
CNN 證實(shí),它最近屏蔽了 GPTBot 的所有產(chǎn)品,但沒(méi)有評(píng)論該品牌是否計(jì)劃就其內(nèi)容在人工智能系統(tǒng)中的使用采取進(jìn)一步行動(dòng)。
路透社發(fā)言人表示,它會(huì)定期審查其 robots.txt 以及網(wǎng)站條款和條件,“因?yàn)橹R(shí)產(chǎn)權(quán)是我們業(yè)務(wù)的命脈,所以我們必須保護(hù)我們內(nèi)容的版權(quán)”
GPTBot可能會(huì)掃描網(wǎng)頁(yè)內(nèi)容以幫助改進(jìn)OpenAI的人工智能模型,如最近火爆的ChatGPT聊天機(jī)器人。不過(guò),媒體擔(dān)心自己的內(nèi)容被AI系統(tǒng)濫用,特別是在訓(xùn)練過(guò)程中。
這場(chǎng)對(duì)峙源于人工智能系統(tǒng)通常需要大量信息來(lái)訓(xùn)練,以便它們能夠用類(lèi)似人類(lèi)語(yǔ)言的方式回答用戶(hù)的提問(wèn)。但開(kāi)發(fā)這些系統(tǒng)的公司通常不會(huì)透露其數(shù)據(jù)集中是否包含有版權(quán)保護(hù)的內(nèi)容。因此,媒體擔(dān)心自己的內(nèi)容被濫用。
此外,Google最近還向澳大利亞政府提出,除非新聞媒體明確選擇退出,否則人工智能系統(tǒng)應(yīng)該可以默認(rèn)獲取這些媒體的內(nèi)容來(lái)訓(xùn)練模型。
(舉報(bào))