幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > 正文

GPT-3.5模型輸出被檢測(cè)出高達(dá)60%含抄襲內(nèi)容

2024-02-26 16:45 · 稿源:站長(zhǎng)之家

站長(zhǎng)之家(ChinaZ.com)2月26日 消息:抄襲檢測(cè)器 Copyleaks 的一份報(bào)告顯示,OpenAI 的 GPT-3.5輸出中有60% 包含某種形式的抄襲。該公司使用了一種專有的評(píng)分方法,考慮相同的文本、微小的改動(dòng)、釋義等來(lái)分配“相似性分?jǐn)?shù)”。

據(jù)悉,Copyleaks 專注于基于人工智能的文本分析,并為企業(yè)和學(xué)校提供抄襲檢測(cè)工具。該公司早在 ChatGPT 之前就已經(jīng)涉足這一領(lǐng)域。盡管 GPT-3.5是 ChatGPT 首次亮相的明星,但 OpenAI 此后已升級(jí)到更先進(jìn)的 GPT-4。

根據(jù)他們的最新發(fā)現(xiàn),GPT-3.5表現(xiàn)出45.7% 的相同文本、27.4% 的微小變化和46.5% 的釋義文本。根據(jù)報(bào)告,0% 意味著完全原創(chuàng),而100% 則表明沒(méi)有原創(chuàng)內(nèi)容。

機(jī)器人 AI寫作 AI教育

圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney

Copyleaks 對(duì) GPT-3.5進(jìn)行了各種測(cè)試,生成了大約1000個(gè)輸出,每個(gè)輸出大約400個(gè)單詞,涉及26個(gè)主題。相似度得分最高的結(jié)果屬于計(jì)算機(jī)科學(xué)(100%),其次是物理學(xué)(92%)和心理學(xué)(88%)。另一方面,戲劇(0.9%)、人文學(xué)科(2.8%)和英語(yǔ)(5.4%)的相似度得分最低。

OpenAI 發(fā)言人 Lindsey Held 告訴Axios:“我們的模型經(jīng)過(guò)設(shè)計(jì)和訓(xùn)練來(lái)學(xué)習(xí)概念,以幫助他們解決新問(wèn)題?!薄拔覀冎贫舜胧﹣?lái)限制無(wú)意的記憶,并且我們的使用條款禁止故意使用我們的模型來(lái)反省內(nèi)容?!?/p>

剽竊不僅僅是剪切和粘貼整個(gè)句子和段落?!都~約時(shí)報(bào)》對(duì) OpenAI提起訴訟,稱 OpenAI 的 AI 系統(tǒng)“大規(guī)模復(fù)制”構(gòu)成版權(quán)侵權(quán)。OpenAI對(duì)訴訟作出回應(yīng),稱“反流”是一種“罕見(jiàn)的錯(cuò)誤”,并指責(zé)《紐約時(shí)報(bào)》“操縱提示”。

內(nèi)容創(chuàng)作者試圖辯稱,生成AI模型是在他們的作品上訓(xùn)練的,所以產(chǎn)出近似副本不應(yīng)構(gòu)成侵權(quán)。但目前相關(guān)法律裁決多支持公司而非創(chuàng)作者。紐約時(shí)報(bào)訴訟一案讓人看到希望,但結(jié)果仍未明朗。

舉報(bào)

  • 相關(guān)推薦

熱文

  • 3 天
  • 7天