劃重點:
?? AI 系統(tǒng)已經(jīng)學(xué)會欺人類,甚至在被訓(xùn)練成為有益和誠實的系統(tǒng)中。
?? 研究呼吁政府盡快制定強(qiáng)力的監(jiān)管措施,以解決 AI 系統(tǒng)欺騙的問題。
?? 欺騙行為可能導(dǎo)致未來更高級形式的 AI 欺騙,對社會構(gòu)成嚴(yán)重威脅。
站長之家(ChinaZ.com)5月11日 消息:人工智能(AI)系統(tǒng)已經(jīng)學(xué)會了如何欺騙人類即使這些系統(tǒng)被訓(xùn)練成有益和誠實的。研人員在5月10日發(fā)表在《Patterns》雜志上的一篇綜述文章中描述了 AI 系統(tǒng)欺騙行為的風(fēng)險呼吁各國政府盡快制定強(qiáng)有力的監(jiān)管措施來解決這一問題。
首席作者、麻省理工學(xué) AI 生存安全博士后研究員彼得?帕克表示:“AI 開發(fā)者并不確定是什么導(dǎo)致不良的 AI 行為,比如欺騙。但一般來說,我們認(rèn)為 AI 欺騙之所以出現(xiàn)是因為欺騙策略被證明是 AI 在訓(xùn)練任務(wù)中表現(xiàn)良好的最佳方式。欺騙幫助它們實現(xiàn)目標(biāo)。” 克和同事分析了關(guān)于 AI 系統(tǒng)傳播虛假信息的文獻(xiàn),包括通過學(xué)習(xí)欺騙來系統(tǒng)性地操縱他。
研究人員在分析中發(fā)現(xiàn)的最引人注目的 AI 欺騙案例是 Meta 的 CICERO,一個旨玩《外交》游戲的 AI 系統(tǒng),這是一個涉及建立聯(lián)盟的征服世界游戲。盡管 Meta 聲稱他訓(xùn)練 CICERO “基本誠實和樂于助人”,并且在玩游戲時 “絕不會故意背叛” 人類盟友,但公司發(fā)布的數(shù)據(jù)和科學(xué)論文揭示了 CICERO 并不公平。
其他 AI 系統(tǒng)展示了在德?lián)淇擞螒蛑邢驅(qū)I(yè)人類玩家虛張聲勢、在戰(zhàn)略游戲《星際爭霸 II》中虛假擊以擊敗對手、以及在經(jīng)濟(jì)談判中歪曲他們的偏好以占據(jù)上風(fēng)的能力。雖然 AI 在游戲中作弊似乎無害,但它可能導(dǎo)致 “欺騙性 AI 能力的突破”,從而在未來變?yōu)楦?span id="79nn5nnn" class="spamTxt">高級形式的 AI 欺騙。
一些 AI 系統(tǒng)甚至學(xué)會了欺騙旨在評估其安全性的測試。究發(fā)現(xiàn),在一個數(shù)字模擬器中,AI 生物 “裝死” 以欺騙一個旨在排除快速復(fù)制 AI 系統(tǒng)測試。
帕克警告稱,欺騙性 AI 的主要近期風(fēng)險包括使敵對行為者更容易進(jìn)行欺詐和縱選舉。最終,如果這些系統(tǒng)能夠完善這種令人不安的技能集,人類可能會失去它們的控制。
帕克表示:“作為社會,我們需要盡可能多的時間來為未來 AI 產(chǎn)品和開源模型更進(jìn)的欺騙行為做準(zhǔn)備,因為 AI 系統(tǒng)的欺騙能力變得更加先進(jìn),它們對社會構(gòu)的危險將變得越來越嚴(yán)重?!?/p>
雖然帕克和他的同事認(rèn)為社會尚未制定出應(yīng)對 AI 欺的正確措施,但他們對決策者已經(jīng)開始認(rèn)真對待這個問題,比如歐盟 AI 法案和拜總統(tǒng)的 AI 行政命令,感到鼓舞。但帕克表示,由于 AI 開發(fā)者尚未掌握使這些系統(tǒng)受制的技術(shù),要嚴(yán)格執(zhí)行旨在緩解 AI 欺騙的政策尚不明朗。
帕克表示:“如果在當(dāng)前時刻政上不可行禁止 AI 欺騙,我們建議將欺騙性 AI 系統(tǒng)分類為高風(fēng)險?!?/p>
(舉報)