AI研究人員發(fā)現(xiàn)了主要大語(yǔ)言模型中關(guān)鍵漏洞可低成本復(fù)制

2023-10-13 11:24 · 稿源：站長(zhǎng)之家

劃重點(diǎn):
- 大型語(yǔ)言模型（LLM），如ChatGPT和Bard，已引起巨大轟動(dòng)，但研究發(fā)現(xiàn)它們存在關(guān)鍵漏洞，可能導(dǎo)致私人信息泄露和有針對(duì)性的攻擊。
- 研究人員發(fā)現(xiàn)，LLM的部分內(nèi)容可以以低成本被復(fù)制，這一攻擊方法被稱為“模型寄生”，可成功傳遞于封閉源和開(kāi)源機(jī)器學(xué)習(xí)模型之間。
- 盡管LLM技術(shù)具有巨大潛力，但業(yè)界需認(rèn)真考慮采用和部署LLM時(shí)可能存在的網(wǎng)絡(luò)安全風(fēng)險(xiǎn)。

站長(zhǎng)之家（ChinaZ.com）10月13日消息:近期，大型語(yǔ)言模型（LLM）如ChatGPT和Bard在全球范圍內(nèi)引起了廣泛的關(guān)注，眾多公司投資數(shù)百萬(wàn)美元用于開(kāi)發(fā)這些人工智能工具，而一些領(lǐng)先的AI聊天機(jī)器人的估值已達(dá)到了數(shù)十億美元。這些LLM主要被應(yīng)用于AI聊天機(jī)器人，它們通過(guò)整合互聯(lián)網(wǎng)上的大量信息來(lái)學(xué)習(xí)和為用戶提供請(qǐng)求的答案，這些請(qǐng)求通常被稱為“提示”。

然而，最近一項(xiàng)由AI安全初創(chuàng)公司Mindgard和英國(guó)蘭開(kāi)斯特大學(xué)的計(jì)算機(jī)科學(xué)家進(jìn)行的研究揭示了LLM存在的嚴(yán)重漏洞。研究發(fā)現(xiàn)，LLM的部分內(nèi)容可以在不到一周的時(shí)間內(nèi)以低至50美元的成本被復(fù)制，并且獲得的信息可以用于發(fā)動(dòng)有針對(duì)性的攻擊。這些潛在的攻擊者可能會(huì)泄露私人機(jī)密信息、繞過(guò)安全保護(hù)措施、提供錯(cuò)誤答案或進(jìn)行進(jìn)一步的有針對(duì)性攻擊。

機(jī)器人黑客

圖源備注：圖片由AI生成，圖片授權(quán)服務(wù)商Midjourney

這項(xiàng)名為“模型寄生”的攻擊方法通過(guò)與LLM進(jìn)行交互，提出一系列有針對(duì)性的提示，以使LLM提供深入見(jiàn)解的信息，揭示了模型的工作方式。研究團(tuán)隊(duì)在研究中主要關(guān)注了ChatGPT-3.5-Turbo，然后利用這一知識(shí)創(chuàng)建了自己的復(fù)制模型，該模型的大小只有原模型的1%，但復(fù)制了LLM的關(guān)鍵特征。研究人員隨后利用這個(gè)模型副本作為測(cè)試平臺(tái)，研究如何在不被察覺(jué)的情況下利用ChatGPT的漏洞。他們成功地利用從模型中獲得的知識(shí)攻擊ChatGPT，并提高了11%的成功率。

蘭開(kāi)斯特大學(xué)的Peter Garraghan博士表示:“我們發(fā)現(xiàn)的現(xiàn)象在科學(xué)上令人著迷，但也極具憂慮。這是首次實(shí)證證明安全漏洞可以成功傳遞于封閉源和開(kāi)源的機(jī)器學(xué)習(xí)模型之間，這在考慮到產(chǎn)業(yè)如何依賴像HuggingFace這樣的公開(kāi)可用機(jī)器學(xué)習(xí)模型時(shí)，令人極為擔(dān)憂?！?/p>

研究人員指出，盡管這些強(qiáng)大的數(shù)字AI技術(shù)具有明顯的用途，但它們存在著隱藏的弱點(diǎn)，甚至不同模型之間可能存在共同的漏洞。各行各業(yè)的企業(yè)目前正在或準(zhǔn)備投資數(shù)十億美元用于開(kāi)發(fā)自己的LLM，以執(zhí)行各種任務(wù)，如智能助手。金融服務(wù)和大型企業(yè)也在采用這些技術(shù)，但研究人員表示，這些漏洞應(yīng)該成為計(jì)劃構(gòu)建或使用第三方LLM的所有企業(yè)的主要關(guān)切點(diǎn)。

Peter Garraghan博士強(qiáng)調(diào):“雖然LLM技術(shù)具有潛在的變革性，但企業(yè)和科學(xué)家都必須仔細(xì)考慮采用和部署LLM所涉及的網(wǎng)絡(luò)安全風(fēng)險(xiǎn)?！边@項(xiàng)研究為我們提醒了雖然AI技術(shù)帶來(lái)了巨大的機(jī)會(huì)，但也伴隨著一系列潛在的威脅，因此必須謹(jǐn)慎行事。

論文網(wǎng)址:https://techxplore.com/partners/lancaster-university/

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

谷歌利用 AI 發(fā)現(xiàn) 20 年前的軟件漏洞：「模糊測(cè)試」改寫(xiě)安全游戲規(guī)則

站長(zhǎng)之家11月23日消息：谷歌近日通過(guò)AI程序發(fā)現(xiàn)了一個(gè)隱藏了二十年的開(kāi)源軟件漏洞。谷歌在周三的一篇博客文章中表示，借助類(lèi)似ChatGPT的AI工具，公司共識(shí)別出了26個(gè)漏洞，其中包括一個(gè)在OpenSSL中潛伏了二十年的漏洞。本月早些時(shí)候，谷歌宣布，BigSleep已成功發(fā)現(xiàn)SQLite中一個(gè)此前未知且可利用的漏洞。

?谷歌 ?Google ?人工智能
薦川普贏了，AI圈炸了！英偉達(dá)市值突破3.6萬(wàn)億， OpenAI研究員：他或?qū)⒁?jiàn)證AGI誕生

科技行業(yè)的游戲規(guī)則，正悄然改寫(xiě)。川普政府即將上臺(tái)，整個(gè)科技圈醞釀著一場(chǎng)重大的變革。大規(guī)模AI競(jìng)賽對(duì)芯片狂熱需求，讓英偉達(dá)股價(jià)直沖云霄，創(chuàng)史上首個(gè)3.6萬(wàn)億美金市值最高紀(jì)錄。史上首個(gè)市值超3.6萬(wàn)億美金的巨頭誕生了!果不其然，美國(guó)大選后，世界最大的贏家當(dāng)屬英偉達(dá)。GPU霸主的股價(jià)在當(dāng)?shù)貢r(shí)間周四，飆漲2.2%創(chuàng)下新高。

?川普
薦我讓AI假扮“知乎大V”，回答了上百個(gè)問(wèn)題無(wú)人發(fā)現(xiàn)

提出“電車(chē)難題”的哲學(xué)教授桑德?tīng)柡驮S知遠(yuǎn)一起探討了“人工智能的發(fā)展是否會(huì)挑戰(zhàn)人類(lèi)存在的意義”這一話題，諸如“如果你的親人在死后以AI的形式繼續(xù)和你交流，你會(huì)愿意嗎?”這并非虛無(wú)縹緲的宏大議題。不知道大家有沒(méi)有感覺(jué)，AI生成的內(nèi)容已經(jīng)占據(jù)了大多數(shù)人的社交平臺(tái)。”AI時(shí)代涌現(xiàn)的超級(jí)個(gè)體們，仍然有很長(zhǎng)的故事要講。

?知乎大V
數(shù)據(jù)安全合規(guī)神器 | 高效、安全、低成本的金融數(shù)據(jù)安全治理實(shí)踐

數(shù)據(jù)安全合規(guī)神器|高效、安全、低成本的金融數(shù)據(jù)安全治理實(shí)踐隨著數(shù)字經(jīng)濟(jì)建設(shè)進(jìn)程加快，數(shù)據(jù)要素也加速流通、共享，數(shù)據(jù)價(jià)值愈發(fā)凸顯的同時(shí)也面臨著更多的安全風(fēng)險(xiǎn)，原有的數(shù)據(jù)安全防護(hù)體系難以適應(yīng)當(dāng)前新的需求。數(shù)據(jù)安全合規(guī)壓力劇增。最終幫助企業(yè)避免數(shù)據(jù)泄漏風(fēng)險(xiǎn)、順利通過(guò)上級(jí)部門(mén)監(jiān)管審查，也為業(yè)務(wù)數(shù)據(jù)安全常態(tài)化保障提供了有力支持。

?數(shù)據(jù)安全 ?合規(guī)管理 ?金融科技
新玩法：僅靠挖出用戶中自有KOC，就直降了80%成本

2024年冒出很多有效但低調(diào)的私域增長(zhǎng)玩法，或從現(xiàn)有資源和用戶挖出新的來(lái)源，或讓已有成本大幅下降。比如“自有KOC”模式。我們已經(jīng)在這方面應(yīng)用得比較成熟，特別是KOC的效率提升方面。

?私域增長(zhǎng) ?自有KOC ?品牌傳播
薦我去華強(qiáng)北走了一圈，發(fā)現(xiàn)這里正被另一種AI包圍

不夸張的說(shuō)，華強(qiáng)北已經(jīng)被AI包圍了。從前的華強(qiáng)北，“類(lèi)蘋(píng)果”是最大的賣(mài)點(diǎn)，如今，卻正在慢慢被AI席卷。今天每個(gè)真正關(guān)注AI硬件落地的人，看來(lái)都得去一趟華強(qiáng)北。

?華強(qiáng)北 ?AI電子產(chǎn)品 ?智能硬件
薦指令層級(jí)，幫助AI大模型防御惡意攻擊

隨著ChatGPT等生成式AI產(chǎn)品被廣泛應(yīng)用在AI代理/客服、虛擬助手等領(lǐng)域，在安全方面會(huì)遭遇黑客攻擊、惡意文本提示等難題。使用特定的提問(wèn)方式，可以讓ChatGPT輸出原始私密訓(xùn)練數(shù)據(jù)。即使面對(duì)未見(jiàn)過(guò)的惡意攻擊指令，經(jīng)過(guò)上下文蒸餾訓(xùn)練的模型也能夠更好地學(xué)習(xí)到這些知識(shí)，以識(shí)別和處理新的安全威脅。

?大模型
薦50多款AI眼鏡來(lái)了，大模型找到了應(yīng)用救星？

一開(kāi)始并不被扎克伯格重視的RaybanMeta現(xiàn)在已經(jīng)成為了硅谷科技達(dá)人的時(shí)尚單品，發(fā)售至今9個(gè)月，RaybanMeta眼鏡第二代已經(jīng)賣(mài)出了100多萬(wàn)臺(tái)第一代產(chǎn)品在1年半內(nèi)僅僅賣(mài)出去了30萬(wàn)臺(tái)。這款由Meta和Rayban聯(lián)名推出的AI眼鏡，第二代因?yàn)榻尤肓薓eta自研的大模型LIama3，提升了攝像/拍照水平，實(shí)現(xiàn)語(yǔ)音交互、物體識(shí)別、文字翻譯等功能，憑借不錯(cuò)的產(chǎn)品力，一下子成為了智能硬件領(lǐng)域的一匹黑馬。強(qiáng)大如Meta一年也才賣(mài)出百萬(wàn)臺(tái)，這是手機(jī)廠商們發(fā)布新品時(shí)3天就能達(dá)到的銷(xiāo)量，中國(guó)的AI眼鏡或許容不下太多玩家。

?Rayban ?Meta ?智能眼鏡
薦中廠怎么做AI，聊聊實(shí)用主義的美圖

經(jīng)過(guò)過(guò)去兩年的野蠻狂奔，今天AI產(chǎn)業(yè)的主流論斷已經(jīng)從當(dāng)初的FOMO狂熱情緒回歸到了PMF的冷靜思考。能看到AI圈在戰(zhàn)術(shù)上有兩個(gè)趨勢(shì)——第一是投放的競(jìng)爭(zhēng)烈度在加大，以豆包為代表的產(chǎn)品在流量投放時(shí)開(kāi)始踩下油門(mén);第二是AI云廠商的價(jià)格戰(zhàn)開(kāi)始愈演愈烈，從大幅降價(jià)到小杯模型免費(fèi)，API價(jià)格下降的速度讓人瞠目結(jié)舌。更多的長(zhǎng)期價(jià)值，需要美圖拿出更好的成績(jī)來(lái)證明。

?AI產(chǎn)業(yè) ?產(chǎn)品市場(chǎng)適配 ?投放競(jìng)爭(zhēng)
中聚AI女?huà)z大模型：專(zhuān)注企業(yè)服務(wù)的智能AI，讓企業(yè)難題一點(diǎn)就通！

在企業(yè)經(jīng)營(yíng)日益復(fù)雜的當(dāng)下，各類(lèi)繁瑣的管理和文書(shū)工作常讓人頭疼。中聚企服團(tuán)隊(duì)帶來(lái)了重磅新品——中聚AI，這款智能助手是基于中聚企服自主開(kāi)發(fā)的“女?huà)z大模型”，經(jīng)過(guò)長(zhǎng)時(shí)間的訓(xùn)練和測(cè)試，專(zhuān)為解決企業(yè)運(yùn)營(yíng)難題而生。如今，中聚AI已覆蓋幾乎所有企業(yè)經(jīng)營(yíng)所需的知識(shí)領(lǐng)域，只需通過(guò)中聚企服小程序輕松一點(diǎn)，便能獲得精準(zhǔn)的解決方案。中聚AI:一站式智能辦公助手，?

?企業(yè)智能助手 ?中聚AI ?文書(shū)管理

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

AI研究人員發(fā)現(xiàn)了主要大語(yǔ)言模型中關(guān)鍵漏洞可低成本復(fù)制

谷歌利用 AI 發(fā)現(xiàn) 20 年前的軟件漏洞：「模糊測(cè)試」改寫(xiě)安全游戲規(guī)則

薦川普贏了，AI圈炸了！英偉達(dá)市值突破3.6萬(wàn)億， OpenAI研究員：他或?qū)⒁?jiàn)證AGI誕生

薦我讓AI假扮“知乎大V”，回答了上百個(gè)問(wèn)題無(wú)人發(fā)現(xiàn)

數(shù)據(jù)安全合規(guī)神器 | 高效、安全、低成本的金融數(shù)據(jù)安全治理實(shí)踐

新玩法：僅靠挖出用戶中自有KOC，就直降了80%成本

薦我去華強(qiáng)北走了一圈，發(fā)現(xiàn)這里正被另一種AI包圍

薦指令層級(jí)，幫助AI大模型防御惡意攻擊

薦50多款AI眼鏡來(lái)了，大模型找到了應(yīng)用救星？

薦中廠怎么做AI，聊聊實(shí)用主義的美圖

中聚AI女?huà)z大模型：專(zhuān)注企業(yè)服務(wù)的智能AI，讓企業(yè)難題一點(diǎn)就通！

熱文

超過(guò)2200萬(wàn)用戶、年收入30億歐元:全球最大盜版流媒體網(wǎng)絡(luò)被摧毀

明年3月上市！小米SUV起售價(jià)曝光：可能23.59萬(wàn)元起

華為鴻蒙智行尊界 S800開(kāi)啟預(yù)訂 48 小時(shí)訂單達(dá) 2108 臺(tái)

菜鳥(niǎo)與東方甄選達(dá)成合作提供全平臺(tái)、多品類(lèi)訂單配送服務(wù)

微信內(nèi)測(cè)好友通話可邀請(qǐng)第三人

美團(tuán)發(fā)布2024年第三季度財(cái)報(bào)：營(yíng)收936億元同比增長(zhǎng)22.4%

張朝陽(yáng)李國(guó)慶張?zhí)m稱不反對(duì)企業(yè)家?guī)ж洠悍e極擁抱市場(chǎng)變化

廣電總局出手整治“霸總”微短劇防止通過(guò)炫富等制造爽點(diǎn)

余承東：明年起華為新手機(jī)、平板將全部直接搭載原生鴻蒙

馬斯克母親不滿兒子富豪標(biāo)簽：他是天才富翁是對(duì)他的貶低

國(guó)行Switch 2026年停止網(wǎng)絡(luò)服務(wù)：e商店將停運(yùn) 將免費(fèi)送4款大作

百度大模型又拿了個(gè)冠軍！全部8個(gè)維度均第一、7項(xiàng)滿分

13年前微信安裝包僅457KB 微信官方回應(yīng)14天自動(dòng)清理原圖

玩不玩LOL？馬斯克：耽誤造火箭不打算玩

任天堂宣布2026年關(guān)閉中國(guó)地區(qū)Switch eShop和網(wǎng)絡(luò)服務(wù)

周鴻祎談企業(yè)家IP打造:余承東開(kāi)始做短視頻，能否超越雷軍?

網(wǎng)易版小紅書(shū)！“網(wǎng)易小蜜蜂”App悄然上線：發(fā)力種草生意

站長(zhǎng)商機(jī)

AI研究人員發(fā)現(xiàn)了主要大語(yǔ)言模型中關(guān)鍵漏洞 可低成本復(fù)制

熱文

站長(zhǎng)商機(jī)

AI研究人員發(fā)現(xiàn)了主要大語(yǔ)言模型中關(guān)鍵漏洞可低成本復(fù)制