11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享。快來騰訊云選購吧!
多模態(tài)大模型在聽覺上,居然也出現(xiàn)了「9.11>9.8」的現(xiàn)象,音量大小這種簡(jiǎn)單問題都識(shí)別不了!港中文、斯坦福等大學(xué)聯(lián)合發(fā)布的AV-Odyssey基準(zhǔn)測(cè)試,包含26個(gè)視聽任務(wù),覆蓋了7種聲音屬性,跨越了10個(gè)不同領(lǐng)域,確保測(cè)試的深度和廣度。在人工智能領(lǐng)域,我們一直以為頂尖的多模態(tài)大模型已經(jīng)無所不能,GPT-4o在ASR任務(wù)上已經(jīng)達(dá)到了97%的正確率,更是凸顯了強(qiáng)大的音頻理解能力?
據(jù)報(bào)道,英偉達(dá)CEO黃仁勛最近表示,在臺(tái)積電的幫助下,英偉達(dá)最新款BlackwellAI芯片的設(shè)計(jì)缺陷已得到修復(fù),該缺陷此前曾影響生產(chǎn)。在最近的高盛會(huì)議上,黃仁勛表示,這些芯片將在今年第四季度發(fā)貨。英偉達(dá)的Blackwell芯片采用了該公司之前產(chǎn)品大小的兩方硅片,并將它們結(jié)合在一起,形成一個(gè)單一的組件,在執(zhí)行諸如為聊天機(jī)器人提供答案之類的任務(wù)時(shí),速度提高了30倍。
近日,蘋果公司的AI研究團(tuán)隊(duì)發(fā)表了一篇題為UnderstandingtheLimitationsofLargeLanguageModelsinMathematicalReasoning”的論文,揭示了大型語言模型在數(shù)學(xué)推理方面的顯著局限性。盡管這些模型在生成人類水平的文本方面表現(xiàn)出色,但當(dāng)處理簡(jiǎn)單的數(shù)學(xué)問題時(shí),即使問題僅進(jìn)行了微小的改動(dòng),如添加無關(guān)信息,模型的表現(xiàn)也會(huì)急劇下降。雖然LLM在許多領(lǐng)域表現(xiàn)優(yōu)異,但其推理能力仍有待改進(jìn)。
【新智元導(dǎo)讀】AppleIntelligence上線在即,一小哥幾行代碼曝出AppleIntelligence安全缺陷。在2024年全球開發(fā)者大會(huì)上,Apple發(fā)布了將搭載在iOS18.1中的AI功能AppleIntelligence。為了避免LLM漏洞引發(fā)安全問題,Karpathy提醒大家:一定要可視化你的token,測(cè)試你的代碼。
【新智元導(dǎo)讀】在基準(zhǔn)測(cè)試上頻頻屠榜的大模型們,竟然被一道簡(jiǎn)單的邏輯推理題打得全軍覆沒?最近,研究機(jī)構(gòu)LAION的幾位作者共同發(fā)表了一篇文章,以「愛麗絲夢(mèng)游仙境」為啟發(fā)涉及了一系列簡(jiǎn)單的推理問題,揭示了LLM基準(zhǔn)測(cè)試的盲區(qū)。一道簡(jiǎn)單的邏輯問題,竟讓幾乎所有的LLM全軍覆沒?對(duì)于人類來說,這個(gè)名為「愛麗絲夢(mèng)游仙境」的測(cè)試并不算很難——「愛麗絲有N個(gè)兄弟,
亞馬遜公司宣布,他們正在利用生成式人工智能和計(jì)算機(jī)視覺技術(shù)來掃描包裹,以發(fā)現(xiàn)缺陷并降低退貨率。該AI模型名為“ProjectPI”,能夠在亞馬遜的訂單處理中心識(shí)別訂單中的問題產(chǎn)品。它推出了一個(gè)服務(wù),提供了幾家公司的人工智能模型。
谷歌DeepMind和斯坦福的研究人員發(fā)現(xiàn)大型語言模型在處理邏輯推理任務(wù)時(shí),前提信息的呈現(xiàn)順序?qū)ζ浔憩F(xiàn)具有決定性影響。在邏輯推理和數(shù)學(xué)問題中,前提按照邏輯自然順序排列時(shí),模型表現(xiàn)更佳。在邏輯推理中,前提順序?qū)Υ笮驼Z言模型推理表現(xiàn)有重大影響,如何應(yīng)對(duì)這一問題仍是一個(gè)挑戰(zhàn)。
谷歌周五承認(rèn),其人工智能工具Gemini在生成歷史人物圖像時(shí)出現(xiàn)錯(cuò)誤,導(dǎo)致圖像顯示出明顯的種族偏差。本周早些時(shí)候,媒體發(fā)現(xiàn)Gemini生成了不同種族的納粹分子和美國開國元?jiǎng)椎膱D像。谷歌將繼續(xù)努力改進(jìn)人工智能技術(shù),以克服這些挑戰(zhàn)。
近期來自紐約大學(xué)和UC伯克利的研究團(tuán)隊(duì)在多模態(tài)大語言模型領(lǐng)域取得了重要突破,成功捕捉到了其在視覺理解方面存在的重大缺陷。研究人員發(fā)現(xiàn),當(dāng)前的MLLM在特定場(chǎng)景下,甚至在一些人類容易識(shí)別的圖像問題上,表現(xiàn)不如隨機(jī)猜測(cè)。這不僅對(duì)AI領(lǐng)域的研究有著積極的推動(dòng)作用,也為未來開發(fā)更強(qiáng)大、全面的多模態(tài)大模型奠定了基礎(chǔ)。
谷歌DeepMind團(tuán)隊(duì)與其他團(tuán)隊(duì)聯(lián)合發(fā)表的一篇論文聲稱AI可以自主創(chuàng)造合成物,引發(fā)了廣泛討論。倫敦大學(xué)的一位化學(xué)教授發(fā)現(xiàn)了這篇論文中嚴(yán)重的缺陷,指出其材料表征存在問題,并建議撤回該論文。這一事件引發(fā)了對(duì)AI在化學(xué)領(lǐng)域應(yīng)用的討論,提醒人們?cè)趹?yīng)用AI時(shí)要注意其局限性。