11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
【新智元導(dǎo)讀】谷歌DeepMind、UC伯克利和MIT的研究人員認(rèn)為,如果用大語言模型的思路來做大視頻模型,能解決很多語言模型不擅長的問題,可能能更進(jìn)一步接近世界模型。OpenAI開年推出的史詩巨作Sora,將改變視頻相關(guān)領(lǐng)域的內(nèi)容生態(tài)。雖然視頻生成模型面臨著如虛假生成和泛化能力等挑戰(zhàn),但它們有潛力成為自主的AI智能體、規(guī)劃者、環(huán)境模擬器和計(jì)算平臺,并最終可能作為?
谷歌的Gemini1.5和OpenAI的Sora模型引發(fā)熱議,但這些模型是否真的能很好地理解世界?以Sora為例,雖然給人們帶來了驚喜,但在模擬復(fù)雜物理原理方面存在一定局限性,如健身男子倒跑跑步機(jī)。隨著大型模型的發(fā)展,固有的缺點(diǎn)也顯現(xiàn)出來,模型在處理現(xiàn)實(shí)世界難以用語言描述的內(nèi)容時(shí)表現(xiàn)困難,長程任務(wù)也難以處理。該研究的推出將為語言模型更好地理解物理世界打開新的可能?
UC伯克利的CV三巨頭推出首個(gè)無自然語言的純視覺大模型,第一次證明純CV模型也是可擴(kuò)展的。更令人震驚的是,LVM竟然也能做對圖形推理題,AGI火花再次出現(xiàn)了?計(jì)算機(jī)視覺的GPT時(shí)刻,來了!最近,來自UC伯克利的計(jì)算機(jī)視覺「三巨頭」聯(lián)手推出了第一個(gè)無自然語言的純視覺大模型,并且第一次證明了純視覺模型本身也是可擴(kuò)展的。下圖展示了一些不容易用語言描述的提示——這是LVM可能最終勝過LLM的任務(wù)類型。
LLM,如ChatGPT,可以輕松地產(chǎn)生各種流利的文本,但是它們的準(zhǔn)確性有多高呢?語言模型容易產(chǎn)生事實(shí)錯(cuò)誤和幻覺,這讓讀者在決定是否相信一個(gè)信息來源時(shí)知道是否使用了這些工具來做新聞文章或其他信息文本的幽靈寫作。這些模型的發(fā)展也引發(fā)了對文本的真實(shí)性和原創(chuàng)性的擔(dān)憂,許多教育機(jī)構(gòu)也限制了ChatGPT的使用,因?yàn)閮?nèi)容很容易生成。這對于那些依賴于AI生成內(nèi)容做出決策的用戶來說,具有重要的意義。
生成式AI模型的新范式要來了。UC伯克利谷歌提出冪等生成網(wǎng)絡(luò),只需單步即可生圖。最新研究的代碼,未來將在GitHub上公開。
加州大學(xué)伯克利分校的一組研究人員成功使用ChatGPT生成了大規(guī)模數(shù)據(jù)集,以研究在應(yīng)對氣候變化中有用的金屬有機(jī)框架材料。根據(jù)發(fā)表在《美國化學(xué)學(xué)會志》的一項(xiàng)研究顯示,ChatGPT的應(yīng)用可以快速收集金屬有機(jī)框架的數(shù)據(jù),從加速相關(guān)研究。研究還表明,這種方法可應(yīng)用于化學(xué)的其他領(lǐng)域,展示了人工智能如何加速科學(xué)研究。
UC伯克利發(fā)起了大語言模型版排位賽,讓大語言模型隨機(jī)進(jìn)行battle,并根據(jù)它們的Elo得分進(jìn)行排名。排行榜數(shù)據(jù)顯示,Vicuna以1169分排名第一,Koala位列第二。之后不僅會定期更新排位賽榜單還會優(yōu)化算法和機(jī)制,并根據(jù)不同的任務(wù)類型提供更加細(xì)化的排名。