11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
一篇文章在推特上爆火,利用純提示方法讓普通LLM搖身一變,成為具備復(fù)雜推理能力的OpenAIo1。OpenAIo1正式登場。組織可以使用較小的開源模型來替代GPT-4o等成本較高的模型,用于需要復(fù)雜推理能力來解決的任務(wù)。
就在一個月前,OpenAI悄悄發(fā)布了o1,o1的推理能力是有目共睹的。我當(dāng)時用了幾個很難很難的測試樣例去試驗了一下,很多模型見了都會犯怵,開始胡說八道。
近日,蘋果公司推出了300億參數(shù)的多模態(tài)AI大模型MM1.5,該版本是在前代MM1的架構(gòu)基礎(chǔ)上發(fā)展來的。該模型繼續(xù)遵循數(shù)據(jù)驅(qū)動的訓(xùn)練原則,著重探究在不同訓(xùn)練周期中混合各類數(shù)據(jù)對模型性能產(chǎn)生的影響,相關(guān)模型文檔已在HuggingFace上發(fā)布。盡管MM1.5模型在多項基準(zhǔn)測試中表現(xiàn)優(yōu)異,但蘋果團(tuán)隊仍計劃通過進(jìn)一步融合文本、圖像和用戶交互數(shù)據(jù),并設(shè)計更復(fù)雜的架構(gòu),來提升模型對移動設(shè)備UI的理解能力,從讓蘋果牌”AI更強大。
TechWeb文/卞海川毫無預(yù)熱的情況下,OpenAI于9月13日凌晨發(fā)布了o1系列的大模型,這是傳聞中內(nèi)部代號為“草莓”的項目,也是OpenAI首款具備復(fù)雜推理能力的大模型。與其前代模型相比,新模型o1擅長通用復(fù)雜推理,在物理、信息學(xué)等領(lǐng)域表現(xiàn)優(yōu)異,OpenAICEO奧特曼稱它是一種新范式的開始:可以進(jìn)行通用復(fù)雜推理的人工智能。但在一些自然語言任務(wù)中,GPT-4o更勝一籌。
9月13日,OpenAI發(fā)布了全新的AI大模型——o1系列,標(biāo)志著大模型技術(shù)發(fā)展邁入了一個新的里程碑。o1模型專注于解決復(fù)雜問題,通過強化學(xué)習(xí)實現(xiàn)了在復(fù)雜推理任務(wù)上的突破,使得一個通用模型能夠處理比以往科學(xué)、代碼和數(shù)學(xué)模型更加困難的問題。OpenAI表示,未來將繼續(xù)推進(jìn)模型的迭代更新,并增加更多實用功能,如網(wǎng)絡(luò)瀏覽、文件和圖像上傳等,以進(jìn)一步提升AI模型的實用性和用戶體驗。
今日凌晨,OpenAI正式推出了OpenAIo1預(yù)覽模型。對于復(fù)雜推理任務(wù)言,新模型代表著人工智能能力的嶄新水平,其特點就是會在回答之前花更多時間進(jìn)行思考,就像人類思考解決問題的過程一樣。OpenAI宣布,ChatGPT訂閱用戶從9月12日起可以訪問這兩個新模型,o1-preview每周消息數(shù)量限制為30條,o1-mini則為50條。
雖然我人還在泰國跟紅衣大叔周鴻祎在靶場開心的射擊。但是也知道昨天的一條微博熱搜爆了。這是我最微不足道、最真誠的祝愿。
谷歌旗下的DeepMind團(tuán)隊近期在國際數(shù)學(xué)奧林匹克中取得了令人矚目的成績。DeepMind的兩款人工智能模型——AlphaProof和AlphaGeometry2,成功解決了本年度比賽中的四個難題,達(dá)到了銀牌水平。OpenAI正在開發(fā)名為“Strawberry”的新型AI模型,以顯著提升AI的推理能力;Meta公司也推出了最新的AI模型Llama3.1,推動開源AI的發(fā)展。
OpenAI被曝出了新項目「草莓」,據(jù)悉能提前計劃,自主瀏覽網(wǎng)頁能進(jìn)行深度研究。草莓由大量通用數(shù)據(jù)上后訓(xùn)練成,推理能力顯著提高。在產(chǎn)品層面,OpenAI已經(jīng)做到了如此先進(jìn)的地步,如果再加上Strawberry的推理能力,OpenAI離AGI的實現(xiàn),恐怕是要很近了。
在最近的一項由北卡羅萊納大學(xué)教堂山分校和艾倫AI研究所共同進(jìn)行的研究中,人工智能的道德推理能力再次得到了令人矚目的展現(xiàn)。特別是OpenAI的新型聊天機器人GPT-4o,在道德推理和提供道德建議方面,已經(jīng)超越了公認(rèn)的道德專家。研究人員也提醒我們,盡管AI在道德推理方面表現(xiàn)出色,但在實際應(yīng)用中仍需謹(jǐn)慎對待其建議,特別是在缺乏人類監(jiān)督的情況下。
新加坡國立大學(xué)聯(lián)合加州大學(xué)圣芭芭拉分校與奧克蘭大學(xué)的研究人員提出了一種名為SymbCoT的全新推理框架,旨在提升大語言模型的符號邏輯推理能力。這一框架結(jié)合了符號化邏輯表達(dá)式與思維鏈,極大提升了推理的質(zhì)量、魯棒性與可信度。不同LLM的影響:SymbCoT與更先進(jìn)的模型之間的協(xié)同效應(yīng)更為顯著。
OpenAI和Meta據(jù)稱正在準(zhǔn)備發(fā)布更先進(jìn)的AI模型,這些模型將能夠幫助解決問題并承擔(dān)更復(fù)雜的任務(wù)。OpenAI的首席運營官BradLightcap告訴《金融時報》,公司下一個版本的GPT將在解決"困難問題"方面取得進(jìn)展,例如推理。馬斯克表示,"有感知計算的總量"——這個概念可能指的是AI獨立思考和行動——將在五年內(nèi)超過所有人類。
小孩子都會的腦筋急轉(zhuǎn)彎推理題,GPT-4和Claude3做不出?國外一位開發(fā)者小哥堅稱這一觀點,認(rèn)為GPT模型在訓(xùn)練集外毫無推理能力,無法實現(xiàn)AGI,甚至懸賞1萬美元,發(fā)起比賽。他當(dāng)天就被光速打臉了!網(wǎng)友用高能的prompt,讓GPT-4和Claude3幾乎達(dá)到百分百的正確率。我只是互聯(lián)網(wǎng)上的一名普通人經(jīng)常犯錯。
3月29日,馬斯克旗下的AI公司x.ai在官網(wǎng)宣布,未來幾天內(nèi)即將發(fā)布Grok-1.5。x.ai開源了Grok-1的權(quán)重和網(wǎng)絡(luò)架構(gòu),成為大模型開源領(lǐng)域的一匹黑馬。訓(xùn)練數(shù)據(jù)方面,Grok-1發(fā)布版本所使用的訓(xùn)練數(shù)據(jù)截至2023年第三季度的互聯(lián)網(wǎng)數(shù)據(jù)以及xAI人工智能導(dǎo)師提供的數(shù)據(jù)。
隨著ChatGPT的出現(xiàn),大語言模型在生成連貫文本和遵循指令方面獲得了巨大技術(shù)突破。然后在推理和解決復(fù)雜內(nèi)容方面,面臨內(nèi)容不準(zhǔn)確、安全等難題。每次只需要一個查詢獲得相似性能的集成方法需要40倍的查詢量,也就是說可以節(jié)省很多算力資源。
深度學(xué)習(xí)領(lǐng)域的研究人員發(fā)現(xiàn),語言模型在邏輯推理方面的表現(xiàn)仍然是一個重要挑戰(zhàn)。最新的一項由Google旗下的DeepMind進(jìn)行的研究揭示了一個簡單重要的發(fā)現(xiàn):任務(wù)中前提的順序顯著影響語言模型的邏輯推理性能。通過這項研究,我們可以看到改變前提順序可能是提升語言模型推理能力的一種簡單有效的方法,也為未來改進(jìn)這一領(lǐng)域的研究提供了新的方向。
谷歌最新研究提出SpatialVLM,旨在解決視覺語言模型缺乏空間推理能力的問題。視覺語言模型在理解目標(biāo)在三維空間中位置或關(guān)系時存在困難,研究者通過借鑒人類空間推理能力的思路,提出了這一新方法。這一研究成果有望推動視覺語言模型在未來的發(fā)展方向上取得更大突破,為人工智能領(lǐng)域帶來新的進(jìn)步。
谷歌最新論文揭示的SpatialVLM,是一種具備空間推理能力的視覺語言模型,旨在解決當(dāng)前視覺語言模型在空間推理方面的困難。視覺語言模型在圖像描述、視覺問答等任務(wù)上取得顯著進(jìn)展,但在理解目標(biāo)在三維空間中的位置或空間關(guān)系方面仍存在難題。這一研究為視覺語言模型的空間推理能力提供了新的思路,為未來在機器人、圖像識別等領(lǐng)域的發(fā)展帶來了新的可能性。
谷歌AI研究團(tuán)隊最近提出了SpatialVLM,這是一種旨在增強視覺語言模型空間推理能力的創(chuàng)新系統(tǒng)。盡管先進(jìn)的模型如GPT-4V在人工智能驅(qū)動任務(wù)中取得了顯著進(jìn)展,但它們在空間推理方面仍存在顯著局限。-SpatialVLM的開發(fā)標(biāo)志著人工智能技術(shù)的重大進(jìn)步。
在AAAI2024上,小紅書搜索算法團(tuán)隊推出了一項創(chuàng)新框架,旨在解決大語言模型在推理任務(wù)中的黑盒屬性和龐大參數(shù)量帶來的問題。傳統(tǒng)研究方法主要關(guān)注正樣本這項工作強調(diào)了負(fù)樣本在知識蒸餾中的價值。這一研究為提高大語言模型應(yīng)用性能提供了新思路,通過引入負(fù)樣本的知識,彌補了傳統(tǒng)研究方法的不足,為推理任務(wù)的應(yīng)用提供了更可靠和高效的解決方案。
“一個法律案件的事實是否清晰,與法條之間的關(guān)系如何判定,全部都在講求邏輯。”在MEET2024智能未來大會現(xiàn)場,面壁智能聯(lián)合創(chuàng)始人、CEO李大海談到大模型在法律行業(yè)的落地時強調(diào)了邏輯推理能力的重要性。希望行業(yè)里的所有伙伴一起來把這些問題攻克和解決,讓整個社會和人們的生活變得更好。
英特爾正式發(fā)布了全新酷睿Ultra移動處理器,代號為MeteorLake。酷睿Ultra的設(shè)計目標(biāo)是在能效、制造工藝和性能方面實現(xiàn)突破。它的AI性能在各個方面都遙遙領(lǐng)先競品,比如在GIMPStableDiffusion中,性能提升達(dá)到了競品的5.4倍。
ChatGPT推出已滿一周年,目前每周活躍用戶約1億,超過92%的財富500強公司都在使用ChatGPT。但最近幾周,OpenAI經(jīng)歷了過山車式的人事變動,首席執(zhí)行官SamAltman被董事會罷免后又回歸,宣布組建了新的董事會。注:Lightcap和OpenAI拒絕就Altman被罷免和重新任命的具體情況發(fā)表進(jìn)一步評論。
LeCun在推特上引發(fā)了關(guān)于大語言模型推理能力的討論,強調(diào)LLM缺乏真正的規(guī)劃推理能力,其涌現(xiàn)能力實際上是上下文學(xué)習(xí)的結(jié)果。研究通過多個實驗驗證LLM在復(fù)雜規(guī)劃任務(wù)上表現(xiàn)不佳,強調(diào)其能力受限于任務(wù)復(fù)雜度。隨著對LLM的研究的不斷深入,對其真實能力的理解也在逐漸清晰,為未來自然語言處理研究方向提供了有價值的參考。
Meta的研究者發(fā)表了一項關(guān)于Transformer架構(gòu)的新研究,提出了一種名為System2Attention的全新注意力機制。該研究旨在解決大型語言模型在推理能力上的不足,特別是在處理復(fù)雜任務(wù)時可能出現(xiàn)的錯誤。S2A的引入為解決當(dāng)前LLM推理能力不足的問題提供了一種創(chuàng)新性的解決方案。
微軟研究團(tuán)隊推出的13億參數(shù)模型Orca2在近期發(fā)布的一篇論文中探索了如何提升小型語言模型的推理能力。通過增強的訓(xùn)練信號,Orca2能夠在與其大小相似的模型中取得與5-10倍更大的模型相媲美甚至更好的性能。研究團(tuán)隊相信,提升小型模型的能力將為不同的應(yīng)用部署場景開辟新的可能,并在效率和功能之間找到平衡。
隨著大型語言模型的出現(xiàn),人工智能和數(shù)學(xué)問題求解領(lǐng)域取得了顯著進(jìn)展。這些模型在面對復(fù)雜的數(shù)學(xué)挑戰(zhàn)時仍然存在問題。對工具交互的優(yōu)勢和挑戰(zhàn)進(jìn)行的全面分析為未來的研究提供了重要見解,有望開發(fā)更先進(jìn)和適應(yīng)性更強的推理代理。
著名AI模型開源平臺HuggingFace上有超過320,000個大模型,并且每天保持高速增長。據(jù)統(tǒng)計只有大約6,000個模型支持ONNX格式,但微軟表示,實際上有超過130,000個模型支持該格式。在HuggingFace開源平臺上還有10萬個模型不支持ONNX格式,鼓勵更多的技術(shù)研究機構(gòu)、開源項目加入到ONNX社區(qū),以通過ONNXRuntime增強開發(fā)效率。
【新智元導(dǎo)讀】昨天,Baichuan2-53B正式發(fā)布!首次開放API,意味著百川大模型開始正式進(jìn)軍商用了。模型的數(shù)學(xué)和邏輯推理能力都大幅飆升,對于幻覺的處理,已經(jīng)在國內(nèi)遙遙領(lǐng)先。已經(jīng)有一大波令人印象深刻的創(chuàng)新,正在土壤中被醞釀了。
OpenAI開源的數(shù)學(xué)數(shù)據(jù)集,中國廠商新成績一舉沖到最前列!就在9月16日,國產(chǎn)大模型在權(quán)威推理評測集GSM8K中,首次達(dá)到了80%正確率,大幅領(lǐng)先GPT-3.5和LLaMA2-70B。且這家廠商在大模型榜單上刷新全球紀(jì)錄,已經(jīng)不是第一次了??梢圆豢鋸埖卣f一句,昆侖萬維和它家的天工大模型,已經(jīng)是大模型江湖中,一個繞不過去的狠角色了。