11.11云上盛惠!海量產品 · 輕松上云!云服務器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
【新智元導讀】LLM訓練速度還可以再飆升20倍!英偉達團隊祭出全新架構歸一化Transformer,上下文越長,訓練速度越快能維持原有精度。AI的未來,或許就此改寫......最近,英偉達團隊拋出的一枚重磅炸彈,提出了全新神經網絡架構——歸一化Transformer,基于超球面進行表示學習。下圖6展示了,注意力模塊和MLP模塊的特征學習率,應用于MLP中間狀態(tài)的縮放因子,應用于QK點積之前?
訓練Transformer,用來解決132年的數(shù)學世紀難題!如何判斷一個動力系統(tǒng)是否穩(wěn)定?Meta和巴黎理工學院團隊攜手提出SymbolicTransformer,直指這一經典難題的核心:發(fā)現(xiàn)新的全局李雅普諾夫函數(shù)。從牛頓、拉格朗日到龐加萊,無數(shù)科學家傾力研究三體問題的長期穩(wěn)定性,卻始終無法給出一個通用的判定方法。作者巴黎師范教授AmauryHayat表示,幾年前剛開始這個項目時,作為一個年輕天真?
【新智元導讀】隨著諾貝爾物理學獎頒給了「機器學習之父」GeoffreyHinton,另一個借鑒物理學概念的模型架構也橫空出世——微軟清華團隊的最新架構DifferentialTransformer,從注意力模塊入手,實現(xiàn)了Transformer的核心能力提升。隨著近些年來NLP領域研究的不斷深入,我們逐漸發(fā)現(xiàn),Transformer架構中出現(xiàn)的幻覺問題,以及各種下游任務中的性能不足,都或多或少與注意力缺陷有關。他的研究興趣是大語言模型的骨干網絡、長序列的建模和推理,以及大語言模型在其他領域的應用。
什么AI應用每秒處理20000個AI推理請求,達到2024年谷歌搜索流量的1/5?答案是獨角獸Character.ai,由Transformer作者NoamShazeer創(chuàng)辦。沙哥公布了推理優(yōu)化獨門秘訣,迅速引起業(yè)界熱議。最近有消息稱,Meta與馬斯克的𝕏都在爭取與他們合作,把聊天機器人引入社交平臺。
來自南京大學、上海人工智能實驗室、復旦大學、浙江大學的研究隊發(fā)布了一項關于視頻理解的開創(chuàng)性工作。該研究全面審視了Mamba模型在建模中的多重角色,提出了針對14種模型/模塊的VideoMambaSuite,并對其在12項視頻理解任務中進行了深估。綜合實驗結果顯示,Mamba模型在視頻理解領域具潛在的優(yōu)勢和多樣化的角色,為未來視頻理解研究提供了有力的推動和參考價值。
特斯拉正式揭開了全新Model3P的神秘面紗,售價33.59萬元,預計交付日期為2024年第三季度。新推出的特斯拉Model3Performance,不僅繼承了特斯拉一貫的高品質與卓越性能,更在細節(jié)之處展現(xiàn)了品牌的匠心獨運。相信憑借其卓越的性能和合理的價格,新款Model3Performance定將成為市場上的一款熱銷車型。
2024年3月26日,聯(lián)泰科技與Formlabs戰(zhàn)略合作簽訂儀式及技術交流會在廣東東莞圓滿落幕!本次戰(zhàn)略合作的達成將進一步推動雙方企業(yè)在3D打印領域的深度融合,以期用專業(yè)實力共筑增材制造行業(yè)發(fā)展新未來。聯(lián)泰科技與Formlabs戰(zhàn)略合作簽訂儀式現(xiàn)場聯(lián)泰科技副總經理&營銷中心總經理汪超先生表示,非常榮幸能夠與Formlabs達成此次戰(zhàn)略合作。聯(lián)泰科技與Formlabs的攜手同行將是增材制造領域對新質生產力的再一次生動詮釋,期待雙方在后續(xù)的合作中帶給行業(yè)更多的精彩內容。
3月29日,知名AI研究實驗室AI21在官網開源了,首個基于SSM-Transformer混合架構的商業(yè)大模型——Jamba。ChatGPT、StableDifusion、Lyria等產品使用的皆是Transformer架構,雖然在捕捉序列內長距離依賴關系、泛化能力、特征提取等方面非常優(yōu)秀,但在處理長序列、訓練大參數(shù)模型時存在AI算力消耗大、過擬合、內存占用大等缺點。耐克、Zoom、沃爾瑪、三星、阿迪達斯、airbnb等知名企業(yè)在使?
【新智元導讀】剛剛,OpenAI超級對齊團隊負責人官宣開源Transformer調試器。研究人員不用寫代碼,就能快速探索LLM的內部構造了!AGI真的越來越近了!為了確保人類不被AI殺死,在解密神經網絡/Transfomer黑箱這一方面,OpenAI從未停下腳步。研究人員使用了了幾個附加指標的組合:不過研究人員也表示,希望從Transformer上訓練的稀疏自動編碼器中,為字典學習解決方案確定更好的指標。
隨著大模型的崛起,RNN模型Eagle7B挑戰(zhàn)了Transformer的霸主地位。該模型在多語言基準測試中表現(xiàn)卓越,同時推理成本降低數(shù)十倍。通過不斷探索和創(chuàng)新,人工智能技術將更好地為人類社會和個體提供服務。
在深度學習技術的推動下,圖像分割領域發(fā)生了巨大變革VisionTransformers在其中發(fā)揮了重要作用。本文介紹了一種基于Transformer的圖像分割模型——Mask2Former,該模型在語義、實例和全景分割任務上都能夠使用相同的架構,具有通用性。在實際應用中,需要根據具體需求權衡模型性能和資源消耗,選擇合適的模型。
INFORM日前宣布了一些關鍵預測和將影響眾多行業(yè)及社會實踐的AI趨勢。AI的迅速發(fā)展使其從炒作轉向為部署,成為我們生活和業(yè)務流程不可或缺的一部分。」INFORM將繼續(xù)探索這些趨勢,提供創(chuàng)新解決方案,同時倡導負責任和道德的AI開發(fā),正如2023年9月發(fā)布的《負責任AI指南》所展示的。
Adobe研究人員與斯坦福大學團隊聯(lián)合提出了一種名為DMV3D的全新3D生成方法。該方法旨在解決增強現(xiàn)實、虛擬現(xiàn)實、機器人技術和游戲等領域中3D資產創(chuàng)建的共同挑戰(zhàn)。該研究為通過統(tǒng)一3D重建和生成的2D和3D生成模型的領域之間的鴻溝,以解決3D視覺和圖形領域中的各種挑戰(zhàn),提供了新的視角和可能性。
斯坦福大學和卡內基梅隆大學的研究團隊聯(lián)合提出了一種新的序列模型,名為Mamba,它在語言、音頻和DNA序列等任務上超越了Transformer模型。Mamba采用了一種新的架構,具有線性復雜度和更高的推理吞吐量。Mamba的出現(xiàn)對于序列建模領域來說是一個重要的突破,未來還有許多研究和實踐的工作需要進行。
在別的領域,如果你想形容一個東西非常重要,你可能將其形容為「撐起了某領域的半壁江山」。但在AI大模型領域,Transformer架構不能這么形容,因為它幾乎撐起了「整個江山」。與類似規(guī)模的Transformer相比,Mamba具有5倍的生成吞吐量Mamba-3B的質量與兩倍于其規(guī)模的Transformer相當。
在計算機圖形學中,「三角形網格」是3D幾何物體的主要表現(xiàn)形式,也是游戲、電影和VR界面中主要使用的3D資產表示方法。業(yè)界通?;谌切尉W格來模擬復雜物體的表面,如建筑、車輛、動物,常見的幾何變換、幾何檢測、渲染著色等動作,也需要基于三角形網格進行。如下圖9所示,MeshGPT還可以基于給定的局部形狀推斷出多種可能的補全,生成多種形狀假設。
Meta的研究者發(fā)表了一項關于Transformer架構的新研究,提出了一種名為System2Attention的全新注意力機制。該研究旨在解決大型語言模型在推理能力上的不足,特別是在處理復雜任務時可能出現(xiàn)的錯誤。S2A的引入為解決當前LLM推理能力不足的問題提供了一種創(chuàng)新性的解決方案。
大型語言模型,如GPT-3、PaLM和OPT,以其卓越的性能和能夠在上下文中學習的能力,令人嘆為觀止。它們在推斷時的高成本是它們的顯著缺點。這些有前途的實驗結果突顯了上下文稀疏性在顯著減少推斷延遲方面的潛力,相較于現(xiàn)有模型,這項研究使LLM更容易被更廣泛的AI社區(qū)使用,可能開啟令人興奮的新的AI應用。
Transformer一作AshishVaswani所在的AI公司Adept發(fā)布了多模態(tài)大模型Fuyu-8B。這一模型具有80億參數(shù),可理解各種圖像類型,包括照片、圖表、PDF和界面UI。這一創(chuàng)新團隊的目標是利用大模型的能力來提升人機合作,使得人類能更高效地完成各種任務。
繼Qbot在八月份被封殺后,F(xiàn)ormbook成為最猖獗的惡意軟件2023年10月,全球領先的網絡安全解決方案提供商CheckPoint?軟件技術有限公司發(fā)布了其2023年9月《全球威脅指數(shù)》報告。研究人員報告了一起針對哥倫比亞企業(yè)的新型隱秘網絡釣魚攻擊活動,該攻擊活動旨在秘密傳播Remcos遠程訪問木馬。CheckPoint為十萬多家各種規(guī)模的企業(yè)提供保護。
CatBERTa是一種基于Transformer的人工智能模型,旨在通過文本輸入進行能量預測。該模型建立在預訓練的Transformer編碼器之上,這是一種在自然語言處理任務中表現(xiàn)出色的深度學習模型。它展示了提高能量差異預測精度的可能性,為更有效和精確的催化劑篩選程序打開了大門。
Meta團隊開發(fā)了一款名為Megabyte的模型,聲稱能夠解決“大模型標配”Transformer所存在的問題速度比它還快4成!目前,Transformer架構比較流行,但是存在兩個重要的缺陷:一方面,自注意力成本隨著輸入和輸出字節(jié)長度的增加迅速增加,如音樂、圖像或視頻文件通常包含數(shù)兆字節(jié)大型解碼器通常只使用幾千個上下文標記;另一方面,前饋網絡單獨對字符組或位置進行操作是難以實現(xiàn)可
NLP領域的主流模型Transformer在GitHub上星標破10萬大關,成為AI領域的基石王者,也是繼Tensorflow和Auto-GPT之后第三個突破10萬星的機器學習庫。Transformer的成功標志著AI領域的技術進步和開源社區(qū)的發(fā)展。Transformer已經成為NLP領域的主流模型,甚至成功向其他領域跨界,成為風靡AI界的機器學習架構。
Facebook+母公司+Meta+的人工智能研究人員推出了一種新的語言模型Toolformer,旨在處理自然語言處理用例中多個+API的調用。Toolformer+基于+GPT-J,后者是一種67億參數(shù)的開源語言模型。Meta+的研究人員在他們的論文中承認,Toolformer+比其同時代的+ChatGPT+更不完整,其目前在使用上仍存在局限性”。
加拿大廠商Formify推出了新款定制游戲鼠標,提升用戶使用舒適度。玩家只需要提供手部照片,F(xiàn)ormify就能夠通過軟件創(chuàng)建一個定制3D模型,隨后針對玩家的獨特定制需求定制鼠標,即使在長時間游戲也不會感到不適。為殘疾人士3D打印游戲設備是另一個發(fā)展領域,F(xiàn)ormify希望有更多的人享受游戲的樂趣。
Check Point Research 報告稱,10 月份 Lokibot 攻擊數(shù)量顯著增加,五個月來首 次位列排行榜第三位。2022 年 11 月, 全球領先的網絡安全解決方案提供商 Check Point 軟件技術有限公司發(fā)布了其 2022 年 10 月最 新版《全球威脅指數(shù)》報告。Check Point 為十萬多家各種規(guī)模的企業(yè)提供保護。
精彩倒計時! 2022 年Formlabs用戶峰會將在 10 月 27 日正式開幕...在Formlabs2022 年全球年度用戶峰會到來之際,F(xiàn)ormlabs迎來了一個重大里程碑——全球打印量達到一億件...本次的大中華區(qū)用戶峰會,F(xiàn)ormlabs還特別增設了現(xiàn)場抽獎和產品展示環(huán)節(jié)...2.在主頁右下角點擊“用戶峰會”...去年的用戶峰會上,Max 為大家展示了自己用Form 3L生態(tài)系統(tǒng)為自己的小孩制作的平衡車......
CPR 報告稱,F(xiàn)ormbook 仍是最猖獗的惡意軟件,影響了全球 3% 的機構;Vidar 目前位列第八位,比 8 月份上升了 7 位...FormBook– FormBook是針對 Windows 操作系統(tǒng)的信息竊取程序,于 2016 年首 次被發(fā)現(xiàn)...↑XMRig - XMRig是一種用于挖掘門羅幣加密貨幣的開源 CPU 軟件...Joker– 一種存在于 Google Play 中的 Android 間諜軟件,可竊取短消息、聯(lián)系人列表及設備信息......
韓國檢察官駁斥了Du Kwon在周末的說法即沒有在逃,另外還要求國際刑警組織對這位Terraform Labs的聯(lián)合創(chuàng)始人發(fā)出“紅色通緝令”...國際刑警組織的紅色通緝令是向全世界的執(zhí)法部門發(fā)出的,它可以阻止個人獲得簽證、限制跨境旅行并在引渡、移交或類似法律行動之前暫時逮捕某人...韓國上周對Kwon發(fā)出了逮捕令,此舉使許多投資者賣出了他們在復蘇的Luna代幣上的頭寸...在上月接受Coinage采訪時,Kwon稱他沒有跟韓國當局接觸過...
Formlabs SLASLS桌面3D打印機 618 年中大促!最高直降 6600 元...一年一度的 618 活動來襲,全球知名的桌面SLA/SLS 3D打印機品牌Formlabs,推出了多種優(yōu)惠選擇,最高直降 6,600 元, 活動有效期: 6 月 7 日 -7 月 7 日...Formlabs 老客戶升級購買 Form3L/Form 3BL 設備,即可獲 6, 600 元 折扣優(yōu)惠...Formlabs 老客戶升級購買 Form 3+,可獲得 3, 300 元 折扣優(yōu)惠......