11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵?lái)騰訊云選購(gòu)吧!
英特爾發(fā)布了新一代人工智能芯片Gaudi3,引發(fā)了業(yè)界的廣泛關(guān)注。Gaudi3的性能遠(yuǎn)超競(jìng)爭(zhēng)對(duì)手英偉達(dá)的H100芯片,成為當(dāng)前市場(chǎng)上最強(qiáng)大的AI芯片之一。這使得Gaudi3在AI領(lǐng)域的應(yīng)用中具有出色的表現(xiàn),特別適合處理大規(guī)模的深度學(xué)習(xí)模型。
日前,蔚來(lái)舉辦了150kWh首臺(tái)量產(chǎn)電池包下線儀式,有網(wǎng)友曬出了下線儀式的現(xiàn)場(chǎng)照片。蔚來(lái)董事長(zhǎng)李斌表示,目前,一代與二代平臺(tái)的所有車型都已經(jīng)完成了驗(yàn)證和公告,團(tuán)隊(duì)也進(jìn)行了各種測(cè)試,續(xù)航里程等性能表現(xiàn)超過(guò)預(yù)期。對(duì)于蔚來(lái)車主來(lái)說(shuō),150kWh電池包上線之后,車輛的續(xù)航能力隨之升級(jí),有長(zhǎng)途出行需求時(shí),只需在換電站租賃150kWh電池包即可,可靈活選用。
【新智元導(dǎo)讀】就在剛剛,老黃又來(lái)打破摩爾定律了:英偉達(dá)新核彈B200,一塊能頂5個(gè)H100,30倍推理加速,能訓(xùn)萬(wàn)億參數(shù)大模型!同時(shí)推出的AI推理微服務(wù)NIM,號(hào)稱讓全世界用上AI。就在剛剛結(jié)束的GTC人工智能大會(huì)上,英偉達(dá)的新一代性能巨獸Backwell誕生了!BlackwellB200GPU,是如今世界上最強(qiáng)大的AI芯片,旨在「普惠萬(wàn)億參數(shù)的AI」。有了世界最強(qiáng)的處理器Blackwell,新一輪技術(shù)革命即將開(kāi)啟。
英偉達(dá)在GTC開(kāi)發(fā)者大會(huì)上發(fā)布了最強(qiáng)AI加速卡BlackwellGB200,計(jì)劃今年晚些時(shí)候發(fā)貨。GB200采用新一代AI圖形處理器架構(gòu)Blackwell,其AI性能可達(dá)20petaflops,比之前的H100提升了5倍。英偉達(dá)的系統(tǒng)還可擴(kuò)展至數(shù)萬(wàn)GB200超級(jí)芯片,具有11.5exaflops的FP4計(jì)算能力。
【新智元導(dǎo)讀】LLM開(kāi)源從Infra做起!Meta公布了自己訓(xùn)練Llama3的H100集群細(xì)節(jié),看來(lái)Llama3快來(lái)了。每年3月份,照例各家大廠又要開(kāi)始秀自己最新的產(chǎn)品和研究了。Meta的目標(biāo)是創(chuàng)建靈活可靠的系統(tǒng),以支持快速發(fā)展的新模式和研究。
最新發(fā)布的全球最強(qiáng)AI芯片WSE-3引起了行業(yè)的矚目。該芯片采用了先進(jìn)的4萬(wàn)億晶體管5nm制程,擁有驚人的性能,單機(jī)可訓(xùn)練出24萬(wàn)億參數(shù)的模型,遠(yuǎn)超英偉達(dá)H100GPU。這種技術(shù)進(jìn)步將對(duì)整個(gè)AI產(chǎn)業(yè)產(chǎn)生深遠(yuǎn)的影響,加速了AI技術(shù)在各個(gè)領(lǐng)域的應(yīng)用和發(fā)展。
3月13日,社交、科技巨頭Meta在官網(wǎng)公布了兩個(gè)全新的24KH100GPU集群,專門(mén)用于訓(xùn)練大模型Llama-3。Llama-3使用了RoCEv2網(wǎng)絡(luò),基于Tectonic/Hammerspace的NFS/FUSE網(wǎng)絡(luò)存儲(chǔ),繼續(xù)使用了PyTorch機(jī)器學(xué)習(xí)庫(kù)。將Meta的Tectonic分布式存儲(chǔ)解決方案和Hammerspace結(jié)合在一起,可以在不影響規(guī)模的情況下實(shí)現(xiàn)快速功能迭代。
為了通用人工智能的宏大目標(biāo),扎克伯格正在給Meta的AI研究部門(mén)進(jìn)行大幅度的改組。Meta首席執(zhí)行官馬克?扎克伯格宣布,他的公司正在致力于為人工智能助手構(gòu)建「通用智能」并「負(fù)責(zé)任地開(kāi)源」,Meta正在將其兩個(gè)主要研究小組合并在一起以實(shí)現(xiàn)這一目標(biāo)。扎克伯格表示,Meta今年將推出一個(gè)新平臺(tái),讓任何人都可以創(chuàng)建自己的人工智能角色,并將其分發(fā)到Meta的社交應(yīng)用程序中,比如Facebook、Instagram和Threads。
NVIDIAAIGPU無(wú)疑是當(dāng)下的硬通貨,從科技巨頭到小型企業(yè)都在搶。MetaCEO扎克伯格近日就透露,為了訓(xùn)練下一代大語(yǔ)言模型Llama3,Meta正在建造龐大的計(jì)算平臺(tái),包括將在今年底前購(gòu)買多達(dá)35萬(wàn)塊NVIDIAH100GPU。微軟也是AMDInstinct的大客戶。
小米汽車技術(shù)發(fā)布會(huì)于今日下午舉辦,會(huì)上,雷軍正式發(fā)布了小米800V電池包。電池包是純電車的基石,是核心部件,成本占到整車的40%-50%,并且影響著車輛的續(xù)航、安全、操控。小米還行業(yè)首創(chuàng)了電芯倒置技術(shù)”,可保證電芯在極端熱失控情況下,快速向下釋放熱源,最大程度保證乘員艙安全。
【新智元導(dǎo)讀】最近,兩位哈佛輟學(xué)生共同創(chuàng)立的AI芯片公司,估值已達(dá)3400萬(wàn)美元,并計(jì)劃明年交付一款名為「Sohu」的AI推理加速芯片——其LLM推理性能達(dá)到H100的10倍單價(jià)吞吐量更是高達(dá)140倍。像Pika一樣的神級(jí)創(chuàng)業(yè)故事又要再次上演了?兩位哈佛退學(xué)的年輕人,想要制造一款專用于大語(yǔ)言模型加速的AI加速器芯片,將于2024年第三季度交付,推理性能達(dá)H100的10倍。CerebrasSystems的CEO
【新智元導(dǎo)讀】Inflection-2最新發(fā)布!性能碾壓一眾大廠模型,僅輸一手GPT-4要集成到Pi?最近,InflectionAI發(fā)布了全新的一款A(yù)I模型。更炸裂的是InfectionAI對(duì)這款模型的評(píng)價(jià)——性能直超谷歌和Meta開(kāi)發(fā)的兩款模型,緊隨OpenAI的GPT-4之后。真能充當(dāng)心理咨詢的角色呢。
H100再次在MLPerf中刷新了記錄!英偉達(dá)超算NVIDIAEos在GPT-3模型的基準(zhǔn)測(cè)試中,只用了3.9分鐘就完成了訓(xùn)練。這比6月份的刷新記錄的成績(jī)——10.9分鐘,提升了近3倍。為了遵守新規(guī),HGXH20、L20PCle和L2PCleGPU不僅性能是殘血的還只配備了殘血版的NVLink連接。
【新智元導(dǎo)讀】有分析公司算出來(lái),才三個(gè)月英偉達(dá)就賣出了800多噸H100。然市值已超萬(wàn)億的英偉達(dá),竟是一個(gè)「無(wú)計(jì)劃、無(wú)匯報(bào)、無(wú)層級(jí)」的公司。業(yè)內(nèi)專家曾稱,英偉達(dá)H100的利潤(rùn)率接近1000%。
市場(chǎng)研究公司Omdia披露,2023年第二季度,英偉達(dá)出貨了900噸H100AIGPU。Omdia認(rèn)為,一個(gè)帶有散熱器的H100GPU的平均重量超過(guò)3公斤,因此英偉達(dá)在第二季度出貨了30多萬(wàn)塊H100。Omida的最新報(bào)告顯示,該公司有望達(dá)到這一里程碑。
MLPerf作為業(yè)界公認(rèn)的AI系統(tǒng)性能基準(zhǔn)測(cè)試,最近發(fā)布了3.1版本。英偉達(dá)最新發(fā)布的GH200GraceHopper超級(jí)芯片首次在公開(kāi)基準(zhǔn)中亮相。未來(lái)的軟件優(yōu)化將進(jìn)一步釋放這些模塊中的英偉達(dá)OrinSoC的強(qiáng)大潛力。
【新智元導(dǎo)讀】現(xiàn)在,34BCodeLlama模型已經(jīng)能夠在M2Ultra上的Mac運(yùn)行了推理速度超過(guò)每秒20個(gè)token,背后殺器竟是「投機(jī)采樣」。開(kāi)源社區(qū)的一位開(kāi)發(fā)者GeorgiGerganov發(fā)現(xiàn),自己可以在M2Ultra上運(yùn)行全F16精度的34BCodeLlama模型推理速度超過(guò)了20token/s。投機(jī)解碼就是一個(gè)很好的例子,可以幫助我們從系統(tǒng)的角度進(jìn)行思考。
NVIDIAAI加速卡無(wú)疑是當(dāng)下最為火爆的產(chǎn)品,妥妥的一卡難求。有分析認(rèn)為,H100的全球需求量多達(dá)43.2萬(wàn)塊,但交付周期長(zhǎng)達(dá)3-6個(gè)月。刨除各種成本,NVIDIA的凈利率依然有30-40%左右,這就是本事!
據(jù)三名接近英偉達(dá)的人士透露,英偉達(dá)計(jì)劃將其頂級(jí)H100人工智能處理器的產(chǎn)量至少提高兩倍。按照英偉達(dá)人士的說(shuō)法,H100的2024年預(yù)計(jì)出貨量在150萬(wàn)至200萬(wàn)顆之間,相較于今年預(yù)計(jì)的50萬(wàn)出貨量,這是一個(gè)巨大的增幅。百度、字節(jié)跳動(dòng)、騰訊和阿里巴巴等互聯(lián)網(wǎng)巨頭在爭(zhēng)相購(gòu)買英偉達(dá)的高性能芯片,訂單總和價(jià)值高達(dá)50億美元沙特和阿聯(lián)酋被曝正在瘋狂下單”英偉達(dá)的AI芯片。
乘著人工智能熱潮,今年NVIDIA的AI計(jì)算卡真的賺瘋了。據(jù)Tomshardware報(bào)道,《巴倫周刊》資深撰稿人TaeKim最近在社交媒體上發(fā)布的帖子估計(jì),NVIDIA每銷售一臺(tái)H100加速卡,就能獲得1000%的利潤(rùn)。Tomshardware此前報(bào)道稱,NVIDIA今年內(nèi)計(jì)劃出售超過(guò)55萬(wàn)塊H100加速卡,其中大部分是出貨給美國(guó)公司,不過(guò)這一說(shuō)法還沒(méi)有被得到NVIDIA證實(shí)。
GPT-5的訓(xùn)練,需要5萬(wàn)張H100加持。英偉達(dá)GPU已成為各大AI公司開(kāi)發(fā)大模型的首選利器。但無(wú)論你怎么看,英偉達(dá)就是堡壘里的綠色國(guó)王。
據(jù)韓國(guó)經(jīng)濟(jì)日?qǐng)?bào)消息,存儲(chǔ)芯片制造商三星電子將為英偉達(dá)公司提供高性能半導(dǎo)體和封裝服務(wù),有望在其它大型科技公司中贏得訂單。根據(jù)周二首爾的行業(yè)消息,三星和英偉達(dá)正在對(duì) HBM3 芯片進(jìn)行技術(shù)驗(yàn)證和封裝服務(wù)。一旦完成工作,預(yù)計(jì)三星將負(fù)責(zé)封裝 H100,英偉達(dá)最新的人工智能 GPU,同時(shí)為處理器供應(yīng) HBM3 芯片。
由于AI火爆,NVIDIA的AI顯卡現(xiàn)在是供不應(yīng)求,其中高端的A100、H100尤其搶手,H100售價(jià)達(dá)到了25萬(wàn)元,廠商都是大批量下單NVIDIA也在加急下單,最近更是找到了外援,產(chǎn)能大增30%。NVIDIA的高端GPU采用了臺(tái)積電的7nm、5nm工藝代工,但是產(chǎn)能瓶頸不在先進(jìn)工藝上是所用的Cowos先進(jìn)封裝上,此前也是依賴臺(tái)積電,但后者的產(chǎn)能提升有限有AMD等公司的訂單搶產(chǎn)能。FP64/FP3260TFlops,F(xiàn)P162000TFlops,TF321000TFlops,都三倍于A100,F(xiàn)P84000TFlops,六倍于A100。
NVIDIAA100計(jì)算卡無(wú)疑是AI行業(yè)最火爆的加速計(jì)算卡它的下一代H100也發(fā)布一年多了,只是產(chǎn)量一直有限,需求又太火爆,妥妥的一卡難求。不過(guò)一家名為InflectionAI”的AI創(chuàng)業(yè)公司,卻宣布要用多達(dá)2.2萬(wàn)塊H100計(jì)算卡,打造一臺(tái)AI超級(jí)計(jì)算機(jī)。InflectionAI創(chuàng)業(yè)以來(lái)已經(jīng)拿到了大約15億美元投資,估值達(dá)40億美元。
機(jī)器學(xué)習(xí)及人工智能領(lǐng)域開(kāi)放產(chǎn)業(yè)聯(lián)盟MLCommons公布了兩項(xiàng)MLPerf基準(zhǔn)測(cè)試的最新數(shù)據(jù):在人工智能算力表現(xiàn)測(cè)試中,英偉達(dá)的H100芯片組刷新了所有組別的紀(jì)錄,也是唯一一個(gè)能夠執(zhí)行完所有基準(zhǔn)測(cè)試的硬件平臺(tái)。在最新的MLPerf基準(zhǔn)測(cè)試中,H100成功創(chuàng)下8項(xiàng)測(cè)試紀(jì)錄。如果按照當(dāng)前的命名方式,下一代GeForce產(chǎn)品應(yīng)該會(huì)成為GeForceRTX50系列的一員。
【新智元導(dǎo)讀】黃老板又贏麻了!在最新的MLPerf基準(zhǔn)測(cè)試中,H100成功創(chuàng)下8項(xiàng)測(cè)試紀(jì)錄。如果迫不得已,英偉達(dá)還可以從舊的Turing版本中拿出一個(gè)產(chǎn)品,更新AdaLovelace,給它封個(gè)「Super」待遇,進(jìn)一步擴(kuò)展Ada陣容。ZhiyeLiu表示,至少今年或明年,Lovelace架構(gòu)不會(huì)真正更新。
AI火爆之后,NVIDIA的顯卡成為香餑餑,尤其是高端的H100加速卡,售價(jià)超過(guò)25萬(wàn)元依然供不應(yīng)求它的性能也非??鋸?,最新的AI測(cè)試中全面刷新記錄,基于GPT-3的大語(yǔ)言模型訓(xùn)練任務(wù)紀(jì)錄已經(jīng)被刷至11分鐘。機(jī)器學(xué)習(xí)及人工智能領(lǐng)域開(kāi)放產(chǎn)業(yè)聯(lián)盟MLCommons公布了最新的MLPerf基準(zhǔn)評(píng)測(cè),其中包括8個(gè)負(fù)載測(cè)試,LLM大語(yǔ)言模型中就有基于GPT-3開(kāi)源模型的,很考驗(yàn)平臺(tái)的AI性能。FP64/FP3260TFlops,F(xiàn)P162000TFlops,TF321000TFlops,都三倍于A100,F(xiàn)P84000TFlops,六倍于A100。
MLPerf基準(zhǔn)測(cè)試是評(píng)估系統(tǒng)在一系列人工智能工作負(fù)載下的性能表現(xiàn)的重要指標(biāo)。人工智能正在快速發(fā)展,生成式人工智能工作負(fù)載日益突出MLPerf也在與行業(yè)一起不斷進(jìn)化。英偉達(dá)不再只是我們成長(zhǎng)過(guò)程中的游戲圖形公司是迅速成為我們集體未來(lái)的關(guān)鍵推動(dòng)者。
據(jù)著名的蘋(píng)果分析師郭明錤日前表示,蘋(píng)果正專注于增強(qiáng)iPhone與其VisionPro平臺(tái)之間的整合。郭明錤指出,升級(jí)硬件規(guī)格是構(gòu)建圍繞VisionPro的競(jìng)爭(zhēng)生態(tài)系統(tǒng)的關(guān)鍵方面。蘋(píng)果打算利用Wi-Fi7在同一局域網(wǎng)上運(yùn)行的硬件產(chǎn)品之間創(chuàng)建一個(gè)更無(wú)縫的生態(tài)系統(tǒng)。
正在預(yù)研固態(tài)電池技術(shù),該技術(shù)采用固態(tài)電解質(zhì)替代傳統(tǒng)電解液,能夠提高電池的能量密度,改善低溫放電性能和安全性。雖然金屬鋰負(fù)極的實(shí)際應(yīng)用仍然存在困難,但實(shí)驗(yàn)室測(cè)試顯示,采用固態(tài)電池技術(shù)可以讓電池的能量密度突破1000Wh/L,在小米13的機(jī)身空間內(nèi)裝進(jìn)6000mAh超大容量電池,大大改善了續(xù)航表現(xiàn)。小米的固態(tài)電池技術(shù)研究目前仍處于初級(jí)階段,但小米表示將繼續(xù)投入大量精力和資源進(jìn)行研發(fā),為消費(fèi)者提供更優(yōu)質(zhì)的移動(dòng)電源解決方案。