11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買(mǎi)1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵?lái)騰訊云選購(gòu)吧!
在當(dāng)下這個(gè)科技日新月異的時(shí)代,AI大語(yǔ)言模型正以前所未有的速度重塑各行各業(yè),教育領(lǐng)域也不例外。隨著AI技術(shù)的不斷成熟,其與職業(yè)教育的融合日益加深,為職業(yè)教育帶來(lái)了前所未有的變革機(jī)遇。她認(rèn)為:“隨著AI技術(shù)的不斷發(fā)展和應(yīng)用深化,數(shù)字職業(yè)教育將迎來(lái)更加廣闊的發(fā)展前景和無(wú)限可能。
【新智元導(dǎo)讀】Robin3D通過(guò)魯棒指令數(shù)據(jù)生成引擎生成的大規(guī)模數(shù)據(jù)進(jìn)行訓(xùn)練,以提高模型在3D場(chǎng)景理解中的魯棒性和泛化能力,在多個(gè)3D多模態(tài)學(xué)習(xí)基準(zhǔn)測(cè)試中取得了優(yōu)異的性能,超越了以往的方法,且無(wú)需針對(duì)特定任務(wù)的微調(diào)。多模態(tài)大語(yǔ)言模型以文本模態(tài)為基礎(chǔ),將其它各種模態(tài)對(duì)齊至語(yǔ)言模型的語(yǔ)義空間,從實(shí)現(xiàn)多模態(tài)的理解和對(duì)話能力。這種大幅的提升體現(xiàn)了對(duì)抗性數(shù)據(jù)對(duì)模型識(shí)別能力的提升。
AMD發(fā)布了自己的首個(gè)小語(yǔ)言模型,名為AMD-135M”。相比于越來(lái)越龐大的大語(yǔ)言模型,它體積小巧,更加靈活,更有針對(duì)性,非常適合私密性、專(zhuān)業(yè)性很強(qiáng)的企業(yè)部署。按照AMD的說(shuō)法,它的性能與其他開(kāi)源小模型基本相當(dāng)或略有領(lǐng)先,比如Hellaswag、SciQ、ARC-Easy等任務(wù)超過(guò)Llama-68M、LLama-160M,Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任務(wù)則基本類(lèi)似GTP2-124MN、OPT-125M。
Nvidia和MistralAI發(fā)布了一款新型的小型語(yǔ)言模型,據(jù)稱(chēng)該模型在小體積下依然具有「最先進(jìn)」的準(zhǔn)確性。該模型名為Mistral-NemMo-Minitron8B,是NeMo12B的迷你版本,參數(shù)量從120億縮減到了80億。開(kāi)發(fā)者可以將這些優(yōu)化技術(shù)應(yīng)用于所有現(xiàn)有的語(yǔ)言模型,從顯著提升整體性能,包括那些只能由AI加速服務(wù)器群組運(yùn)行的大型語(yǔ)言模型。
每一項(xiàng)革命性的技術(shù)誕生后,人類(lèi)都需要探尋技術(shù)走向“應(yīng)用普惠”的方法。正如造紙術(shù)的誕生帶來(lái)了文明的傳播,蒸汽機(jī)帶來(lái)了人流、物流,電子計(jì)算機(jī)技術(shù)帶來(lái)了今天互聯(lián)網(wǎng)的一切,它們背后的邏輯都是先進(jìn)技術(shù)普惠穿透了應(yīng)用邊界,觸達(dá)每個(gè)人,帶來(lái)社會(huì)級(jí)的變化,從形成了文明的更迭。“全方位降低使用AI的技術(shù)門(mén)檻、成本門(mén)檻,讓更多的組織和個(gè)人更容易、更廣泛地使用AI,才能實(shí)現(xiàn)真正的AGIforEveryonesGood。
探索MetaLlama3.1-405B能為你帶來(lái)哪些改變?yōu)槭裁催x擇MetaLlama3.1-405B?MetaLlama3.1-405B不僅僅是一款產(chǎn)品——它是一項(xiàng)革命性的技術(shù),致力于提供大型多語(yǔ)言預(yù)訓(xùn)練語(yǔ)言模型,以滿足自然語(yǔ)言處理研究人員、軟件開(kāi)發(fā)者、教育工作者和企業(yè)用戶的需求。通過(guò)AIbase,您可以輕松發(fā)現(xiàn)最適合您需求的人工智能工具,解鎖AI的力量。
歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、谷歌發(fā)布最強(qiáng)開(kāi)源語(yǔ)言模型Gemma2性能超越Llama3谷歌在最近的I/O柏林大會(huì)上宣布開(kāi)源最新語(yǔ)言模型Gemma2,該模型性能超越Llama3,同時(shí)具有高效推理和廣泛的硬件支持。CIR的首席執(zhí)?
6月18日,北京智譜華章科技有限公司與中國(guó)銀聯(lián)股份有限公司大語(yǔ)言模型聯(lián)合實(shí)驗(yàn)室簽約儀式在上海正式舉行。中國(guó)銀聯(lián)作為國(guó)內(nèi)領(lǐng)先的轉(zhuǎn)接清算機(jī)構(gòu),擁有豐富的金融支付數(shù)據(jù)和業(yè)務(wù)場(chǎng)景,智譜AI作為行業(yè)領(lǐng)先的大模型公司,專(zhuān)注于做大模型的中國(guó)創(chuàng)新,模型研發(fā)能力位列全球前列,雙方具備大模型合作的堅(jiān)實(shí)基礎(chǔ)。下一步雙方將推動(dòng)大語(yǔ)言模型應(yīng)用的科技研發(fā)、聯(lián)合創(chuàng)新、
DeepSeek-Coder-V2是一個(gè)開(kāi)源的Mixture-of-Experts代碼語(yǔ)言模型,性能與GPT4-Turbo相當(dāng),在代碼特定任務(wù)上表現(xiàn)卓越。它在DeepSeek-Coder-V2-Base的基礎(chǔ)上,通過(guò)6萬(wàn)億token的高質(zhì)量多源語(yǔ)料庫(kù)進(jìn)一步預(yù)訓(xùn)練,顯著增強(qiáng)了編碼和數(shù)學(xué)推理能力,同時(shí)保持了在通用語(yǔ)言任務(wù)上的性能。AIbase擁有一個(gè)全面的國(guó)內(nèi)外AI產(chǎn)品數(shù)據(jù)庫(kù),收錄了超過(guò)7000個(gè)出色的人工智能網(wǎng)站和產(chǎn)品,覆蓋了40多個(gè)不同的領(lǐng)域,如Ai繪畫(huà)生成、Ai文案寫(xiě)作、Ai視頻編輯、Ai智能營(yíng)銷(xiāo)等。
在CVPR2024上,美國(guó)英特爾研究院的蔡志鵬博士及其團(tuán)隊(duì)提出了一種名為L(zhǎng)-MAGIC的新技術(shù)。這項(xiàng)技術(shù)通過(guò)結(jié)合語(yǔ)言模型和圖像擴(kuò)散模型,實(shí)現(xiàn)了高質(zhì)量、多模態(tài)、零樣本泛化的360度場(chǎng)景生成。技術(shù)應(yīng)用:L-MAGIC還能夠利用深度估計(jì)模型生成場(chǎng)景的沉浸式視頻和三維點(diǎn)云,為場(chǎng)景理解和可視化提供了更多可能性。
本地部署大型語(yǔ)言模型的開(kāi)源框架Ollama備受關(guān)注,那么ollama到底是什么呢?一個(gè)專(zhuān)為本地機(jī)器設(shè)計(jì)的開(kāi)源框架,旨在簡(jiǎn)化大型語(yǔ)言模型的部署和運(yùn)行。它提供了一套工具和命令,使用戶能夠輕松地下載、管理和運(yùn)行各種語(yǔ)言模型,包括LLaMA、LLaVA等流行模型。它減少了對(duì)云服務(wù)或復(fù)雜基礎(chǔ)設(shè)施設(shè)置的依賴(lài),使得大型語(yǔ)言模型的部署和應(yīng)用變得更加容易和高效。
AI界近日迎來(lái)了一項(xiàng)重大突破,一款名為L(zhǎng)lama3-V的全新開(kāi)源視覺(jué)大語(yǔ)言模型正式亮相。Llama3-V基于Llama38B和siglip-so400m構(gòu)建,被業(yè)界譽(yù)為最先進(jìn)的視覺(jué)大語(yǔ)言模型之一。讓我們共同期待Llama3-V在未來(lái)AI應(yīng)用中的精彩表現(xiàn)。
AI界掀起了一股新風(fēng)潮,一款名為L(zhǎng)lama3-V的全新開(kāi)源視覺(jué)大語(yǔ)言模型橫空出世!這款模型基于Llama38B和siglip-so400m,被稱(chēng)為最先進(jìn)的視覺(jué)大語(yǔ)言模型之一。Llama3-V的推出無(wú)疑將為AI領(lǐng)域帶來(lái)一股新的風(fēng)向,讓我們拭目以待,看這款模型能為人工智能領(lǐng)域帶來(lái)怎樣的突破與創(chuàng)新!
蘋(píng)果最近推出了一項(xiàng)新的技術(shù)創(chuàng)新,去噪語(yǔ)言模型,通過(guò)大量合成數(shù)據(jù)的訓(xùn)練,取得了超越以往的成就,實(shí)現(xiàn)了自動(dòng)語(yǔ)音識(shí)別領(lǐng)域的最新性能水平。這項(xiàng)技術(shù)的核心在于使用文本轉(zhuǎn)語(yǔ)音系統(tǒng)創(chuàng)建音頻,并將其輸入ASR系統(tǒng),通過(guò)這種方式產(chǎn)生了嘈雜的假設(shè),與原始文本進(jìn)行配對(duì),從訓(xùn)練DLM。這種創(chuàng)新性的做法為DLM的性能提升提供了更廣闊的空間,使其在ASR領(lǐng)域引領(lǐng)潮流。
歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、李彥宏:百度搜索已有11%結(jié)果由AI生成在百度2024年第一季度財(cái)報(bào)電話會(huì)上,百度創(chuàng)始人李彥宏深入探討了公司的業(yè)務(wù)表現(xiàn)和未來(lái)發(fā)展方向,強(qiáng)調(diào)人工智能技術(shù)對(duì)用戶體驗(yàn)的推動(dòng)?
谷歌推出了一款名為PaliGemma的開(kāi)源視覺(jué)語(yǔ)言模型,該模型結(jié)合了圖像處理和語(yǔ)言理解的能力,旨在支持多種視覺(jué)語(yǔ)言任務(wù),如圖像和短視頻字幕生成、視覺(jué)問(wèn)答、圖像文本理解、物體檢測(cè)、文件圖表解讀以及圖像分割等。PaliGemma的關(guān)鍵特點(diǎn):多任務(wù)支持:PaliGemma能夠處理多種視覺(jué)語(yǔ)言相關(guān)的任務(wù),提供廣泛的應(yīng)用場(chǎng)景。開(kāi)源的特性意味著PaliGemma可以被社區(qū)廣泛地使用、改進(jìn)和集成到各種產(chǎn)品和服務(wù)中。
小米官方宣布,小米大語(yǔ)言模型MiLM正式通過(guò)大模型備案。通過(guò)備案后,小米大模型將逐步應(yīng)用于小米公司的汽車(chē)、手機(jī)、智能家居等產(chǎn)品中,通過(guò)端云結(jié)合,既帶來(lái)單個(gè)設(shè)備的智能提升,也實(shí)現(xiàn)場(chǎng)景內(nèi)和場(chǎng)景間多設(shè)備的協(xié)同,為人車(chē)家全生態(tài)戰(zhàn)略賦能。在全新高通驍龍8Gen3終端上,基于NPU運(yùn)行了小米自研60億參數(shù)語(yǔ)言大模型,在首詞響應(yīng)、生成速度等幾項(xiàng)關(guān)鍵指標(biāo)上均處于行業(yè)領(lǐng)先水平。
RefuelAI最近宣布推出兩個(gè)新版本的大型語(yǔ)言模型,RefuelLLM-2和RefuelLLM-2-small,這兩個(gè)模型專(zhuān)為數(shù)據(jù)標(biāo)注、清洗和豐富任務(wù)設(shè)計(jì),旨在提高處理大規(guī)模數(shù)據(jù)集的效率。RefuelLLM-2的主要特點(diǎn)包括:自動(dòng)化數(shù)據(jù)標(biāo)注:能夠自動(dòng)識(shí)別和標(biāo)記數(shù)據(jù)中的關(guān)鍵信息,如分類(lèi)數(shù)據(jù)和解析特定屬性。RefuelAI的這一創(chuàng)新為數(shù)據(jù)標(biāo)注和清洗領(lǐng)域帶來(lái)了新的解決方案,有助于自動(dòng)化和優(yōu)化大規(guī)模數(shù)據(jù)處理流程。
Meditron是一個(gè)基于Llama的大型醫(yī)學(xué)語(yǔ)言模型,由Meta公司更新并發(fā)布。Meditron項(xiàng)目是完全開(kāi)源的,包括數(shù)據(jù)、模型權(quán)重和配置,這意味著全球的研究人員和開(kāi)發(fā)者都可以自由地訪問(wèn)、使用、修改和改進(jìn)這一技術(shù)。在緊急情況下快速提供醫(yī)療響應(yīng),或在基礎(chǔ)設(shè)施不足的地區(qū)輔助醫(yī)療工作,Meditron可以發(fā)揮重要作用。
Meta公司最新發(fā)布了LayerSkip,這是一款端到端的解決方案,專(zhuān)門(mén)設(shè)計(jì)用于提升大型語(yǔ)言模型的推理速度。這一技術(shù)在不同規(guī)模的Llama模型上經(jīng)過(guò)了廣泛的訓(xùn)練實(shí)驗(yàn),并在多個(gè)任務(wù)上展現(xiàn)了顯著的性能提升。未來(lái)展望:隨著LayerSkip技術(shù)的不斷完善和應(yīng)用,預(yù)計(jì)將為大語(yǔ)言模型的部署和使用帶來(lái)更多可能性,特別是在需要快速處理大量語(yǔ)言數(shù)據(jù)的場(chǎng)合。
Meta最近發(fā)布了LLama3,這是一款新的大型語(yǔ)言模型,用于實(shí)現(xiàn)更安全、更準(zhǔn)確的生成式人工智能體驗(yàn)。除了LLM,Meta還推出了LlamaGuard2、CodeShield和CyberSecEval2等信任和安全工具,以幫助確保符合行業(yè)和用戶安全期望。隨著400億參數(shù)顯示出更高的準(zhǔn)確性,可以推斷出更高的AI硬件需求不會(huì)很快減少。
蘋(píng)果公司正在開(kāi)發(fā)自己的大型語(yǔ)言模型。這款模型將能夠在設(shè)備上本地運(yùn)行,從優(yōu)先考慮速度和隱私保護(hù)。蘋(píng)果更廣泛的人工智能戰(zhàn)略預(yù)計(jì)將在6月份的WWDC上與主要軟件更新預(yù)覽一起公布。
MetaLlama3是Meta公司最新推出的一款開(kāi)源大型語(yǔ)言模型。它在多項(xiàng)行業(yè)基準(zhǔn)測(cè)試中表現(xiàn)出色,性能卓越,可支持廣泛的使用場(chǎng)景,包括改善推理能力等新功能。要了解更多信息,請(qǐng)?jiān)L問(wèn)MetaLlama3官方網(wǎng)站。
RekaAI近日宣布推出其最新力作——RekaCore,這是一款前沿的多模態(tài)語(yǔ)言模型,擁有強(qiáng)大的性能和靈活的部署方式。該模型像Gemini一樣可以直接分析圖片、視頻、音頻,評(píng)測(cè)得分與GPT-4和Gemini-Ultra接近。通過(guò)Edge、Flash和Core等系列模型的全面支持,Reka已經(jīng)準(zhǔn)備好迎接更廣泛的挑戰(zhàn),展望未來(lái),我們期待著與更多愿意加入我們的伙伴共同探索多模態(tài)世界的無(wú)限可能。
HuggingFace首次發(fā)布了其Idefics視覺(jué)語(yǔ)言模型,該模型于2023年首次亮相,采用了最初由DeepMind開(kāi)發(fā)的技術(shù)。Idefics迎來(lái)了升級(jí),新版本Idefics2擁有更小的參數(shù)規(guī)模、開(kāi)放許可證以及改進(jìn)的光學(xué)字符識(shí)別能力。Idefics2的發(fā)布是AI繁榮持續(xù)推出的許多多模態(tài)模型之一,包括Reka的新Core模型、xAI的Grok-1.5V和Google的Imagen2。
Mixtral-8x22B是一個(gè)預(yù)訓(xùn)練的生成式稀疏專(zhuān)家語(yǔ)言模型,由MistralAI團(tuán)隊(duì)開(kāi)發(fā)。該模型擁有141B個(gè)參數(shù),支持多種優(yōu)化部署方式,旨在推進(jìn)人工智能的開(kāi)放發(fā)展。
蘋(píng)果公司近日發(fā)布了一款名為MLLLLMFerret-UI的新型機(jī)器學(xué)習(xí)語(yǔ)言模型,旨在提升對(duì)移動(dòng)應(yīng)用用戶界面的理解。這款模型經(jīng)過(guò)特別優(yōu)化,能夠處理移動(dòng)UI屏幕上的各種任務(wù),并具備指向、定位和推理等能力。Ferret-UI還能夠通過(guò)功能推斷來(lái)解釋屏幕的整體目的,顯示出在理解和生成自然語(yǔ)言指令方面的高級(jí)能力。
MetaPlatforms公司計(jì)劃在下周推出Llama3大語(yǔ)言模型的兩個(gè)小參數(shù)版本,作為即將在2024年夏天推出的Llama3最大版本的前奏。Llama3最高版本可能擁有超過(guò)1400億個(gè)參數(shù),這將使其性能有望趕上OpenAI最新的GPT-4Turbo版本。Meta正在全力推進(jìn)Llama3的開(kāi)發(fā),這不僅體現(xiàn)了該公司在AI領(lǐng)域的野心,也為用戶帶來(lái)了更加智能和開(kāi)放的AI服務(wù)的期待。
在文檔處理中,特別是在視覺(jué)豐富的文檔中,高效信息提取的需求變得越來(lái)越關(guān)鍵。VRDs,如發(fā)票、水電費(fèi)單和保險(xiǎn)報(bào)價(jià),在業(yè)務(wù)工作流中隨處可見(jiàn),通常以不同的布局和格式呈現(xiàn)類(lèi)似信息。他們的研究為使普通用戶能夠訪問(wèn)先進(jìn)的文檔處理功能鋪平了道路,標(biāo)志著該領(lǐng)域邁出了重要的一步。
研究人員從清華大學(xué)和北京理工大學(xué)開(kāi)發(fā)了DRAGIN,這是一種針對(duì)大型語(yǔ)言模型設(shè)計(jì)的動(dòng)態(tài)檢索增強(qiáng)生成框架。該框架旨在通過(guò)在文本生成過(guò)程中實(shí)時(shí)確定何時(shí)以及如何檢索外部信息,從提高語(yǔ)言模型的性能。未來(lái)的工作旨在克服與自注意力可訪問(wèn)性相關(guān)的限制,并對(duì)查詢構(gòu)建技術(shù)的影響進(jìn)行評(píng)估。