LLaVA-1.6來了！趕超Gemini Pro 提升推理性能

2024-02-01 14:08 · 稿源：站長(zhǎng)之家

要點(diǎn):
1、LLaVA-1.6提升了推理、OCR能力，支持更多場(chǎng)景和廣泛用戶。
2、LLaVA-1.6在多項(xiàng)基準(zhǔn)測(cè)試中超越了Gemini Pro，并優(yōu)于Qwen-VL-Plus。
3、LLaVA-1.6展現(xiàn)出強(qiáng)大的零樣本中文能力，取得了SOTA性能。

站長(zhǎng)之家（ChinaZ.com）2月1日消息:LLaVA-1.6是一項(xiàng)新的技術(shù)成果，通過提升推理、OCR能力以及支持更多場(chǎng)景和廣泛用戶，為用戶帶來更好的體驗(yàn)。LLaVA-1.6不僅在多項(xiàng)基準(zhǔn)測(cè)試中超越了Gemini Pro，并且優(yōu)于Qwen-VL-Plus，展現(xiàn)出了強(qiáng)大的性能。

同時(shí)，LLaVA-1.6還展現(xiàn)出強(qiáng)大的零樣文能力，取得了SOTA性能。這項(xiàng)技術(shù)的發(fā)布，將會(huì)給用戶帶來更廣泛的應(yīng)用場(chǎng)景和更好的體驗(yàn)。

項(xiàng)目地址:https://github.com/haotian-liu/LLaVA

在LLaVA-1.6中，通過提升輸入圖像分辨率和改進(jìn)視覺指令調(diào)整數(shù)據(jù)混合，使得該技術(shù)能夠掌握更多的視覺細(xì)節(jié)，獲得更好的視覺推理和OCR能力。此外，LLaVA-1.6還覆蓋了更多世界知識(shí)，具備更好的邏輯推理能力，實(shí)現(xiàn)了SOTA性能。LLaVA-1.6的發(fā)布，對(duì)于提高多模態(tài)技術(shù)在不同場(chǎng)景下的應(yīng)用潛力有著重要的意義。

通過LLaVA-1.6的發(fā)布，研究團(tuán)隊(duì)表示將繼續(xù)探索更多的LLM方案，包括Mistral-7B和Nous-Hermes-2-Yi-34B，以使LLaVA能夠支持更廣泛的用戶和更多的場(chǎng)景。這表明，LLaVA將繼續(xù)保持技術(shù)創(chuàng)新，不斷提升用戶體驗(yàn)，滿足不斷變化的市場(chǎng)需求。LLaVA-1.6的發(fā)布將為未來的多模態(tài)技術(shù)發(fā)展指明了方向。

LLaVA-1.6在推理、OCR能力的提升以及對(duì)更廣泛用戶和更多場(chǎng)景的支持方面表現(xiàn)出了強(qiáng)大的性能，展現(xiàn)了SOTA的實(shí)力。這將對(duì)多模態(tài)技術(shù)的發(fā)展產(chǎn)生積極的推動(dòng)作用，為用戶帶來更廣泛的應(yīng)用場(chǎng)景和更好的體驗(yàn)。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

LLaVA1.6

谷歌史上最強(qiáng)大模型！Gemini 2.0正式發(fā)布

今天凌晨，谷歌正式發(fā)布了為新智能體時(shí)代構(gòu)建的下一代模型Gemini2.0。這是谷歌迄今為止功能最強(qiáng)的AI模型，帶來了更強(qiáng)的性能、更多的多模態(tài)表現(xiàn)和新的原生工具應(yīng)用。Gemini2.0還會(huì)擴(kuò)展到更多Google產(chǎn)品中。

?谷歌 ?Gemini ?2.0
薦AI日?qǐng)?bào)：支付寶推AI創(chuàng)意生成平臺(tái)；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中間幀；OpenAI準(zhǔn)備o3推理模型

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、谷歌發(fā)布王炸推理模型Gemini2.0FlashThinking，挑戰(zhàn)OpenAIo1谷歌近期推出的Gemini2.0FlashThinking模型在多模態(tài)推理領(lǐng)域展現(xiàn)出強(qiáng)大的能力，支持32，000個(gè)輸入標(biāo)記和8，000個(gè)輸出標(biāo)記，極大提升了處理復(fù)雜問題的效率。與前代產(chǎn)品相比，F(xiàn)alcon3的訓(xùn)練規(guī)模翻倍，展現(xiàn)出強(qiáng)勁的競(jìng)爭(zhēng)力，尤其是在與其他主流開源模型的基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異。

?AI技術(shù) ?人工智能 ?機(jī)器學(xué)習(xí)
可靈1.6模型發(fā)布：文本響應(yīng)度、運(yùn)動(dòng)合理性明顯提升

快科技12月20日消息，近日快手可靈AI宣布基座模型再升級(jí)，視頻生成推出可靈1.6模型。據(jù)快手官方介紹，1.6模型在文本響應(yīng)度、畫面美感及運(yùn)動(dòng)合理性上均有明顯提升，畫面更穩(wěn)定更生動(dòng)，對(duì)運(yùn)動(dòng)、時(shí)序類動(dòng)作、運(yùn)鏡等文字描述響應(yīng)更好。并且動(dòng)態(tài)質(zhì)量進(jìn)一步增強(qiáng)，運(yùn)動(dòng)更加合理，人物表情更自然；同時(shí)1.6模型畫面質(zhì)量也再次進(jìn)化，色彩、光影、細(xì)節(jié)表現(xiàn)均明顯提升，提供支持標(biāo)準(zhǔn)和高品質(zhì)模式，圖生視頻效果提升同樣顯著。此前在今年9月份，可靈AI 1.5模型上線，當(dāng)時(shí)就已經(jīng)支持高品質(zhì)模式，與可靈1.0模型只能生成最高720P的視頻不同，可靈1.5模型則

?快手可靈AI ?視頻生成 ?可靈1.6模型
薦AI日?qǐng)?bào)：蘋果全家桶接入ChatGPT；百度文庫(kù)上線專業(yè)PPT生成；谷歌Gemini 2.0版來襲；ChatGPT全球宕機(jī)已修復(fù)

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、蘋果發(fā)布iOS18.2正式版:Siri接入ChatGPT蘋果公司正式發(fā)布了iOS18.2、iPadOS18.2和macOSSequoia15.2，特別是iOS18.2引入的新功能AppleIntelligence備受關(guān)注。廣州警方成功偵破了一個(gè)犯罪團(tuán)伙，抓獲6名嫌疑人，該團(tuán)伙通過注冊(cè)自媒體賬號(hào)和使用AI工具批量發(fā)布虛假信息，造成了嚴(yán)重的網(wǎng)絡(luò)污染。

?人工智能 ?蘋果產(chǎn)品 ?iOS更新
ORICO奧?？?span id="79nn5nnn" class="col-red02">mini系列：Mac mini存儲(chǔ)擴(kuò)展的高性價(jià)比方案

蘋果今年新發(fā)布的M4Macmini，憑借其強(qiáng)大的芯片功能、便攜的迷你尺寸和獨(dú)有的MacOS系統(tǒng)，再次成為大家熱議追捧的明星產(chǎn)品。尤其對(duì)于有視頻剪輯需求的職場(chǎng)人士來說，無論是編輯高分辨率圖像、制作4K視頻等復(fù)雜項(xiàng)目是多任務(wù)處理等，都是優(yōu)選辦公電腦之一。目前這一系列產(chǎn)品已在各大電商平臺(tái)官方旗艦店同步發(fā)售，雙12馬上到了，有需要的小伙伴可以抓緊行動(dòng)，活動(dòng)期間預(yù)售立減100元，并有限量小禮品贈(zèng)送。

?M4 ?Mac ?mini
iPad Air/iPad mini將升級(jí)OLED：蘋果即將淘汰LCD

據(jù)DSCC報(bào)告，蘋果正在將OLED擴(kuò)展到iPad產(chǎn)品線上。8.5英寸OLEDiPadmini將于2026年推出，11英寸/13英寸OLEDiPadAir將于2027年推出，預(yù)計(jì)到2027年，除了低成本的iPad使用LCD外，蘋果絕大部分iPad產(chǎn)品都將轉(zhuǎn)向OLED。不過目前雙串聯(lián)OLED成本很高，未來很長(zhǎng)一段時(shí)間內(nèi)，它都是iPadPro獨(dú)占的屏幕，iPadAir以及iPadmini等產(chǎn)品都將配備單程OLED。

?OLED ?iPad ?蘋果
九號(hào)平衡車miniPRO2，超長(zhǎng)待機(jī)，帶你暢享出行樂趣

在快節(jié)奏的生活中，如何實(shí)現(xiàn)更便捷、更高效地短途出行，成為了不少人關(guān)注的焦點(diǎn)。在此需求下，九號(hào)平衡車miniPRO2應(yīng)運(yùn)生，它不僅以其時(shí)尚炫酷的外觀成為青春活力的象征，更以充沛的動(dòng)力和超長(zhǎng)續(xù)航里程，成為激情與自由的代表。九號(hào)平衡車miniPRO2不僅是一種代步工具，更是個(gè)性與時(shí)尚的體現(xiàn)，它讓每一次短途出行都變得豐富多彩，充滿樂趣。

?短途出行 ?平衡車 ?智能交通
TCL年末大招！Mini LED新技術(shù)或?qū)⒄鸷嘲l(fā)布

最近電視圈似乎要迎來一陣“技術(shù)風(fēng)暴”！電視巨頭TCL疑似在MiniLED有了新技術(shù)突破。如果小伙伴們想及時(shí)知道TCL新品后續(xù)信息，可以關(guān)注我哦~有消息我會(huì)第一時(shí)間和大家分享。

?Mini ?LED ?TCL電視
年末換新季必看：如何挑選Mini LED電視？三招助你輕松選對(duì)！

眼瞅著年末就到了，年底大促也跟著熱鬧起來，這時(shí)候啊，有些家電真就得趁機(jī)換一換了。特別是家里的電視，馬上逢假期聚會(huì)的好時(shí)候，到時(shí)候親朋好友一大家子圍坐在一起，要是電視看著不清晰，聲音聽著也模糊，那多掃興啊！希望這篇選購(gòu)攻略能幫到大家，在年末換新季里，都能選到一款心儀的MiniLED電視，看得開心、聽得過癮！

?家電 ?電視 ?Mini
名創(chuàng)優(yōu)品MINISO攜手哈利·波特IP，打造沉浸式魔法購(gòu)物體驗(yàn)

10月26日，位于淮海中路的名創(chuàng)優(yōu)品MINISO上海旗艦店華麗變身為主題門店，與風(fēng)靡全球的“哈利·波特”IP攜手，舉辦了一場(chǎng)魔法盛宴，引領(lǐng)消費(fèi)者進(jìn)入一個(gè)奇幻且充滿驚喜的魔法世界。上?；春Ｂ返罔F站也被精心裝扮，復(fù)刻了《哈利·波特》中的標(biāo)志性場(chǎng)景“九又四分之三站臺(tái)”，讓哈迷們仿佛穿越到了真實(shí)的魔法場(chǎng)景中，體驗(yàn)一場(chǎng)奇幻的魔法之旅。我們滿懷期待，希望名創(chuàng)優(yōu)品MINISO能夠持續(xù)推陳出新，帶來更多富有創(chuàng)意、充滿趣味的聯(lián)名商品，為消費(fèi)者打造更多滿意的購(gòu)物體驗(yàn)。

?名創(chuàng)優(yōu)品 ?哈利·波特 ?魔法盛宴

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

LLaVA-1.6來了！趕超Gemini Pro 提升推理性能

谷歌史上最強(qiáng)大模型！Gemini 2.0正式發(fā)布

薦AI日?qǐng)?bào)：支付寶推AI創(chuàng)意生成平臺(tái)；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中間幀；OpenAI準(zhǔn)備o3推理模型

可靈1.6模型發(fā)布：文本響應(yīng)度、運(yùn)動(dòng)合理性明顯提升

薦AI日?qǐng)?bào)：蘋果全家桶接入ChatGPT；百度文庫(kù)上線專業(yè)PPT生成；谷歌Gemini 2.0版來襲；ChatGPT全球宕機(jī)已修復(fù)

ORICO奧?？?span id="79nn5nnn" class="col-red02">mini系列：Mac mini存儲(chǔ)擴(kuò)展的高性價(jià)比方案

iPad Air/iPad mini將升級(jí)OLED：蘋果即將淘汰LCD

九號(hào)平衡車miniPRO2，超長(zhǎng)待機(jī)，帶你暢享出行樂趣

TCL年末大招！Mini LED新技術(shù)或?qū)⒄鸷嘲l(fā)布

年末換新季必看：如何挑選Mini LED電視？三招助你輕松選對(duì)！

名創(chuàng)優(yōu)品MINISO攜手哈利·波特IP，打造沉浸式魔法購(gòu)物體驗(yàn)

熱文

京東發(fā)布年終獎(jiǎng)通知部分員工年前可收到年終獎(jiǎng)

消息稱OpenAI新模型GPT-5研發(fā)未達(dá)到預(yù)期：成本高昂效果欠佳

央視曝光未成年人繞開防沉迷只需4元：通過租用游戲賬號(hào)規(guī)避

李斌回應(yīng)螢火蟲外觀設(shè)計(jì)：看過實(shí)車的人都喜歡這個(gè)設(shè)計(jì)

沒網(wǎng)也能聯(lián)絡(luò)！小米15系列星辰無網(wǎng)通12月底升級(jí)6km級(jí)通話范圍

不得使用惡俗惡趣味微短劇片名！廣電總局出手整治“霸總愛上我

FF再獲3000萬美元新一輪融資加速第二品牌FX戰(zhàn)略推進(jìn)

QQ音樂年度聽歌報(bào)告發(fā)布：誰是你最喜歡的歌手？

微信可以線上送實(shí)體禮物了：微信小店“藍(lán)包”功能正灰度測(cè)試逐

抖音上線“驗(yàn)證助手” 可幫助用戶識(shí)別電話等是否屬于抖音官方

微信朋友圈崩了上熱搜騰訊客服：請(qǐng)嘗試這幾種方法

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

小紅書封號(hào)上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

京東發(fā)布年終獎(jiǎng)通知部分員工年前可收到年終獎(jiǎng)

未成年人成部分博主流量密碼抖音治理涉“網(wǎng)紅兒童”違規(guī)內(nèi)容

極越員工善后方案已出爐：?jiǎn)T工獲“N+1”賠償由百度吉利出資

螞蟻集團(tuán)否認(rèn)借殼上市：目前沒有上市計(jì)劃

小紅書被吐槽無理由封號(hào) 客服回應(yīng)：未說明處罰時(shí)間就是永封

雷軍：小米是北方車廠 SU7研發(fā)之初就要做冬季電車?yán)m(xù)航之王

極越公關(guān)負(fù)責(zé)人被開除本人回應(yīng)：此前未接到任何通知

站長(zhǎng)商機(jī)

LLaVA-1.6來了！趕超Gemini Pro 提升推理性能

熱文

站長(zhǎng)商機(jī)

LLaVA-1.6來了！趕超Gemini Pro 提升推理性能