谷歌Gemini1.5新功能揭秘:上下文挑戰(zhàn)重現(xiàn)準(zhǔn)確性

2024-02-21 09:05 · 稿源：站長(zhǎng)之家

站長(zhǎng)之家（ChinaZ.com）2月21日消息:近日，Google Gemini1.5推出了一項(xiàng)令人矚目的技術(shù)突破，該版本引入了一個(gè)擁有高達(dá)一百萬(wàn)個(gè)令牌的上下文窗口功能。這項(xiàng)新功能旨在處理完整的書(shū)籍甚至電影，其準(zhǔn)確性關(guān)注。

盡管Gemini1.5的上下文窗口容量龐大，但可能仍存在不準(zhǔn)確再現(xiàn)信息的可能性。在“海底撈針”測(cè)試中，該系統(tǒng)需要提取多達(dá)100條特定信息，但平均準(zhǔn)確度僅在60%至70這項(xiàng)任務(wù)相對(duì)于復(fù)雜文檔的摘要撰寫(xiě)而言仍然要簡(jiǎn)單一些。

值得一提的是，在谷歌對(duì)維克多·雨果的《悲慘世界》進(jìn)行的更復(fù)雜的測(cè)試中，他們提出了100個(gè)問(wèn)題，共涉及710，000個(gè)標(biāo)記，并使用“歸因于已識(shí)別來(lái)源”的方法進(jìn)行答案評(píng)估。結(jié)果顯示，在人工評(píng)估中，80% 的答案可歸因于源文檔，而在機(jī)器評(píng)估中則有91% 的答案可歸因于源文檔。然而，這一基準(zhǔn)傾向目前的權(quán)威及其與原著作者之間存在細(xì)微的差異。

在“大海撈針”測(cè)試中，模型必須在上下文窗口中找到一條信息。這與LLM的實(shí)際應(yīng)用場(chǎng)景關(guān)系不大。 |圖片:谷歌

盡管社交媒體上對(duì)Gemini1.5的積極評(píng)價(jià)絡(luò)并不絕，但即將對(duì)其準(zhǔn)確性進(jìn)行更深入的評(píng)估。大多數(shù)評(píng)論焦點(diǎn)于功能測(cè)試，缺乏對(duì)源材料的深入了解。如果信息檢索的可信度不高，即使在復(fù)雜的查詢下，巨大的上下文窗口可能仍然存在問(wèn)題。

可見(jiàn)， Gemini1.5Pro 提供了令人印象深刻的技術(shù)突破，但在實(shí)踐中，提取復(fù)雜的信息仍然是一個(gè)挑戰(zhàn)。如果其可靠性低于90%，那么實(shí)際中的巨大容量的上下文窗口運(yùn)用中可能并不具備專業(yè)的幫助。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

谷歌史上最強(qiáng)大模型！Gemini 2.0正式發(fā)布

今天凌晨，谷歌正式發(fā)布了為新智能體時(shí)代構(gòu)建的下一代模型Gemini2.0。這是谷歌迄今為止功能最強(qiáng)的AI模型，帶來(lái)了更強(qiáng)的性能、更多的多模態(tài)表現(xiàn)和新的原生工具應(yīng)用。Gemini2.0還會(huì)擴(kuò)展到更多Google產(chǎn)品中。

?谷歌 ?Gemini ?2.0
華為WatchGT 5新功能上線：每天情緒一目了然

華為WatchGT5情緒健康新功能上線，好心情分享給好朋友，一起看看今天狀態(tài)如何。全新的情緒健康摘要可以記錄階段心情，可選分析月/周/日情緒健康狀態(tài)，過(guò)去一段時(shí)間的情緒狀態(tài)一目了然！它還還首發(fā)支持女性卵巢健康研究，以基礎(chǔ)體溫、心率、心率變異性以及呼吸率等數(shù)據(jù)為基礎(chǔ)，通過(guò)長(zhǎng)周期的持續(xù)監(jiān)測(cè)提供卵巢健康評(píng)估。

?華為 ?Watch ?GT
薦AI日?qǐng)?bào)：蘋果全家桶接入ChatGPT；百度文庫(kù)上線專業(yè)PPT生成；谷歌Gemini 2.0版來(lái)襲；ChatGPT全球宕機(jī)已修復(fù)

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、蘋果發(fā)布iOS18.2正式版:Siri接入ChatGPT蘋果公司正式發(fā)布了iOS18.2、iPadOS18.2和macOSSequoia15.2，特別是iOS18.2引入的新功能AppleIntelligence備受關(guān)注。廣州警方成功偵破了一個(gè)犯罪團(tuán)伙，抓獲6名嫌疑人，該團(tuán)伙通過(guò)注冊(cè)自媒體賬號(hào)和使用AI工具批量發(fā)布虛假信息，造成了嚴(yán)重的網(wǎng)絡(luò)污染。

?人工智能 ?蘋果產(chǎn)品 ?iOS更新
薦AI日?qǐng)?bào)：支付寶推AI創(chuàng)意生成平臺(tái)；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中間幀；OpenAI準(zhǔn)備o3推理模型

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、谷歌發(fā)布王炸推理模型Gemini2.0FlashThinking，挑戰(zhàn)OpenAIo1谷歌近期推出的Gemini2.0FlashThinking模型在多模態(tài)推理領(lǐng)域展現(xiàn)出強(qiáng)大的能力，支持32，000個(gè)輸入標(biāo)記和8，000個(gè)輸出標(biāo)記，極大提升了處理復(fù)雜問(wèn)題的效率。與前代產(chǎn)品相比，F(xiàn)alcon3的訓(xùn)練規(guī)模翻倍，展現(xiàn)出強(qiáng)勁的競(jìng)爭(zhēng)力，尤其是在與其他主流開(kāi)源模型的基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異。

?AI技術(shù) ?人工智能 ?機(jī)器學(xué)習(xí)
ORICO奧?？?span id="79nn5nnn" class="col-red02">mini系列：Mac mini存儲(chǔ)擴(kuò)展的高性價(jià)比方案

蘋果今年新發(fā)布的M4Macmini，憑借其強(qiáng)大的芯片功能、便攜的迷你尺寸和獨(dú)有的MacOS系統(tǒng)，再次成為大家熱議追捧的明星產(chǎn)品。尤其對(duì)于有視頻剪輯需求的職場(chǎng)人士來(lái)說(shuō)，無(wú)論是編輯高分辨率圖像、制作4K視頻等復(fù)雜項(xiàng)目是多任務(wù)處理等，都是優(yōu)選辦公電腦之一。目前這一系列產(chǎn)品已在各大電商平臺(tái)官方旗艦店同步發(fā)售，雙12馬上到了，有需要的小伙伴可以抓緊行動(dòng)，活動(dòng)期間預(yù)售立減100元，并有限量小禮品贈(zèng)送。

?M4 ?Mac ?mini
薦微信小店悄悄上線新功能，能否像「搶紅包」一樣爆火？

年末節(jié)日扎堆之際，微信小店開(kāi)啟了「送禮物」功能的灰度測(cè)試，這一創(chuàng)新舉措迅速引起了業(yè)界的廣泛關(guān)注。微信小店運(yùn)營(yíng)團(tuán)隊(duì)在官網(wǎng)發(fā)布了《微信小店「送禮物」使用指南》，揭示了這一功能的神秘面紗。它是否會(huì)真的讓中國(guó)電商“變天”，雖然目前還不能下定論，但可以肯定的是，它已經(jīng)在電商領(lǐng)域掀起了一陣新的波瀾，未來(lái)將持續(xù)重塑電商行業(yè)的社交化、情感化和競(jìng)爭(zhēng)態(tài)勢(shì)。

?微信小店 ?送禮物功能 ?電商創(chuàng)新
PICO OS 升級(jí)，一大波新功能來(lái)了

當(dāng)你正沉浸在MR世界中享受一場(chǎng)視覺(jué)盛宴，微信卻不合時(shí)宜地跳出一條工作消息，迫使你中斷觀影，摘下頭顯設(shè)備去回復(fù)。這樣的場(chǎng)景是否讓你感到既無(wú)奈又沮喪？12月23日起，將會(huì)展映相關(guān)產(chǎn)品，有興趣的朋友屆時(shí)可一睹新生創(chuàng)作者的風(fēng)采。

?MR技術(shù) ?PICO ?OS
115網(wǎng)盤新功能上線：免登錄直接下載文件

快科技12月6日消息，115生活全新功能免登錄下載”正式上線，能讓用戶無(wú)需登錄直接下載被分享的文件。具體來(lái)說(shuō)，注冊(cè)用戶均可使用免登錄分享功能，還可根據(jù)不同分享場(chǎng)景設(shè)置多種分發(fā)限制。接收者通過(guò)免登錄”鏈接下載文件，會(huì)對(duì)應(yīng)扣除分享者賬號(hào)內(nèi)的免登錄下載流量額度。功能上線后，官方會(huì)贈(zèng)送給注冊(cè)會(huì)員一定的免登錄下載流量額度。會(huì)員等級(jí)越高，獲贈(zèng)的流量額度就越多。同時(shí)，年費(fèi)及以上用戶，可支持直接將分享鏈接有效期設(shè)置為長(zhǎng)期有效。如果你的免登錄下載流量額度已用完，鏈接將需要登錄下載，你也可以單獨(dú)購(gòu)買免登錄下載流量包增加額

?115生活 ?免登錄下載 ?文件分享
TCL年末大招！Mini LED新技術(shù)或?qū)⒄鸷嘲l(fā)布

最近電視圈似乎要迎來(lái)一陣“技術(shù)風(fēng)暴”！電視巨頭TCL疑似在MiniLED有了新技術(shù)突破。如果小伙伴們想及時(shí)知道TCL新品后續(xù)信息，可以關(guān)注我哦~有消息我會(huì)第一時(shí)間和大家分享。

?Mini ?LED ?TCL電視
騰訊音樂(lè)與長(zhǎng)城汽車達(dá)成戰(zhàn)略合作，共推 “AI 伴聽(tīng)” 新功能

今年4月，騰訊音樂(lè)娛樂(lè)集團(tuán)與長(zhǎng)城汽車攜手踏上戰(zhàn)略合作之旅。其合作成果在11月8日得到進(jìn)一步展現(xiàn)，雙方聯(lián)合推出了智能座駕領(lǐng)域的首個(gè)「AI伴聽(tīng)」功能。雙方憑借持續(xù)的技術(shù)合作與創(chuàng)新，有望進(jìn)一步挖掘AI技術(shù)與音樂(lè)內(nèi)容結(jié)合的潛力，為用戶帶來(lái)更豐富多樣的車載音樂(lè)體驗(yàn)，也將推動(dòng)整個(gè)智能座駕音樂(lè)領(lǐng)域的發(fā)展與進(jìn)步。

?騰訊音樂(lè) ?長(zhǎng)城汽車 ?AI

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

谷歌Gemini1.5新功能揭秘:上下文挑戰(zhàn)重現(xiàn)準(zhǔn)確性

谷歌史上最強(qiáng)大模型！Gemini 2.0正式發(fā)布

華為WatchGT 5新功能上線：每天情緒一目了然

薦AI日?qǐng)?bào)：蘋果全家桶接入ChatGPT；百度文庫(kù)上線專業(yè)PPT生成；谷歌Gemini 2.0版來(lái)襲；ChatGPT全球宕機(jī)已修復(fù)

薦AI日?qǐng)?bào)：支付寶推AI創(chuàng)意生成平臺(tái)；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中間幀；OpenAI準(zhǔn)備o3推理模型

ORICO奧?？?span id="79nn5nnn" class="col-red02">mini系列：Mac mini存儲(chǔ)擴(kuò)展的高性價(jià)比方案

薦微信小店悄悄上線新功能，能否像「搶紅包」一樣爆火？

PICO OS 升級(jí)，一大波新功能來(lái)了

115網(wǎng)盤新功能上線：免登錄直接下載文件

TCL年末大招！Mini LED新技術(shù)或?qū)⒄鸷嘲l(fā)布

騰訊音樂(lè)與長(zhǎng)城汽車達(dá)成戰(zhàn)略合作，共推 “AI 伴聽(tīng)” 新功能

熱文

余承東：華為明年將推出大家想不到的產(chǎn)品

董明珠回應(yīng)格力電器賣得貴：為消費(fèi)者帶來(lái)更長(zhǎng)遠(yuǎn)的價(jià)值

抖音完成100部老港片4K高清修復(fù)：已上線抖音、西瓜視頻

抖音副總裁回應(yīng)吳柳芳再次被禁：分歧很大將根據(jù)法律執(zhí)行好

周鴻祎：2025年這7大風(fēng)口最賺錢單身經(jīng)濟(jì)排第一

周鴻祎稱被車門夾傷的手成頑固傷：近3個(gè)月沒(méi)攀巖

昇騰AI平臺(tái)訓(xùn)練推理！中國(guó)聯(lián)通元景文生圖大模型開(kāi)源：真正懂中

2024財(cái)富縮水最多的5位億萬(wàn)富豪：拼多多創(chuàng)始人黃崢上榜今年夏

董明珠稱網(wǎng)暴編的太離譜：破壞網(wǎng)絡(luò)環(huán)境清者自清

吳柳芳賬號(hào)再次被禁粉絲從600萬(wàn)被清理至4萬(wàn) 抖音：低俗內(nèi)容吸

余承東：華為明年將推出大家想不到的產(chǎn)品

劉強(qiáng)東提前發(fā)年終獎(jiǎng) 絕大多數(shù)員工可獲5到8個(gè)月年終獎(jiǎng)

京東發(fā)布年終獎(jiǎng)通知部分員工年前可收到年終獎(jiǎng)

肯德基中國(guó)漲價(jià) 官方回應(yīng)：運(yùn)營(yíng)成本變化導(dǎo)致

美團(tuán)回應(yīng)騎手穿點(diǎn)男模字樣工服：博流量惡意炒作

騰訊張軍辟謠微信送禮會(huì)議紀(jì)要：只想做點(diǎn)腳踏實(shí)地的事

董明珠回應(yīng)格力電器賣得貴：為消費(fèi)者帶來(lái)更長(zhǎng)遠(yuǎn)的價(jià)值

小米SU7最新版本OTA推送：正式接入VLM視覺(jué)語(yǔ)言大模型

抖音完成100部老港片4K高清修復(fù)：已上線抖音、西瓜視頻

站長(zhǎng)商機(jī)