站長(zhǎng)之家(ChinaZ.com) 12 月 12 日消息:在日益激烈的生成型 AI 市場(chǎng)競(jìng)爭(zhēng)中,谷歌近期推出了其大型語(yǔ)言模型 Gemini 的預(yù)告視頻。然而,有關(guān)該視頻真實(shí)性的爭(zhēng)議隨后引發(fā)了廣泛關(guān)注。
谷歌發(fā)布的演示視頻展示了 Gemini 模型的多模態(tài)能力,能夠巧妙地解讀并處理來(lái)自實(shí)時(shí)視頻和音頻的信息。這對(duì)谷歌來(lái)說(shuō)是一項(xiàng)重大成就,尤其是在與 OpenAI 等競(jìng)爭(zhēng)對(duì)手的激烈競(jìng)爭(zhēng)中。然而,據(jù)彭博社報(bào)道,演示視頻實(shí)際上是通過(guò)「使用視頻的靜態(tài)圖像幀,并通過(guò)文本提示」制作的,而不是看似實(shí)現(xiàn)的實(shí)時(shí)語(yǔ)音和視頻處理。
在舊金山舉行的《財(cái)富》雜志 Brainstorm AI 會(huì)議上,谷歌助手和 Bard 的副總裁兼總經(jīng)理 Sissie Hsiao 討論了這段頗具爭(zhēng)議的演示視頻。她強(qiáng)調(diào)了 Gemini 作為一個(gè)模型所達(dá)到的標(biāo)準(zhǔn),以及它將如何推動(dòng)谷歌的聊天機(jī)器人 Bard 的發(fā)展。「這個(gè)視頻完全真實(shí)。所有的提示和模型響應(yīng)都是真實(shí)的,」Hsiao 說(shuō)?!肝覀兇_實(shí)為了簡(jiǎn)潔而縮短了部分內(nèi)容,這些信息也已經(jīng)在視頻中說(shuō)明。」
演示視頻展示了新 AI 模型識(shí)別一條波浪線,然后識(shí)別新線的曲線,最終繪制出一只鴨子的圖畫(huà)的多模態(tài)能力。在整個(gè)過(guò)程中,模型持續(xù)識(shí)別每個(gè)元素,實(shí)時(shí)提供與鴨子相關(guān)的事實(shí)和答案。
Hsiao 突出了 Gemini 在各種基準(zhǔn)測(cè)試中的成就,這些測(cè)試包括高中物理、專業(yè)法律難題和道德場(chǎng)景。據(jù) The Verge 報(bào)道,Gemini Ultra 在 32 項(xiàng)基準(zhǔn)測(cè)試中擊敗了 OpenAI 的 GPT-4,共贏得了 30 項(xiàng)測(cè)試,這是一個(gè)值得夸耀的成就,盡管 Gemini Ultra 直到明年才會(huì)發(fā)布。目前,Bard 使用的是不那么先進(jìn)的 Gemini Pro,大致相當(dāng)于 GPT 3.5。
Hsiao 表示,這些 Gemini 模型將繼續(xù)改進(jìn)谷歌搜索以及谷歌 Bard 聊天機(jī)器人,后者據(jù)她所說(shuō)是「目前市場(chǎng)上最受歡迎的免費(fèi)聊天機(jī)器人?!?/p>
(舉報(bào))