聲明:本文來(lái)自于微信公眾號(hào) Tech星球(微信ID:tech618,作者:陳橋輝,授權(quán)站長(zhǎng)之家轉(zhuǎn)載發(fā)布。
AI已成為各大科技巨頭角逐的關(guān)鍵賽道,而螞蟻集團(tuán)在AI領(lǐng)域的密集布局,愈發(fā)引人注目。
2024年12月30日,支付寶宣布推出新一代AI視覺(jué)搜索產(chǎn)品“探一下”,基于自研的多模態(tài)大模型技術(shù),可“用AI之眼探索萬(wàn)物”,提供更快速、有用、趣味的生成式搜索服務(wù)。
螞蟻的AI布局,早就有跡可循,板塊也愈發(fā)清晰。過(guò)去兩年,螞蟻?zhàn)越巳f(wàn)卡異構(gòu)算力集群,自研了百靈大語(yǔ)言模型和多模態(tài)大模型;應(yīng)用層面,推出三大AI管家,讓AI“有手有腳”能辦事,開(kāi)拓全新的辦事型AI形態(tài);生態(tài)方面,以支付寶商業(yè)生態(tài)為主陣地,發(fā)布智能體開(kāi)發(fā)平臺(tái)“百寶箱”,為千萬(wàn)商家打造AI“掘金鏟”。
久未露面的馬云,也公開(kāi)表達(dá)了AI之于螞蟻的動(dòng)能。他在螞蟻20周年晚會(huì)上表示,“未來(lái)的20年,AI時(shí)代所帶來(lái)的巨大的變革,會(huì)超出所有人的想象”。
毫無(wú)疑問(wèn),螞蟻正在嘗試以支付寶為核心,用AI加速科技驅(qū)動(dòng)力。未來(lái)的螞蟻,AI或?qū)?huì)成為其重要的底色,甚至是打造新螞蟻的推進(jìn)器。
借AI“探”萬(wàn)象
相比于大廠熱衷布局的AI社交、AI視頻、AI音樂(lè)等熱門(mén)賽道不同,此次支付寶通過(guò)推出“探一下”,則切入了一條全新的生成式AI視覺(jué)搜索賽道。
Tech星球體驗(yàn)發(fā)現(xiàn),“探一下”是基于螞蟻百靈多模態(tài)大模型技術(shù)的AI產(chǎn)品,相比于傳統(tǒng)的視覺(jué)識(shí)別產(chǎn)品,“探一下”可以提供更快速、有用、趣味的生成式搜索服務(wù)。
用戶在支付寶首頁(yè)點(diǎn)擊 “掃一掃” 后往左劃,即可找到 “探一下”的入口,在支小寶App也能快速訪問(wèn)。進(jìn)入“探一下”的主界面后,只需定格攝像頭所捕捉的畫(huà)面,系統(tǒng)便會(huì)開(kāi)始分析并生成結(jié)果。
圖注:支付寶“掃碼”旁邊就是“探一下”。
不同于以往的掃五福等玩法,運(yùn)用的都只是圖片識(shí)別技術(shù)。支付寶上線的“探一下”,除了融合原有的AR掃之外,還有三個(gè)特色核心功能——探知識(shí)、探靈感、探文本,兼具實(shí)用性和趣味性。
“探知識(shí)”是對(duì)內(nèi)容進(jìn)行識(shí)別,在捕捉畫(huà)面主體后主動(dòng)生成識(shí)別結(jié)果,并基于此進(jìn)行發(fā)散性的信息智能推薦。
探知識(shí)的使用場(chǎng)景并不少,在生活、旅行、學(xué)習(xí)、購(gòu)物等場(chǎng)景中,都有著很大需求。譬如,用戶在購(gòu)買手機(jī)時(shí),不僅可以通過(guò) “探知識(shí)” 直觀地看到手機(jī)的配置信息、設(shè)計(jì)靈感等知識(shí),還可以通過(guò)其附帶的“探商品”入口,跳轉(zhuǎn)至商品界面,完成從了解手機(jī)到購(gòu)買手機(jī)的鏈路。
“探文本”也是基礎(chǔ)的通用功能,可用于文本提取和翻譯。譬如,對(duì)于跨境游客、跨境商家和海淘買家大有作用,遇到外文菜單或商品詳情頁(yè),就可以快速提取關(guān)鍵信息并翻譯。
除此之外,“探一下”還有“探靈感”的功能,Tech星球發(fā)現(xiàn),在小紅書(shū)內(nèi),“探靈感”成為了不少用戶討論最多的一個(gè)功能。
一位用戶直言,“探靈感”讓內(nèi)容有了生命。從AI的視角看,這種生命感,源自“探靈感”讓內(nèi)容被AI賦予了特別的視角濾鏡。譬如,可用幽默或治愈的視角,對(duì)靜態(tài)圖片進(jìn)行趣味解讀,讓你在網(wǎng)上曬圖再也不愁寫(xiě)啥文案。
總體上,“探一下”是一款具有創(chuàng)新性和實(shí)用性的生成式AI視覺(jué)搜索產(chǎn)品。不過(guò),從目前的使用體驗(yàn)來(lái)看,也還有待完善的地方,例如,會(huì)受到光線、角度、距離等實(shí)際場(chǎng)景因素的影響,導(dǎo)致識(shí)別結(jié)果不準(zhǔn)確或出現(xiàn)錯(cuò)誤。
從“搜”到“探”,引領(lǐng)下一代AI視覺(jué)搜索
搜索誕生20年,一直致力于幫助用戶更平等地獲取信息。
傳統(tǒng)搜索一直在進(jìn)化,信息輸入方式從手動(dòng)打字到語(yǔ)音喚醒、圖片識(shí)別,但始終未能煥新呈現(xiàn)結(jié)果。在Make2024釘釘生態(tài)大會(huì)上,釘釘COO傅徐軍在接受媒體采訪時(shí)還談及了傳統(tǒng)搜索引擎難用的更多原因。他表示,傳統(tǒng)的搜索檢索到的大量信息是碎片化、離散化、非結(jié)構(gòu)化的。
這背后折射出的是傳統(tǒng)搜索模式基于關(guān)鍵詞匹配的低效,較難精準(zhǔn)理解用戶的真實(shí)意圖,僅僅是機(jī)械羅列可能相關(guān)的內(nèi)容。而用戶得到想要的內(nèi)容,還需要在搜索到的內(nèi)容中進(jìn)行二次甚至多次檢索。
生成式AI技術(shù)讓搜索有了革新的可能。不少企業(yè)正在嘗試革新搜索,比如搜索鼻祖Google旗下的視覺(jué)搜索產(chǎn)品Google Lens。
Google Lens近年來(lái)不斷拓展功能邊界,比如增加視頻搜索與語(yǔ)音輸入等形式,然而其核心依然是圍繞傳統(tǒng)搜索以“搜”為主的理念的修補(bǔ),比如Google Lens生成的內(nèi)容必須鏈接到Google自己的搜索結(jié)果,但是Google自己的結(jié)果跟內(nèi)容生態(tài)并不是為視覺(jué)入口去設(shè)計(jì)的,很多還是基于文本的一個(gè)入口;國(guó)內(nèi)的識(shí)別類AI則專注于花草等識(shí)別,卻也只是在細(xì)分領(lǐng)域深耕細(xì)作,未能投入大規(guī)模應(yīng)用。
在支付寶探一下業(yè)務(wù)負(fù)責(zé)人蔡偉看來(lái):未來(lái)的搜索有兩大發(fā)展趨勢(shì),第一個(gè)趨勢(shì)就是從搜索到生成;第二個(gè)趨勢(shì)是從文本主導(dǎo)的交互走向多模態(tài)交互。
技術(shù)極客們的終極目標(biāo),正是希望用戶一次就可以得到滿意的答案和服務(wù)。這是探一下和其他搜索工具的核心區(qū)別。
探一下通過(guò)視覺(jué)大模型的識(shí)別和思考后,基于生成式AI技術(shù)給出系統(tǒng)性的答案,而不是碎片化的信息。這不僅是簡(jiǎn)單的技術(shù)升級(jí),實(shí)際上背后是一種全新的交互邏輯。
以潮玩識(shí)別為例,傳統(tǒng)搜索可能只是敷衍地給出基本信息,“掃” 模式也僅是略知一二,而 “探一下” 則將被動(dòng)搜索轉(zhuǎn)變?yōu)橹悄芡扑],能深挖其收藏價(jià)值、市場(chǎng)動(dòng)態(tài)及同系列產(chǎn)品的前世今生,這種深度挖掘能力源于其先進(jìn)的算法架構(gòu)和海量數(shù)據(jù)的精準(zhǔn)訓(xùn)練,使其在知識(shí)理解與關(guān)聯(lián)拓展上更進(jìn)一步。
同時(shí),“探靈感” 像是創(chuàng)意的源泉,為圖片量身定制趣味盎然的文案,開(kāi)啟用戶與 AI 攜手創(chuàng)作的大門(mén),這也是以“搜”為主導(dǎo)的搜索時(shí)代無(wú)法完成的功能,因?yàn)樗軓挠杏眯畔⑦~向有趣內(nèi)容 ,給用戶獨(dú)特的情緒價(jià)值。
搜索引擎的核心始終是如何正確理解并回答用戶的提問(wèn)。在生成式AI技術(shù)的加持下,“探一下” 正探索一種全新的視覺(jué)交互方式和入口。它有眼睛能探索萬(wàn)物,也像人腦一樣思考,想要一步到位給出用戶最全的知識(shí)圖譜,讓用戶的搜索體驗(yàn)得以變革性提升。
積厚成勢(shì),AI煥新螞蟻
20年前,中國(guó)開(kāi)通國(guó)際64K Internet信道,標(biāo)志著中國(guó)正式全功能接入了國(guó)際互聯(lián)網(wǎng),并且誕生了一批傳奇性互聯(lián)網(wǎng)企業(yè)。如今,隨著技術(shù)紅利見(jiàn)頂,互聯(lián)網(wǎng)市場(chǎng)飽和,對(duì)于螞蟻這樣的互聯(lián)網(wǎng)公司而言,急需探索新的技術(shù)點(diǎn)、挖掘新的盈利點(diǎn),尋求破局關(guān)鍵。
AI技術(shù),或許能成為網(wǎng)絡(luò)寬帶一樣的使能技術(shù),催生新的商業(yè)形態(tài)。
從戰(zhàn)略規(guī)劃層面看,螞蟻集團(tuán)確立“AI First”方針,這是基于自身大規(guī)模業(yè)務(wù)場(chǎng)景需求所做出的決策。螞蟻集團(tuán)著手布局多項(xiàng)AI前沿技術(shù),涵蓋大模型、知識(shí)圖譜、運(yùn)籌優(yōu)化、圖學(xué)習(xí)以及可信AI等領(lǐng)域,構(gòu)建起自身技術(shù)體系。
在2024外灘大會(huì)上,螞蟻集團(tuán)集中一口氣推出多項(xiàng)成果:發(fā)布AI生活管家App“支小寶”,聚焦日常生活服務(wù);升級(jí)AI金融管家 “螞小財(cái)”,主打金融專業(yè)智能服務(wù);推出面向醫(yī)療及泛健康行業(yè)的“AI健康管家”,開(kāi)拓健康領(lǐng)域智能化應(yīng)用。
同時(shí),螞蟻集團(tuán)啟動(dòng)支付寶智能體生態(tài)開(kāi)放計(jì)劃,上線智能體開(kāi)發(fā)平臺(tái)“百寶箱”,吸引外部開(kāi)發(fā)者參與,豐富生態(tài)多樣性。
此外,螞蟻以百靈大模型為核心驅(qū)動(dòng)力,為各應(yīng)用賦予多模態(tài)理解與生成等能力,推動(dòng)產(chǎn)品穩(wěn)定運(yùn)行與煥新。如2024年支付寶五福節(jié),百靈大模型服務(wù)近6億人次,讓大眾通過(guò)AI互動(dòng)玩法感受新年氛圍。
螞蟻AI發(fā)展路徑也不止于內(nèi)部研發(fā),還通過(guò)投資與合作拓展邊界。2024年,其投資與成立多家AI相關(guān)企業(yè),比如12月在上海成立 “上海螞蟻靈波科技有限公司”,聚焦具身智能領(lǐng)域;8月領(lǐng)投秘塔科技超1億元新一輪融資,推動(dòng)AI搜索技術(shù)發(fā)展。
此外,支付寶在垂直行業(yè)持續(xù)泛化AI能力,如針對(duì)政務(wù)場(chǎng)景打造了政務(wù)AI解決方案,推動(dòng)民生服務(wù)分發(fā)效率提高50%,發(fā)揮了AI在實(shí)際場(chǎng)景中的作用。
大模型的競(jìng)技是一場(chǎng)關(guān)于技術(shù)、資金、人才的比拼。AI能否開(kāi)啟螞蟻集團(tuán)諸多新業(yè)務(wù)大門(mén),助力螞蟻集團(tuán)塑造新形態(tài),實(shí)現(xiàn)新一輪成長(zhǎng)蛻變,值得期待。
(舉報(bào))