11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵?lái)騰訊云選購(gòu)吧!
全球AI領(lǐng)導(dǎo)者NVIDIA發(fā)布了全新開發(fā)產(chǎn)品——NVIDIAAIBlueprint。AIBlueprint主要用于開發(fā)視覺AIAgent,幾乎任何行業(yè)都能開發(fā)出用于分析視頻、圖像的AIAgent來(lái)提升工作、監(jiān)控效率等。全球著名系統(tǒng)集成商和技術(shù)解決方案提供商,包括聯(lián)想、埃森哲、戴爾科技,正在將英偉達(dá)的AIBlueprint帶到全球的企業(yè)和城市,推動(dòng)下一波AI應(yīng)用的部署,以提高工廠、倉(cāng)庫(kù)、商店、機(jī)場(chǎng)、交通路口等地的生?
在今天下午舉行的榮耀MagicOS9.0發(fā)布會(huì)上,榮耀MagicOS9.0正式發(fā)布。榮耀CEO趙明表示,榮耀MagicOS9.0是行業(yè)首個(gè)搭載智能體的個(gè)人化全場(chǎng)景AI操作系統(tǒng),開啟手機(jī)自動(dòng)駕駛時(shí)代。以智能體為核心的MagicOS9.0將首次實(shí)現(xiàn)純AI視覺、零生態(tài)適配的任務(wù)自主執(zhí)行,讓手機(jī)進(jìn)入自動(dòng)駕駛時(shí)代。
歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、百度智能云一見視覺大模型v4.5發(fā)布百度智能云一見視覺大模型平臺(tái)v4.5的發(fā)布,為工業(yè)行業(yè)帶來(lái)了革命性變革,提供高效的視覺智能解決方案,極大地提高了企業(yè)的運(yùn)營(yíng)效率和安全性。國(guó)外科技媒體Techcrunch整理了2024年迄今籌集1億美元以上資金的美國(guó)AI公司。
小鵬汽車今日宣布,新車型小鵬P7將于10月10日進(jìn)行全球首次亮相,宣傳口號(hào)為“因AI生,越級(jí)登場(chǎng)”。小鵬P7的官方宣傳中,它被譽(yù)為“全球首款A(yù)I汽車”。新的智能駕駛方案不受城市、路線、路況的限制,能夠?qū)崿F(xiàn)從“門到門”以及“車位到車位”的全程自動(dòng)駕駛功能。
這兩天看虎嗅的文章的時(shí),我突然發(fā)現(xiàn)一個(gè)已經(jīng)存在了很久,但是卻被我一直忽視的事情。他們的頭圖,是AI生成的。既然看到這里了,如果覺得不錯(cuò),隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時(shí)間收到推送,也可以給我個(gè)星標(biāo)?~謝謝你看我的文章,我們,下次再見。
每個(gè)人心中都珍藏著一些難忘的瞬間:孩子的第一次微笑,與愛人攜手漫步夕陽(yáng)下的海灘,朋友歡聚時(shí)的開懷大笑……這些珍貴的記憶,都值得被用心記錄,并與身邊的人分享。正是承載這些美好回憶的最佳載體。無(wú)論你是攝影愛好者還是普通用戶,都能輕松用它捕捉生活中的每一個(gè)精彩瞬間,創(chuàng)作出令人驚艷的影像作品。
2024年8月29日,視覺中國(guó)發(fā)布2024半年度報(bào)告。視覺中國(guó)合并層面營(yíng)業(yè)收入3.99億元,較2023年H1同比增長(zhǎng)7.56%;歸屬母公司股東凈利潤(rùn)為5,085萬(wàn)元,較2023年H1同比有所下降。自2014年上市以來(lái),公司累計(jì)共向供稿方支付稿酬超過(guò)24.74億元,激勵(lì)了創(chuàng)作者創(chuàng)造優(yōu)秀作品的積極性,促進(jìn)創(chuàng)作者生態(tài)的健康發(fā)展。
在今晚舉行的發(fā)布會(huì)上,小鵬汽車發(fā)布了全新的純視覺智駕方案AI鷹眼。AI鷹眼視覺方案比人眼更清晰,采用全球首發(fā)的Lofic架構(gòu),攝像頭精度、可視距離升級(jí),色彩分辨能力更加強(qiáng),在弱光、逆光、大光差等環(huán)境看得都清晰,在黑夜,雨霧天,隧道等都能清晰識(shí)別。值得一體的是,小鵬P7將作為全球首個(gè)搭載AI視覺鷹眼視覺方案的車型,與此同時(shí),過(guò)往搭載激光雷達(dá)方案的車型,OTA同步更新,保持一致體驗(yàn)。
對(duì)于有“智能家居*股"之稱的螢石網(wǎng)絡(luò)來(lái)說(shuō),一場(chǎng)同時(shí)面向C端用戶和B端客戶的AI大變革,正在全面開啟。6月27日,以“AI達(dá)百業(yè) 視之所向”為主題的2024 ECDC螢石云開發(fā)者大會(huì)在杭舉行。
一、準(zhǔn)備工作準(zhǔn)備幾張600*800尺寸的黑底白字圖,我這邊也替大家準(zhǔn)備好了,可以掃描底部二維碼加群領(lǐng)取哦二、參數(shù)設(shè)置【大模型】寫實(shí)大模型都可以嘗試。
AIGC科技企業(yè)-愛設(shè)計(jì)&AiPPT.cn宣布完成B1輪融資。本輪融資由A股上市公司視覺中國(guó)領(lǐng)投,星連資本和36氪跟投?!笎墼O(shè)計(jì)&AiPPT.cn」成立于2018年,去年8月份孵化上線了AI辦公超級(jí)單品-AiPPT.cn/AiPPT.com。
《柳葉刀》上發(fā)表了一篇關(guān)于心血管疾病風(fēng)險(xiǎn)預(yù)測(cè)的重要文章,介紹了一項(xiàng)名為CaRi-Heart的技術(shù)。該技術(shù)結(jié)合了AI視覺識(shí)別和預(yù)測(cè)算法,可以在沒有明顯癥狀時(shí)提前10年識(shí)別出重大的心血管疾病風(fēng)險(xiǎn)。CaRi-Heart技術(shù)的應(yīng)用具有重大意義,可以幫助臨床醫(yī)生更好地識(shí)別和預(yù)防患者的心臟疾病風(fēng)險(xiǎn),從提高預(yù)防和管理的效果。
歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、李彥宏:百度搜索已有11%結(jié)果由AI生成在百度2024年第一季度財(cái)報(bào)電話會(huì)上,百度創(chuàng)始人李彥宏深入探討了公司的業(yè)務(wù)表現(xiàn)和未來(lái)發(fā)展方向,強(qiáng)調(diào)人工智能技術(shù)對(duì)用戶體驗(yàn)的推動(dòng)?
OpenAI最近宣布,其AssistantsAPI現(xiàn)在支持視覺能力,這標(biāo)志著該公司在多模態(tài)AI領(lǐng)域的進(jìn)一步擴(kuò)展。這項(xiàng)更新使得API能夠處理和理解圖像內(nèi)容,為用戶提供更加豐富的交互體驗(yàn)。OpenAI持續(xù)推動(dòng)AI技術(shù)的邊界,AssistantsAPI的這一新功能將進(jìn)一步促進(jìn)AI在各個(gè)行業(yè)中的集成和應(yīng)用。
VQAScore是一種新的評(píng)估指標(biāo),旨在更好地評(píng)估復(fù)雜的文本到視覺生成效果。這一指標(biāo)結(jié)合了CLIP-FlanT5模型,能夠在文本到圖像/視頻/3D生成評(píng)估中實(shí)現(xiàn)最佳性能,是評(píng)估和優(yōu)化文本到視覺生成模型的強(qiáng)大工具。如果您希望了解更多信息并開始使用VQAScore進(jìn)行評(píng)估,請(qǐng)?jiān)L問VQAScore官方網(wǎng)站。
VAR是一種新的視覺自回歸建模方法,能夠超越擴(kuò)散模型,實(shí)現(xiàn)更高效的圖像生成。它建立了視覺生成的冪律scalinglaws,并具備零shots的泛化能力。想要了解更多關(guān)于VAR的信息并開始您的圖像生成之旅,請(qǐng)?jiān)L問VAR官方網(wǎng)站。
由國(guó)控廣東物流和曠視聯(lián)合研發(fā)的“藥械自動(dòng)識(shí)別和數(shù)據(jù)采集系統(tǒng)”在國(guó)控廣東物流佛山物流中心進(jìn)入運(yùn)作使用。在藥械收貨環(huán)節(jié),該系統(tǒng)通過(guò)人機(jī)協(xié)作,數(shù)秒內(nèi)就能完成單批產(chǎn)品的多輪信息復(fù)核和數(shù)據(jù)自動(dòng)采集,實(shí)現(xiàn)高準(zhǔn)確率的同時(shí),整體工作效率提升超50%。對(duì)此,國(guó)控廣東物流總經(jīng)理梁穎康表示:“國(guó)控廣東物流佛山物流中心的視覺復(fù)核項(xiàng)目,是醫(yī)藥行業(yè)首例通過(guò)AI視覺識(shí)?
中國(guó)香港中文大學(xué)和SmartMore的研究人員推出了一種名為Mini-Gemini的新穎框架,通過(guò)增強(qiáng)多模態(tài)輸入處理來(lái)推動(dòng)VLMs的發(fā)展。Mini-Gemini采用了雙編碼器系統(tǒng)和一種新穎的補(bǔ)丁信息挖掘技術(shù),結(jié)合一個(gè)特別策劃的高質(zhì)量數(shù)據(jù)集,使其能夠有效處理高分辨率圖像并生成內(nèi)容豐富的視覺和文本內(nèi)容,從使其脫穎出。正如研究人員所承認(rèn)的那樣,Mini-Gemini在視覺理解和推理能力方面仍有改進(jìn)?
自上個(gè)月人工智能模型Sora問世以來(lái),OpenAI一直在積極地與視覺藝術(shù)家、設(shè)計(jì)師、創(chuàng)意總監(jiān)和電影制作人等各類創(chuàng)意人士進(jìn)行合作。他們邀請(qǐng)Sora參與他們的創(chuàng)作過(guò)程,共同探索并挖掘Sora在視覺藝術(shù)領(lǐng)域的應(yīng)用潛力。我們期待在未來(lái),能看到更多由Sora創(chuàng)作的藝術(shù)作品,也期待Sora能在更多的領(lǐng)域中發(fā)揮其獨(dú)特的價(jià)值。
大型視覺語(yǔ)言模型在需要文本和圖像理解的任務(wù)中表現(xiàn)出色。特別是在區(qū)域級(jí)任務(wù),如引用表達(dá)理解中,經(jīng)過(guò)圖像文本理解和推理的發(fā)展之后,這一進(jìn)展變得明顯。該模型在定量和定性目標(biāo)計(jì)數(shù)方面均優(yōu)于專家模型,證明了其在感知和理解方面的優(yōu)越性。
Katalist是一款面向電影制片人、廣告商和內(nèi)容創(chuàng)作者的在線工具,利用生成式AI技術(shù)幫助用戶可視化創(chuàng)意構(gòu)思,輕松創(chuàng)建故事板、視頻創(chuàng)意和創(chuàng)意推介。Katalist的核心功能是分析劇本,自動(dòng)提取人物、場(chǎng)景和活動(dòng),一鍵生成相應(yīng)的視覺素材。Katalist的產(chǎn)品特色和功能一鍵生成劇本故事板保持人物場(chǎng)景一致性快速切換角色場(chǎng)景元素導(dǎo)入劇本自動(dòng)生成視覺素材定制視覺元素的細(xì)節(jié)想要了解更多關(guān)于Katalist的信息并開始體驗(yàn)這一工具,請(qǐng)?jiān)L問官方網(wǎng)站。
加利福尼亞大學(xué)圣地亞哥分校和南加利福尼亞大學(xué)的研究人員最近推出了一種名為CyberDemo的新型人工智能框架,旨在通過(guò)視覺觀察進(jìn)行機(jī)器人模仿學(xué)習(xí)。傳統(tǒng)的模仿學(xué)習(xí)方法通常需要大量高質(zhì)量的示范數(shù)據(jù)來(lái)教導(dǎo)機(jī)器人完成復(fù)雜任務(wù),特別是對(duì)于需要高度靈巧的任務(wù)來(lái)說(shuō)。雖然為每個(gè)任務(wù)設(shè)計(jì)模擬環(huán)境需要額外的工作,但減少了數(shù)據(jù)收集的人為干預(yù),并避免了復(fù)雜的獎(jiǎng)勵(lì)設(shè)計(jì)?
LeCun在「視覺世界模型」論文中詳細(xì)介紹了世界模型在AI學(xué)習(xí)物理世界中的關(guān)鍵作用。世界模型相比自回歸學(xué)習(xí)范式能更好地理解世界,掌握物理世界的關(guān)鍵。LeCun的「視覺世界模型」論文有望成為AI學(xué)習(xí)物理世界的關(guān)鍵里程碑。
AIRLOOK與百度視覺技術(shù)部聯(lián)合發(fā)布了中國(guó)地信領(lǐng)域的第一個(gè)大空間高精度3DGS解決方案,率先實(shí)現(xiàn)了測(cè)繪級(jí)SfM與3DGaussianSplatting逆渲染技術(shù)的完美融合,為行業(yè)提供更強(qiáng)大的顯式編輯能力和更低算力需求的實(shí)時(shí)渲染能力,進(jìn)一步降低開發(fā)和部署門檻,在雙方的合作下,將加快創(chuàng)新性技術(shù)在地理信息領(lǐng)域的應(yīng)用。GIR重建及重光照渲染效果打造數(shù)字孿生城市的“新引擎”隨著數(shù)字經(jīng)濟(jì)的快速發(fā)展,地理信息數(shù)據(jù)已經(jīng)成為數(shù)字經(jīng)濟(jì)的重要組成部分,對(duì)于推動(dòng)經(jīng)濟(jì)發(fā)展和提升社會(huì)治理水平具有重要意義。3DGS-PBR的引入,讓重建的3DGS結(jié)果可無(wú)縫與其他CG渲染內(nèi)容融合。
VSP-LLM是一個(gè)結(jié)合視覺語(yǔ)音處理與大型語(yǔ)言模型的框架,旨在通過(guò)LLMs的強(qiáng)大能力最大化上下文建模能力。VSP-LLM設(shè)計(jì)用于執(zhí)行視覺語(yǔ)音識(shí)別和翻譯的多任務(wù),通過(guò)自監(jiān)督視覺語(yǔ)音模型將輸入視頻映射到LLM的輸入潛在空間。該框架通過(guò)提出一種新穎的去重方法和低秩適配器,可以高效地進(jìn)行訓(xùn)練。
【新智元導(dǎo)讀】谷歌團(tuán)隊(duì)推出「通用視覺編碼器」VideoPrism,在3600萬(wàn)高質(zhì)量視頻字幕對(duì)和5.82億個(gè)視頻剪輯的數(shù)據(jù)集上完成了訓(xùn)練,性能刷新30項(xiàng)SOTA。AI視頻模型Sora爆火之后,Meta、谷歌等大廠紛紛下場(chǎng)做研究,追趕OpenAI的步伐。盡管對(duì)比基線已經(jīng)在K400上取得了有競(jìng)爭(zhēng)力的結(jié)果,但所提出的全局蒸餾和token洗牌進(jìn)一步提高了準(zhǔn)確性。
YOLOv8是YOLO系列目標(biāo)檢測(cè)模型的最新版本。它能夠在圖像或視頻中準(zhǔn)確快速地識(shí)別和定位多個(gè)對(duì)象,并實(shí)時(shí)跟蹤它們的移動(dòng)。利用YOLOv8分析醫(yī)學(xué)影像,幫助醫(yī)生進(jìn)行疾病診斷。
PixelPlayer是一項(xiàng)革命性的工具,可以通過(guò)觀看大量無(wú)標(biāo)注視頻學(xué)會(huì)定位產(chǎn)生聲音的圖像區(qū)域并分離輸入聲音成一組表示每個(gè)像素聲音的組件的系統(tǒng)。該系統(tǒng)利用視覺和聽覺雙模態(tài)的自然同步特點(diǎn),在無(wú)需額外人工標(biāo)注的情況下學(xué)習(xí)聯(lián)合解析聲音和圖像模型。欲了解更多關(guān)于PixelPlayer的信息,請(qǐng)?jiān)L問官方網(wǎng)站。
劃重點(diǎn):??GoogleAI團(tuán)隊(duì)提出了ScreenAI,這是一個(gè)視覺語(yǔ)言模型,可以全面理解UI和信息圖。??ScreenAI在多個(gè)任務(wù)上表現(xiàn)出色,包括圖形問答,元素注釋,摘要生成等。通過(guò)利用這些組件的共同視覺語(yǔ)言和復(fù)雜設(shè)計(jì),ScreenAI為理解數(shù)字內(nèi)容提供了全面的方法。
OpenAI投資的人形機(jī)器人,通過(guò)最新視頻拜年了有倆人上來(lái)就表演了一個(gè)從貨架取包裹,轉(zhuǎn)身放進(jìn)筐里:鏡頭繼續(xù)推進(jìn),旁邊靠墻的兩個(gè)機(jī)器人,在不停地將俄羅斯方塊積木舉起-丟下-再舉起。充好電的機(jī)器人,溫柔地拔掉插銷,微微半蹲,把插頭放到指定位置。1X官方說(shuō)法是,計(jì)劃在今年正式發(fā)布NEO,并進(jìn)行量產(chǎn)。