歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、百度文心智能體平臺免費(fèi)開放文心4.0版本
百度文心智能體平臺最新推出的文心大模型4.0版本免費(fèi)開放給公眾使用,極大地擴(kuò)展了平臺的功能和應(yīng)用范圍。該版本在理解力、生成力、邏輯推理和記憶能力等方面取得顯著進(jìn)步,綜合能力與GPT-4相媲美。百度創(chuàng)始人李彥宏在世界人工智能大會上強(qiáng)調(diào)智能體作為AI應(yīng)用的前景,認(rèn)為搜索是智能體分發(fā)的關(guān)鍵渠道。文心智能體平臺的零代碼開發(fā)模式降低了普通用戶開發(fā)智能體的難度,為開發(fā)者提供了易于開發(fā)、易于分發(fā)、易于盈利的優(yōu)勢。
【AiBase提要:】
?? 文心大模型4.0版本免費(fèi)開放給開發(fā)者使用,功能和應(yīng)用范圍大幅擴(kuò)展。
?? 文心4.0版本在理解力、生成力、邏輯推理和記憶能力等方面取得顯著進(jìn)步,與GPT-4相媲美。
?? 文心智能體平臺提供零代碼開發(fā)模式,降低了普通用戶開發(fā)智能體的難度,為開發(fā)者提供了易于開發(fā)、易于分發(fā)、易于盈利的優(yōu)勢。
詳情鏈接:https://top.aibase.com/tool/wenxinzhinengtipingtai-agentbuilder
2、Meta 發(fā)布 AI 重磅炸彈:多標(biāo)記預(yù)測模型現(xiàn)已開放研究
Meta 邁出了重要一步,發(fā)布了采用多標(biāo)記預(yù)測方法的預(yù)訓(xùn)練模型,可能改變大型語言模型的開發(fā)和部署方式。這種新技術(shù)有望提高人工智能效率,加速人機(jī)協(xié)作編碼的趨勢,對語言理解和上下文產(chǎn)生更細(xì)致的影響。
【AiBase提要:】
?? 新技術(shù)采用多標(biāo)記預(yù)測方法,有望提高性能并縮短訓(xùn)練時間。
?? 模型同時預(yù)測多個未來單詞,可能改善語言結(jié)構(gòu)和上下文理解。
?? Meta 在Hugging Face上發(fā)布模型,加速創(chuàng)新和人才獲取,助力人工智能領(lǐng)域競爭。
詳情鏈接:https://top.aibase.com/tool/multi-token-prediction
3、商湯科技發(fā)布“日日新5o”:對標(biāo)GPT-4o 實現(xiàn)實時流式多模態(tài)交互
商湯科技在2024年世界人工智能大會上發(fā)布了國內(nèi)首個所見即所得模型“日日新5o”,實現(xiàn)了實時的流式多模態(tài)交互,與GPT-4o相當(dāng)。該模型整合聲音、文本、圖像和視頻等跨模態(tài)信息,能夠進(jìn)行實時的理解和響應(yīng)。
【AiBase提要:】
?? “日日新5o”模型實現(xiàn)了實時的流式多模態(tài)交互,能夠識別胸卡、描述小狗玩偶外觀、對圖畫進(jìn)行評價。
?? “日日新5.5”是“日日新5.0”的升級版,綜合性能提升30%,特別在數(shù)學(xué)推理、英文能力和指令跟隨方面有顯著提升。
?? 商湯推出“大模型0元Go”計劃,為企業(yè)用戶提供免費(fèi)服務(wù)、贈送Tokens包、提供搬家顧問幫助用戶遷移,實現(xiàn)零服務(wù)成本。
4、上海AI lab開源超強(qiáng)多模態(tài)LLM InternLM-XComposer-2.5
昨天,上海AI實驗室開源了一款名為InternLM-XComposer-2.5的多模態(tài)大型語言模型,展現(xiàn)出在超高分辨率圖像理解、細(xì)粒度視頻理解和多輪圖像對話等方面的超凡能力。該模型對網(wǎng)頁制作和圖文混排文章進(jìn)行了特別優(yōu)化,填補(bǔ)了國內(nèi)多模態(tài)LLM領(lǐng)域的空白,為創(chuàng)作者提供了更大的創(chuàng)作空間。
【AiBase提要:】
?? 長上下文處理: IXC-2.5支持處理超長文本和圖像輸入,原生支持24K標(biāo)記的輸入并可擴(kuò)展到96K,為用戶提供更大的創(chuàng)作空間。
??? 多樣化視覺能力: IXC-2.5不僅支持超高分辨率的圖像理解,還能進(jìn)行細(xì)粒度的視頻理解和多輪多圖對話,展現(xiàn)出難以想象的能力。
? 生成能力: IXC-2.5能夠生成網(wǎng)頁和高質(zhì)量的圖文文章,將文本和圖像的結(jié)合提升到一個新的高度。
項目地址:https://top.aibase.com/tool/internlm-xcomposer-2-5
完整內(nèi)容點(diǎn)此查看:https://www.aibase.com/news/10053
5、斯坦福大學(xué)出品!OccFusion:可完整渲染出被遮擋的人體
OccFusion是斯坦福大學(xué)提出的新方法,旨在實現(xiàn)遮擋人體的高保真度渲染。該方法經(jīng)過三個階段的處理,利用高效的3D高斯分片和2D擴(kuò)散模型監(jiān)督實現(xiàn),在評估中表現(xiàn)出色,達(dá)到了遮擋人體渲染的最新水平。
【AiBase提要:】
?? OccFusion是一種新方法,旨在實現(xiàn)遮擋人體的高保真度渲染。
?? 該方法包括三個階段:初始化、優(yōu)化和細(xì)化,通過高效的3D高斯分片和2D擴(kuò)散模型監(jiān)督實現(xiàn)。
?? 在ZJU-MoCap和OcMotion序列上評估,OccFusion表現(xiàn)出色,達(dá)到了遮擋人體渲染的最新水平。
詳情鏈接:https://top.aibase.com/tool/occfusion
6、蘋果開放4M模型演示 輕松拆解圖片所有信息
蘋果公司在Hugging Face上放出了一顆重磅炸彈,開放了去年的論文4M模型的演示。這一模型能夠處理和生成多種模態(tài)內(nèi)容,包括文本、圖像和3D場景。通過上傳一張照片,用戶可以輕松獲得照片的所有信息,如主要輪廓、色調(diào)和尺寸等。蘋果展示了強(qiáng)大的AI實力,并希望圍繞4M構(gòu)建生態(tài)系統(tǒng),但也面臨數(shù)據(jù)實踐和AI倫理挑戰(zhàn)。
【AiBase提要:】
?? 4M模型能處理和生成多種模態(tài)內(nèi)容,包括文本、圖像和3D場景。
??? 4M采用"大規(guī)模多模態(tài)屏蔽建模"訓(xùn)練方法,實現(xiàn)模態(tài)間的無縫對接。
?? 4M使用全球最大的開源數(shù)據(jù)集CC12M,采用弱監(jiān)督偽標(biāo)簽的方法,證明自身能直接執(zhí)行多模態(tài)任務(wù)。
詳情鏈接:https://huggingface.co/spaces/EPFL-VILAB/4M
7、中國生成式AI專利數(shù)量超過美國 6 倍
中國在生成式AI領(lǐng)域取得了巨大成就,專利數(shù)量超過美國6倍,展現(xiàn)出強(qiáng)大的創(chuàng)新實力和領(lǐng)先地位。騰訊、平安保險集團(tuán)和百度等中國公司在GenAI專利數(shù)量上表現(xiàn)突出。中國的頂級學(xué)術(shù)機(jī)構(gòu)和技術(shù)生態(tài)為生成式AI的發(fā)展提供了有力支持,獲得學(xué)術(shù)界和媒體的認(rèn)可。
【AiBase提要:】
?? 中國在2014年至2023年期間申請的生成式AI專利數(shù)量達(dá)到38210個,超過了美國的6倍。
?? 騰訊、平安保險集團(tuán)和百度是GenAI專利數(shù)量最多的中國公司。
?? 中國的頂級學(xué)術(shù)機(jī)構(gòu)和技術(shù)生態(tài)為生成式AI的發(fā)展提供了強(qiáng)大支持,中國在該領(lǐng)域的領(lǐng)先地位得到了學(xué)術(shù)界和媒體的認(rèn)可。
詳情鏈接:https://www.wipo.int/web-publications/patent-landscape-report-generative-artificial-intelligence-genai/index.html
8、魔法般的LivePortrait:將照片變?yōu)樯鷦右曨l,精準(zhǔn)操控眼睛和嘴唇動作!
LivePortrait是一項黑科技,讓靜態(tài)照片動起來,突破傳統(tǒng)動畫制作難題,高效精確。它能生成逼真的動畫,控制眼睛和嘴唇動作,提升用戶創(chuàng)意空間。讓照片活起來,講述自己的故事。
【AiBase提要:】
?? LivePortrait讓靜態(tài)照片變?yōu)榱鲿硠討B(tài)視頻,顛覆傳統(tǒng)動畫制作,處理多人物肖像無縫拼接,自然流暢。
? LivePortrait解決傳統(tǒng)動畫制作難題,高質(zhì)量高效率,精確控制眼睛和嘴唇動作,微表情逼真。
?? LivePortrait采用先進(jìn)技術(shù)方法,生成速度快,支持多風(fēng)格肖像,提供更多創(chuàng)意空間。
詳情鏈接:https://top.aibase.com/tool/liveportrait
9、WAIC 開幕日精彩集錦丨AI 界大佬們都分享了哪些觀點(diǎn)?
7月4日在上海舉辦的2024年世界人工智能大會暨人工智能全球治理高級別會議上,AI行業(yè)專家們就AI的發(fā)展方向和應(yīng)用落地展開深入討論。會議反映出AI行業(yè)正向?qū)嶋H應(yīng)用轉(zhuǎn)變,關(guān)注如何讓AI技術(shù)產(chǎn)生實際價值。同時,AI安全與倫理問題、產(chǎn)業(yè)變革與機(jī)遇也成為討論焦點(diǎn)。
【AiBase提要:】
?? AI應(yīng)用落地成為關(guān)注焦點(diǎn),重點(diǎn)轉(zhuǎn)向?qū)嶋H應(yīng)用,如何讓AI技術(shù)產(chǎn)生實際價值成為關(guān)注焦點(diǎn)。
?? AI發(fā)展重點(diǎn)轉(zhuǎn)向?qū)嶋H應(yīng)用,商湯科技CEO強(qiáng)調(diào)應(yīng)用是推動AI進(jìn)入"超級時刻"的關(guān)鍵,突破需要高質(zhì)量數(shù)據(jù)、流暢交互和可控性。
?? AI安全與倫理問題受到重視,AI風(fēng)險主要來自網(wǎng)絡(luò)風(fēng)險擴(kuò)大、社會結(jié)構(gòu)顛覆和存在風(fēng)險,需要平衡控制AI和發(fā)揮潛力。
10、科幻小說照進(jìn)現(xiàn)實?Clone Robotics:一個制造類似西部世界仿生機(jī)器人的公司
Clone Robotics是一家制造仿生機(jī)器人的公司,通過仿生設(shè)計和生物力學(xué)原理推動技術(shù)發(fā)展,產(chǎn)品具有高度仿真、耐用性和經(jīng)濟(jì)性。他們的核心產(chǎn)品包括Clone Hand和Clone Torso,能執(zhí)行各種復(fù)雜操作任務(wù),提供廣泛的應(yīng)用場景。公司代表了人類與機(jī)器人和諧共存的未來生活方式。
【AiBase提要:】
?? Clone Robotics是一家制造仿生機(jī)器人的公司,產(chǎn)品具有高度仿真、耐用性和經(jīng)濟(jì)性。
?? 核心產(chǎn)品包括Clone Hand和Clone Torso,能執(zhí)行各種復(fù)雜操作任務(wù),提供廣泛的應(yīng)用場景。
?? 公司代表了人類與機(jī)器人和諧共存的未來生活方式。
詳情鏈接:https://top.aibase.com/tool/clone-incorporated
11、好萊塢視覺特效提供商獲得2億美元投資
DNEG集團(tuán)成功獲得來自阿布扎比投資者的2億美元戰(zhàn)略投資,將加速AI創(chuàng)作者工具的開發(fā),估值超過20億美元。這一投資有望降低電影制作成本,推動中東地區(qū)內(nèi)容生產(chǎn)生態(tài)系統(tǒng)的發(fā)展。
【AiBase提要:】
?? DNEG集團(tuán)獲得2億美元戰(zhàn)略投資,加速AI創(chuàng)作者工具的開發(fā),估值超過20億美元。
?? 電影制作成本不斷攀升,AI CGI工具有望幫助降低成本,創(chuàng)造更逼真的效果。
?? 投資將促使DNEG集團(tuán)在阿布扎比設(shè)立辦公室和視覺體驗中心,推動中東地區(qū)內(nèi)容生產(chǎn)生態(tài)系統(tǒng)的發(fā)展。
(舉報)