歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/
1、字節(jié)跳動推出AI模型社區(qū)平臺:爐米Lumi 類似Liblib和CIvitai
字節(jié)跳動最新推出的AI模型分享社區(qū)平臺爐米Lumi,展示其在AI領(lǐng)域的全面布局策略。平臺提供模型上傳分享、Workflow搭建和LoRA訓(xùn)練功能,目前僅向白名單用戶開放。與LiblibAI相似,爐米Lumi將成為字節(jié)跳動在AI領(lǐng)域的重要布局。
【AiBase提要:】
?? 爐米Lumi是字節(jié)跳動最新推出的AI模型分享社區(qū)平臺,提供模型上傳分享和訓(xùn)練功能。
?? 與LiblibAI功能定位相似,爐米Lumi展示了字節(jié)跳動在AI領(lǐng)域的全面布局策略。
?? 字節(jié)跳動在AI領(lǐng)域已有廣泛布局,包括大模型、ChatBot、AI社交、AI虛擬陪伴等多個領(lǐng)域。
產(chǎn)品入口:https://top.aibase.com/tool/lumilumi
2、神秘大模型“小熊貓”身份揭曉:英國AI公司最新圖像生成模型Recraft V3
我對最新揭曉的英國AI公司Recraft V3圖像生成模型進行了點評。該模型以red_panda化名引起關(guān)注,具備強大的長文本圖像生成能力,突出的文本布局和樣式控制功能讓用戶可以精確創(chuàng)造專業(yè)品質(zhì)的視覺效果。
【AiBase提要:】
?? Recraft V3實為英國AI初創(chuàng)公司Recraft AI推出的最新圖像生成模型,以red_panda身份引發(fā)關(guān)注。
?? Recraft V3在Artificial Analysis排行榜上以1172的ELO評分領(lǐng)先其他模型,收獲超過10萬次投票。
?? Recraft V3具備強大的長文本圖像生成能力,增強的文本布局和樣式控制功能,特別適用于品牌推廣、營銷和復(fù)雜圖形設(shè)計領(lǐng)域。
詳情鏈接:https://www.recraft.ai/
3、OpenAI宣布ChatGPT高級語音模式登陸Windows和Mac平臺
OpenAI今日宣布,ChatGPT的高級語音模式(AVM)正式登陸Windows和Mac平臺,基于GPT-4o模型開發(fā),提供更自然的實時對話交互體驗。用戶反饋良好,但部分地區(qū)暫時無法使用。系統(tǒng)新增五種語音選項,支持打斷和停頓,滿足用戶更接近人際交流的需求。AI回答準(zhǔn)確率高,用戶滿意度達96%。ChatGPT還推出網(wǎng)頁版聊天歷史搜索功能,持續(xù)突破語音交互技術(shù)領(lǐng)域,市場推廣效果待觀察。
【AiBase提要:】
?? ChatGPT的高級語音模式(AVM)正式登陸Windows和Mac平臺,提供更自然的實時對話交互體驗。
?? 系統(tǒng)新增五種語音選項,支持打斷和停頓,滿足用戶更接近人際交流的需求。
?? 用戶反饋良好,AI回答準(zhǔn)確率高,用戶滿意度達96%。ChatGPT還推出網(wǎng)頁版聊天歷史搜索功能,持續(xù)突破語音交互技術(shù)領(lǐng)域。
4、專為蘋果AI而生!蘋果宣布推出M4Max芯片
蘋果公司最新推出的M4Pro和M4Max芯片為Mac電腦帶來顯著性能提升和先進功能。這些芯片采用領(lǐng)先的制程工藝,優(yōu)化了性能和能效,為專業(yè)和AI任務(wù)提供優(yōu)異表現(xiàn)。
【AiBase提要:】
?? M4系列芯片采用第二代3納米制程工藝,提升性能和能效。
?? M4Pro和M4Max芯片支持雷靂5和統(tǒng)一內(nèi)存帶寬提升,為Mac帶來更強大的功能和速度。
?? M4、M4Pro和M4Max芯片搭載神經(jīng)網(wǎng)絡(luò)引擎和機器學(xué)習(xí)加速器,為用戶帶來全新的智能化體驗。
5、OpenAI 重磅升級實時 API:除了降價超50%,還推五種新語音
OpenAI 最新更新了實時 API,推出五種新的語音選項,降低了緩存費用,提供更經(jīng)濟實惠的開發(fā)體驗。新語音包括生動可調(diào)節(jié)的 Ash、Verse 和英國風(fēng)格的 Ballad,提供更自然的交流體驗。然而,實時 API仍在測試階段,無法提供客戶端身份驗證,且網(wǎng)絡(luò)條件影響音頻處理可靠性。開發(fā)者可通過降價和緩存功能吸引更多用戶使用。
【AiBase提要:】
?? 新增五種自然語音,提升語音應(yīng)用體驗
?? 實時 API通過緩存降低輸入費用,開發(fā)者更劃算
? 實時音頻處理受網(wǎng)絡(luò)條件影響,可靠性需關(guān)注
6、好萊塢黑科技!Wonder Dynamics發(fā)布視頻轉(zhuǎn)3D功能
Wonder Dynamics發(fā)布了顛覆性的AI工具Wonder Animation測試版,利用人工智能重新定義影視制作流程。這項技術(shù)讓創(chuàng)作者可以輕松轉(zhuǎn)換素材為包含CG角色的3D動畫場景,實現(xiàn)完整虛擬場景編輯。
【AiBase提要:】
? 創(chuàng)作者可使用任何相機、在任何場地拍攝,通過AI轉(zhuǎn)換為3D動畫場景
?? 強大的場景重建能力,精確還原攝像機與角色、環(huán)境的位置關(guān)系和運動軌跡
?? 讓藝術(shù)家保持創(chuàng)作控制權(quán),更容易制作全動畫電影
詳情鏈接:https://top.aibase.com/tool/wonder-dynamics
7、谷歌重磅升級AI語音技術(shù):2分鐘對話3秒生成,將徹底改變?nèi)藱C交互方式
谷歌最新發(fā)布的語音生成技術(shù)再次刷新了業(yè)界標(biāo)準(zhǔn),突破性技術(shù)能在3秒內(nèi)生成長達2分鐘的自然對話,確保多說話人之間的語音連貫性和音質(zhì)表現(xiàn)。該技術(shù)已在多個谷歌產(chǎn)品中得到應(yīng)用,全球范圍內(nèi)改變著人們與數(shù)字助手和AI工具的交互方式。
【AiBase提要:】
? 高效語音編解碼器,每秒600比特低比特率下壓縮音頻,保持高質(zhì)量輸出。
?? 專門的Transformer架構(gòu),處理信息層次結(jié)構(gòu),預(yù)訓(xùn)練并微調(diào)在高質(zhì)量對話數(shù)據(jù)集上。
?? SynthID技術(shù)整合,為AI生成的音頻內(nèi)容添加水印,確保技術(shù)負責(zé)任使用。
詳情鏈接:https://deepmind.google/discover/blog/pushing-the-frontiers-of-audio-generation/
8、面壁智能與百度智能云達成合作
面壁智能與百度智能云宣布戰(zhàn)略合作,共同致力于開發(fā)大模型端云協(xié)同解決方案。合作將提升大模型在智能終端、邊緣計算等應(yīng)用場景中的效果,降低推理成本,提升響應(yīng)速度,提高用戶體驗和業(yè)務(wù)效率。面壁智能發(fā)布MiniCPM3.0和MiniCPM-V2.6,實現(xiàn)對GPT系列的趕超,引發(fā)國內(nèi)外高度關(guān)注。
【AiBase提要:】
?? 合作共同開發(fā)大模型端云協(xié)同解決方案,提升模型效果、降低成本、提高響應(yīng)速度。
?? 發(fā)布MiniCPM3.0,4B模型參數(shù)規(guī)模趕超GPT-3.5,在多領(lǐng)域脫穎而出。
?? 發(fā)布MiniCPM-V2.6,全面對標(biāo)GPT-4V級水平,實現(xiàn)實時視頻、多圖聯(lián)合理解,引發(fā)國內(nèi)外關(guān)注。
9、19年虧損終結(jié)!Reddit CEO發(fā)文感謝AI幫助網(wǎng)站首度盈利
Reddit 經(jīng)過19年的虧損,終于在上市后迎來了利潤。第三季度凈收入達到2990萬美元,營收348.4億美元,同比增長68%。CEO 哈夫曼表示,人工智能是實現(xiàn)盈利的關(guān)鍵。未來計劃加速產(chǎn)品路線圖,提升用戶搜索體驗。
【AiBase提要:】
?? Reddit 首次實現(xiàn)盈利,第三季度凈收入2990萬美元。
?? 用戶增長顯著,日活躍用戶數(shù)達9700萬,多次突破1億。
?? 人工智能助力翻譯功能擴展,預(yù)計到2025年將覆蓋30個國家。
10、波士頓動力新款A(yù)tlas機器人:全電動、完全自主,成功完成復(fù)雜任務(wù)
波士頓動力公司發(fā)布了新一代人形機器人Atlas的精彩視頻,展示了其在模擬工廠環(huán)境中獨立完成分揀任務(wù)的能力。視頻強調(diào)了Atlas利用機器學(xué)習(xí)和升級傳感器實現(xiàn)實時環(huán)境反饋與調(diào)整的特點,展示了完全自主工作能力。
【AiBase提要:】
?? 波士頓動力展示了全電動Atlas機器人,能夠獨立完成復(fù)雜的分揀任務(wù)。
?? Atlas利用機器學(xué)習(xí)和升級傳感器,實現(xiàn)了實時的環(huán)境反饋與調(diào)整。
?? 視頻中顯示“完全自主”的水印,強調(diào)了其在最少人類干預(yù)下的工作能力。
11、清華大學(xué)推出突破性音源仿真平臺SonicSim
清華大學(xué)研究團隊發(fā)布了名為SonicSim的移動音源仿真平臺,解決了語音處理領(lǐng)域移動聲源場景下數(shù)據(jù)缺乏的難題。該平臺模擬真實聲學(xué)環(huán)境,為語音分離和增強模型提供優(yōu)質(zhì)數(shù)據(jù)支持。SonicSim有效解決了現(xiàn)有數(shù)據(jù)集難以滿足移動聲源場景需求的問題。
【AiBase提要:】
?? SonicSim平臺基于Habitat-sim構(gòu)建,模擬真實聲學(xué)環(huán)境
?? SonicSet數(shù)據(jù)集使用多場景移動音源數(shù)據(jù),確保數(shù)據(jù)真實性和多樣性
?? 在SonicSet數(shù)據(jù)集上訓(xùn)練的模型取得更優(yōu)異性能,證明SonicSim有效模擬真實聲學(xué)環(huán)境
詳情鏈接:https://arxiv.org/pdf/2410.01481
12、百川智能發(fā)布一站式解決方案 幫助企業(yè)最低成本私有化部署模型
百川智能科技推出的一站式解決方案旨在幫助企業(yè)以低成本實現(xiàn)大模型的私有化部署,并提高效率。該解決方案包括全鏈路優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù)、Baichuan4-Turbo和Baichuan4-Air兩款模型,以及全鏈路領(lǐng)域增強工具鏈,能夠滿足企業(yè)在不同場景下的需求。
【AiBase提要:】
?? 高達96%的多場景可用率,領(lǐng)先行業(yè)
?? Baichuan4-Turbo在核心能力上有顯著提升,部署成本低
?? Baichuan4-Air采用MoE模型,推理成本極低,降低企業(yè)運營成本
詳情鏈接:https://platform.baichuan-ai.com/homePage
(舉報)