歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、萬物皆可一鍵毛茸茸!阿里通義App上線“局部風(fēng)格化”功能
通義App最近推出的“局部風(fēng)格化”功能引發(fā)了社交平臺的熱潮。用戶只需簡單操作,就能為照片添加多種風(fēng)格化效果。通義萬相ACE圖片編輯模型的支持,使得用戶可以通過簡單描述實(shí)現(xiàn)圖像編輯,極大地降低了使用門檻。
【AiBase提要:】
??? 用戶可以通過通義App的“局部風(fēng)格化”功能,輕松為照片中的特定對象添加風(fēng)格化效果。
? 首批上線的風(fēng)格模板包括針織、毛絨、冰雕和陶瓷等七種,豐富了用戶的選擇。
?? 該功能基于通義萬相ACE模型,用戶只需口語化描述意圖,即可完成各種圖像編輯任務(wù)。
2、阿里國際AI團(tuán)隊(duì)開源開放型問題推理模型Marco-o1
阿里巴巴國際AI團(tuán)隊(duì)推出的Marco-o1模型,專注于解決開放型問題,超越了傳統(tǒng)的標(biāo)準(zhǔn)答案領(lǐng)域。該模型通過創(chuàng)新的self-play和MCTS技術(shù),構(gòu)建了具備反思能力的超長CoT數(shù)據(jù),展現(xiàn)了在機(jī)器翻譯和其他領(lǐng)域的強(qiáng)大能力。
【AiBase提要:】
?? Marco-o1模型專注于開放型問題的解決,超越了傳統(tǒng)的學(xué)科領(lǐng)域。
?? 該模型通過self-play和MCTS技術(shù),構(gòu)建了具備反思和改正能力的超長CoT數(shù)據(jù)。
?? 研究團(tuán)隊(duì)計(jì)劃開源更多數(shù)據(jù)與模型,推動AI領(lǐng)域的進(jìn)一步發(fā)展。
詳情鏈接:https://modelscope.cn/models/AIDC-AI/Marco-o1
3、Anthropic發(fā)布開源MCP協(xié)議 推動AI系統(tǒng)與數(shù)據(jù)源的雙向連接
Anthropic推出的模型上下文協(xié)議(MCP)旨在通過連接AI助手與多種數(shù)據(jù)源,提高查詢響應(yīng)的質(zhì)量和相關(guān)性。MCP解決了AI助手與數(shù)據(jù)源之間的隔離問題,允許開發(fā)者在應(yīng)用程序與數(shù)據(jù)源之間建立雙向連接,簡化了系統(tǒng)的擴(kuò)展性。
【AiBase提要:】
?? MCP協(xié)議允許AI助手直接從多個數(shù)據(jù)源提取信息,解決信息孤島問題。
?? 開發(fā)者可以通過MCP服務(wù)器共享數(shù)據(jù),簡化與不同數(shù)據(jù)源的連接。
?? 目前已有多家公司集成MCP,Anthropic還提供了預(yù)構(gòu)建的MCP服務(wù)器以支持企業(yè)應(yīng)用。
詳情鏈接:https://www.anthropic.com/news/model-context-protocol
4、Runway推圖像生成模型Frames 專注特定美學(xué),重構(gòu)創(chuàng)意邊界
Runway的Frames模型以革命性的方式重新定義了視覺創(chuàng)作的可能性。Frames的獨(dú)特之處在于其對風(fēng)格和美學(xué)的精細(xì)控制,使每一幀都能展現(xiàn)出藝術(shù)家的風(fēng)格,同時激發(fā)創(chuàng)意的多樣性。
【AiBase提要:】
? Frames模型提供細(xì)粒度的控制,用戶可精確調(diào)整圖像的外觀和氛圍。
?? 該工具在保持風(fēng)格一致的同時,激發(fā)創(chuàng)意的多樣性,適合各種視覺項(xiàng)目。
?? Frames不僅是技術(shù)升級,更是創(chuàng)意民主化的突破,適合所有創(chuàng)作者。
詳情鏈接:https://runwayml.com/research/introducing-frames
5、腦洞大開!Luma推全新Dream Machine 文字、圖像、視頻一條龍服務(wù)
Luma AI推出了Dream Machine平臺,旨在簡化高質(zhì)量圖像和視頻的創(chuàng)作過程,適合各種技術(shù)水平的用戶。該平臺基于先進(jìn)的Photon圖像基礎(chǔ)模型,允許用戶通過自然語言或參考圖像進(jìn)行創(chuàng)作,省去復(fù)雜的提示工程。Dream Machine的直觀設(shè)計(jì)和強(qiáng)大的功能,如角色參考、鏡頭運(yùn)動等。
【AiBase提要:】
??? Dream Machine平臺基于Luma最新的Photon模型,支持高質(zhì)量圖像生成。
?? 用戶可以通過自然語言描述或上傳參考圖像,簡化創(chuàng)作過程。
?? 平臺提供動畫故事情節(jié)制作功能,確保視頻中的角色一致性。
詳情鏈接:https://lumalabs.ai/dream-machine
6、英偉達(dá)出品!AI音頻模型Fugatto:輸入文本、音頻可生成音樂、音效
Fugatto是NVIDIA推出的一款革命性音頻生成模型,具備25億參數(shù),旨在通過文本和音頻輸入為音樂創(chuàng)作提供靈活支持。該模型突破了傳統(tǒng)音頻生成的局限,采用創(chuàng)新的數(shù)據(jù)生成方法和可組合音頻表示變換技術(shù),使藝術(shù)家和開發(fā)者能夠?qū)崟r生成和修改聲音。
【AiBase提要:】
?? Fugatto是NVIDIA推出的音頻AI模型,擁有25億參數(shù),支持文本與音頻輸入。
?? 采用創(chuàng)新的數(shù)據(jù)生成方法和可組合音頻表示變換技術(shù),使得用戶能夠靈活生成和修改聲音。
?? 初步測試顯示,F(xiàn)ugatto在音頻合成與變換方面的表現(xiàn)優(yōu)于多種專業(yè)模型。
詳情鏈接:https://blogs.nvidia.com/blog/fugatto-gen-ai-sound-model/
7、新型AI圖像生成框架OminiControl:可將素材主體融入生成圖片中
OminiControl是新加坡國立大學(xué)研究團(tuán)隊(duì)提出的圖像生成框架,旨在提升圖像生成的靈活性和效率。通過參數(shù)重用機(jī)制,該框架能夠以更少的額外參數(shù)處理圖像條件,顯著提高生成能力。它還提供了一個名為Subjects200K的數(shù)據(jù)集,包含超過20萬張一致性圖像,為研究人員提供了豐富的資源。
【AiBase提要:】
?? OminiControl通過參數(shù)重用機(jī)制,讓圖像生成的控制能力更強(qiáng)大,效率更高。
?? 該框架能同時處理多種圖像條件任務(wù),如邊緣、深度圖等,適應(yīng)不同創(chuàng)作需求。
?? 團(tuán)隊(duì)發(fā)布了超過20萬張圖像的數(shù)據(jù)集Subjects200K,助力進(jìn)一步的研究與探索。
詳情鏈接:https://huggingface.co/spaces/Yuanshi/OminiControl
8、三星有意將ChatGPT集成到Galaxy AI,挑戰(zhàn)谷歌Gemini
金融分析師Dan Nystedt透露,OpenAI正與三星電子洽談合作,計(jì)劃將ChatGPT集成到三星最新的Galaxy AI系統(tǒng)中。這一合作有望提升三星AI系統(tǒng)的語言理解和交互能力,可能對谷歌的Gemini構(gòu)成挑戰(zhàn)。
【AiBase提要:】
?? 三星與OpenAI洽談將ChatGPT集成到Galaxy AI,提升語言理解能力。
?? 此次合作可能對谷歌的Gemini模型造成重大沖擊,打破其市場主導(dǎo)地位。
?? 這并非首次合作傳聞,三星與OpenAI的互動潛力持續(xù)加深。
9、蘋果公布2024年度iPhone應(yīng)用”入圍名單, AI應(yīng)用再度被冷落
蘋果公司近日公布了2024年“年度iPhone應(yīng)用”入圍名單,顯示出對人工智能技術(shù)在移動應(yīng)用生態(tài)系統(tǒng)中影響的低估。盡管ChatGPT等AI應(yīng)用在市場上表現(xiàn)出色,但在提名中卻未能獲得認(rèn)可。
【AiBase提要:】
?? 蘋果2024年“年度iPhone應(yīng)用”提名名單再次忽視了AI應(yīng)用的影響。
?? 提名的應(yīng)用主要聚焦于激發(fā)人類創(chuàng)造力,而非依賴AI自動化功能。
?? 少數(shù)AI應(yīng)用在iPad和Mac的年度提名中出現(xiàn),但整體提名數(shù)量較少。
10.Kimi 數(shù)學(xué)版上線,科學(xué)思維解讀生活
Kimi 數(shù)學(xué)版正式上線,用戶可通過網(wǎng)頁與 k0-math 模型互動,深入理解數(shù)學(xué)知識。此版本支持 LaTeX 輸入及公式轉(zhuǎn)換,提升用戶體驗(yàn)。未來將推出移動版,團(tuán)隊(duì)致力于優(yōu)化功能和互動性,增強(qiáng)用戶在學(xué)習(xí)數(shù)學(xué)時的樂趣。
【AiBase 提要:】
?? Kimi 數(shù)學(xué)版通過 k0-math 模型提供數(shù)學(xué)互動體驗(yàn)。
?? 用戶可通過此版解答問題,享受科學(xué)維解讀生活。
?? 支持 LaTeX 輸入和公式截圖轉(zhuǎn)換,方便用戶操作。
11、英特爾研究顯示使用AI PC每周能省 4 小時工作時間
英特爾公司最新發(fā)布的研究報(bào)告揭示,AI電腦能夠顯著提高用戶的工作效率,平均每周為用戶節(jié)省超過 240 分鐘的工作時間。這項(xiàng)研究強(qiáng)調(diào)了AI電腦在任務(wù)處理、隱私保護(hù)和自適應(yīng)學(xué)習(xí)方面的優(yōu)勢。
【AiBase提要:】
? AI PC 每周可為用戶節(jié)省 240 分鐘的日常工作時間。
?? 科技公司預(yù)計(jì)到 2025 年將在 AI 基礎(chǔ)設(shè)施上投入超過 2000 億美元。
?? AI 初創(chuàng)企業(yè)面臨融資挑戰(zhàn),可能會減緩創(chuàng)新速度。
(舉報(bào))