歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、百度Web端首頁(yè)正式上線(xiàn)AI搜入口,全面整合文心大模型能力
百度搜索迎來(lái)了重大的更新,推出了AI搜入口,這一功能是在之前AI伙伴的基礎(chǔ)上進(jìn)行全面升級(jí),標(biāo)志著百度在智能搜索領(lǐng)域的又一次突破。AI搜基于文心大模型,深度整合了百度的多個(gè)內(nèi)容平臺(tái),提供更可靠的搜索結(jié)果。用戶(hù)可以享受多樣化的智能服務(wù)體驗(yàn),包括話(huà)題探索、問(wèn)題解決等,同時(shí)還集成了文心智能體入口。
【AiBase提要:】
??? AI搜是基于文心大模型的桌面端智能搜索引擎,整合了多個(gè)百度內(nèi)容平臺(tái)。
?? 用戶(hù)可以進(jìn)行話(huà)題探索、問(wèn)題解決、決策輔助等多樣化操作,享受全方位的智能服務(wù)。
?? 集成文心智能體入口,用戶(hù)可通過(guò)@方式與智能體互動(dòng),提升了搜索的個(gè)性化和交互性。
2、字節(jié)跳動(dòng)否認(rèn)開(kāi)發(fā) AI 手機(jī)傳聞:未有相關(guān)計(jì)劃
近日,有關(guān)字節(jié)跳動(dòng)與努比亞合作開(kāi)發(fā)AI手機(jī)的消息引發(fā)熱議,但字節(jié)跳動(dòng)迅速回應(yīng)稱(chēng)此信息不實(shí),強(qiáng)調(diào)公司并沒(méi)有開(kāi)發(fā)AI手機(jī)的計(jì)劃。盡管字節(jié)跳動(dòng)在人工智能領(lǐng)域的投入持續(xù)增加,然而手機(jī)開(kāi)發(fā)并不在其未來(lái)的發(fā)展戰(zhàn)略中。
【AiBase提要:】
?? 字節(jié)跳動(dòng)否認(rèn)與努比亞合作開(kāi)發(fā)AI手機(jī)的傳聞,稱(chēng)此信息不實(shí)。
?? 雙方曾簽署框架協(xié)議,但字節(jié)跳動(dòng)表示沒(méi)有開(kāi)發(fā)AI手機(jī)的計(jì)劃。
?? 字節(jié)跳動(dòng)將繼續(xù)探索AI技術(shù)在現(xiàn)有產(chǎn)品中的應(yīng)用,以提升市場(chǎng)競(jìng)爭(zhēng)力。
3、TryOffAnyone:AI試衣反向操作,可提取人物身上穿的衣服
近日,研究者們推出了一項(xiàng)名為“TryOffAnyone”的創(chuàng)新技術(shù),該技術(shù)利用深度學(xué)習(xí)算法從模特身上提取穿著的衣物,并生成多樣化的服裝圖案。用戶(hù)只需提供一張圖片的URL,程序便能自動(dòng)處理并生成相應(yīng)的服裝圖像。
【AiBase提要:】
??? 該技術(shù)可以從人物身上提取出穿著的衣服,并生成多樣化的服裝圖案。
?? 用戶(hù)只需提供一張圖片的URL,程序便能自動(dòng)生成相應(yīng)的服裝圖像,操作簡(jiǎn)單方便。
?? 研究團(tuán)隊(duì)在VITON-HD數(shù)據(jù)集上進(jìn)行了評(píng)估,確保模型的有效性和準(zhǔn)確性。
4、字節(jié)和中國(guó)科大出品!VMix:提升擴(kuò)散模型美學(xué)的擴(kuò)展,即插即用
在文本生成圖像的領(lǐng)域,VMix適配器通過(guò)創(chuàng)新的條件控制方法顯著提升了擴(kuò)散模型的美學(xué)表現(xiàn)。該技術(shù)利用美學(xué)嵌入將文本提示分解為內(nèi)容和美學(xué)描述,確保生成圖像與文本之間的對(duì)齊。實(shí)驗(yàn)結(jié)果表明,VMix在美學(xué)圖像生成方面超越了其他先進(jìn)方法,兼容多種社區(qū)模型,展現(xiàn)出廣泛的應(yīng)用潛力。
【AiBase提要:】
?? VMix適配器通過(guò)美學(xué)嵌入將文本提示分解為內(nèi)容和美學(xué)描述,增強(qiáng)圖像生成質(zhì)量。
??? 該適配器兼容多個(gè)社區(qū)模型,用戶(hù)無(wú)需重訓(xùn)練即可提升圖像視覺(jué)效果。
? 實(shí)驗(yàn)結(jié)果表明,VMix在美學(xué)生成方面的表現(xiàn)優(yōu)于現(xiàn)有技術(shù),具有廣泛的應(yīng)用潛力。
詳情鏈接:https://vmix-diffusion.github.io/VMix/
5、騰訊AI實(shí)驗(yàn)室與上海交大攜手破解o1模型 “過(guò)度思考” 難題
近年來(lái),隨著大語(yǔ)言模型的廣泛應(yīng)用,o1-like模型在推理任務(wù)中展現(xiàn)出過(guò)度思考的低效問(wèn)題。騰訊AI實(shí)驗(yàn)室與上海交通大學(xué)的研究揭示了這一現(xiàn)象,并提出了通過(guò)引入效率指標(biāo)來(lái)優(yōu)化模型資源利用的新方法。實(shí)驗(yàn)結(jié)果顯示,優(yōu)化策略顯著降低了計(jì)算資源的消耗,同時(shí)提高了模型在簡(jiǎn)單任務(wù)上的準(zhǔn)確性。
【AiBase提要:】
?? 研究揭示o1-like模型在簡(jiǎn)單問(wèn)題上存在“過(guò)度思考”現(xiàn)象,導(dǎo)致不必要的計(jì)算資源浪費(fèi)。
?? 通過(guò)引入結(jié)果效率和過(guò)程效率指標(biāo),研究者優(yōu)化模型的計(jì)算資源利用,提升推理的有效性。
?? 實(shí)驗(yàn)結(jié)果顯示優(yōu)化策略顯著減少token使用,同時(shí)保持或提高模型在簡(jiǎn)單任務(wù)上的準(zhǔn)確性。
詳情鏈接:https://arxiv.org/abs/2412.21187
6、超快音效生成模型TangoFlux:僅需3秒鐘就能生成30秒長(zhǎng)音頻
TANGOFLUX是一款革命性的文本音頻生成模型,能夠在短短3.7秒內(nèi)生成高達(dá)30秒的高質(zhì)量音頻,展現(xiàn)出卓越的性能和效率。該模型不僅能夠生成各種音效,如鳥(niǎo)鳴和口哨聲,還引入了一種新的優(yōu)化框架CLAP-Ranked Preference Optimization(CRPO),以提升生成音頻的質(zhì)量和對(duì)齊性能。
【AiBase提要:】
?? TANGOFLUX是一款高效的文本音頻生成模型,能夠在3.7秒內(nèi)生成30秒的高質(zhì)量音頻。
?? 提出了CLAP-Ranked Preference Optimization(CRPO)框架,以?xún)?yōu)化模型性能和音頻偏好數(shù)據(jù)。
?? 所有代碼和模型已開(kāi)源,旨在推動(dòng)文本音頻生成的研究與應(yīng)用。
詳情鏈接:https://tangoflux.github.io/
7、HuggingFace發(fā)布全新開(kāi)源代碼庫(kù)smolagents:支持快速搭建Agent
HuggingFace推出的smolagents是一個(gè)全新的開(kāi)源庫(kù),旨在簡(jiǎn)化智能代理的構(gòu)建過(guò)程。它允許用戶(hù)通過(guò)簡(jiǎn)化的代碼結(jié)構(gòu)和多種工具支持,輕松創(chuàng)建能夠執(zhí)行各種任務(wù)的智能代理。smolagents不僅支持多種語(yǔ)言模型,還提供了安全的沙盒環(huán)境來(lái)執(zhí)行代碼,確保用戶(hù)安全。
【AiBase提要:】
?? smolagents是一個(gè)新發(fā)布的開(kāi)源庫(kù),旨在簡(jiǎn)化智能代理的構(gòu)建過(guò)程。
?? 用戶(hù)可以通過(guò)定義工具和模型,快速創(chuàng)建智能代理以完成特定任務(wù)。
?? 使用代碼執(zhí)行操作比傳統(tǒng)方法更有效,能夠提升AI代理的性能與靈活性。
詳情鏈接:https://huggingface.co/blog/smolagents
8、上交大揭露AI審稿弊端 一句話(huà)就能讓論文評(píng)分大幅提高
學(xué)術(shù)同行評(píng)審面臨壓力,研究顯示大型語(yǔ)言模型(LLM)在審稿中存在嚴(yán)重風(fēng)險(xiǎn)。上海交通大學(xué)的研究揭示,作者可通過(guò)操控內(nèi)容影響LLM評(píng)分,顯性操控顯著提高評(píng)分并降低與人類(lèi)評(píng)審一致性。此外,LLM容易受到隱性操控影響,且存在幻覺(jué)問(wèn)題和偏見(jiàn)。
【AiBase提要:】
?? LLM審稿存在顯性和隱性操控風(fēng)險(xiǎn),可能導(dǎo)致評(píng)分失真。
?? LLM在評(píng)審中容易受到幻覺(jué)問(wèn)題和論文長(zhǎng)度偏見(jiàn)的影響。
?? 研究者建議暫停使用LLM進(jìn)行審稿,直至建立有效的安全措施。
詳情鏈接:https://arxiv.org/pdf/2412.01708
9、151個(gè)上榜!工信部公布人工智能賦能新型工業(yè)化典型應(yīng)用案例名單
工信部發(fā)布了151個(gè)典型應(yīng)用案例,展示了人工智能在工業(yè)領(lǐng)域的廣泛應(yīng)用。這些案例不僅體現(xiàn)了國(guó)家在推動(dòng)新型工業(yè)化進(jìn)程中的決心,還有效引領(lǐng)了人工智能技術(shù)的深入發(fā)展。通過(guò)政策、資金及項(xiàng)目支持,地方政府和企業(yè)可以共同探索和推廣人工智能的應(yīng)用,促進(jìn)整個(gè)行業(yè)的技術(shù)升級(jí)與創(chuàng)新。
【AiBase提要:】
??151個(gè)典型應(yīng)用案例發(fā)布,助力人工智能在工業(yè)領(lǐng)域的應(yīng)用。
?? 工信部呼吁加大支持力度,推動(dòng)政策與資金落實(shí)。
?? 人工智能成為推動(dòng)新型工業(yè)化的重要?jiǎng)恿?,促進(jìn)行業(yè)技術(shù)升級(jí)。
10、卷瘋了!AI巨頭們紛紛大幅降價(jià)以爭(zhēng)奪市場(chǎng)份額
隨著生成式AI市場(chǎng)競(jìng)爭(zhēng)的加劇,主要科技公司紛紛采取降價(jià)策略以爭(zhēng)奪市場(chǎng)份額。阿里云宣布多款A(yù)I產(chǎn)品降價(jià)最高達(dá)85%,標(biāo)志著競(jìng)爭(zhēng)進(jìn)入白熱化階段。OpenAI和谷歌也緊隨其后,推出降價(jià)產(chǎn)品以應(yīng)對(duì)市場(chǎng)壓力。同時(shí),AI模型的高價(jià)維持面臨挑戰(zhàn),尤其是在開(kāi)源模型和新興企業(yè)的競(jìng)爭(zhēng)下。
【AiBase提要:】
?? 阿里云宣布對(duì)多款 AI 產(chǎn)品降價(jià),最高幅度達(dá)85%。
?? AI 行業(yè)競(jìng)爭(zhēng)加劇,OpenAI 和谷歌紛紛降價(jià)以爭(zhēng)奪市場(chǎng)份額。
?? 未來(lái) OpenAI 可能推出高達(dá)2000美元的高級(jí)模型,尋求營(yíng)收增長(zhǎng)。
11、微軟論文再曝OpenAI模型參數(shù)?醫(yī)療AI評(píng)測(cè)意外暴露4o-mini只有8B
在最新的研究論文中,微軟意外披露了多家頂級(jí)AI公司的模型參數(shù),尤其是OpenAI的多個(gè)模型。論文中提到,OpenAI的o1-preview模型參數(shù)約為300B,而GPT-4o和GPT-4o-mini的參數(shù)分別為200B和8B。這引發(fā)了業(yè)內(nèi)對(duì)模型架構(gòu)和技術(shù)實(shí)力的熱議。此外,Claude3.5Sonnet在醫(yī)療文檔錯(cuò)誤檢測(cè)中表現(xiàn)突出,得分領(lǐng)先。此次泄露再次引發(fā)對(duì)AI模型參數(shù)透明度的關(guān)注,尤其是在OpenAI逐漸淡化開(kāi)源承諾的背景下。
【AiBase提要:】
?? 微軟論文揭示OpenAI多個(gè)模型參數(shù),o1-preview為300B,GPT-4o為200B,GPT-4o-mini僅8B。
?? 論文的主要目的是介紹MEDEC醫(yī)療基準(zhǔn)測(cè)試,Claude3.5Sonnet在錯(cuò)誤檢測(cè)中表現(xiàn)優(yōu)異,得分70.16。
?? 業(yè)內(nèi)對(duì)模型參數(shù)的真實(shí)性展開(kāi)討論,特別是未提及谷歌Gemini的參數(shù),可能與其使用TPU有關(guān)。
詳情鏈接:https://arxiv.org/pdf/2412.19260
12、英偉達(dá)2024年斥資10億美元投資AI初創(chuàng)企業(yè)
英偉達(dá)在2024年積極投資人工智能領(lǐng)域,向多家初創(chuàng)公司注入10億美元,鞏固其在技術(shù)革命中的支持者地位。通過(guò)與初創(chuàng)企業(yè)的合作,英偉達(dá)不僅推動(dòng)了自身技術(shù)的進(jìn)步,還助力了醫(yī)療、金融、教育等多個(gè)行業(yè)的創(chuàng)新解決方案。
【AiBase提要:】
?? 英偉達(dá)在2024年向人工智能初創(chuàng)企業(yè)投資了10億美元,成為技術(shù)革命的重要支持者。
?? 投資涵蓋醫(yī)療、金融、教育等多個(gè)行業(yè),助力初創(chuàng)公司開(kāi)發(fā)創(chuàng)新解決方案。
?? 英偉達(dá)計(jì)劃繼續(xù)關(guān)注新興技術(shù)領(lǐng)域,通過(guò)資本與技術(shù)結(jié)合推動(dòng)更多企業(yè)發(fā)展。
13.百度25周年李彥宏發(fā)全員信:AI應(yīng)用將在2025年井噴
在百度25周年之際,創(chuàng)始人李彥宏發(fā)布全員信,強(qiáng)調(diào)技術(shù)創(chuàng)新是公司核心競(jìng)爭(zhēng)力,預(yù)計(jì) AI 應(yīng)用將在2025年迅速增長(zhǎng)。他回顧了百度的發(fā)展歷程,從最初的網(wǎng)頁(yè)搜索到如今的全棧技術(shù),展現(xiàn)了技術(shù)對(duì)公司的重要性,并鼓勵(lì)員工繼續(xù)努力,迎接未來(lái)的挑戰(zhàn)。
【AiBase 提要:】
?? 百度將超過(guò)20% 資金投入研發(fā),推動(dòng)技術(shù)創(chuàng)新。
?? 李彥宏期待2025年 AI 應(yīng)用實(shí)現(xiàn)重大突破與市場(chǎng)認(rèn)可。
?? 公司致力于將前沿技術(shù)轉(zhuǎn)化為實(shí)際產(chǎn)品,服務(wù)更多人。
(舉報(bào))