歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、階躍星辰視頻生成大模型Step-Video開啟內(nèi)測 可在躍問視頻申請
階躍星辰的Step-Video模型正式開啟內(nèi)測,用戶可以通過躍問視頻官網(wǎng)申請資格。該模型支持從文本生成高達(dá)1080P分辨率、最長10秒的視頻,展現(xiàn)出在自動優(yōu)化提示詞、美學(xué)風(fēng)格和運(yùn)動控制方面的顯著優(yōu)勢。
【AiBase提要:】
?? Step-Video模型支持從文本生成高清視頻,分辨率高達(dá)1080P,最長可達(dá)10秒。
?? 在美學(xué)風(fēng)格上,Step-Video對中國風(fēng)題材的理解和生成尤為精準(zhǔn),符合古詩意境。
?? 該模型在運(yùn)動控制方面表現(xiàn)優(yōu)異,能夠生成符合物理規(guī)律的視頻,處理復(fù)雜的空間關(guān)系。
詳情鏈接:https://top.aibase.com/tool/yuewenshipin
2、Luma發(fā)布全新圖像生成模型Luma Photon,速度更快,成本更低!
Luma Labs推出的Luma Photon和Photon Flash是兩款革命性的圖像生成模型,具有超高的生成速度和低成本優(yōu)勢。Luma Photon在多項測試中表現(xiàn)出色,能夠生成高質(zhì)量的圖像,適用于廣告、影視、藝術(shù)等多個領(lǐng)域。
【AiBase提要:】
?? Luma Photon生成圖像速度是市場上其他模型的10倍,成本低至0.2美分每張1080p圖片。
?? 支持多輪自然語言指令,用戶可逐步優(yōu)化生成內(nèi)容,適合復(fù)雜創(chuàng)意任務(wù)。
?? 在質(zhì)量、創(chuàng)造力和理解力方面,Luma Photon在雙盲評估中超越市場上所有模型。
詳情鏈接:https://lumalabs.ai/photon
3、可靈AI導(dǎo)演共創(chuàng)計劃作品12月6日上線 將發(fā)布9部電影級AI視頻
快手科技宣布將于12月6日正式上線中國首個AIGC導(dǎo)演共創(chuàng)計劃——“可靈AI導(dǎo)演共創(chuàng)計劃”。此計劃由快手自研的視頻生成大模型“可靈AI”聯(lián)合多位知名導(dǎo)演共同發(fā)起,旨在通過AI技術(shù)拓寬影視創(chuàng)作的邊界。
【AiBase提要:】
?? 計劃由快手科技與9位知名導(dǎo)演共同發(fā)起,涵蓋多元題材。
?? 所有短片將使用可靈AI進(jìn)行視頻生成,推動AI技術(shù)在影視創(chuàng)作中的應(yīng)用。
?? 可靈AI自發(fā)布以來已服務(wù)超500萬用戶,生成5100萬個視頻和1.5億張圖片。
4、字節(jié)旗下即夢AI灰測圖片2.1模型 AI生圖終于可以出中文字體了!
字節(jié)跳動旗下的即夢AI最近推出了圖片2.1模型,解決了AI圖像生成中文字體的問題。用戶只需簡單輸入文字描述,便可快速生成個性化海報,極大提高了設(shè)計師的工作效率。新模型的應(yīng)用場景廣泛,包括海報制作、書籍封面設(shè)計和社交媒體配圖。
【AiBase提要:】
?? 新模型支持中文字體生成,提升海報設(shè)計效率。
?? 用戶可通過文字描述創(chuàng)建個性化海報和封面。
?? 模型應(yīng)用場景廣泛,適用于社交媒體、故事創(chuàng)作等。
詳情鏈接:https://top.aibase.com/tool/jimeng
5、秘塔AI搜索:「學(xué)術(shù)搜索」數(shù)據(jù)增加7倍 新增”解釋“功能
上海秘塔網(wǎng)絡(luò)科技有限公司最近對其AI秘塔學(xué)術(shù)搜索功能進(jìn)行了重大升級,數(shù)據(jù)量增加了7倍,用戶現(xiàn)在可以更全面地檢索到數(shù)千萬篇Open Access論文,包括40%的SCI論文及頂級期刊如《Nature》和《Science》。此次更新還新增了“解釋”功能,幫助用戶理解復(fù)雜的文獻(xiàn)內(nèi)容。
【AiBase提要:】
?? 數(shù)據(jù)量增加7倍,覆蓋數(shù)千萬篇Open Access論文,提升檢索能力。
?? 新增“解釋”功能,幫助用戶理解文獻(xiàn)中復(fù)雜的句子。
?? 支持44種語言的翻譯模型,消除小語種論文的閱讀障礙。
6、李飛飛創(chuàng)業(yè)首秀:一張圖生成交互式3D 世界,AIGC 進(jìn)入全新時代!
李飛飛的最新創(chuàng)業(yè)項目World Labs,帶來了顛覆性的3D生成技術(shù)。用戶只需提供一張圖片或一句話,就能創(chuàng)造出互動的3D場景,標(biāo)志著AIGC進(jìn)入全新的沉浸式時代。這項技術(shù)不僅能精準(zhǔn)還原細(xì)節(jié),還能模擬各種相機(jī)效果,賦予用戶導(dǎo)演般的控制感。
【AiBase提要:】
??? 只需一張圖片或一句話,即可生成栩栩如生的3D場景,開啟全新交互體驗。
?? 該技術(shù)支持模擬多種相機(jī)效果,讓用戶在3D世界中自由掌控鏡頭。
?? World Labs計劃持續(xù)提升3D世界的規(guī)模和精度,探索更多用戶互動方式。
詳情鏈接:https://www.worldlabs.ai/blog
7、告別語音克隆侵權(quán)!Hume AI推出語音控制功能,可創(chuàng)建個性化AI語音
Hume AI最近推出了一項名為“語音控制”的實驗性功能,使用戶能夠輕松創(chuàng)建個性化的AI聲音,無需任何編碼技能。該功能允許用戶通過滑塊調(diào)整聲音特征,提供多種維度的定制選項,旨在滿足多樣化的應(yīng)用需求。
【AiBase提要:】
?? Hume AI推出“語音控制”功能,用戶可輕松創(chuàng)建個性化AI聲音。
??? 該功能無須編碼技能,用戶可以通過滑塊調(diào)整聲音特征。
?? Hume旨在通過個性化和情感智能的語音AI來滿足多樣化的應(yīng)用需求。
詳情鏈接:https://www.hume.ai/blog/introducing-voice-control
8、Cohere推新的搜索模型 Rerank3.5:可處理100多種語言精準(zhǔn)查詢
Cohere最近推出的Rerank3.5搜索模型,標(biāo)志著企業(yè)數(shù)據(jù)檢索的重大進(jìn)步。該模型支持超過100種語言的查詢,尤其在阿拉伯語、日語和韓語等主要商業(yè)語言中表現(xiàn)出色,幫助跨國公司打破語言障礙。內(nèi)部測試顯示,Rerank3.5在金融服務(wù)領(lǐng)域的表現(xiàn)顯著提升,能夠節(jié)省成本并降低風(fēng)險。
【AiBase提要:】
?? Rerank3.5能夠處理100多種語言的查詢,幫助全球企業(yè)打破語言障礙。
?? 內(nèi)部測試顯示,該模型在金融服務(wù)領(lǐng)域的搜索表現(xiàn)大幅提升,能節(jié)省成本和降低風(fēng)險。
?? Cohere 通過主流云平臺的部署,力求成為企業(yè)搜索的行業(yè)標(biāo)準(zhǔn),同時企業(yè)需隨時適應(yīng)快速變化的 AI 環(huán)境。
詳情鏈接:https://cohere.com/blog/rerank-3pt5
9、OpenAI CFO 回應(yīng)廣告?zhèn)髀?當(dāng)前不考慮引入廣告模式
OpenAI的首席財務(wù)官Sarah Friar在接受采訪時表示,當(dāng)前公司并無計劃引入廣告,盡管廣告收入對盈利公司來說是一個誘人的選擇。Friar提到,OpenAI正在快速增長,并在現(xiàn)有商業(yè)模式中發(fā)現(xiàn)了機(jī)會,未來可能會探索其他收入來源。
【AiBase提要:】
?? OpenAI CFO Sarah Friar 表示當(dāng)前無意引入廣告,未來有可能探索其他收入來源。
?? OpenAI 招聘了多位廣告和市場營銷領(lǐng)域的專家,表明未來或?qū)⒖紤]廣告模式。
?? 公司高管頻繁變動,創(chuàng)始人 Sam Altman 依然在努力推動公司愿景。
10、提到 “David Mayer”一詞ChatGPT就崩潰,這是什么神秘力量?
最近,社交媒體上出現(xiàn)了一個讓人困惑的現(xiàn)象:OpenAI的聊天機(jī)器人ChatGPT在提到“David Mayer”時無法正常回應(yīng),并強(qiáng)制結(jié)束對話。這一現(xiàn)象引發(fā)了網(wǎng)友們的廣泛討論與猜測,許多人嘗試詢問ChatGPT有關(guān)“David Mayer”的信息,卻都遭遇了同樣的結(jié)局。
【AiBase提要:】
?? ChatGPT在提到“David Mayer”時無法回應(yīng),并強(qiáng)制結(jié)束對話。
?? “David Mayer”可能與法律問題有關(guān),涉及GDPR被遺忘權(quán)。
?? 其他姓名同樣會導(dǎo)致ChatGPT出現(xiàn)故障,凸顯AI模型的復(fù)雜性。
11.WPS Office 推出 AI 語音速記功能
WPS Office 近期發(fā)布了 AI 語音速記功能,增強(qiáng)了語音轉(zhuǎn)文字的體驗,支持實時錄音和多語言互譯。該功能通過聲紋識別和 AI 自動總結(jié)提升準(zhǔn)確性,并與 WPS 云文檔深度整合,確保用戶在錄音過程中能順利繼續(xù)錄音。用戶可在最新版本的 WPS Office 中輕松找到并使用此功能。
【AiBase 提要:】
??? 語音速記功能實現(xiàn)實時錄音與音頻轉(zhuǎn)文字。
?? 支持中英等多種語言的互譯功能。
?? 提供安全的文檔協(xié)作體驗,提升用戶便利性。
12.騰訊發(fā)布混元視頻生成大模型: 130 億參數(shù)全面開源
騰訊推出了混元視頻生成模型,擁有 130 億參數(shù),是當(dāng)前最大開源視頻生成模型。該模型支持高清、真實感視頻生成,適用于廣告和創(chuàng)意視頻等商業(yè)應(yīng)用。用戶可通過騰訊元寶 APP 和騰訊云接口進(jìn)行試用或?qū)?,降低了視頻生成的技術(shù)門檻,促進(jìn)了 AI 技術(shù)的普及。
【AiBase 提要:】
?? 混元視頻生成模型具備超寫實質(zhì)感,適合多種商業(yè)場景使用。
?? 模型允許用戶細(xì)致刻畫生成內(nèi)容,提供高度語義遵循。
?? 開源模式推動了 AI 視頻生成技術(shù)的民主化,鼓勵創(chuàng)意與開發(fā)者創(chuàng)新。
官網(wǎng):https://aivideo.hunyuan.tencent.com
模型:https://huggingface.co/tencent/HunyuanVideo
(舉報)