幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 原創(chuàng) > 關(guān)鍵詞  > 人工智能最新資訊  > 正文

AI日報:階躍星辰內(nèi)測視頻大模型Step-Video;即夢AI圖片2.1模型支持生成文字;騰訊發(fā)布混元視頻生成大模型

2024-12-03 15:28 · 稿源:站長之家

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/

1、階躍星辰視頻生成大模型Step-Video開啟內(nèi)測 可在躍問視頻申請

階躍星辰的Step-Video模型正式開啟內(nèi)測,用戶可以通過躍問視頻官網(wǎng)申請資格。該模型支持從文本生成高達(dá)1080P分辨率、最長10秒的視頻,展現(xiàn)出在自動優(yōu)化提示詞、美學(xué)風(fēng)格和運(yùn)動控制方面的顯著優(yōu)勢。

image.png

【AiBase提要:】

?? Step-Video模型支持從文本生成高清視頻,分辨率高達(dá)1080P,最長可達(dá)10秒。

?? 在美學(xué)風(fēng)格上,Step-Video對中國風(fēng)題材的理解和生成尤為精準(zhǔn),符合古詩意境。

?? 該模型在運(yùn)動控制方面表現(xiàn)優(yōu)異,能夠生成符合物理規(guī)律的視頻,處理復(fù)雜的空間關(guān)系。

詳情鏈接:https://top.aibase.com/tool/yuewenshipin

2、Luma發(fā)布全新圖像生成模型Luma Photon,速度更快,成本更低!

Luma Labs推出的Luma Photon和Photon Flash是兩款革命性的圖像生成模型,具有超高的生成速度和低成本優(yōu)勢。Luma Photon在多項測試中表現(xiàn)出色,能夠生成高質(zhì)量的圖像,適用于廣告、影視、藝術(shù)等多個領(lǐng)域。

【AiBase提要:】

?? Luma Photon生成圖像速度是市場上其他模型的10倍,成本低至0.2美分每張1080p圖片。

?? 支持多輪自然語言指令,用戶可逐步優(yōu)化生成內(nèi)容,適合復(fù)雜創(chuàng)意任務(wù)。

?? 在質(zhì)量、創(chuàng)造力和理解力方面,Luma Photon在雙盲評估中超越市場上所有模型。

詳情鏈接:https://lumalabs.ai/photon

3、可靈AI導(dǎo)演共創(chuàng)計劃作品12月6日上線 將發(fā)布9部電影級AI視頻

快手科技宣布將于12月6日正式上線中國首個AIGC導(dǎo)演共創(chuàng)計劃——“可靈AI導(dǎo)演共創(chuàng)計劃”。此計劃由快手自研的視頻生成大模型“可靈AI”聯(lián)合多位知名導(dǎo)演共同發(fā)起,旨在通過AI技術(shù)拓寬影視創(chuàng)作的邊界。

image.png

【AiBase提要:】

?? 計劃由快手科技與9位知名導(dǎo)演共同發(fā)起,涵蓋多元題材。

?? 所有短片將使用可靈AI進(jìn)行視頻生成,推動AI技術(shù)在影視創(chuàng)作中的應(yīng)用。

?? 可靈AI自發(fā)布以來已服務(wù)超500萬用戶,生成5100萬個視頻和1.5億張圖片。

4、字節(jié)旗下即夢AI灰測圖片2.1模型 AI生圖終于可以出中文字體了!

字節(jié)跳動旗下的即夢AI最近推出了圖片2.1模型,解決了AI圖像生成中文字體的問題。用戶只需簡單輸入文字描述,便可快速生成個性化海報,極大提高了設(shè)計師的工作效率。新模型的應(yīng)用場景廣泛,包括海報制作、書籍封面設(shè)計和社交媒體配圖。

image.png

【AiBase提要:】

?? 新模型支持中文字體生成,提升海報設(shè)計效率。

?? 用戶可通過文字描述創(chuàng)建個性化海報和封面。

?? 模型應(yīng)用場景廣泛,適用于社交媒體、故事創(chuàng)作等。

詳情鏈接:https://top.aibase.com/tool/jimeng

5、秘塔AI搜索:「學(xué)術(shù)搜索」數(shù)據(jù)增加7倍 新增”解釋“功能

上海秘塔網(wǎng)絡(luò)科技有限公司最近對其AI秘塔學(xué)術(shù)搜索功能進(jìn)行了重大升級,數(shù)據(jù)量增加了7倍,用戶現(xiàn)在可以更全面地檢索到數(shù)千萬篇Open Access論文,包括40%的SCI論文及頂級期刊如《Nature》和《Science》。此次更新還新增了“解釋”功能,幫助用戶理解復(fù)雜的文獻(xiàn)內(nèi)容。

微信截圖_20241203091022.png

【AiBase提要:】

?? 數(shù)據(jù)量增加7倍,覆蓋數(shù)千萬篇Open Access論文,提升檢索能力。

?? 新增“解釋”功能,幫助用戶理解文獻(xiàn)中復(fù)雜的句子。

?? 支持44種語言的翻譯模型,消除小語種論文的閱讀障礙。

6、李飛飛創(chuàng)業(yè)首秀:一張圖生成交互式3D 世界,AIGC 進(jìn)入全新時代!

李飛飛的最新創(chuàng)業(yè)項目World Labs,帶來了顛覆性的3D生成技術(shù)。用戶只需提供一張圖片或一句話,就能創(chuàng)造出互動的3D場景,標(biāo)志著AIGC進(jìn)入全新的沉浸式時代。這項技術(shù)不僅能精準(zhǔn)還原細(xì)節(jié),還能模擬各種相機(jī)效果,賦予用戶導(dǎo)演般的控制感。

【AiBase提要:】

??? 只需一張圖片或一句話,即可生成栩栩如生的3D場景,開啟全新交互體驗。

?? 該技術(shù)支持模擬多種相機(jī)效果,讓用戶在3D世界中自由掌控鏡頭。

?? World Labs計劃持續(xù)提升3D世界的規(guī)模和精度,探索更多用戶互動方式。

詳情鏈接:https://www.worldlabs.ai/blog

7、告別語音克隆侵權(quán)!Hume AI推出語音控制功能,可創(chuàng)建個性化AI語音

Hume AI最近推出了一項名為“語音控制”的實驗性功能,使用戶能夠輕松創(chuàng)建個性化的AI聲音,無需任何編碼技能。該功能允許用戶通過滑塊調(diào)整聲音特征,提供多種維度的定制選項,旨在滿足多樣化的應(yīng)用需求。

image.png

【AiBase提要:】

?? Hume AI推出“語音控制”功能,用戶可輕松創(chuàng)建個性化AI聲音。

??? 該功能無須編碼技能,用戶可以通過滑塊調(diào)整聲音特征。

?? Hume旨在通過個性化和情感智能的語音AI來滿足多樣化的應(yīng)用需求。

詳情鏈接:https://www.hume.ai/blog/introducing-voice-control

8、Cohere推新的搜索模型 Rerank3.5:可處理100多種語言精準(zhǔn)查詢

Cohere最近推出的Rerank3.5搜索模型,標(biāo)志著企業(yè)數(shù)據(jù)檢索的重大進(jìn)步。該模型支持超過100種語言的查詢,尤其在阿拉伯語、日語和韓語等主要商業(yè)語言中表現(xiàn)出色,幫助跨國公司打破語言障礙。內(nèi)部測試顯示,Rerank3.5在金融服務(wù)領(lǐng)域的表現(xiàn)顯著提升,能夠節(jié)省成本并降低風(fēng)險。

image.png

【AiBase提要:】

?? Rerank3.5能夠處理100多種語言的查詢,幫助全球企業(yè)打破語言障礙。

?? 內(nèi)部測試顯示,該模型在金融服務(wù)領(lǐng)域的搜索表現(xiàn)大幅提升,能節(jié)省成本和降低風(fēng)險。

?? Cohere 通過主流云平臺的部署,力求成為企業(yè)搜索的行業(yè)標(biāo)準(zhǔn),同時企業(yè)需隨時適應(yīng)快速變化的 AI 環(huán)境。

詳情鏈接:https://cohere.com/blog/rerank-3pt5

9、OpenAI CFO 回應(yīng)廣告?zhèn)髀?當(dāng)前不考慮引入廣告模式

OpenAI的首席財務(wù)官Sarah Friar在接受采訪時表示,當(dāng)前公司并無計劃引入廣告,盡管廣告收入對盈利公司來說是一個誘人的選擇。Friar提到,OpenAI正在快速增長,并在現(xiàn)有商業(yè)模式中發(fā)現(xiàn)了機(jī)會,未來可能會探索其他收入來源。

【AiBase提要:】

?? OpenAI CFO Sarah Friar 表示當(dāng)前無意引入廣告,未來有可能探索其他收入來源。

?? OpenAI 招聘了多位廣告和市場營銷領(lǐng)域的專家,表明未來或?qū)⒖紤]廣告模式。

?? 公司高管頻繁變動,創(chuàng)始人 Sam Altman 依然在努力推動公司愿景。

10、提到 “David Mayer”一詞ChatGPT就崩潰,這是什么神秘力量?

最近,社交媒體上出現(xiàn)了一個讓人困惑的現(xiàn)象:OpenAI的聊天機(jī)器人ChatGPT在提到“David Mayer”時無法正常回應(yīng),并強(qiáng)制結(jié)束對話。這一現(xiàn)象引發(fā)了網(wǎng)友們的廣泛討論與猜測,許多人嘗試詢問ChatGPT有關(guān)“David Mayer”的信息,卻都遭遇了同樣的結(jié)局。

image.png

【AiBase提要:】

?? ChatGPT在提到“David Mayer”時無法回應(yīng),并強(qiáng)制結(jié)束對話。

?? “David Mayer”可能與法律問題有關(guān),涉及GDPR被遺忘權(quán)。

?? 其他姓名同樣會導(dǎo)致ChatGPT出現(xiàn)故障,凸顯AI模型的復(fù)雜性。

11.WPS Office 推出 AI 語音速記功能

WPS Office 近期發(fā)布了 AI 語音速記功能,增強(qiáng)了語音轉(zhuǎn)文字的體驗,支持實時錄音和多語言互譯。該功能通過聲紋識別和 AI 自動總結(jié)提升準(zhǔn)確性,并與 WPS 云文檔深度整合,確保用戶在錄音過程中能順利繼續(xù)錄音。用戶可在最新版本的 WPS Office 中輕松找到并使用此功能。

微信截圖_20241203150637.png

【AiBase 提要:】

??? 語音速記功能實現(xiàn)實時錄音與音頻轉(zhuǎn)文字。

?? 支持中英等多種語言的互譯功能。

?? 提供安全的文檔協(xié)作體驗,提升用戶便利性。

12.騰訊發(fā)布混元視頻生成大模型: 130 億參數(shù)全面開源

騰訊推出了混元視頻生成模型,擁有 130 億參數(shù),是當(dāng)前最大開源視頻生成模型。該模型支持高清、真實感視頻生成,適用于廣告和創(chuàng)意視頻等商業(yè)應(yīng)用。用戶可通過騰訊元寶 APP 和騰訊云接口進(jìn)行試用或?qū)?,降低了視頻生成的技術(shù)門檻,促進(jìn)了 AI 技術(shù)的普及。

【AiBase 提要:】

?? 混元視頻生成模型具備超寫實質(zhì)感,適合多種商業(yè)場景使用。

?? 模型允許用戶細(xì)致刻畫生成內(nèi)容,提供高度語義遵循。

?? 開源模式推動了 AI 視頻生成技術(shù)的民主化,鼓勵創(chuàng)意與開發(fā)者創(chuàng)新。

官網(wǎng):https://aivideo.hunyuan.tencent.com

模型:https://huggingface.co/tencent/HunyuanVideo

舉報

  • 相關(guān)推薦

熱文

  • 3 天
  • 7天