幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > 可靈最新資訊  > 正文

你還說(shuō)這是AI?我們體驗(yàn)了一波生成亞洲人看的文生圖大模型

2024-12-30 16:57 · 稿源:?機(jī)器之心公眾號(hào)

聲明:本文來(lái)自于微信公眾號(hào) 機(jī)器之心,作者:蛋醬,授權(quán)站長(zhǎng)之家轉(zhuǎn)載發(fā)布。

這幾天,打開(kāi)社交媒體平臺(tái),很多人正在熱烈討論一個(gè)叫做「AI 模特」的玩法。

點(diǎn)開(kāi)幾個(gè) Demo,確實(shí)驚艷。下方視頻是一位海外網(wǎng)友自制的穿搭合輯,你能分得清這是 AI 還是真人嗎?

image.png

來(lái)源:https://x.com/mad_mask/status/1872522970050253178

一般來(lái)說(shuō),都是先有真人模特照片,用 AI 換裝也不新鮮。但這個(gè)平臺(tái)能一站式完成模特主體、換裝、展示視頻的生成:

image.png

上述作品,都來(lái)自剛剛重磅更新的可靈 AI。

圖片

在2024年的尾聲,可靈 AI 給所有用戶送上了新年大禮包:全新的「可圖1.5」和「可靈1.6」,目前已全量上線。

圖片

可圖1.5帶來(lái)了更豐富的場(chǎng)景層次、更自然的畫(huà)面細(xì)節(jié)和更真實(shí)人像生成。就說(shuō)下方這兩張人像,你能確定哪個(gè)是實(shí)拍、哪個(gè)是可圖生成的嗎?

圖片

答案揭曉:左圖為可圖大模型生成,右圖為真人實(shí)拍。AI 生成的水準(zhǔn),完全達(dá)到了以假亂真的程度。

圖片

基于可圖大模型能力的更新,「AI 模特」功能也正式上線。

圖片

Prompt:美麗的印度人,明亮面部,柔和光線,白色吊帶露出腰部,白色喇叭闊腿長(zhǎng)褲,赤腳,,雙手自然深插褲袋,下巴微抬,目光平視鏡頭,表情冷靜自信,淺灰色背景,全身構(gòu)圖,街拍風(fēng)格

讓這位 AI 模特?fù)Q上指定款式的服裝,再使用一下可靈圖生視頻功能,一條精美的服裝展示視頻這不就有了嗎?

看到這里,感到震驚的不只是普通用戶,電商和廣告領(lǐng)域的從業(yè)者一定也陷入了沉思……

是的,我們都知道 AI 會(huì)成為推進(jìn)社會(huì)生產(chǎn)力的重要一環(huán),只是沒(méi)想到這場(chǎng)變革來(lái)得這么快,而且這么徹底。

如果你想上手嘗試,測(cè)評(píng)地址在這里:https://klingai.kuaishou.com/

可圖1.5上線

我們真的分不清 AI 與實(shí)拍了

從2022年的 Stable Diffusion 開(kāi)始,過(guò)去兩年的文生圖領(lǐng)域是飛速發(fā)展的。不管是技術(shù)還是應(yīng)用層面,都出現(xiàn)多次爆發(fā)式的增長(zhǎng)。在這個(gè)過(guò)程中,眾多科技公司都推出了文生圖應(yīng)用,并在「卷」的過(guò)程中將這一領(lǐng)域推向新的高度,包括 Midjourney、Stability AI,快手的「可圖」也是其中一支重要力量。

當(dāng)下的文生圖產(chǎn)品已經(jīng)非常優(yōu)秀,在很多生成任務(wù)的表現(xiàn)上近乎無(wú)可挑剔。剩下的難點(diǎn)主要集中于一些具體應(yīng)用場(chǎng)景,比如對(duì)人像真實(shí)度、畫(huà)面細(xì)節(jié)豐富度等維度的把控。

這次,新上線的可圖1.5就著重從這兩點(diǎn)入手。

圖片

一方面,可圖1.5生成的畫(huà)面美感顯著提升,構(gòu)圖與光影更加協(xié)調(diào),人像美觀度大幅提升,呈現(xiàn)出更高級(jí)的美學(xué)效果。

有網(wǎng)友嘗試用可圖1.5生成古風(fēng)攝影,原圖直出就是驚艷的程度,人物一致性保持得也很好:

圖片

圖片

作為尊貴的年卡黃金會(huì)員,機(jī)器之心也對(duì)可圖1.5模型進(jìn)行了一場(chǎng)全面測(cè)評(píng)。

我們發(fā)現(xiàn),可圖1.5對(duì)亞洲人的人像生成更加擅長(zhǎng),相比之下,ChatGPT 給出的結(jié)果就不那么如人意了。

Prompt:高級(jí)時(shí)尚肖像,柔和魅力打光,亞洲女模特,飄逸黑色長(zhǎng)發(fā)搭配空氣劉海,身穿淺藍(lán)色襯衫式連衣裙,薰衣草花田背景,專(zhuān)業(yè)美妝攝影

作為更適合中國(guó)用戶體質(zhì)的文生圖應(yīng)用,可圖1.5生成的人像發(fā)絲根根分明,前額劉海的空氣感很強(qiáng),五官和臉型也更符合我們對(duì)亞洲女孩的認(rèn)知。

圖片

將這張圖片一鍵輸入「圖生視頻」,靜態(tài)人物鮮活了起來(lái):

Prompt:美女微微一笑,撥動(dòng)了頭發(fā),動(dòng)人心弦。

另一方面,可圖1.5生成的畫(huà)面質(zhì)量顯著提升。增強(qiáng)了畫(huà)面細(xì)節(jié)表現(xiàn),色彩還原更加自然,層次感更加豐富。如下圖所示:

Prompt:長(zhǎng)發(fā)女孩站在高處眺望城市全景,淺色上衣,遠(yuǎn)處是山脈和城鎮(zhèn)以及中國(guó)傳統(tǒng)風(fēng)格的建筑群,屋頂整齊排列,延伸到遠(yuǎn)方,背景是藍(lán)天白云,云朵層次分明,陽(yáng)光明媚,兩側(cè)被青翠的山脈環(huán)繞,與城市形成鮮明對(duì)比,色調(diào)柔和,動(dòng)畫(huà)風(fēng)格,寧?kù)o的氛圍。

圖片

Prompt:生成一幅帶有 “merry christmas” 的電影海報(bào),創(chuàng)意獨(dú)一無(wú)二的想像力,卡通風(fēng)格,圣誕老人,禮物,大師作品,獲獎(jiǎng)作品。

可以看到,可圖1.5為海報(bào)設(shè)置了前景(圣誕老人)、中景(圣誕樹(shù)屋)、遠(yuǎn)景(遠(yuǎn)山和夜空)三個(gè)層次,由近處的暖色逐漸過(guò)渡到遠(yuǎn)處的冷色,明暗對(duì)比強(qiáng)烈,制造出真實(shí)的深度感,并運(yùn)用定向光源的元素為畫(huà)面增加了立體感。

圖片

Prompt:土撥鼠擬人化,陽(yáng)光透過(guò)廚房的窗戶,光線通過(guò)空氣中的面粉產(chǎn)生丁達(dá)爾效應(yīng),耶穌光,一只穿著藍(lán)色圍裙的土撥鼠媽媽在白色色調(diào)的廚房里蒸饅頭,案板上放著已經(jīng)整形好的饅頭,兩只可愛(ài)的小土撥鼠在旁邊玩耍,身上沾滿了面粉,精致線條,溫暖的陽(yáng)光,虛幻引擎渲染,8K 電影效果,真實(shí)的光影效果。

一般來(lái)說(shuō),動(dòng)物毛發(fā)和面粉狀態(tài)會(huì)是生成難點(diǎn)。在這幅畫(huà)中,土撥鼠的毛發(fā)紋理非常逼真,具有明顯的柔軟感和立體感,且毛發(fā)受光部位明亮,背光部分暗淡,細(xì)節(jié)清晰可見(jiàn)。案板上面團(tuán)的質(zhì)感細(xì)膩,表面略微反光,也體現(xiàn)出濕潤(rùn)柔軟的特性。面粉漂浮在空氣中的動(dòng)態(tài)效果增加了畫(huà)面的活力,嚴(yán)格遵循了丁達(dá)爾效應(yīng)的文字指令。土撥鼠的表情專(zhuān)注溫和,精準(zhǔn)實(shí)現(xiàn)了擬人化特性的表達(dá)。

圖片

據(jù)了解,基于可圖1.5模型的參考圖 / 墊圖功能正在快速趕來(lái)的路上,我們可以先期待一下。

「AI 模特」+「尾幀生成」

廣告片制作已經(jīng)不需要真人了

基于可圖大模型在人物生成方面的能力提升,一項(xiàng)極具應(yīng)用潛力的新功能應(yīng)運(yùn)而生:AI 模特。

我們都知道,在傳統(tǒng)的廣告片生產(chǎn)流程中,通常包含場(chǎng)景布置、拍攝執(zhí)行、后期調(diào)整等工作,演員、設(shè)備、場(chǎng)地、道具、后期都需要一定的預(yù)算,且需要聘請(qǐng)專(zhuān)業(yè)團(tuán)隊(duì)協(xié)作完成。

現(xiàn)在,打開(kāi)可靈 AI 網(wǎng)站,任何用戶都可以通過(guò)文本描述,一鍵生成高質(zhì)量的 AI 模特圖像。并且,這種生成結(jié)果的視覺(jué)表現(xiàn)力完全是專(zhuān)業(yè)級(jí)的:精致真實(shí)的五官細(xì)節(jié)、自然的姿態(tài)、清晰的服裝質(zhì)感。

圖片

當(dāng)然,如果用戶生成素材的目的是用來(lái)展示商品,上圖的 AI 模特可以無(wú)縫銜接 AI 換裝功能,一鍵完成服裝更換和搭配展示。

圖片

圖片

同時(shí),基于可靈1.6的圖生視頻能力,即可生成自然、真實(shí)的動(dòng)態(tài)服裝展示視頻,讓商品展示更具感染力與真實(shí)感。

腦洞一下,以后的廣告片可能只需要拍攝商品圖,甚至不需要再聘請(qǐng)真人模特,也不需要搭建任何場(chǎng)景了。

商業(yè)廣告場(chǎng)景之外,這種讓任意靜態(tài)圖動(dòng)起來(lái)的一站式方案,還可以加速影視作品制作:

目前在可靈1.5模型高品質(zhì)模式中,還支持僅使用尾幀完成圖生視頻,比如向前生成5s/10s 的視頻,非常適合生成商品展示、酷炫入場(chǎng)動(dòng)效、遠(yuǎn)景到近景等場(chǎng)景。

Prompt:一幅圖像從空白的白紙過(guò)渡到超流暢的無(wú)縫水墨筆觸,逐漸流暢,像宣紙上的水一樣融合在一起。筆觸柔和自然,圖像有機(jī)地形成,每個(gè)元素都在連續(xù)、優(yōu)雅的過(guò)渡中展現(xiàn)出來(lái)。

圖片

AI 技術(shù)落地的應(yīng)用場(chǎng)景往往是具體的,但產(chǎn)生的價(jià)值卻是非常宏偉的。對(duì)于普通人來(lái)說(shuō),技術(shù)能夠幫助他們跨越專(zhuān)業(yè)領(lǐng)域原本存在的一些門(mén)檻,以更低的成本和更高的效率接近目標(biāo)。

這讓我們想到一位業(yè)內(nèi)人士關(guān)于《AGI 實(shí)現(xiàn)前夜》的思考:「我們目前的許多工作很快就會(huì)自動(dòng)化,我們必須適應(yīng)。如果你從一項(xiàng)特定的技能中獲得意義,這項(xiàng)技能可能在5年后就不再需要了。但如果你能從力所能及的幫助世界中獲得意義,那么這種意義永遠(yuǎn)不會(huì)消失?!?/p>

瘋狂的2024

可靈 AI 的進(jìn)化之路

在2024年的末尾回顧可靈 AI 這一年的發(fā)展歷程,一定會(huì)讓關(guān)注國(guó)產(chǎn)大模型的用戶們百感交集。

作為國(guó)內(nèi)頂尖的 AI 創(chuàng)意生產(chǎn)力平臺(tái),自今年6月發(fā)布以來(lái),可靈 AI 至今已服務(wù)超過(guò)600萬(wàn)用戶,生成1.75億張圖片和6500萬(wàn)個(gè)視頻。

在文生圖上,不斷迭代「可圖」已成為行業(yè)內(nèi)頂尖的模型之一。得益于在文本表征方面的創(chuàng)新,以及圖像數(shù)據(jù)對(duì)齊的大量工作,可圖可以畫(huà)出攝像級(jí)的畫(huà)面質(zhì)感,經(jīng)過(guò)強(qiáng)化學(xué)習(xí)的訓(xùn)練,審美也和人類(lèi)的普遍標(biāo)準(zhǔn)實(shí)現(xiàn)了對(duì)齊,并推出了「AI 試衣」、「AI 模特」等實(shí)用功能。

在視頻生成上,「可靈 AI」成為全球首個(gè)用戶可用的真實(shí)影像級(jí)視頻生成大模型,繼 Sora 之后,宣告了全球視頻生成領(lǐng)域的新一輪競(jìng)爭(zhēng)開(kāi)啟。不管是在畫(huà)質(zhì)質(zhì)量、動(dòng)態(tài)質(zhì)量、美學(xué)表現(xiàn)、運(yùn)動(dòng)合理性和語(yǔ)義理解層面的表現(xiàn),還是「文生視頻」、「圖生視頻」、「視頻續(xù)寫(xiě)」、「運(yùn)動(dòng)筆刷」等功能的陸續(xù)發(fā)布,都吸引了海內(nèi)外用戶的持續(xù)關(guān)注。

有人直呼:「Kling is killing!」這并非溢美之詞,今年來(lái),海外社區(qū)的確在經(jīng)歷一場(chǎng)中國(guó) AI 飛速發(fā)展帶來(lái)的震撼。

圖片

在即將到來(lái)的2025年,你對(duì)國(guó)產(chǎn) AI 以及可靈 AI 有怎樣的期許呢?歡迎在評(píng)論區(qū)討論。

舉報(bào)

  • 相關(guān)推薦
  • 昇騰AI平臺(tái)訓(xùn)練推理!中國(guó)聯(lián)通元景文生圖大模型開(kāi)源:真正懂中文

    中國(guó)聯(lián)通宣布,聯(lián)通數(shù)據(jù)智能公司打造、首個(gè)完全在國(guó)產(chǎn)昇騰AI軟硬件平臺(tái)上實(shí)現(xiàn)訓(xùn)練和推理的中文原生文生圖模型聯(lián)通元景文生圖模型”,正式開(kāi)源。該模型實(shí)現(xiàn)了多項(xiàng)自主創(chuàng)新突破:首先是在架構(gòu)上,通過(guò)在SDXL架構(gòu)中融合復(fù)合語(yǔ)言編碼模塊,實(shí)現(xiàn)了對(duì)中文長(zhǎng)文本、多屬性對(duì)應(yīng)和中文特色詞匯的精確語(yǔ)義理解,對(duì)應(yīng)圖像的生成效果得到了極大提升。該模型已在聯(lián)通的多個(gè)內(nèi)?

  • AI日?qǐng)?bào):階躍星辰內(nèi)測(cè)視頻大模型Step-Video;即夢(mèng)AI片2.1模型支持生成文字;騰訊發(fā)布混元視頻生成大模型

    歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、階躍星辰視頻生成大模型Step-Video開(kāi)啟內(nèi)測(cè)可在躍問(wèn)視頻申請(qǐng)階躍星辰的Step-Video模型正式開(kāi)啟內(nèi)測(cè),用戶可以通過(guò)躍問(wèn)視頻官網(wǎng)申請(qǐng)資格。用戶可在最新版本的WPSOffice中輕松找到?

  • 視頻生成大模型賽道,只是看上去擁擠

    2024年最后一個(gè)月,國(guó)產(chǎn)大模型落地應(yīng)用突然加速。尤其視頻生成模型,就像密集射出子彈后的槍管,熱得發(fā)燙。AI一天,人間一年。

  • 迄今最大視頻開(kāi)源模型!騰訊混元文生視頻上線:一句話生成視頻

    今日,騰訊混元大模型宣布文生視頻功能上線,一句話就能生成視頻。此次開(kāi)源的視頻生成大模型,參數(shù)量130億,是當(dāng)前最大的視頻開(kāi)源模型。通過(guò)先進(jìn)的圖像視頻混合VAE,讓模型在細(xì)節(jié)表現(xiàn)有明顯提升,特別是小人臉、高速鏡頭等場(chǎng)景。

  • AI大模型時(shí)代,人才的需求已經(jīng)變了

    什么是AI發(fā)展的第一驅(qū)動(dòng)力?最近,全球科技大廠都在用行動(dòng)告訴我們:人才。谷歌NotebookLM的核心團(tuán)隊(duì)共同宣布離職創(chuàng)業(yè),他們新公司的網(wǎng)站已經(jīng)進(jìn)入了「建設(shè)中」的狀態(tài)。但要真正解決AI人才短缺的問(wèn)題需要更多企業(yè)、高校和社會(huì)各界的共同努力。

  • 智象多模態(tài)生成大模型3.0發(fā)布 離幻覺(jué)更遠(yuǎn)與離落地更近

    12月28日,智象未來(lái)科技有限公司在安徽人工智能產(chǎn)業(yè)先導(dǎo)區(qū)啟動(dòng)儀式中,正式發(fā)布智象多模態(tài)生成大模型3.0版。啟動(dòng)儀式上,智象未來(lái)創(chuàng)始人兼首席執(zhí)行官梅濤總結(jié)了2024年人工領(lǐng)域技術(shù)發(fā)展的五個(gè)標(biāo)志性事件,分別是以Sora為代表的視覺(jué)生成物理世界模擬器、以ChatGPT4o為代表的多模態(tài)模型、以GPT-o1為代表的從預(yù)訓(xùn)練到后訓(xùn)練推理優(yōu)化、多模態(tài)大模型賦能具身智能實(shí)現(xiàn)軟硬件結(jié)合,以及人工智能學(xué)者榮獲諾貝爾化學(xué)獎(jiǎng)表明AI賦能科研范式變革。本次活動(dòng)現(xiàn)場(chǎng),智象未來(lái)與人民網(wǎng)、上海電影集團(tuán)、彩訊科技、捷成華視網(wǎng)聚、安徽聯(lián)通、中國(guó)移動(dòng)咪咕音樂(lè)等12家生態(tài)伙伴企業(yè)代表簽約,共同打造集技術(shù)研發(fā)、產(chǎn)業(yè)化應(yīng)用、市場(chǎng)推廣于一體的生態(tài)體系。

  • 理想同學(xué)AI大模型APP搶鮮體驗(yàn):識(shí)物精準(zhǔn)、語(yǔ)音交互流暢

    在2024理想AITalk上,李想宣布,理想同學(xué)進(jìn)入手機(jī),APP將于12月27日上線。博主旌旗超智能搶先體驗(yàn)了理想同學(xué)APP的內(nèi)測(cè)版本,這款A(yù)pp可以實(shí)時(shí)解答用戶提出的問(wèn)題能識(shí)別物體,遇到不認(rèn)識(shí)的汽車(chē)、動(dòng)物、植物都可以在理想同學(xué)App中識(shí)別。二是我們希望可以讓理想汽車(chē)的100多萬(wàn)用戶再加上這些用戶的家庭,大概300-500萬(wàn)的人,不僅可以在車(chē)上可以在手機(jī)、電腦,甚至后邊還可以在眼鏡上,都體驗(yàn)到一致的人工智能產(chǎn)品,我覺(jué)得這是我們必須要做的。

  • 豆包說(shuō)要「普惠」,于是大模型處理片按「厘」計(jì)價(jià)了

    OpenAI宣告連續(xù)12輪轟炸,讓2024年底的大模型領(lǐng)域熱鬧起來(lái)了。但堅(jiān)持每個(gè)凌晨看直播的話會(huì)發(fā)現(xiàn),越到后面的發(fā)布越平淡,內(nèi)心的波動(dòng)也越少了。豆包大模型還有哪些驚喜?值得每一個(gè)人期待。

  • 灰豚AI數(shù)字人重磅突破,國(guó)內(nèi)最強(qiáng)數(shù)字人AI口播軟件大模型來(lái)襲

    只要對(duì)著鏡頭說(shuō)123,321,1234567,AI就能生成高質(zhì)量口播短視頻軟件。一度成為短視頻主播們的香悖悖軟件,畢竟以后不用自己出鏡了,然而不到幾個(gè)月, 123 口播數(shù)字人分身又被迭代了。AI的技術(shù)發(fā)展真是超乎人們的想象。近期溫州專(zhuān)幫科技信息有限公司旗下灰豚AI數(shù)字人發(fā)布了最新的AI口播大模型,直接淘汰了123AI口播軟件,效果令人驚嘆。被稱(chēng)之為國(guó)內(nèi)最強(qiáng)數(shù)字人AI口播大模?

  • 大模型拿單江湖

    11月29日,智譜AgentOpenDay會(huì)后,現(xiàn)場(chǎng)有記者問(wèn)了CEO張鵬一個(gè)問(wèn)題:“ToB進(jìn)展如何?”“還行吧”,至此張鵬沒(méi)有再多說(shuō)一句。這家明星AI公司深度參與到大模型的廝殺當(dāng)中,其同臺(tái)競(jìng)爭(zhēng)對(duì)手是百度、阿里、騰訊和字節(jié)。留在AI公司手中的牌就要見(jiàn)底了。

熱文

  • 3 天
  • 7天