在AI技術(shù)的浪潮中,快手公司推出的文生圖大模型——Kolors,以其卓越的性能和開源精神,成為國產(chǎn)AI技術(shù)的一顆璀璨新星。Kolors不僅在圖像生成效果上超越了現(xiàn)有的開源模型,更達(dá)到了與商業(yè)閉源模型相媲美的水平,迅速在社交媒體上引發(fā)熱議。
Kolors的開源之路
Kolors的開源不僅僅是一個(gè)技術(shù)里程碑,更是快手對(duì)AI技術(shù)開放態(tài)度的體現(xiàn)。在世界人工智能大會(huì)上,快手宣布Kolors正式開源,提供了包括模型權(quán)重、完整代碼和技術(shù)報(bào)告在內(nèi)的全面資源,目前已在Huggingface平臺(tái)和GitHub上線,供全球開發(fā)者免費(fèi)使用。
并且在github主頁上表示了開源計(jì)劃,模具已經(jīng)開源了接口和大模型,后續(xù)會(huì)開源出kolors的Lora,controlnet等等,著實(shí)讓人期待。
Kolors的卓越性能
Kolors以其強(qiáng)大的復(fù)雜語義理解能力和攝影級(jí)的畫質(zhì)質(zhì)感,贏得了開發(fā)者和用戶的高度評(píng)價(jià)。在智源FlagEval文生圖模型評(píng)測(cè)中,Kolors以75.23分的主觀綜合評(píng)分排名全球第二,尤其在圖像質(zhì)量方面表現(xiàn)突出,評(píng)分排名第一。
Kolors的技術(shù)創(chuàng)新
Kolors采用了隱空間擴(kuò)散模型,并結(jié)合大語言模型進(jìn)行文本表征,使其具備了復(fù)雜長(zhǎng)文本理解能力。通過兩階段漸進(jìn)訓(xùn)練策略,Kolors在圖像美感和質(zhì)量上達(dá)到了國際領(lǐng)先水平。此外,Kolors還是首個(gè)原生支持中文文字生成的文生圖模型,展現(xiàn)了其在理解和呈現(xiàn)中國特色元素方面的優(yōu)勢(shì)。
Kolors的ComfyUI部署
以上介紹這么多,大家肯定已經(jīng)躍躍欲試了?,F(xiàn)在教大家如何在本地部署Kolors。
在github上已經(jīng)有了Kolors的一鍵部署
github首頁:https://github.com/kijai/ComfyUI-KwaiKolorsWrapper
huggingface首頁:https://huggingface.co/Kwai-Kolors/Kolors
首先我們復(fù)制項(xiàng)目的url
復(fù)制后我們到comfyui管理器安裝,安裝完成后重啟
然后我們搭建出一個(gè)最簡(jiǎn)單的Kolors文生圖工作流
搭建完成后我們點(diǎn)擊添加提示詞隊(duì)列就會(huì)幫我們自動(dòng)下載所需的大模型和文本編碼
??注意:由于模型都是從huggingface上下載,大模型大概5G,文本編碼器大約11G,所以請(qǐng)使用科學(xué)上網(wǎng)保持網(wǎng)絡(luò)暢通。
最后模型會(huì)下載到該文件路徑下:
安裝報(bào)錯(cuò)解決
我們第一次下載使用是可能會(huì)遇到 文本編碼器找不到文件報(bào)錯(cuò)
解決的辦法也很簡(jiǎn)單,我們到huggingface的項(xiàng)目地址,在text_encoder文件中下載所有的json和python文件,
并放入我們本地的text_encoder文件夾中,由于下載下來的文件命名不對(duì),所以我們還要重命名,對(duì)應(yīng)下圖命名即可
最后我們還要下載Vae模型,并放入下圖的文件路徑內(nèi)
本地vae文件路徑
以上問題解決后我們就可以使用Korols生圖了,在我們剛剛的工作流中使用中午提示詞生圖真的很舒服,而且畫面質(zhì)量也很精美,手部也沒有出現(xiàn)太大問題。在抽象圖片上也有很好的效果不輸Midjouney。
Kolors與開源社區(qū)的未來
在Stability AI經(jīng)歷動(dòng)蕩之際,快手的Kolors開源成為了開源社區(qū)的新焦點(diǎn)??焓钟?jì)劃陸續(xù)開源Kolors的相關(guān)應(yīng)用組件,豐富其開源生態(tài),并期待與全球開發(fā)者共同推動(dòng)文生圖大模型社區(qū)的發(fā)展。
總結(jié)
快手的Kolors大模型以其開放的態(tài)度、高標(biāo)準(zhǔn)的技術(shù)和實(shí)際的商業(yè)應(yīng)用,展現(xiàn)了國產(chǎn)AI技術(shù)的真正實(shí)力。在AI技術(shù)不斷演進(jìn)的今天,Kolors的開源和落地讓我們看到了技術(shù)與內(nèi)容形態(tài)結(jié)合的無限可能。隨著越來越多的企業(yè)和開發(fā)者加入Kolors的開源生態(tài),我們有理由相信,這將為整個(gè)行業(yè)帶來新的發(fā)展機(jī)遇。
------------------------------------------------------------------------------------------
站長(zhǎng)素材AI教程是站長(zhǎng)之家旗下AI繪圖教程平臺(tái)
海量AI免費(fèi)教程,持續(xù)更新干貨內(nèi)容
想要深入學(xué)習(xí)更多AI繪圖教程,請(qǐng)?jiān)L問站長(zhǎng)素材AI教程網(wǎng):
https://aisc.chinaz.com/jiaocheng/
(舉報(bào))