放大招！百度復旦視覺生成模型Hallo2或將落地數(shù)字人等場景

2024-10-25 13:39 · 稿源：站長之家用戶

近日，百度聯(lián)合復旦大學等發(fā)布 Hallo2，一個可以生成長達數(shù)小時且分辨率為4K的人物動畫的視覺模型。Hallo2 目前已經在GitHub平臺開源，供全球開發(fā)者免費使用和研究，預計將促進視頻生成技術的廣泛應用和發(fā)展。

Hallo2 發(fā)布后在海外引發(fā)了不小的震動。有人驚嘆視頻生成的長度和分辨率，也有老用戶從Hallo首先代模型就被圈粉。

還有對Hallo2 開源模型和代碼的認可。

Hallo2 備受關注，很重要一個原因是百度和復旦的研究團隊解決了人像視頻生成一個很大的痛點：如何提升視頻生成的時長和質量。

一直以來，生成高質量的人物動畫需要耗費大量的時間和人力成本。而百度與復旦聯(lián)合發(fā)布的Hallo2 的出現(xiàn)，有望徹底改變這一現(xiàn)狀，為數(shù)字人、電影制作、虛擬助手、游戲開發(fā)等領域帶來革命性的變化。這不同于Sora等AI視頻生成模型遭遇到的發(fā)展瓶頸，Hallo2 模型解決的問題更垂直，可落地空間更大。

Hallo2 是目前頭個實現(xiàn)長達一小時、4K分辨率的音頻驅動人像動畫生成模型。通過創(chuàng)新的圖像塊丟棄、噪聲增強和時間對齊等技術，Hallo2 解決了長時視頻生成中的外觀漂移和視覺不一致問題，支持靈活的語音與文本控制，生成質量達到業(yè)內領先水平。

Hallo2 繼承了前代Hallo模型的創(chuàng)新框架，繼續(xù)采用基于擴散的生成模型和分層音頻驅動視覺合成模塊，提高了音頻與視覺輸出之間的同步精度，并經過改進使得各部分的協(xié)同作用更加有效，增強了生成動畫的質量和真實感。此外，Hallo2 不僅在圖像和視頻的質量方面有了顯著提升，而且大幅增加了動作的豐富性和多樣性，可以說為AI驅動的肖像圖像動畫領域樹立了新的標桿。

有行業(yè)專家表示，Hallo2 的出現(xiàn)，標志著音頻驅動的肖像圖像動畫技術邁入了新的發(fā)展階段。百度基于長期的視覺技術積累，正在瞄準行業(yè)痛點進行針對性研究和場景落地，不僅為開發(fā)者提供了強大的工具，也為未來各種應用場景下的動畫形象創(chuàng)作帶來了新的可能性。

目前Hallo2 模型已在GitHub上開源，項目地址：https://fudan-generative-vision.github.io/hallo2/#/。

另據(jù)悉，除視覺模型外，作為中國比較大的AI公司，百度將在 11 月 12 日召開百度世界大會2024，展現(xiàn)更多AI方面的應用和技術進展。大會將圍繞大模型和AI應用帶來五大亮點，除百度創(chuàng)始人李彥宏領銜的主題演講外，還有100+AI原生應用發(fā)布、四場主題分論壇、30+公開課和 5000 平米AI展區(qū)，全方位展示AI應用的落地成果。大會目前已開放免費報名通道，可通過大會官網報名參會。

（推廣）

特別聲明：以上內容(如有圖片或視頻亦包括在內)均為站長傳媒平臺用戶上傳并發(fā)布，本平臺僅提供信息存儲服務，對本頁面內容所引致的錯誤、不確或遺漏，概不負任何法律責任，相關信息僅供參考。站長之家將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。任何單位或個人認為本頁面內容可能涉嫌侵犯其知識產權或存在不實內容時，可及時向站長之家提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明（點擊查看反饋聯(lián)系地址）。本網站在收到上述法律文件后，將會依法依規(guī)核實信息，溝通刪除相關內容或斷開相關鏈接。

相關推薦

關鍵詞：

薦孫正義放大招！又給OpenAI投資15億美元，非常看好AI發(fā)展

軟銀集團創(chuàng)始人兼CEO孫正義又給OpenAI投資了15億美元。軟銀曾參與了OpenAI在今年10月獲得66億美元的融資，當時投資了5億美元。愿景基金專注于AI、機器人、物聯(lián)網等前沿科技領域的投資，進一步鞏固了孫正義在科技行業(yè)的地位。

?OpenAI
字節(jié)視頻生成模型PixelDance上線即夢AI：用戶可免費體驗

字節(jié)跳動視頻生成模型PixelDance和Seaweed在即夢AI正式上線，面向公眾免費開放使用。用戶進入即夢AI的視頻生成”界面，在視頻模型里選擇視頻P2.0Pro”或視頻S2.0Pro”，即可分別體驗這兩款模型，目前網頁版和手機端APP均已支持。平臺提供智能畫布、故事創(chuàng)作模式，以及首尾幀、對口型、運鏡控制、速度控制等AI編輯能力，并有海量影像靈感及興趣社區(qū)，一站式提供用戶創(chuàng)意靈感?

?字節(jié)跳動 ?視頻生成 ?即夢AI
薦微軟開源多功能視覺模型Florence-2，分割、識別一切圖片！

微軟AzureAI團隊宣布開源視覺模型——Florence-2。Florence-2是一個多功能視覺模型，可提供圖像描述、目標檢測、視覺定位、圖像分割等。尤其是在微調后，F(xiàn)lorence-2在公共基準測試中的性能與更大參數(shù)的專業(yè)模型相媲美。

?Florence-2 ?微軟開源 ?視覺模型
百度大模型又拿了個冠軍！全部8個維度均第一、7項滿分

時隔1個月，百度大模型又拿了個IDC報告的第一。IDC發(fā)布了《中國生成式AI應用開發(fā)平臺市場：企業(yè)統(tǒng)一AI開發(fā)平臺的雛形》。IDC發(fā)布的《中國人工智能公有云服務市場份額，2023》報告中，百度智能云市場份額排名第一，占比26.4%，連續(xù)5年蟬聯(lián)中國市場第一。

?百度大模型 ?生成式AI ?AI應用開發(fā)
薦對話李彥宏：大模型進化變慢是好事，百度從來沒對標過OpenAI

2024年11月12日，在“百度世界大會”期間，百度創(chuàng)始人、CEO李彥宏與硅星人創(chuàng)始人駱軼航、甲子光年創(chuàng)始人張一甲進行了一場對談。以下是對話實錄:1為什么“應用來了”?張一甲:過去一兩年，人工智能是全行業(yè)很火的賽道和技術方向，每天我們都看到非常多的產品和技術進展，今年世界大會為什么主題定為“應用來了”?李彥宏:因為我從去年開始不斷講，模型本身不產生直接價

?百度世界大會 ?李彥宏 ?人工智能
薦AI日報：字節(jié)推圖像編輯模型SeedEdit；Suno發(fā)布V4音樂生成模型；谷歌最新AI視頻制作神器Vids

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內容，聚焦開發(fā)者，助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。新鮮AI產品點擊了解:https://top.aibase.com/1、豆包大模型團隊正式發(fā)布圖像編輯模型SeedEdit用嘴P圖成真!SeedEdit是豆包大模型團隊推出的圖像編輯工具，通過一句話命令AI實現(xiàn)精準修改圖片元素，比MJ更簡單快捷。格萊美提名使樂隊再次成為關注焦點。

?SeedEdit ?Vids
薦AI日報：InstantX推FLUX圖像生成黑科技；面部遷移模型HelloMeme；游戲實時生成算法GameGen-X

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內容，聚焦開發(fā)者，助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。新鮮AI產品點擊了解：https://top.aibase.com/1、InstantX圖像生成黑科技！微軟使用了OpenAI的GPT-4o進行開發(fā)，但系統(tǒng)與大型語言模型無關，推薦使用強大的推理模型作為指揮者智能體。

?FLUX
百度網盤推出“超能畫布”：一鍵生成創(chuàng)意大片身臨其境

快科技11月20日消息，百度網盤推出全新攝影行業(yè)解決方案，其中超能畫布”功能可解決人像攝影中的創(chuàng)意問題。百度網盤B端業(yè)務負責人楊熙表示，創(chuàng)意研發(fā)是攝影企業(yè)影樓每年都需要支出的成本，而降低成本才能在激烈的行業(yè)競爭中存活。對此，百度網盤打造了超能畫布”，這是一款專注于人像攝影的AI創(chuàng)意生成工具。在影樓攝影師完成照片拍攝后，超能畫布能一鍵生成創(chuàng)意?
薦AI日報：驚艷！Sora遭惡意泄露；昆侖萬維Skywork o1啟動邀測；阿里開源圖像生成模型Qwen2vl-Flux

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內容，聚焦開發(fā)者，助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。新鮮AI產品點擊了解:https://top.aibase.com/1、來自藝術家的復仇!OpenAI視頻模型Sora慘遭短暫泄露OpenAI的文本轉視頻模型Sora在測試階段遭到藝術家的抗議和泄露，這些藝術家對公司利用他們的創(chuàng)造力表示不滿。這位專員可能與“加密貨幣專員”職位合并，形成新的監(jiān)管框架，特斯拉CEO馬斯克等人將對人選產生重要影響。

?AI日報 ?OpenAI ?視頻模型
百度Apollo開放平臺10.0發(fā)布：框架、算法全面升級單Orin芯片撐起L4自動駕駛

百度于今日上午，正式發(fā)布了Apollo開放平臺10.0，其基于自動駕駛大模型ADFM重構算法，框架、模塊、系統(tǒng)全面升級，技術應用更高性能、更低成本、更安全。該平臺還通過自動駕駛大模型ADFM重構算法，提升了核心算法模塊效果。對于車企言，Apollo開放平臺10.0性能大幅提升同時，軟硬件成本大幅下探，也為L4級自動駕駛的推廣提供了更堅實的基礎。

?自動駕駛 ?Apollo開放平臺 ?ADFM重構算法

熱文

3 天
7天

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

放大招！百度復旦視覺生成模型Hallo2或將落地數(shù)字人等場景

薦孫正義放大招！又給OpenAI投資15億美元，非常看好AI發(fā)展

字節(jié)視頻生成模型PixelDance上線即夢AI：用戶可免費體驗

薦微軟開源多功能視覺模型Florence-2，分割、識別一切圖片！

百度大模型又拿了個冠軍！全部8個維度均第一、7項滿分

薦對話李彥宏：大模型進化變慢是好事，百度從來沒對標過OpenAI

薦AI日報：字節(jié)推圖像編輯模型SeedEdit；Suno發(fā)布V4音樂生成模型；谷歌最新AI視頻制作神器Vids

薦AI日報：InstantX推FLUX圖像生成黑科技；面部遷移模型HelloMeme；游戲實時生成算法GameGen-X

百度網盤推出“超能畫布”：一鍵生成創(chuàng)意大片身臨其境

薦AI日報：驚艷！Sora遭惡意泄露；昆侖萬維Skywork o1啟動邀測；阿里開源圖像生成模型Qwen2vl-Flux

百度Apollo開放平臺10.0發(fā)布：框架、算法全面升級單Orin芯片撐起L4自動駕駛

熱文

抖音宣布大力扶持精品短?。簡尾孔罡咄顿Y金額可到500萬元保底

瓊瑤走了一個時代宣告結束了：小米王化發(fā)文悼念

馬斯克加碼起訴OpenAI：要求禁止其轉變?yōu)闋I利性公司

抖音副總裁否認回應鐘睒睒：沒有回應任何人不要以訛傳訛

騰訊回應微信提現(xiàn)可免手續(xù)費：只有銀行卡轉入零錢通可以

盧偉冰：小米15、K80系列市場反饋非常好 Turbo4將本月發(fā)布

腦腐brain rot被評為2024牛津年度詞匯：過度瀏覽網絡低質量內容

官方通報27款APP侵害用戶權益涉及亂跳轉、違規(guī)收集信息等問題

人人網回應停止服務：正在“換車”升級嚴格保護用戶數(shù)據(jù)

王化回應小米相機部大佬離職傳聞：大概率沒正經上過班

周鴻祎公司突然賣房：360全資子公司1.33億元出售房屋車位

抖音宣布大力扶持精品短?。簡尾孔罡咄顿Y金額可到500萬元保底

瓊瑤走了一個時代宣告結束了：小米王化發(fā)文悼念

超過2200萬用戶、年收入30億歐元:全球最大盜版流媒體網絡被摧毀

馬斯克加碼起訴OpenAI：要求禁止其轉變?yōu)闋I利性公司

抖音副總裁否認回應鐘睒睒：沒有回應任何人不要以訛傳訛

騰訊回應微信提現(xiàn)可免手續(xù)費：只有銀行卡轉入零錢通可以

盧偉冰：小米15、K80系列市場反饋非常好 Turbo4將本月發(fā)布

腦腐brain rot被評為2024牛津年度詞匯：過度瀏覽網絡低質量內容

明年3月上市！小米SUV起售價曝光：可能23.59萬元起

站長商機

放大招！百度復旦視覺生成模型Hallo2或將落地數(shù)字人等場景

熱文

站長商機

放大招！百度復旦視覺生成模型Hallo2或將落地數(shù)字人等場景