11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
國產(chǎn)短劇正“瘋魔”,長視頻又來添了把火。中老年短劇的熱潮將瑪麗蘇的風(fēng)吹向了銀發(fā)市場,不斷“上分”的中老年強勁用戶,也助推多款相關(guān)作品接連上榜,帶給短劇市場極大信心。在長視頻一番排兵布陣后,接下來短劇的風(fēng)將吹向哪里,需要時間檢驗。
【新智元導(dǎo)讀】長視頻理解迎來新紀(jì)元!智源聯(lián)手國內(nèi)多所頂尖高校,推出了超長視頻理解大模型Video-XL。僅用一張80G顯卡處理小時級視頻,未來AI看懂電影再也不是難事。Video-XL的模型代碼均已開源,以促進(jìn)全球多模態(tài)視頻理解研究社區(qū)的合作和技術(shù)共享。
僅需1塊80G顯卡,大模型理解小時級超長視頻。智源研究院聯(lián)合上海交通大學(xué)、中國人民大學(xué)、北京大學(xué)和北京郵電大學(xué)等多所高校帶來最新成果超長視頻理解大模型Video-XL。Video-XL的模型代碼均已開源,以促進(jìn)全球多模態(tài)視頻理解研究社區(qū)的合作和技術(shù)共享。
歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、面向付費用戶!全新ChatGPTWindows版本上線:快捷鍵即可召喚AI助手OpenAI推出了全新的ChatGPTWindows應(yīng)用早期版,為付費用戶提供便捷的AI助手體驗。營收主要來自Robotaxi業(yè)務(wù),2024年上半年同比增長86%。
長視頻行業(yè)正站在一個十字路口。隨著市場的飽和和用戶需求的多樣化,傳統(tǒng)的內(nèi)容生產(chǎn)和分發(fā)模式已經(jīng)難以滿足當(dāng)前的市場需求。通過合理規(guī)劃和精心運營,長視頻平臺有望在電商領(lǐng)域開辟出一片新的天地,實現(xiàn)內(nèi)容與電商的有機融合,為用戶提供更加豐富、便捷的娛樂和購物體驗。
2024年步入最后一個季度。相比上半年,在頭部劇集戰(zhàn)績斐然的帶領(lǐng)之下,長視頻實現(xiàn)一片喧囂從暑期檔開始的下半年就明顯能感覺到長視頻的疲軟,即便是吸引了大部分注意力的奧運會已經(jīng)過去兩個多月時間,依然沒有太多能夠引發(fā)話題的長視頻內(nèi)容出現(xiàn)。畢竟這個時代最不缺的便是內(nèi)容如何更多維度的聚焦內(nèi)容不同面向才是唯一能讓長視頻做到區(qū)別于其他渠道的生存之道。
一條長達(dá)900分鐘的數(shù)學(xué)解說視頻,在抖音火了。900分鐘,足足15個小時。既然遠(yuǎn)遠(yuǎn)定了一個靶子立在那兒,也就不看眼前這兩下子,看后期有沒有值得沉淀的東西”。
NVIDIA正在訓(xùn)練尚未向公眾發(fā)布,內(nèi)部命名為Cosmos的AI項目。該項目旨在構(gòu)建一個集合光傳輸、物理和智能模擬的先進(jìn)視頻模型,以支持Omniverse3D世界生成器、自動駕駛汽車系統(tǒng)和數(shù)字人產(chǎn)品等下游應(yīng)用。這一行為被指可能違反了版權(quán)法和平臺的使用條款,盡管NVIDIA方面回應(yīng)稱其做法完全合法,但谷歌和奈飛均表示,未與NVIDIA達(dá)成內(nèi)容提取協(xié)議,且平臺服務(wù)條款禁止內(nèi)容抓取。
抖音6月漲粉榜已出,我們一起來看榜:繼5月漲粉走勢相比前幾個月開始出現(xiàn)明顯下滑后,6月的整體漲粉走勢又呈現(xiàn)了更為明顯的頹勢:位列TOP1的@廣東夫婦 增粉量只有315.6W,對比5月@郭有才(菏澤樹哥)1227.9W 的增粉量,差距異常明顯。作為一個成功轉(zhuǎn)型直播帶貨的老牌劇情賬號,@廣東夫婦 在抖音618期間直播間銷售額位列第一。在6月30日的收官之戰(zhàn)中,他們在藍(lán)月亮廣州總部舉
FIFO-Diffusion項目最近引發(fā)了廣泛關(guān)注,這個項目展示了在無需額外訓(xùn)練的情況下生成無限長視頻的強大能力。通過對角去噪技術(shù),F(xiàn)IFO-Diffusion實現(xiàn)了高質(zhì)量且具有一致性的長視頻生成。隨著技術(shù)的進(jìn)一步優(yōu)化和完善,F(xiàn)IFO-Diffusion有望解決復(fù)雜場景下的閃爍問題,提升視頻生成的整體質(zhì)量和穩(wěn)定性。
騰訊控股今天正式發(fā)布了2024年第一季度財報。騰訊第一季度營收1595億元,預(yù)估1588.1億元,同比增長6%;調(diào)整后凈利潤502.7億元,預(yù)估430億元,同比增長54%。劇中的人物形象鮮明,情節(jié)跌宕起伏,讓觀眾看得十分過癮,同時還融入了上海獨特的文化,讓觀眾在欣賞劇情的同時也能感受到上海的魅力。
南開大學(xué)HVision團(tuán)隊開發(fā)了StoryDiffusion,一款能夠創(chuàng)造神奇故事的工具。StoryDiffusion可以保持角色一致,生成多圖漫畫和長視頻。該項目發(fā)布了生成漫畫部分的源碼。
“觀眾去哪里了?觀眾都在看什么?”制片人七七發(fā)現(xiàn),2024年長視頻行業(yè)開局表現(xiàn)一般,沒有大爆劇綜,“幾部平臺的頭部劇播得都不太理想”。數(shù)據(jù)層面也能看出變化。*應(yīng)受訪者要求,文中七七、龍卷風(fēng)為化名。
“一個國家或地區(qū)人均GDP每年大于1萬美金,這個國家的文化娛樂消費相比GDP有更快的增長速度。2019年中國人均GDP超過了1萬美金,我們相信歷史規(guī)律可以在娛樂行業(yè)再現(xiàn),消費拐點給了我們更多的空間?!边@是愛奇藝創(chuàng)始人、首席執(zhí)行官龔宇在2024愛奇藝世界·大會的一段發(fā)言。拋開成績和爆款來談這個世界的變化,愛奇藝在大家都在低頭趕路的時候,扮演了一個抬頭看路的角?
你說箱子里要裝滿鉆石,于是箱子被鉆石填滿,比實拍還要耀眼。這樣的技能,哪個劇組不喜歡?這是前段時間Adobe旗下的視頻剪輯軟件PremierePro所呈現(xiàn)的「魔法」。此次「Vidu」的推出,是生數(shù)科技在多模態(tài)原生大模型領(lǐng)域的再一次創(chuàng)新和領(lǐng)先。
MetaAI近日推出了一種名為MA-LMM的新型模型,旨在解決長期視頻理解中的挑戰(zhàn)。LLMs在處理文本數(shù)據(jù)時表現(xiàn)出了令人印象深刻的能力,但在處理視頻輸入方面存在一些限制,例如上下文長度限制和GPU內(nèi)存限制。其創(chuàng)新性的設(shè)計以及利用長期記憶庫和順序處理的方法使得該模型能夠在各種復(fù)雜場景下取得顯著成果,證明了其在多模態(tài)視頻理解應(yīng)用中的有效性和多功能性。
一個名為MagicTime的新模型引起了業(yè)界的廣泛關(guān)注。這個模型專注于生成變形時間延遲視頻,基于DiT的架構(gòu),解決了現(xiàn)有文本到視頻生成模型未能充分編碼現(xiàn)實世界物理知識的問題。MagicTime還計劃將額外的變形景觀時間延遲視頻集成到相同的注釋框架中,查找ChronoMagic-Landscape數(shù)據(jù)集,然后使用該數(shù)據(jù)集Open-Sora-Planv1.0.0,獲得MagicTime-DiT模型。
來自加州大學(xué)伯克利分校的研究人員最近發(fā)布并開源了首個世界模型,被稱為LWM系列模型。這一模型采用了大量視頻和書籍?dāng)?shù)據(jù)集,通過RingAttention技術(shù)實現(xiàn)了長序列的可擴展訓(xùn)練,使得模型的上下文長度達(dá)到了1Mtoken。其優(yōu)秀的性能表現(xiàn)和開源特性吸引了眾多開發(fā)者的關(guān)注和參與,為人工智能領(lǐng)域的進(jìn)步和創(chuàng)新帶來了新的契機。
UT奧斯丁等機構(gòu)提出的StreamingT2V技術(shù)引發(fā)了廣泛關(guān)注,將AI視頻生成推向了新的高度。這項技術(shù)突破了以往視頻長度的限制,實現(xiàn)了生成高度一致且長度可擴展的視頻。StreamingT2V技術(shù)的不斷完善和提升也將進(jìn)一步推動AI視頻生成領(lǐng)域的發(fā)展,為視頻內(nèi)容創(chuàng)作提供更多可能性。
圖像編輯平臺Fotor正式拓展視頻領(lǐng)域,推出名為Clipfly的全新一站式AI長視頻平臺。Clipfly集成了AI視頻生成、增強和編輯等多種功能,用戶可在該平臺完成從構(gòu)思到最終視頻輸出的整個流程。該平臺將為視頻創(chuàng)作者提供高效的AI制作工具。
在2024世界經(jīng)濟論壇的一次會談中,圖靈獎得主YannLeCun提出用來處理視頻的模型應(yīng)該學(xué)會在抽象的表征空間中進(jìn)行預(yù)測不是具體的像素空間[1]。借助文本信息的多模態(tài)視頻表征學(xué)習(xí)可抽取利于視頻理解或內(nèi)容生成的特征,正是促進(jìn)該過程的關(guān)鍵技術(shù)。研究者可進(jìn)一步探討多種模態(tài)間的關(guān)聯(lián)問題,例如視頻往往包含視覺、文本及音頻信號;可嘗試結(jié)合外部大語言模型或多模態(tài)模型來
“扔進(jìn)一部小說、出來一部大片”。這并不是科幻是AI即將帶給整個內(nèi)容行業(yè)的一點點震撼。文章不構(gòu)成投資建議,投資與否須自行甄別。
想要AI生成更長的視頻?現(xiàn)在,有人提出了一個效果很不錯的免調(diào)優(yōu)方法,直接就能作用于預(yù)訓(xùn)練好的視頻擴散模型。它最長可支持512幀。畢業(yè)后曾在UC伯克利做博士后、港中文擔(dān)任四年研究員。
微軟AzureAI發(fā)布了MM-Vid,這是一項結(jié)合GPT-4V與專用工具的創(chuàng)新,致力于解讀長視頻并為視障人士提供更好的體驗。人工智能在長視頻理解領(lǐng)域所面臨的復(fù)雜挑戰(zhàn),包括分析多個片段、提取不同信息源、實時處理動態(tài)環(huán)境等。這一創(chuàng)新有望推動視覺領(lǐng)域的發(fā)展,使得語言模型在多模態(tài)環(huán)境下的應(yīng)用更加廣泛。
TESTA是一種旨在通過組合相似幀和補丁來加速理解長視頻的方法。這種方法的引入成功地降低了計算負(fù)荷,并提高了匹配段落到視頻以及回答關(guān)于長視頻的問題的性能。憑借其高效的令牌聚合、預(yù)訓(xùn)練模型、提高的計算效率、可擴展性和全面的代碼庫,TESTA對于致力于在視頻分析和理解領(lǐng)域取得卓越成就的研究人員、開發(fā)人員和組織來說都是寶貴的資源。
視頻生成工具越來越受歡迎,特別是用來創(chuàng)建短視頻的工具。這些工具在處理長視頻時往往表現(xiàn)出一些限制。評估準(zhǔn)則保證質(zhì)量:SEINE通過三個評估準(zhǔn)則:時間一致性、語義相似性和視頻-文本語義對齊,保證生成的視頻內(nèi)容具有流暢的過渡和高質(zhì)量。
近日,快手推出了一款名為“噗嘰”的APP,產(chǎn)品定位是潮流視頻社區(qū),包含時尚、音樂、藝術(shù)、二次元等興趣知識視頻、圖文內(nèi)容。抖音旗下的B站版APP“青桃”,于近期更名為“抖音精選”,定位年輕人的興趣知識視頻平臺??梢灶A(yù)見的是,各方的競爭不會止步于平臺側(cè)的創(chuàng)作者計劃,以及功能的構(gòu)建,圍繞版權(quán)、內(nèi)容種類等各方面的競爭也將更全面化,這會是一場需要耐力?
在2023年的愛奇藝悅享會上,愛奇藝的創(chuàng)始人和CEO龔宇強調(diào),愛奇藝未來的發(fā)展主要依賴于兩個關(guān)鍵因素:內(nèi)容和科技創(chuàng)新。這兩個方面不僅決定了愛奇藝的未來,也決定了整個行業(yè)的未來?!饼徲钫J(rèn)為,未來的影視制作將廣泛使用AIGC技術(shù),這不僅可以提高制作效率和降低成本可以提升觀眾的視聽體驗。
抖音旗下中長視頻APP“青桃”在最新的2.0.0版本更新中,更名為“抖音精選”,圖標(biāo)也相應(yīng)更改。青桃視頻于今年3月推出,定位年輕人興趣知識視頻平臺,是抖音官方出品的中長視頻APP。青桃視頻App里的頻道,包含互聯(lián)網(wǎng)前沿、科學(xué)探索、財經(jīng)、職場、環(huán)游、汽車、運動、文化藝術(shù)、萌寵、時尚美妝、美食、歌舞、游戲和情感等。
OpusClip是一款生成式人工智能視頻工具,可以將長視頻一鍵轉(zhuǎn)換成高質(zhì)量短視頻,讓您可以在TikTok、YouTubeShorts和Reels等平臺上分享,以增加社交媒體的影響力。體驗地址:https://www.opus.pro/not-available核心功能:高質(zhì)量短視頻生成:OpusClip利用先進(jìn)的生成式人工智能技術(shù),將長視頻快速轉(zhuǎn)換成高質(zhì)量短視頻,讓您能夠快速制作出引人注目的短視頻內(nèi)容。高度定制化:OpusClip還提供多種定制化選項,讓您根據(jù)自己的需求調(diào)整短視頻的長度、音頻、濾鏡和字幕等,以滿足您的個性化要求。