AI視野：Midjourney正式上線Alpha網(wǎng)頁版；OpenAI恢復(fù)會(huì)員注冊(cè)；騰訊發(fā)布視頻生成模型AnimateZero；微軟發(fā)布小語言模型AI Phi-2

2023-12-13 15:19 · 稿源：站長(zhǎng)之家

??????AI應(yīng)用

Midjourney正式上線Alpha網(wǎng)頁版!支持已生成圖片設(shè)置參數(shù)回填

Midjourney Alpha全新升級(jí)，生成用戶界面更便捷，成功生成1萬張圖片即可獲得權(quán)限，可視化圖像參數(shù)支持點(diǎn)擊回填到提示詞輸入框，提升生成體驗(yàn)。

QQ圖片20231213145423.png

截圖自歸藏

【AiBase提要:】
?? 生成體驗(yàn)提升: Midjourney Alpha升級(jí)界面更便捷，所有參數(shù)以可視化圖像形式展示，成功生成1萬張圖片即可獲得權(quán)限。
??? 可視化回填功能: 已生成的圖片參數(shù)支持點(diǎn)擊回填到提示詞輸入框，簡(jiǎn)化分割提示詞的操作，提升用戶體驗(yàn)。
?? 圖像識(shí)別升級(jí): 圖像生成功能升級(jí)，選擇已生成圖片時(shí)系統(tǒng)顯示藝術(shù)家和風(fēng)格的提示詞，方便點(diǎn)擊選擇進(jìn)行回填，使操作更加簡(jiǎn)便。

runway支持人物面部生成指定表情

Runway宣布運(yùn)動(dòng)筆刷功能升級(jí)，結(jié)合提示詞實(shí)現(xiàn)對(duì)人物面部表情的精準(zhǔn)控制，讓制作人員更方便地在創(chuàng)作過程中控制人物的表情。

【AiBase提要:】
?? 運(yùn)動(dòng)筆刷升級(jí): Runway運(yùn)動(dòng)筆刷功能升級(jí)，通過結(jié)合提示詞，能夠在人物面部快速準(zhǔn)確地產(chǎn)生指定表情，提高創(chuàng)作效率。
?? 創(chuàng)新技術(shù)應(yīng)用: 運(yùn)動(dòng)筆刷是Runway推出的一項(xiàng)創(chuàng)新技術(shù)，用戶無需輸入文字，通過手勢(shì)操作即可使圖片動(dòng)起來，簡(jiǎn)化視頻制作流程。
?? 生動(dòng)人物形象: 制作人員可以更方便地控制人物表情，使人物形象更加生動(dòng)，為內(nèi)容創(chuàng)作提供了更靈活的可能性。

Snapchat推出AI生成照片功能

Snapchat Plus會(huì)員現(xiàn)在可通過AI生成圖像，選擇文本提示或預(yù)制選項(xiàng)，豐富定制照片，包括背景填充和主題變換。

【AiBase提要:】
?? Snapchat Plus會(huì)員通過點(diǎn)擊“AI”按鈕，利用AI生成圖像功能，根據(jù)文本提示創(chuàng)建并發(fā)送圖像。
?? 新功能包括AI填充背景，使主體看起來離相機(jī)更遠(yuǎn)，以及通過“Dreams”功能為照片添加主題變換。
?? Snapchat Plus會(huì)員每月可免費(fèi)獲得一個(gè)包含八個(gè)“Dreams”的禮包，豐富用戶定制和分享體驗(yàn)。

????????大模型動(dòng)態(tài)

騰訊發(fā)布視頻生成模型AnimateZero 效果秒殺Animatediff

騰訊最新發(fā)布的AnimateZero視頻生成模型效果優(yōu)于Animatediff，具備更好的SD生態(tài)兼容性，并采用社區(qū)SD模型進(jìn)行演示。

項(xiàng)目地址:https://vvictoryuki.github.io/animatezero.github.io/

【AiBase提要:】
?? AnimateZero效果超群，優(yōu)于Animatediff，更兼容SD生態(tài)。
?? 采用視頻擴(kuò)散模型，解決傳統(tǒng)模型不透明、難以控制等問題。
?? 在應(yīng)用方面展示多種場(chǎng)景，提供高質(zhì)量視頻編輯輔助工具。

微軟發(fā)布小語言模型AI Phi-2

微軟研究院推出Phi-2小語言模型，參數(shù)達(dá)27億，性能媲美Meta的Llama2-7B和Mistral-7B。盡管規(guī)模僅為L(zhǎng)lama2-7B的一半，Phi-2性能更佳，且在回答物理問題和指導(dǎo)學(xué)生方面表現(xiàn)出色。然而，目前僅限用于研究目的，不可用于商業(yè)用途。

【AiBase提要】
?? 微軟發(fā)布27億參數(shù)的小語言模型Phi-2，性能與更大的Llama2-7B和Mistral-7B相當(dāng)。
?? Phi-2在回答物理問題和學(xué)生指導(dǎo)方面展現(xiàn)出更好的性能，毒性和偏差比Llama2更少。
?? Phi-2目前僅限用于研究目的，商業(yè)用途受限。

阿里、港大推動(dòng)態(tài)視頻生成模型LivePhoto

阿里巴巴、香港大學(xué)、螞蟻集團(tuán)聯(lián)合推出LivePhoto，這是一種創(chuàng)新的動(dòng)態(tài)視頻生成模型，通過圖像內(nèi)容控制、運(yùn)動(dòng)建模、額外控制指令等模塊，精準(zhǔn)生成高質(zhì)量動(dòng)態(tài)視頻。

論文地址:https://arxiv.org/abs/2312.02928

【AiBase提要:】
?? 創(chuàng)新模型: 阿里、港大、螞蟻集團(tuán)合作推出LivePhoto，基于Stable Diffusion的動(dòng)態(tài)視頻生成模型，結(jié)合圖像內(nèi)容控制、運(yùn)動(dòng)建模、額外控制指令。
?? 卓越性能: LivePhoto在多輪測(cè)試中展現(xiàn)出卓越性能，與主流模型如Gen-2、Pikalabs相比效果顯著，用戶可通過調(diào)節(jié)運(yùn)動(dòng)強(qiáng)度定制視頻中的運(yùn)動(dòng)方式。
?? 零樣本生成: LivePhoto在零樣本視頻動(dòng)畫生成性能方面表現(xiàn)出色，用戶通過簡(jiǎn)單調(diào)節(jié)運(yùn)動(dòng)強(qiáng)度能自由定制視頻中的運(yùn)動(dòng)方式。

通義千問72B模型榮登大模型評(píng)測(cè)平臺(tái)OpenCompass榜首

通義千問72B模型以67.1的高分在中國權(quán)威模型評(píng)估平臺(tái)OpenCompass上獲得榜首，顯示出其在學(xué)科、語言、知識(shí)、理解和推理等五個(gè)維度的全面能力。

【AiBase提要】
?? 通義千問72B模型以67.1高分登頂OpenCompass模型評(píng)測(cè)平臺(tái)，展現(xiàn)在多維度全面評(píng)估中的卓越表現(xiàn)。
?? 阿里云開源的Qwen-72B模型在十個(gè)權(quán)威基準(zhǔn)測(cè)評(píng)中超越開源和商業(yè)模型，成為業(yè)界最強(qiáng)大的開源大型模型。
?? 通義千問-72B在中文數(shù)據(jù)集評(píng)測(cè)中顯著優(yōu)于其他模型，處理最長(zhǎng)為32k的文本輸入，性能超越ChatGPT-3.5-16k。

??????AI新鮮事

OpenAI恢復(fù)會(huì)員注冊(cè)

OpenAI開始逐步恢復(fù)ChatGPT Plus注冊(cè)，已向部分用戶發(fā)出邀請(qǐng)，并表示感謝用戶注冊(cè)候補(bǔ)名單。

微信截圖_20231213081742.png

【AiBase提要:】
?? 逐步恢復(fù)注冊(cè): OpenAI開始逐漸允許ChatGPT Plus注冊(cè)，已向部分用戶發(fā)出邀請(qǐng)，解決先前因使用量激增而暫停注冊(cè)的問題。
?? 邀請(qǐng)函內(nèi)容: 用戶收到邀請(qǐng)函，感謝注冊(cè)候補(bǔ)名單，有效期10天，可通過電腦登錄ChatGPT升級(jí)到Plus，享受GPT-4和其他工具。
?? 用戶反應(yīng): 先前的“ChatGPT Plus絕版”消息引起一些用戶在eBay上租售賬戶或高價(jià)出售邀請(qǐng)碼，突顯對(duì)ChatGPT Plus的高度關(guān)注。

Meta使用盜版書籍訓(xùn)練AI模型遭指控

Meta公司在夏季提起的版權(quán)侵權(quán)訴訟中，被指控?zé)o視律師的警告，使用數(shù)千本盜版書籍訓(xùn)練其AI模型。最新提交文件揭示了Meta關(guān)聯(lián)研究員在Discord上討論數(shù)據(jù)集采購的聊天記錄，顯示公司或許明知使用這些書籍存在法律風(fēng)險(xiǎn)。

【AiBase提要:】
?? 法律風(fēng)險(xiǎn)忽視: Meta被控?zé)o視律師警告，使用受版權(quán)保護(hù)的書籍進(jìn)行AI模型訓(xùn)練。
?? 聊天記錄揭示: 提交的新文件包括研究員在Discord上的聊天記錄，或許表明Meta知曉其行為可能涉及法律問題。
?? 訴訟背景: 一些著名作者起訴Meta未經(jīng)許可使用其作品訓(xùn)練人工智能語言模型Llama，公司尚未對(duì)指控回應(yīng)。

OpenAI非營(yíng)利部門去年凈收入不足4.5萬美元

OpenAI的非營(yíng)利部門在最新稅務(wù)文件中披露，去年凈收入僅為44，485美元，盡管其盈利業(yè)務(wù)可能為公司創(chuàng)造了數(shù)百萬美元的收入，引起外界關(guān)注。

【AiBase提要:】
?? OpenAI非營(yíng)利部門去年凈收入僅為44，485美元，與其盈利業(yè)務(wù)（如ChatGPT）創(chuàng)造的數(shù)百萬美元收入形成鮮明對(duì)比。
?? OpenAI的盈利部門可能估值高達(dá)900億美元，微軟投資100億美元持有其49%股份，引發(fā)了對(duì)公司結(jié)構(gòu)的關(guān)注。
?? OpenAI的企業(yè)結(jié)構(gòu)受到爭(zhēng)議，接受私人投資數(shù)十億美元，與其他非營(yíng)利組織不同，引發(fā)了透明度和公共信任的討論。

頂尖AI公司薪酬榜曝光:600萬天價(jià)年薪震驚網(wǎng)友

一張最新薪酬表格曝光，顯示OpenAI領(lǐng)銜全美AI公司，提供高達(dá)600萬美元年薪，引發(fā)社會(huì)廣泛熱議。初級(jí)碼農(nóng)時(shí)薪低至85美元，突顯AI行業(yè)薪資差距。網(wǎng)友對(duì)高薪AI科學(xué)家和低薪工程師的差異表示質(zhì)疑。各大科技公司年薪不一，但大多數(shù)超過百萬美元。未來AI領(lǐng)域人才需求增長(zhǎng)，薪資引起廣泛關(guān)注。

【AiBase提要:】
?? OpenAI以600萬美元年薪領(lǐng)銜AI公司榜單。
?? 薪資差距懸殊，初級(jí)碼農(nóng)時(shí)薪僅為85美元。
?? AI領(lǐng)域需求升高，未來薪酬或?qū)⒊掷m(xù)吸引關(guān)注。

特斯拉人形機(jī)器人Optimus二代上線

特斯拉人形機(jī)器人Optimus二代上線，展示更靈活的雙手和輕盈身體，具備對(duì)物體分類和瑜伽動(dòng)作等新能力，引領(lǐng)機(jī)器人技術(shù)創(chuàng)新。

【AiBase提要:】
?? 特斯拉人形機(jī)器人Optimus二代亮相，經(jīng)過兩年半的練習(xí)，展示出更靈活的雙手和輕盈的身體。
?? Optimus Gen2配備全新手，擁有11個(gè)自由度，能靈巧處理精細(xì)物體，展示觸覺處理能力。
?? 特斯拉人形機(jī)器人展示驚人的進(jìn)步速度，包括對(duì)物體分類和瑜伽動(dòng)作等新能力。

Meta 推出雷朋智能眼鏡的多模態(tài) AI 功能測(cè)試

Meta宣布早期訪問測(cè)試其多模態(tài)AI功能，應(yīng)用于Ray-Ban智能眼鏡，通過攝像頭和麥克風(fēng)告知用戶周圍視聽信息，包括物體識(shí)別和語言翻譯。

【AiBase提要】
?? 智能眼鏡新體驗(yàn): Meta推出早期測(cè)試，讓Ray-Ban智能眼鏡具備多模態(tài)AI功能，用戶通過眼鏡體驗(yàn)物體識(shí)別和語言翻譯。
?? 全天候互動(dòng): 用戶可通過眼鏡與Meta AI助手全天對(duì)話，提問并得到智能建議，開創(chuàng)全新智能眼鏡應(yīng)用場(chǎng)景。
?? 測(cè)試范圍有限: 初期測(cè)試僅限于美國，選擇加入的少數(shù)人參與，拓展智能眼鏡在用戶生活中的潛在應(yīng)用。

?????????聚焦開發(fā)者

南大提出全新框架VividTalk 一張照片一段聲音秒生超逼真視頻

南大等機(jī)構(gòu)研究人員推出VividTalk框架，通過一段音頻和一張照片生成高質(zhì)量、富有表現(xiàn)力的說話視頻，實(shí)現(xiàn)口型和音頻的無縫對(duì)齊。

論文地址:https://arxiv.org/pdf/2312.01841.pdf

【AiBase提要:】
?? 全新框架VividTalk: 南大研究人員提出通用框架，通過音頻和照片生成逼真說話視頻。
??? 兩階段生成方法: 采用多分支Transformer網(wǎng)絡(luò)建模音頻上下文和渲染投影紋理，實(shí)現(xiàn)全面建模運(yùn)動(dòng)。
?? 優(yōu)越生成質(zhì)量: VividTalk展現(xiàn)出在多語言支持下生成具有豐富表情和自然頭部姿勢(shì)的口型同步視頻的優(yōu)越性能。

趣味項(xiàng)目CLoT:訓(xùn)練LLM更幽默地回答問題

趣味項(xiàng)目CLoT通過日本傳統(tǒng)喜劇游戲“大喜利”挑戰(zhàn)AI，培養(yǎng)其成為幽默吐槽高手。研究人員構(gòu)建了多模態(tài)Oogiri-GO數(shù)據(jù)集，通過特殊訓(xùn)練方法使AI學(xué)會(huì)在游戲中產(chǎn)生創(chuàng)意和幽默回答。CLoT顯著提高了大語言模型（LLM）在多種Oogiri游戲中的幽默表現(xiàn)，展現(xiàn)了卓越的創(chuàng)造性和泛化能力。

【AiBase提要:】
?? CLoT項(xiàng)目通過"大喜利"游戲挑戰(zhàn)AI，培養(yǎng)其成為幽默吐槽高手。
?? 構(gòu)建多模態(tài)Oogiri-GO數(shù)據(jù)集，訓(xùn)練AI在游戲中生成創(chuàng)意和幽默回答。
?? CLoT顯著提高LLM在Oogiri游戲中的幽默表現(xiàn)，展現(xiàn)出卓越的創(chuàng)造性和泛化能力。

HiFi4G渲染技術(shù)實(shí)現(xiàn)25倍壓縮率，照片級(jí)真實(shí)人體建模和高效渲染

上?？萍即髮W(xué)、NeuDim、字節(jié)跳動(dòng)和DGene的研究團(tuán)隊(duì)聯(lián)合發(fā)布的HiFi4G渲染技術(shù)，以緊湊的高斯噴濺表示法和雙圖機(jī)制為基礎(chǔ)，實(shí)現(xiàn)了25倍壓縮率。

項(xiàng)目網(wǎng)址:https://nowheretrix.github.io/HiFi4G/

論文網(wǎng)址:https://arxiv.org/abs/2312.03461

【AiBase提要】
1. ?? HiFi4G實(shí)現(xiàn)了從密集視頻中重新創(chuàng)建高保真4D人體表演的全顯式和緊湊方法。
2. ?? HiFi4G在優(yōu)化速度、渲染質(zhì)量和存儲(chǔ)開銷方面明顯優(yōu)于當(dāng)前的隱式渲染技術(shù)。
3. ?? 研究團(tuán)隊(duì)提供了一種壓縮方法，使HiFi4G在每幀不到2MB的存儲(chǔ)空間下，以約25倍的壓縮率，可在各種設(shè)備上實(shí)現(xiàn)沉浸式觀看人體表演。

（舉報(bào)）

相關(guān)推薦
大家在看

關(guān)鍵詞：

Midjourney

【騰訊云】11.11云上盛惠！云服務(wù)器首年1.8折起，買1年送3個(gè)月！

11.11云上盛惠！海量產(chǎn)品 · 輕松上云！云服務(wù)器首年1.8折起，買1年送3個(gè)月！超值優(yōu)惠，性能穩(wěn)定，讓您的云端之旅更加暢享?？靵眚v訊云選購吧！

Docker容器鏡像
去看看

Docker容器鏡像 60元/15天

爆款產(chǎn)品組合購
去看看

爆款產(chǎn)品組合購低至1元

騰訊云x NVIDIA加速計(jì)劃
去看看

騰訊云x NVIDIA加速計(jì)劃最高獲贈(zèng)10萬元扶持基金

2核2G云服務(wù)器
去看看

2核2G云服務(wù)器 112元/1年

查看更多相關(guān)信息>>

騰訊云 12-20

廣告
薦AI日?qǐng)?bào)：Rhymes AI開源視頻生成模型Allegro；Grok API正式上線；ComfyUI發(fā)布桌面一鍵安裝包ComfyUI V1

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、RhymesAI開源視頻生成模型Allegro:文本秒變高清視頻RhymesAI最近開源了先進(jìn)的文本生成視頻模型Allegro，為人工智能生成視頻領(lǐng)域帶來新的可能性。這次收購反映了垂類大模型公司面臨的發(fā)展困境，也印證了大廠對(duì)AI人才的渴求趨勢(shì)。

?Allegro
AI日?qǐng)?bào)：字節(jié)旗下AI助手豆包開啟視頻生成內(nèi)測(cè)；OpenAI買下Chat.com域名；超清AI圖像生成模型FLUX 1.1 Pro Ultra發(fā)布

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI成功收購Chat.com域名OpenAI成功收購知名老牌域名Chat.com，進(jìn)一步豐富了其在網(wǎng)絡(luò)領(lǐng)域的資產(chǎn)。公司正積極推進(jìn)產(chǎn)品測(cè)試與上線工作，未來可能拓展至教育和陪伴等多種應(yīng)用場(chǎng)景，提升用戶體驗(yàn)。

?人工智能 ?OpenAI ?ChatGPT
薦AI日?qǐng)?bào)：Pika 1.5又上線4個(gè)新特效；英偉達(dá)推超快AI圖像生成模型Sana；Mistral AI推超強(qiáng)邊緣AI模型Ministral 8B

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、Pika1.5重磅上線四個(gè)新特效:從粉碎到消失，效果炸裂了!Pika1.5版本再度增加了四種新特效，讓用戶可以輕松生成炫酷動(dòng)畫。臺(tái)積電作為高級(jí)芯片制造商，受益于人工智能應(yīng)用的快速發(fā)展，業(yè)績(jī)得到顯著提升。

?Pika
劍指谷歌！OpenAI宣布ChatGPT搜索功能正式上線

北京時(shí)間今天凌晨，OpenAI宣布ChatGPT搜索功能正式上線，該功能覆蓋ChatGPT網(wǎng)頁版、手機(jī)、桌面應(yīng)用。該功能只有付費(fèi)的ChatGPTPlus和Team用戶，以及SearchGPT候補(bǔ)名單用戶可以訪問。從ChatGPT搜索功能開始，OpenAI可能對(duì)搜索巨頭谷歌構(gòu)成重大威脅。

?ChatGPT ?搜索功能 ?OpenAI
薦豪擲千億美元布局AI，微軟不止有OpenAI

微軟和OpenAI無疑是大洋彼岸最具看點(diǎn)的一對(duì)商業(yè)組合。人們?cè)谝荒昵皶诚氲腁GI、SuperApp并未如期出現(xiàn)訓(xùn)練所需的資金基本都來自于大廠輸血。但退一步講，這個(gè)答案或許并不重要。

?微軟 ?OpenAI
薦開源版OpenAI再出「神作」，小模型吊打Llama 3！Ministral系列問世，邊緣AI革命開啟

【新智元導(dǎo)讀】Mistral7B誕生一周年之際，法國AI初創(chuàng)公司Mistral再次連發(fā)兩個(gè)輕量級(jí)模型Ministral3B和Ministral8B，性能趕超Llama38B。Mistral7B僅僅發(fā)布一周年，法國AI初創(chuàng)小模型「lesMinistraux」就打敗它了。對(duì)于Mistral也是如此，若要持續(xù)打造優(yōu)秀的模型，只有這一種選擇。

?OpenAI ?Llama3 ?Ministral
AI日?qǐng)?bào)：王炸！ElevenLabs推聲音設(shè)計(jì)功能；全能型圖像生成模型OmniGen問世；快50倍！OpenAI推全新模型sCM

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、ElevenLabs推出AI語音生成工具VoiceDesignElevenLabs最新推出的AI語音生成工具VoiceDesign開創(chuàng)了AI配音領(lǐng)域的新紀(jì)元，通過簡(jiǎn)單的文本描述即可創(chuàng)建個(gè)性化語音，為用戶提供了直觀的文本提?

?ElevenLabs ?OmniGen
Meta 發(fā)布可以檢查其他 AI 模型工作的 AI 模型

Facebook母公司Meta當(dāng)?shù)貢r(shí)間周五正式發(fā)布了一批來自其研究部門的新AI模型，其中包括一個(gè)名為「自學(xué)評(píng)估器」的模型，這可能為減少人類在AI開發(fā)過程中的參與度提供了一條新路徑。此次發(fā)布緊隨Meta在8月份一篇論文中介紹該工具之后，該論文詳細(xì)說明了如何依賴與OpenAI最近發(fā)布的o1模型中使用的「思維鏈」技術(shù)，來讓模型對(duì)其輸出進(jìn)行可靠判斷。Meta在周五發(fā)布的其他AI工具還包

?Meta ?人工智能 ?AI模型
薦AI日?qǐng)?bào)：阿里發(fā)布 FLUX.1-Turbo-Alpha；蘋果多模態(tài)模型MM1升級(jí)為MM1.5；獲獎(jiǎng)AI畫作《太空歌劇院》版權(quán)申請(qǐng)?jiān)饩?/a>

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里發(fā)布FLUX.1-Turbo-Alpha:基于FLUX.1-dev、8步提煉Lora阿里媽媽創(chuàng)意團(tuán)隊(duì)發(fā)布了基于FLUX.1-dev模型訓(xùn)練的FLUX.1-Turbo-Alpha，采用8步蒸餾Lora模型，多頭判別器顯著提高蒸餾質(zhì)量，支持多種FLU

?FLUX
薦OpenAI科學(xué)家震驚TED大會(huì)：讓AI模型思考20秒，提升10萬倍性能！

知名科技媒體Venturebeat消息，OpenAI高級(jí)研究科學(xué)家、德?lián)銩I之父NoamBrown，在美國舊金山舉辦的TEDAI大會(huì)上提出了一個(gè)震驚的理論——讓AI模型思考20秒所帶來的性能提升，相當(dāng)于將模型擴(kuò)大100，000倍并訓(xùn)練100，000倍的時(shí)間。Brown也被這個(gè)結(jié)果嚇到了寫了多篇論文來驗(yàn)證其真實(shí)性。Brown是OpenAI的高級(jí)研究科學(xué)家主要方向是超復(fù)雜推理、AIAgent以及自我對(duì)弈。

?OpenAI

Editor Usage:監(jiān)控和管理您的Cursor編輯器使用情況

Editor Usage 是一款為macOS設(shè)計(jì)的菜單欄應(yīng)用程序，旨在幫助用戶監(jiān)控和管理他們的Cursor編輯器使用情況。該應(yīng)用程序能夠追蹤高級(jí)、普通和特殊請(qǐng)求的使用情況，并在接近使用限制時(shí)提供警告。它允許用戶從菜單欄快速查看剩余的請(qǐng)求次數(shù)，從而確保用戶始終了解他們的使用情況，并避免因超出限制而受到影響。這款應(yīng)用的主要優(yōu)點(diǎn)包括詳細(xì)的使用監(jiān)控、可定制的警告設(shè)置以及快速便捷的訪問方式。它適合需要管理多個(gè)項(xiàng)目或希望實(shí)時(shí)監(jiān)控請(qǐng)求使用情況的用戶。

監(jiān)控管理編輯器

Yepic Studio:在線視頻制作平臺(tái)，提供AI虛擬形象和視頻制作服務(wù)。

Yepic Studio是一個(gè)在線視頻制作平臺(tái)，它通過使用人工智能技術(shù)，允許用戶創(chuàng)建和編輯視頻內(nèi)容，包括制作會(huì)說話的照片視頻、專業(yè)視頻以及AI虛擬形象。該平臺(tái)的主要優(yōu)點(diǎn)在于能夠快速生成高質(zhì)量的視頻內(nèi)容，同時(shí)提供個(gè)性化的AI虛擬形象，滿足不同商業(yè)需求。產(chǎn)品背景信息顯示，Yepic Studio旨在為內(nèi)容創(chuàng)作者和企業(yè)提供一個(gè)簡(jiǎn)單易用的在線視頻制作工具，以提高內(nèi)容生產(chǎn)的效率和質(zhì)量。關(guān)于價(jià)格，頁面顯示用戶為'Guest'且'Credits'為0，暗示可能有免費(fèi)試用或基礎(chǔ)免費(fèi)服務(wù)，具體定價(jià)需進(jìn)一步查看。

視頻編輯 AI虛擬形象在線視頻制作

Jumper:是一個(gè)強(qiáng)大的AI視頻搜索工具，幫助編輯者快速找到視頻素材。

Jumper是一個(gè)專為視頻編輯者設(shè)計(jì)的AI搜索工具，它能夠讓用戶在眨眼間搜索自己的視頻素材。Jumper集成到了用戶的非線性編輯器（NLE）中，無需離開編輯工作流程即可找到所需素材。Jumper支持多語言搜索，能夠快速定位特定詞匯或短語在視頻中的位置，支持多機(jī)位和同步剪輯，并且完全在設(shè)備上運(yùn)行，保護(hù)用戶隱私，無需上傳素材至云端。Jumper的主要優(yōu)點(diǎn)包括快速搜索、完全離線工作、保護(hù)隱私和兼容性強(qiáng)。產(chǎn)品背景信息顯示，Jumper由Witchcraft Software AB開發(fā)，旨在通過AI技術(shù)提高視頻編輯的效率和創(chuàng)造力。

AI 視頻編輯搜索

CogVideoX1.5-5B-SAT:開源視頻生成模型，支持10秒視頻和更高分辨率。

CogVideoX1.5-5B-SAT是由清華大學(xué)知識(shí)工程與數(shù)據(jù)挖掘團(tuán)隊(duì)開發(fā)的開源視頻生成模型，是CogVideoX模型的升級(jí)版。該模型支持生成10秒視頻，并支持更高分辨率的視頻生成。模型包含Transformer、VAE和Text Encoder等模塊，能夠根據(jù)文本描述生成視頻內(nèi)容。CogVideoX1.5-5B-SAT模型以其強(qiáng)大的視頻生成能力和高分辨率支持，為視頻內(nèi)容創(chuàng)作者提供了一個(gè)強(qiáng)大的工具，尤其在教育、娛樂和商業(yè)領(lǐng)域有著廣泛的應(yīng)用前景。

視頻生成文本到視頻高分辨率

Ask The Post AI:華盛頓郵報(bào)的AI問答產(chǎn)品

Ask The Post AI是華盛頓郵報(bào)推出的一款基于人工智能的產(chǎn)品，它允許讀者就自2016年以來發(fā)布的所有報(bào)道提出問題。該產(chǎn)品利用生成式AI技術(shù)和對(duì)話格式，依托華盛頓郵報(bào)長(zhǎng)期以來基于事實(shí)、深入報(bào)道的新聞傳統(tǒng)，以新的方式取悅并通知讀者。Ask The Post AI通過機(jī)器學(xué)習(xí)團(tuán)隊(duì)對(duì)Climate Answers工具的數(shù)據(jù)進(jìn)行提煉，優(yōu)化了如何檢索和匹配自2016年以來新聞室發(fā)布的所有報(bào)道中與用戶查詢相關(guān)的相關(guān)文章。

AI 問答新聞

Mistral Moderation API:AI內(nèi)容審核服務(wù)，保護(hù)下游部署安全。

Mistral Moderation API是Mistral AI推出的內(nèi)容審核服務(wù)，旨在幫助用戶檢測(cè)和過濾不受歡迎的文本內(nèi)容。該API是Le Chat中使用的審核服務(wù)的同一技術(shù)，現(xiàn)在對(duì)外開放，以便用戶可以根據(jù)特定的應(yīng)用和安全標(biāo)準(zhǔn)定制和使用這一工具。該模型是一個(gè)基于LLM（大型語言模型）的分類器，能夠?qū)⑽谋据斎敕诸惖?個(gè)預(yù)定義的類別中。Mistral AI的這一API支持原生多語言，特別針對(duì)阿拉伯語、中文、英語、法語、德語、意大利語、日語、韓語、葡萄牙語、俄語和西班牙語進(jìn)行了訓(xùn)練。該API的主要優(yōu)點(diǎn)包括提高審核的可擴(kuò)展性和魯棒性，以及通過技術(shù)文檔提供的詳細(xì)政策定義和啟動(dòng)指南，幫助用戶有效實(shí)施系統(tǒng)級(jí)的安全防護(hù)。

內(nèi)容審核 AI 多語言支持

Medio AI:AI編輯工具，助力企業(yè)視頻營(yíng)銷本地化。

Medio AI是一個(gè)為企業(yè)提供AI編輯工具的平臺(tái)，專注于視頻翻譯和視頻配音，幫助企業(yè)無畏全球擴(kuò)張，實(shí)現(xiàn)視頻營(yíng)銷的本地化。產(chǎn)品背景信息顯示，Medio AI旨在幫助企業(yè)探索更多海外市場(chǎng)，通過AI技術(shù)提升視頻編輯效率，增強(qiáng)產(chǎn)品在國際市場(chǎng)上的競(jìng)爭(zhēng)力。產(chǎn)品的主要優(yōu)點(diǎn)包括無需下載、在線使用、一鍵去除視頻水印、產(chǎn)品翻譯、視頻配音等。價(jià)格方面，Medio AI提供免費(fèi)試用，并根據(jù)不同的功能需求提供不同的付費(fèi)版本。

AI編輯視頻營(yíng)銷本地化

PodExtra AI:釋放播客的力量，用AI提升播客收聽體驗(yàn)

PodExtra AI是一款先進(jìn)的AI工具，專為播客收聽和知識(shí)獲取設(shè)計(jì)。它通過生成播客內(nèi)容的摘要、思維導(dǎo)圖、大綱、亮點(diǎn)和要點(diǎn)，幫助用戶快速把握播客的核心內(nèi)容。產(chǎn)品背景信息顯示，播客愛好者平均每周消費(fèi)超過8集，全球有超過400萬的節(jié)目可供選擇。PodExtra AI通過AI技術(shù)，使得用戶能夠快速瀏覽內(nèi)容，節(jié)省時(shí)間，提高效率。產(chǎn)品定位于幫助用戶從海量播客內(nèi)容中快速獲取有價(jià)值的信息，特別適合時(shí)間緊張但希望從播客中獲取知識(shí)的人群。

播客 AI 知識(shí)管理

語鯨:，智能語言處理平臺(tái)

語鯨是一個(gè)專注于語言處理的平臺(tái)，它利用先進(jìn)的自然語言處理技術(shù)，為用戶提供文本分析、翻譯、校對(duì)等服務(wù)。產(chǎn)品背景信息顯示，語鯨旨在幫助用戶提高寫作效率和質(zhì)量，特別是在多語言環(huán)境中。語鯨的價(jià)格定位尚未明確，但考慮到其提供的服務(wù)，可能會(huì)有免費(fèi)試用和付費(fèi)版本。

自然語言處理文本分析翻譯

CR-Mentor:AI驅(qū)動(dòng)的代碼審查導(dǎo)師，提升代碼質(zhì)量和審查效率。

CR-Mentor AI CodeReview Mentor是一個(gè)基于人工智能的代碼審查工具，它通過積累的最佳實(shí)踐知識(shí)庫和大型語言模型（LLM）分析，為主流編程語言提供智能代碼審查。該產(chǎn)品支持自定義的代碼審查標(biāo)準(zhǔn)，能夠?yàn)閱蝹€(gè)文件代碼變更提供專業(yè)評(píng)分和改進(jìn)建議，并通過LLM生成全面的審查報(bào)告，包括代碼走查、變更描述和時(shí)序圖。它與GitHub工作流程深度集成，實(shí)現(xiàn)自動(dòng)化代碼審查，支持多語言反饋，幫助整個(gè)團(tuán)隊(duì)提升代碼質(zhì)量和審查效率。

代碼審查人工智能 GitHub集成

Srcbook:開源、自托管、AI驅(qū)動(dòng)的應(yīng)用構(gòu)建器。

Srcbook是一個(gè)開源、自托管的AI驅(qū)動(dòng)應(yīng)用構(gòu)建器，它允許用戶快速構(gòu)建和部署各種應(yīng)用程序。產(chǎn)品背景信息顯示，Srcbook旨在提供一個(gè)平臺(tái)，讓開發(fā)者和非技術(shù)用戶都能夠輕松地構(gòu)建應(yīng)用程序，從而提高生產(chǎn)力和創(chuàng)新能力。它支持多種應(yīng)用場(chǎng)景，如項(xiàng)目管理工具、音樂發(fā)現(xiàn)頁面、技術(shù)文檔網(wǎng)站等。Srcbook的主要優(yōu)點(diǎn)包括開源性、靈活性和易用性，用戶可以根據(jù)自己的需求定制和擴(kuò)展功能。

開源自托管 AI

ReCapture:用戶視頻的生成性視頻攝像機(jī)控制

ReCapture是一種從單一用戶提供的視頻生成新視頻和新穎攝像機(jī)軌跡的方法。該技術(shù)允許我們從完全不同的角度重新生成源視頻，并帶有電影級(jí)別的攝像機(jī)運(yùn)動(dòng)。ReCapture通過使用多視圖擴(kuò)散模型或基于深度的點(diǎn)云渲染生成帶有新攝像機(jī)軌跡的嘈雜錨視頻，然后通過我們提出的掩蔽視頻微調(diào)技術(shù)將錨視頻重新生成為干凈且時(shí)間上一致的重新角度視頻。這種技術(shù)的重要性在于它能夠利用視頻模型的強(qiáng)大先驗(yàn)，將近似的視頻重新生成為時(shí)間上一致且美觀的視頻。

視頻生成攝像機(jī)控制多視圖擴(kuò)散模型

AI Tattoo Generator.net:快速創(chuàng)建個(gè)性化紋身設(shè)計(jì)

AI Tattoo Generator是一個(gè)利用人工智能技術(shù)幫助用戶快速創(chuàng)建個(gè)性化紋身設(shè)計(jì)的在線平臺(tái)。該平臺(tái)使用先進(jìn)的機(jī)器學(xué)習(xí)算法，根據(jù)用戶輸入生成具有各種風(fēng)格的現(xiàn)實(shí)感紋身概念圖，確保用戶的想法以視覺上引人入勝的方式呈現(xiàn)。它不僅能夠提供即時(shí)的設(shè)計(jì)結(jié)果，還能讓用戶根據(jù)自己的偏好進(jìn)一步定制和細(xì)化設(shè)計(jì)，滿足個(gè)性化需求。

AI設(shè)計(jì) 紋身個(gè)性化

Unfaked:AI生成的逼真圖片庫

Unfaked是一個(gè)提供由人工智能生成的逼真圖片的網(wǎng)站，這些圖片幾乎可以以假亂真。用戶可以免費(fèi)下載并自由使用這些圖片。每周都會(huì)更新更多的圖片。這個(gè)平臺(tái)的重要性在于它為設(shè)計(jì)師、內(nèi)容創(chuàng)作者和營(yíng)銷人員提供了一個(gè)免費(fèi)的資源庫，他們可以在這里找到高質(zhì)量的圖片資源，而無需擔(dān)心版權(quán)問題。

AI生成免費(fèi)圖片版權(quán)免費(fèi)

ComfyUI-GIMM-VFI:基于GIMM-VFI的ComfyUI幀插值工具

ComfyUI-GIMM-VFI是一個(gè)基于GIMM-VFI算法的幀插值工具，使用戶能夠在圖像和視頻處理中實(shí)現(xiàn)高質(zhì)量的幀插值效果。該技術(shù)通過在連續(xù)幀之間插入新的幀來提高視頻的幀率，從而使得動(dòng)作看起來更加流暢。這對(duì)于視頻游戲、電影后期制作和其他需要高幀率視頻的應(yīng)用場(chǎng)景尤為重要。產(chǎn)品背景信息顯示，它是基于Python開發(fā)的，并且依賴于CuPy庫，特別適用于需要進(jìn)行高性能計(jì)算的場(chǎng)景。

幀插值視頻處理圖像處理

5ire:簡(jiǎn)單易用，釋放AI的強(qiáng)大力量

5ire是一個(gè)以簡(jiǎn)潔和用戶友好為核心的AI產(chǎn)品，旨在讓即使是初學(xué)者也能輕松利用大型語言模型。它支持多種文檔格式的解析和向量化，具備本地知識(shí)庫、使用分析、提示庫、書簽和快速關(guān)鍵詞搜索等功能。作為一個(gè)開源項(xiàng)目，5ire提供免費(fèi)下載，并且提供了按需付費(fèi)的大型語言模型API服務(wù)。

AI 大型語言模型開源

AI Hear:一款在您電腦本地運(yùn)行的私有軟件，提供多語種實(shí)時(shí)翻譯。

AI Hear是一款在電腦本地運(yùn)行的私有軟件，它通過一鍵開啟多語種實(shí)時(shí)翻譯功能，幫助用戶管理音頻、譯文和時(shí)間軸。產(chǎn)品不收集數(shù)據(jù)，保護(hù)用戶隱私。它適用于多種場(chǎng)景，如線上會(huì)議、網(wǎng)課播客、游戲直播等，并且完全本地運(yùn)行，相比市面上的實(shí)時(shí)翻譯產(chǎn)品更具性價(jià)比。

實(shí)時(shí)翻譯音頻管理隱私保護(hù)

SD Image:使用最新的Stable Diffusion 3.5模型生成高質(zhì)量圖像。

SD Image的Stable Diffusion 3.5 Image Generator是一個(gè)在線圖像生成器，它利用最新的Stable Diffusion 3.5模型，包括Medium, Large, Large Turbo，來生成高質(zhì)量的圖像。這項(xiàng)技術(shù)的重要性在于它能夠通過文本提示（prompt）快速生成圖像，為設(shè)計(jì)師、藝術(shù)家和創(chuàng)意工作者提供靈感和便利。產(chǎn)品背景信息顯示，SD Image是一個(gè)在線平臺(tái)，用戶可以通過它找到靈感、生成圖像、探索不同的prompt和模型。目前，該產(chǎn)品提供免費(fèi)試用，適合需要快速生成圖像的用戶。

圖像生成 AI藝術(shù) 創(chuàng)意工具

AI Homeworkify:下一代AI作業(yè)助手，免費(fèi)獲取作業(yè)答案

AI Homeworkify是一個(gè)基于人工智能的在線問答平臺(tái)，旨在幫助學(xué)生通過提供詳細(xì)的答案和解題步驟來學(xué)習(xí)和理解各種學(xué)術(shù)問題。該平臺(tái)不涉及版權(quán)侵犯，注重教育平等，提供免費(fèi)、即時(shí)的作業(yè)幫助，支持多種學(xué)科和語言。AI Homeworkify的主要優(yōu)點(diǎn)包括完全免費(fèi)、無需注冊(cè)、即時(shí)答案、全天候服務(wù)、多設(shè)備兼容、隱私保護(hù)和逐步解決方案。產(chǎn)品背景信息顯示，AI Homeworkify致力于通過技術(shù)手段減少教育不平等，為全球?qū)W生提供免費(fèi)的優(yōu)質(zhì)學(xué)習(xí)輔助服務(wù)。

AI 教育作業(yè)幫助

AI Voice Lab:在線將文字轉(zhuǎn)換為逼真的語音

AI Voice Lab免費(fèi) AI 文字轉(zhuǎn)語音神器是一個(gè)利用最新的類GPT AI語音模型技術(shù)，提供超級(jí)逼真的配音結(jié)果，支持20+種語言和100+種聲音，每天提供免費(fèi)使用次數(shù)，適用于視頻、音頻制作等多種場(chǎng)景，提高內(nèi)容吸引力。

AI語音文字轉(zhuǎn)語音配音

今日大家都在搜的詞：

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

AI視野：Midjourney正式上線Alpha網(wǎng)頁版；OpenAI恢復(fù)會(huì)員注冊(cè)；騰訊發(fā)布視頻生成模型AnimateZero；微軟發(fā)布小語言模型AI Phi-2

今日大家都在搜的詞：

熱文

站長(zhǎng)商機(jī)

AI視野：Midjourney正式上線Alpha網(wǎng)頁版；OpenAI恢復(fù)會(huì)員注冊(cè)；騰訊發(fā)布視頻生成模型AnimateZero；微軟發(fā)布小語言模型AI Phi-2