AI視野：百度Apollo開放平臺(tái)9.0發(fā)布；OpenAI公布ChatGPT安全框架；Etched AI推AI推理加速芯片Sohu；美圖云修Pro版正式發(fā)布；Runway上線文字生成語音功能

2023-12-19 15:10 · 稿源：站長(zhǎng)之家

??????AI新鮮事

百度Apollo開放平臺(tái)9.0發(fā)布

百度發(fā)布Apollo開放平臺(tái)9.0，全面升級(jí)自動(dòng)駕駛開發(fā)領(lǐng)域，包括工程、算法和工具三方面，重構(gòu)12萬行代碼，新增20萬行。工程框架拆分成小軟件包，提高靈活性;算法優(yōu)化感知算法，支持4D毫米波雷達(dá);工具升級(jí)包括高精地圖、傳感器標(biāo)定等，提升Dreamview+效率。

微信截圖_20231219135004.png

【AiBase提要:】
?? 工程框架全面升級(jí)，模塊拆分提高靈活性;
?? 算法優(yōu)化感知算法，支持4D毫米波雷達(dá);
?? 工具升級(jí)包括高精地圖、傳感器標(biāo)定，提升效率。

OpenAI公布ChatGPT安全框架

OpenAI發(fā)布ChatGPT安全框架，采用風(fēng)險(xiǎn)“記分卡”衡量潛在危害，雇傭跨領(lǐng)域?qū)＜覉F(tuán)隊(duì)監(jiān)測(cè)技術(shù)，與第三方合作測(cè)試技術(shù)，與競(jìng)爭(zhēng)對(duì)手Anthropic的政策形成差異。

【AiBase提要:】
?? 安全框架發(fā)布:OpenAI推出ChatGPT安全框架，采用風(fēng)險(xiǎn)“記分卡”評(píng)估潛在危害，不斷完善框架以確保AI安全。
?? 跨領(lǐng)域?qū)＜覉F(tuán)隊(duì):雇傭AI研究、國(guó)家安全、政策專業(yè)人員組成“應(yīng)對(duì)”團(tuán)隊(duì)，監(jiān)測(cè)技術(shù)風(fēng)險(xiǎn)并提供預(yù)警。
?? 開放合作與競(jìng)爭(zhēng)對(duì)手對(duì)比:允許第三方測(cè)試技術(shù)，與Anthropic的政策形成鮮明對(duì)比，展現(xiàn)出框架的靈活性。

Etched AI推AI推理加速芯片Sohu

美國(guó)芯片初創(chuàng)公司Etched AI成功開發(fā)了一項(xiàng)技術(shù)，將Transformer架構(gòu)直接嵌入芯片，創(chuàng)造出專為Transformer推理的超強(qiáng)服務(wù)器Sohu，可運(yùn)行萬億參數(shù)模型，挑戰(zhàn)英偉達(dá)。

QQ截圖20231219095455.jpg

官網(wǎng)地址:https://www.etched.ai/

【AiBase提要】
?? Etched AI成功將Transformer架構(gòu)“燒錄”到芯片，創(chuàng)造強(qiáng)大服務(wù)器Sohu。
?? 技術(shù)支持實(shí)時(shí)語音代理、高級(jí)解碼等多項(xiàng)功能。
?? 服務(wù)器配備144GB HBM3E，支持MoE和轉(zhuǎn)換器變體，為高性能提供有力支持。

百度數(shù)字人生成專利公布

百度公布一項(xiàng)數(shù)字人生成專利，專利涉及人工智能技術(shù)領(lǐng)域，通過計(jì)算機(jī)視覺、自然語言處理和深度學(xué)習(xí)等技術(shù)，實(shí)現(xiàn)對(duì)數(shù)字人賦予不同人格。

【AiBase提要:】
?? 多人格數(shù)字人生成專利: 百度公布一項(xiàng)數(shù)字人生成專利，通過語言模型訓(xùn)練和三維建模，使數(shù)字人具備不同人格。
?? 應(yīng)用領(lǐng)域廣泛: 該專利涉及計(jì)算機(jī)視覺、自然語言處理和深度學(xué)習(xí)，可應(yīng)用于元宇宙等場(chǎng)景，提升數(shù)字人的交流與互動(dòng)自然度。
?? 賦予情感與意識(shí): 生成的數(shù)字人可像人類一樣表達(dá)情感和意識(shí)，為人機(jī)交互提供更豐富、自然的體驗(yàn)。

OpenAI官方發(fā)布Prompt工程指南

OpenAI官方發(fā)布的Prompt工程指南分享了六個(gè)策略，幫助用戶優(yōu)化ChatGPT等大型語言模型的輸出，包括寫清楚指令、提供參考文本、拆分復(fù)雜任務(wù)等。

指南地址:https://platform.openai.com/docs/guides/prompt-engineering

【AiBase提要:】
?? 寫清楚指令: 用戶需明確、詳細(xì)指導(dǎo)模型，減少猜測(cè)，提高滿意度。
?? 提供參考文本: 使用參考文本幫助模型減少錯(cuò)誤輸出，指導(dǎo)回答問題。
?? 拆分復(fù)雜任務(wù): 將任務(wù)分解為簡(jiǎn)單子任務(wù)，降低錯(cuò)誤率，提高整體性能。

Adobe終止200億美元收購(gòu)Figma

Adobe和Figma宣布終止200億美元的合并交易，因歐洲監(jiān)管機(jī)構(gòu)強(qiáng)烈反對(duì)，認(rèn)為該交易將損害競(jìng)爭(zhēng)，導(dǎo)致用戶面臨更高的價(jià)格和更少的選擇。

【AiBase提要:】
?? Adobe和Figma終止200億美元的合并交易，歐洲監(jiān)管機(jī)構(gòu)認(rèn)為交易將損害競(jìng)爭(zhēng)，不予批準(zhǔn)。
?? Adobe首席執(zhí)行官表示盡管相信合并的好處，但由于歐洲監(jiān)管無法獲得批準(zhǔn)，共同同意終止交易。
?? 根據(jù)合同規(guī)定，Adobe需支付Figma10億美元的終止費(fèi)，反映科技行業(yè)監(jiān)管日益嚴(yán)格。

Mistral AI CEO宣布于2024年開源GPT-4級(jí)別模型

法國(guó)初創(chuàng)公司Mistral AI計(jì)劃于2024年開源GPT-4級(jí)別模型，最近獲得4.15億美元融資，推出基于MoE架構(gòu)的8X7B模型，同時(shí)推進(jìn)多語言模型Mistral Medium的開發(fā)。

【AiBase提要:】
?? Mistral AI首席執(zhí)行官Arthur Mensch宣布公司將于2024年開源GPT-4級(jí)模型，引起行業(yè)廣泛關(guān)注。
?? 公司最近獲得4.15億美元融資，估值20億美元，推出基于MoE架構(gòu)的8X7B模型，同時(shí)推出API服務(wù)“La Plateforme”。
?? Mistral AI正在開發(fā)支持多語言的Mistral Medium模型，在標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異，預(yù)計(jì)將于2024年發(fā)布。

??????AI應(yīng)用

美圖云修Pro版正式發(fā)布

美圖公司旗下的美圖云修正式推出Pro版，搭載全新圖像處理引擎，實(shí)現(xiàn)實(shí)時(shí)預(yù)覽，為商業(yè)攝影提供即時(shí)修圖解決方案。同時(shí)，智能修圖API服務(wù)也正式開放，支持多端應(yīng)用，助力快速出圖。數(shù)據(jù)顯示，美圖云修已擁有超過百萬用戶和3萬余家商業(yè)攝影機(jī)構(gòu)使用，年修圖量超過5億張，有效提升修圖效率和生產(chǎn)力。

微信截圖_20231219082230.png

美圖云修官網(wǎng):https://yunxiu.meitu.com/home

【AiBase提要】
?? Pro版亮點(diǎn): 全新圖像處理引擎，實(shí)時(shí)預(yù)覽，適用于約拍和旅拍等即時(shí)修圖場(chǎng)景。
?? API服務(wù)開放: 美圖云修智能修圖API服務(wù)全面開放，支持多端應(yīng)用，實(shí)現(xiàn)“即拍即修”。
?? 數(shù)據(jù)亮點(diǎn): 超過百萬用戶、3萬余家商業(yè)攝影機(jī)構(gòu)使用，年修圖量超5億張，提升修圖效率。

Runway上線文字生成語音功能

Runway最近悄悄上線了文字生成語音功能，初次嘗試英文效果驚艷，但中文語音仍帶有外國(guó)口音，可能需要解決。

QQ截圖20231218175418.jpg

體驗(yàn)地址:https://app.runwayml.com

【AiBase提要】
?? 語音功能驚艷登場(chǎng):Runway最新推出的文字生成語音功能，在英文表達(dá)方面展現(xiàn)出驚人的自然豐富情感。
?? 多模型選擇，點(diǎn)數(shù)消耗低:該功能提供多種語音模型，僅需右上角點(diǎn)數(shù)即可生成長(zhǎng)時(shí)間可用的語音。
?? 中文語音仍存問題:盡管英文效果驚艷，中文語音仍存在外國(guó)口音問題，可能需要解決。

超強(qiáng)小說生成工具M(jìn)idreal AI 情節(jié)有邏輯還具有互動(dòng)能力

小說生成工具M(jìn)idreal AI強(qiáng)于其他LLM直接生成的小說，以內(nèi)存跨越技術(shù)和長(zhǎng)篇寫作能力為特色，用戶可在關(guān)鍵節(jié)點(diǎn)選擇劇情走向，獲得具有邏輯和互動(dòng)能力的小說。

體驗(yàn)地址:discord.gg/ReKvgchE3P

【AiBase提要:】
?? 內(nèi)存跨越技術(shù):Midreal AI采用內(nèi)存跨越技術(shù)，實(shí)現(xiàn)幾乎無限的記憶保留，確保長(zhǎng)期無縫連接的游戲體驗(yàn)。
?? 長(zhǎng)篇寫作能力:具備長(zhǎng)篇寫作能力，保持?jǐn)⑹逻B貫和引人入勝，為用戶提供高質(zhì)量的閱讀體驗(yàn)。
?? 中英文支持:Midreal AI支持中文和英文，為喜愛閱讀和寫作的用戶提供全新的創(chuàng)作體驗(yàn)。

CSM ai推實(shí)時(shí)草圖轉(zhuǎn)3D功能

CSM AI最新推出的實(shí)時(shí)繪圖工具進(jìn)化，用戶可通過簡(jiǎn)單草圖生成3D模型，并導(dǎo)出至3D軟件，在兒童游戲和專業(yè)3D創(chuàng)意工作中具備廣泛應(yīng)用。

體驗(yàn)地址:https://3d.csm.ai/canvas

【AiBase提要】
?? 實(shí)時(shí)草圖轉(zhuǎn)3D: CSM AI推出的工具允許用戶通過簡(jiǎn)單的草圖實(shí)時(shí)生成3D模型。
?? 導(dǎo)出至3D軟件: 生成的3D模型可直接導(dǎo)出到其他3D軟件中進(jìn)行進(jìn)一步編輯和應(yīng)用。
?? 免費(fèi)體驗(yàn)功能: 用戶可以通過訪問體驗(yàn)地址免費(fèi)嘗試這一功能，為創(chuàng)意設(shè)計(jì)提供便利。

????????大模型動(dòng)態(tài)

谷歌推視覺語言模型PixelLLM

通過與加州大學(xué)圣迭戈分校合作，谷歌AI研究團(tuán)隊(duì)推出PixelLLM，實(shí)現(xiàn)了細(xì)粒度定位和視覺-語言對(duì)齊。該模型通過在語言模型的每個(gè)輸出單詞與像素位置建立密集對(duì)齊，成功解決了大語言模型在定位任務(wù)中的挑戰(zhàn)。

項(xiàng)目體驗(yàn)網(wǎng)址:https://top.aibase.com/tool/pixelllm

論文網(wǎng)址:https://arxiv.org/abs/2312.09237

【AiBase提要:】
?? PixelLLM采用密集對(duì)齊策略，成功解決了大型語言模型在細(xì)粒度定位任務(wù)中的挑戰(zhàn)。
?? 在密集目標(biāo)描述、位置條件描述和引用定位等視覺任務(wù)中，PixelLLM表現(xiàn)出卓越性能，取得最先進(jìn)的結(jié)果。
?? 通過引入新的視覺-語言模型，PixelLLM為實(shí)現(xiàn)更精確的視覺-語言對(duì)齊和定位提供了新的可能性。

元象開源高性能大模型XVERSE-65B-2底座版

元象宣布開源XVERSE-65B-2底座版，強(qiáng)化代碼和數(shù)學(xué)能力，保持生成創(chuàng)作、角色扮演等能力，為生態(tài)貢獻(xiàn)“文理兼修、大有可為”的大模型。

【AiBase提要:】
?? XVERSE-65B-2通過綜合優(yōu)化器狀態(tài)和學(xué)習(xí)率策略進(jìn)行Continual Pre-Training，總訓(xùn)練token量達(dá)3.2萬億。
?? 模型支持40多種語言，上下文窗口為16K，在六個(gè)維度11項(xiàng)標(biāo)準(zhǔn)中八成超越GPT3.5。
?? XVERSE-65B顯著提升大模型的理解、生成、邏輯和記憶等能力，是國(guó)內(nèi)最早開源的650億參數(shù)免費(fèi)商用模型。

項(xiàng)目地址:

Github:https://github.com/xverse-ai/XVERSE-65B
Hugging Face:https://huggingface.co/xverse/XVERSE-65B-2
ModelScope魔搭:https://modelscope.cn/models/xverse/XVERSE-65B-2

UIUC清華聯(lián)手發(fā)布全新代碼大模型Magicoder

UIUC和清華合作推出的Magicoder是一款在代碼生成領(lǐng)域表現(xiàn)出色的大型語言模型，僅使用了7B參數(shù)，并以全面開源的方式分享了其代碼、權(quán)重和數(shù)據(jù)。

論文地址:https://arxiv.org/pdf/2312.02120.pdf

【AiBase提要:】
?? 模型介紹: UIUC和清華合作推出的Magicoder，在代碼生成領(lǐng)域以不到7B參數(shù)媲美頂級(jí)模型，并全面開源其代碼、權(quán)重和數(shù)據(jù)。
??? OSS-INSTRUCT方法: Magicoder采用OSS-INSTRUCT方法，從開源代碼中獲取靈感，生成多樣、真實(shí)和可控的編碼指令數(shù)據(jù)，注重真實(shí)性對(duì)于指令調(diào)整的重要性。
?? 性能表現(xiàn): 在Python、其他編程語言以及數(shù)據(jù)科學(xué)庫(kù)領(lǐng)域，Magicoder表現(xiàn)出色，在DS-1000dataset上改善了8.3個(gè)百分點(diǎn)，展現(xiàn)了在實(shí)際用例中的潛力。

音樂生成深度學(xué)習(xí)模型StemGen

字節(jié)跳動(dòng)AI研究團(tuán)隊(duì)推出StemGen項(xiàng)目，采用非自回歸、基于Transformer的模型，通過聽取音樂上下文生成音樂，在音頻質(zhì)量和音樂與上下文協(xié)調(diào)性方面取得競(jìng)爭(zhēng)性成果。

項(xiàng)目網(wǎng)址:https://julian-parker.github.io/stemgen/

論文網(wǎng)址:https://arxiv.org/abs/2312.08723

【AiBase提要】
?? 革新性方法: StemGen采用非自回歸、基于Transformer的模型，通過聽取音樂上下文生成音樂，突破傳統(tǒng)抽象條件的模型。
?? 模型效果驗(yàn)證: 采用標(biāo)準(zhǔn)指標(biāo)和主觀測(cè)試證明StemGen模型在音頻質(zhì)量和音樂與上下文的強(qiáng)大協(xié)調(diào)性方面表現(xiàn)出競(jìng)爭(zhēng)性。
?? 技術(shù)進(jìn)步: 結(jié)合圖像和語言處理技術(shù)，以端到端方式推動(dòng)深度學(xué)習(xí)音頻生成，提出非自回歸、基于Transformer的架構(gòu)訓(xùn)練模型的新范例。

?????????聚焦開發(fā)者

創(chuàng)新3D技術(shù)Gaussian-SLAM 通過分析視頻重建逼真的3D場(chǎng)景

通過分析視頻流中的圖像，Gaussian-SLAM技術(shù)能夠?qū)崟r(shí)渲染并重建逼真的3D模型，為自動(dòng)駕駛、機(jī)器人導(dǎo)航、增強(qiáng)現(xiàn)實(shí)等領(lǐng)域提供新的可能性。

【AiBase提要:】
?? 光學(xué)真實(shí)的渲染: Gaussian-SLAM以高度真實(shí)的方式重建和渲染真實(shí)世界和合成場(chǎng)景。
?? 高斯斑點(diǎn)場(chǎng)景表示: 使用高斯斑點(diǎn)作為場(chǎng)景的表示單位，與傳統(tǒng)的點(diǎn)云或網(wǎng)格表示不同。
?? 適用于單目RGBD輸入: 針對(duì)單目RGBD輸入數(shù)據(jù)進(jìn)行優(yōu)化，適用于多種場(chǎng)景。

論文地址:https://ivi.fnwi.uva.nl/cv/paper/GaussianSLAM.pdf

項(xiàng)目地址:https://github.com/VladimirYugay/Gaussian-SLAM

演示地址:https://vladimiryugay.github.io/gaussian_slam/

（舉報(bào)）

相關(guān)推薦
大家在看

關(guān)鍵詞：

Apollo

【騰訊云】11.11云上盛惠！云服務(wù)器首年1.8折起，買1年送3個(gè)月！

11.11云上盛惠！海量產(chǎn)品 · 輕松上云！云服務(wù)器首年1.8折起，買1年送3個(gè)月！超值優(yōu)惠，性能穩(wěn)定，讓您的云端之旅更加暢享。快來騰訊云選購(gòu)吧！

Docker容器鏡像
去看看

Docker容器鏡像 60元/15天

爆款產(chǎn)品組合購(gòu)
去看看

爆款產(chǎn)品組合購(gòu) 低至1元

騰訊云x NVIDIA加速計(jì)劃
去看看

騰訊云x NVIDIA加速計(jì)劃最高獲贈(zèng)10萬元扶持基金

2核2G云服務(wù)器
去看看

2核2G云服務(wù)器 112元/1年

查看更多相關(guān)信息>>

騰訊云 12-20

廣告
劍指谷歌！OpenAI宣布ChatGPT搜索功能正式上線

北京時(shí)間今天凌晨，OpenAI宣布ChatGPT搜索功能正式上線，該功能覆蓋ChatGPT網(wǎng)頁(yè)版、手機(jī)、桌面應(yīng)用。該功能只有付費(fèi)的ChatGPTPlus和Team用戶，以及SearchGPT候補(bǔ)名單用戶可以訪問。從ChatGPT搜索功能開始，OpenAI可能對(duì)搜索巨頭谷歌構(gòu)成重大威脅。

?ChatGPT ?搜索功能 ?OpenAI
薦突發(fā)！OpenAI正式發(fā)布ChatGPT網(wǎng)絡(luò)搜索，徹底顛覆谷歌！

今天凌晨1點(diǎn)，OpenAI正式發(fā)布了ChatGPT網(wǎng)絡(luò)搜索功能，能實(shí)時(shí)、快速獲取附帶相關(guān)網(wǎng)頁(yè)來源鏈接的答案。用戶通過自然語言就能獲取各種網(wǎng)絡(luò)信息，例如，幫我看看今天華爾街日?qǐng)?bào)的頭條新聞是什么;雅虎體育板塊中的NBA熱門新聞?dòng)心男?CNBC的熱門財(cái)經(jīng)新聞報(bào)道了哪些內(nèi)容，ChatGPT都能快速幫你找到這些并附帶原始鏈接。ChatGPTPlus和Team用戶已經(jīng)可以使用，未來搜索功能會(huì)開放給免費(fèi)?

?OpenAI ?ChatGPT
AI日?qǐng)?bào)：字節(jié)旗下AI助手豆包開啟視頻生成內(nèi)測(cè)；OpenAI買下Chat.com域名；超清AI圖像生成模型FLUX 1.1 Pro Ultra發(fā)布

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI成功收購(gòu)Chat.com域名OpenAI成功收購(gòu)知名老牌域名Chat.com，進(jìn)一步豐富了其在網(wǎng)絡(luò)領(lǐng)域的資產(chǎn)。公司正積極推進(jìn)產(chǎn)品測(cè)試與上線工作，未來可能拓展至教育和陪伴等多種應(yīng)用場(chǎng)景，提升用戶體驗(yàn)。

?人工智能 ?OpenAI ?ChatGPT
薦ChatGPT搜索搞不定勾股定理新證明，但國(guó)產(chǎn)AI可以！

萬萬沒想到，現(xiàn)在的國(guó)產(chǎn)AI搜索，竟然讓我成功讀懂了陶哲軒推薦的論文。每個(gè)用戶都有機(jī)會(huì)成為寶典的主理人，內(nèi)容方向幾乎是覆蓋了所有的行業(yè)和領(lǐng)域。

?ChatGPT
薦剛剛，OpenAI開放ChatGPT Windows版本，可像Office那樣使用了

今天凌晨OpenAI宣布向所有ChatGPTPlus、Enterprise、Team和Edu用戶，提供Windows桌面應(yīng)用早期版本。用戶可在微軟的應(yīng)用商店中下載，安裝完成后通過AltSpace快捷鍵就能迅速啟用，提供文件分析、搜索對(duì)話、文本生成等功能，使用體驗(yàn)相當(dāng)絲滑和Office一樣。系統(tǒng)要求Windows1017763.0以上版本。

?ChatGPT
薦ChatGPT搜索？也就那樣

OpenAI終于正式上線搜索功能。當(dāng)?shù)貢r(shí)間10月31日，OpenAI宣布“ChatGPT搜索”上線，開放給ChatGPTPlus的訂閱用戶。但至于這個(gè)未來屬不屬于OpenAI，就不一定了。

?ChatGPT ?搜索功能 ?OpenAI
OpenAI最新53頁(yè)論文：ChatGPT看人下菜碟，對(duì)“小美”比“小帥”更友好

AI對(duì)待每個(gè)人類都一視同仁嗎?現(xiàn)在OpenAI用53頁(yè)的新論文揭示:ChatGPT真的會(huì)看人下菜碟。根據(jù)用戶的名字就自動(dòng)推斷出性別、種族等身份特征，并重復(fù)訓(xùn)練數(shù)據(jù)中的社會(huì)偏見。如果你也在ChatGPT中開啟了長(zhǎng)期記憶功能，推薦嘗試一下，歡迎在評(píng)論區(qū)分享結(jié)果。

?ChatGPT
薦AI日?qǐng)?bào)：字節(jié)推AI模型社區(qū)平臺(tái)爐米Lumi；神秘大模型“小熊貓”身份揭曉；ChatGPT高級(jí)語音模式登陸Mac

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、字節(jié)跳動(dòng)推出AI模型社區(qū)平臺(tái):爐米Lumi類似Liblib和CIvitai字節(jié)跳動(dòng)最新推出的AI模型分享社區(qū)平臺(tái)爐米Lumi，展示其在AI領(lǐng)域的全面布局策略。該解決方案包括全鏈路優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù)

?Lumi
薦AI日?qǐng)?bào)：復(fù)旦、百度新模型可生成1小時(shí)長(zhǎng)視頻；全新ChatGPT Windows版本上線；NotebookLM又上2個(gè)新功能

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、面向付費(fèi)用戶!全新ChatGPTWindows版本上線:快捷鍵即可召喚AI助手OpenAI推出了全新的ChatGPTWindows應(yīng)用早期版，為付費(fèi)用戶提供便捷的AI助手體驗(yàn)。營(yíng)收主要來自Robotaxi業(yè)務(wù)，2024年上半年同比增長(zhǎng)86%。

?Hallo2
剛剛，ChatGPT新增重磅功能！能打造自己的聊天數(shù)據(jù)庫(kù)了

今天凌晨3點(diǎn)，OpenAI宣布ChatGPT新增重磅功能——聊天記錄搜索。用戶可以快速一鍵搜索自己的聊天記錄，或者從中斷的地方繼續(xù)聊天了。免費(fèi)用戶將從下個(gè)月開始獲得訪問權(quán)限。

?ChatGPT

Editor Usage:監(jiān)控和管理您的Cursor編輯器使用情況

Editor Usage 是一款為macOS設(shè)計(jì)的菜單欄應(yīng)用程序，旨在幫助用戶監(jiān)控和管理他們的Cursor編輯器使用情況。該應(yīng)用程序能夠追蹤高級(jí)、普通和特殊請(qǐng)求的使用情況，并在接近使用限制時(shí)提供警告。它允許用戶從菜單欄快速查看剩余的請(qǐng)求次數(shù)，從而確保用戶始終了解他們的使用情況，并避免因超出限制而受到影響。這款應(yīng)用的主要優(yōu)點(diǎn)包括詳細(xì)的使用監(jiān)控、可定制的警告設(shè)置以及快速便捷的訪問方式。它適合需要管理多個(gè)項(xiàng)目或希望實(shí)時(shí)監(jiān)控請(qǐng)求使用情況的用戶。

監(jiān)控管理編輯器

Yepic Studio:在線視頻制作平臺(tái)，提供AI虛擬形象和視頻制作服務(wù)。

Yepic Studio是一個(gè)在線視頻制作平臺(tái)，它通過使用人工智能技術(shù)，允許用戶創(chuàng)建和編輯視頻內(nèi)容，包括制作會(huì)說話的照片視頻、專業(yè)視頻以及AI虛擬形象。該平臺(tái)的主要優(yōu)點(diǎn)在于能夠快速生成高質(zhì)量的視頻內(nèi)容，同時(shí)提供個(gè)性化的AI虛擬形象，滿足不同商業(yè)需求。產(chǎn)品背景信息顯示，Yepic Studio旨在為內(nèi)容創(chuàng)作者和企業(yè)提供一個(gè)簡(jiǎn)單易用的在線視頻制作工具，以提高內(nèi)容生產(chǎn)的效率和質(zhì)量。關(guān)于價(jià)格，頁(yè)面顯示用戶為'Guest'且'Credits'為0，暗示可能有免費(fèi)試用或基礎(chǔ)免費(fèi)服務(wù)，具體定價(jià)需進(jìn)一步查看。

視頻編輯 AI虛擬形象在線視頻制作

Jumper:是一個(gè)強(qiáng)大的AI視頻搜索工具，幫助編輯者快速找到視頻素材。

Jumper是一個(gè)專為視頻編輯者設(shè)計(jì)的AI搜索工具，它能夠讓用戶在眨眼間搜索自己的視頻素材。Jumper集成到了用戶的非線性編輯器（NLE）中，無需離開編輯工作流程即可找到所需素材。Jumper支持多語言搜索，能夠快速定位特定詞匯或短語在視頻中的位置，支持多機(jī)位和同步剪輯，并且完全在設(shè)備上運(yùn)行，保護(hù)用戶隱私，無需上傳素材至云端。Jumper的主要優(yōu)點(diǎn)包括快速搜索、完全離線工作、保護(hù)隱私和兼容性強(qiáng)。產(chǎn)品背景信息顯示，Jumper由Witchcraft Software AB開發(fā)，旨在通過AI技術(shù)提高視頻編輯的效率和創(chuàng)造力。

AI 視頻編輯搜索

CogVideoX1.5-5B-SAT:開源視頻生成模型，支持10秒視頻和更高分辨率。

CogVideoX1.5-5B-SAT是由清華大學(xué)知識(shí)工程與數(shù)據(jù)挖掘團(tuán)隊(duì)開發(fā)的開源視頻生成模型，是CogVideoX模型的升級(jí)版。該模型支持生成10秒視頻，并支持更高分辨率的視頻生成。模型包含Transformer、VAE和Text Encoder等模塊，能夠根據(jù)文本描述生成視頻內(nèi)容。CogVideoX1.5-5B-SAT模型以其強(qiáng)大的視頻生成能力和高分辨率支持，為視頻內(nèi)容創(chuàng)作者提供了一個(gè)強(qiáng)大的工具，尤其在教育、娛樂和商業(yè)領(lǐng)域有著廣泛的應(yīng)用前景。

視頻生成文本到視頻高分辨率

Ask The Post AI:華盛頓郵報(bào)的AI問答產(chǎn)品

Ask The Post AI是華盛頓郵報(bào)推出的一款基于人工智能的產(chǎn)品，它允許讀者就自2016年以來發(fā)布的所有報(bào)道提出問題。該產(chǎn)品利用生成式AI技術(shù)和對(duì)話格式，依托華盛頓郵報(bào)長(zhǎng)期以來基于事實(shí)、深入報(bào)道的新聞傳統(tǒng)，以新的方式取悅并通知讀者。Ask The Post AI通過機(jī)器學(xué)習(xí)團(tuán)隊(duì)對(duì)Climate Answers工具的數(shù)據(jù)進(jìn)行提煉，優(yōu)化了如何檢索和匹配自2016年以來新聞室發(fā)布的所有報(bào)道中與用戶查詢相關(guān)的相關(guān)文章。

AI 問答新聞

Mistral Moderation API:AI內(nèi)容審核服務(wù)，保護(hù)下游部署安全。

Mistral Moderation API是Mistral AI推出的內(nèi)容審核服務(wù)，旨在幫助用戶檢測(cè)和過濾不受歡迎的文本內(nèi)容。該API是Le Chat中使用的審核服務(wù)的同一技術(shù)，現(xiàn)在對(duì)外開放，以便用戶可以根據(jù)特定的應(yīng)用和安全標(biāo)準(zhǔn)定制和使用這一工具。該模型是一個(gè)基于LLM（大型語言模型）的分類器，能夠?qū)⑽谋据斎敕诸惖?個(gè)預(yù)定義的類別中。Mistral AI的這一API支持原生多語言，特別針對(duì)阿拉伯語、中文、英語、法語、德語、意大利語、日語、韓語、葡萄牙語、俄語和西班牙語進(jìn)行了訓(xùn)練。該API的主要優(yōu)點(diǎn)包括提高審核的可擴(kuò)展性和魯棒性，以及通過技術(shù)文檔提供的詳細(xì)政策定義和啟動(dòng)指南，幫助用戶有效實(shí)施系統(tǒng)級(jí)的安全防護(hù)。

內(nèi)容審核 AI 多語言支持

Medio AI:AI編輯工具，助力企業(yè)視頻營(yíng)銷本地化。

Medio AI是一個(gè)為企業(yè)提供AI編輯工具的平臺(tái)，專注于視頻翻譯和視頻配音，幫助企業(yè)無畏全球擴(kuò)張，實(shí)現(xiàn)視頻營(yíng)銷的本地化。產(chǎn)品背景信息顯示，Medio AI旨在幫助企業(yè)探索更多海外市場(chǎng)，通過AI技術(shù)提升視頻編輯效率，增強(qiáng)產(chǎn)品在國(guó)際市場(chǎng)上的競(jìng)爭(zhēng)力。產(chǎn)品的主要優(yōu)點(diǎn)包括無需下載、在線使用、一鍵去除視頻水印、產(chǎn)品翻譯、視頻配音等。價(jià)格方面，Medio AI提供免費(fèi)試用，并根據(jù)不同的功能需求提供不同的付費(fèi)版本。

AI編輯視頻營(yíng)銷本地化

PodExtra AI:釋放播客的力量，用AI提升播客收聽體驗(yàn)

PodExtra AI是一款先進(jìn)的AI工具，專為播客收聽和知識(shí)獲取設(shè)計(jì)。它通過生成播客內(nèi)容的摘要、思維導(dǎo)圖、大綱、亮點(diǎn)和要點(diǎn)，幫助用戶快速把握播客的核心內(nèi)容。產(chǎn)品背景信息顯示，播客愛好者平均每周消費(fèi)超過8集，全球有超過400萬的節(jié)目可供選擇。PodExtra AI通過AI技術(shù)，使得用戶能夠快速瀏覽內(nèi)容，節(jié)省時(shí)間，提高效率。產(chǎn)品定位于幫助用戶從海量播客內(nèi)容中快速獲取有價(jià)值的信息，特別適合時(shí)間緊張但希望從播客中獲取知識(shí)的人群。

播客 AI 知識(shí)管理

語鯨:，智能語言處理平臺(tái)

語鯨是一個(gè)專注于語言處理的平臺(tái)，它利用先進(jìn)的自然語言處理技術(shù)，為用戶提供文本分析、翻譯、校對(duì)等服務(wù)。產(chǎn)品背景信息顯示，語鯨旨在幫助用戶提高寫作效率和質(zhì)量，特別是在多語言環(huán)境中。語鯨的價(jià)格定位尚未明確，但考慮到其提供的服務(wù)，可能會(huì)有免費(fèi)試用和付費(fèi)版本。

自然語言處理文本分析翻譯

CR-Mentor:AI驅(qū)動(dòng)的代碼審查導(dǎo)師，提升代碼質(zhì)量和審查效率。

CR-Mentor AI CodeReview Mentor是一個(gè)基于人工智能的代碼審查工具，它通過積累的最佳實(shí)踐知識(shí)庫(kù)和大型語言模型（LLM）分析，為主流編程語言提供智能代碼審查。該產(chǎn)品支持自定義的代碼審查標(biāo)準(zhǔn)，能夠?yàn)閱蝹€(gè)文件代碼變更提供專業(yè)評(píng)分和改進(jìn)建議，并通過LLM生成全面的審查報(bào)告，包括代碼走查、變更描述和時(shí)序圖。它與GitHub工作流程深度集成，實(shí)現(xiàn)自動(dòng)化代碼審查，支持多語言反饋，幫助整個(gè)團(tuán)隊(duì)提升代碼質(zhì)量和審查效率。

代碼審查人工智能 GitHub集成

Srcbook:開源、自托管、AI驅(qū)動(dòng)的應(yīng)用構(gòu)建器。

Srcbook是一個(gè)開源、自托管的AI驅(qū)動(dòng)應(yīng)用構(gòu)建器，它允許用戶快速構(gòu)建和部署各種應(yīng)用程序。產(chǎn)品背景信息顯示，Srcbook旨在提供一個(gè)平臺(tái)，讓開發(fā)者和非技術(shù)用戶都能夠輕松地構(gòu)建應(yīng)用程序，從而提高生產(chǎn)力和創(chuàng)新能力。它支持多種應(yīng)用場(chǎng)景，如項(xiàng)目管理工具、音樂發(fā)現(xiàn)頁(yè)面、技術(shù)文檔網(wǎng)站等。Srcbook的主要優(yōu)點(diǎn)包括開源性、靈活性和易用性，用戶可以根據(jù)自己的需求定制和擴(kuò)展功能。

開源自托管 AI

ReCapture:用戶視頻的生成性視頻攝像機(jī)控制

ReCapture是一種從單一用戶提供的視頻生成新視頻和新穎攝像機(jī)軌跡的方法。該技術(shù)允許我們從完全不同的角度重新生成源視頻，并帶有電影級(jí)別的攝像機(jī)運(yùn)動(dòng)。ReCapture通過使用多視圖擴(kuò)散模型或基于深度的點(diǎn)云渲染生成帶有新攝像機(jī)軌跡的嘈雜錨視頻，然后通過我們提出的掩蔽視頻微調(diào)技術(shù)將錨視頻重新生成為干凈且時(shí)間上一致的重新角度視頻。這種技術(shù)的重要性在于它能夠利用視頻模型的強(qiáng)大先驗(yàn)，將近似的視頻重新生成為時(shí)間上一致且美觀的視頻。

視頻生成攝像機(jī)控制多視圖擴(kuò)散模型

AI Tattoo Generator.net:快速創(chuàng)建個(gè)性化紋身設(shè)計(jì)

AI Tattoo Generator是一個(gè)利用人工智能技術(shù)幫助用戶快速創(chuàng)建個(gè)性化紋身設(shè)計(jì)的在線平臺(tái)。該平臺(tái)使用先進(jìn)的機(jī)器學(xué)習(xí)算法，根據(jù)用戶輸入生成具有各種風(fēng)格的現(xiàn)實(shí)感紋身概念圖，確保用戶的想法以視覺上引人入勝的方式呈現(xiàn)。它不僅能夠提供即時(shí)的設(shè)計(jì)結(jié)果，還能讓用戶根據(jù)自己的偏好進(jìn)一步定制和細(xì)化設(shè)計(jì)，滿足個(gè)性化需求。

AI設(shè)計(jì) 紋身個(gè)性化

Unfaked:AI生成的逼真圖片庫(kù)

Unfaked是一個(gè)提供由人工智能生成的逼真圖片的網(wǎng)站，這些圖片幾乎可以以假亂真。用戶可以免費(fèi)下載并自由使用這些圖片。每周都會(huì)更新更多的圖片。這個(gè)平臺(tái)的重要性在于它為設(shè)計(jì)師、內(nèi)容創(chuàng)作者和營(yíng)銷人員提供了一個(gè)免費(fèi)的資源庫(kù)，他們可以在這里找到高質(zhì)量的圖片資源，而無需擔(dān)心版權(quán)問題。

AI生成免費(fèi)圖片版權(quán)免費(fèi)

ComfyUI-GIMM-VFI:基于GIMM-VFI的ComfyUI幀插值工具

ComfyUI-GIMM-VFI是一個(gè)基于GIMM-VFI算法的幀插值工具，使用戶能夠在圖像和視頻處理中實(shí)現(xiàn)高質(zhì)量的幀插值效果。該技術(shù)通過在連續(xù)幀之間插入新的幀來提高視頻的幀率，從而使得動(dòng)作看起來更加流暢。這對(duì)于視頻游戲、電影后期制作和其他需要高幀率視頻的應(yīng)用場(chǎng)景尤為重要。產(chǎn)品背景信息顯示，它是基于Python開發(fā)的，并且依賴于CuPy庫(kù)，特別適用于需要進(jìn)行高性能計(jì)算的場(chǎng)景。

幀插值視頻處理圖像處理

5ire:簡(jiǎn)單易用，釋放AI的強(qiáng)大力量

5ire是一個(gè)以簡(jiǎn)潔和用戶友好為核心的AI產(chǎn)品，旨在讓即使是初學(xué)者也能輕松利用大型語言模型。它支持多種文檔格式的解析和向量化，具備本地知識(shí)庫(kù)、使用分析、提示庫(kù)、書簽和快速關(guān)鍵詞搜索等功能。作為一個(gè)開源項(xiàng)目，5ire提供免費(fèi)下載，并且提供了按需付費(fèi)的大型語言模型API服務(wù)。

AI 大型語言模型開源

AI Hear:一款在您電腦本地運(yùn)行的私有軟件，提供多語種實(shí)時(shí)翻譯。

AI Hear是一款在電腦本地運(yùn)行的私有軟件，它通過一鍵開啟多語種實(shí)時(shí)翻譯功能，幫助用戶管理音頻、譯文和時(shí)間軸。產(chǎn)品不收集數(shù)據(jù)，保護(hù)用戶隱私。它適用于多種場(chǎng)景，如線上會(huì)議、網(wǎng)課播客、游戲直播等，并且完全本地運(yùn)行，相比市面上的實(shí)時(shí)翻譯產(chǎn)品更具性價(jià)比。

實(shí)時(shí)翻譯音頻管理隱私保護(hù)

SD Image:使用最新的Stable Diffusion 3.5模型生成高質(zhì)量圖像。

SD Image的Stable Diffusion 3.5 Image Generator是一個(gè)在線圖像生成器，它利用最新的Stable Diffusion 3.5模型，包括Medium, Large, Large Turbo，來生成高質(zhì)量的圖像。這項(xiàng)技術(shù)的重要性在于它能夠通過文本提示（prompt）快速生成圖像，為設(shè)計(jì)師、藝術(shù)家和創(chuàng)意工作者提供靈感和便利。產(chǎn)品背景信息顯示，SD Image是一個(gè)在線平臺(tái)，用戶可以通過它找到靈感、生成圖像、探索不同的prompt和模型。目前，該產(chǎn)品提供免費(fèi)試用，適合需要快速生成圖像的用戶。

圖像生成 AI藝術(shù) 創(chuàng)意工具

AI Homeworkify:下一代AI作業(yè)助手，免費(fèi)獲取作業(yè)答案

AI Homeworkify是一個(gè)基于人工智能的在線問答平臺(tái)，旨在幫助學(xué)生通過提供詳細(xì)的答案和解題步驟來學(xué)習(xí)和理解各種學(xué)術(shù)問題。該平臺(tái)不涉及版權(quán)侵犯，注重教育平等，提供免費(fèi)、即時(shí)的作業(yè)幫助，支持多種學(xué)科和語言。AI Homeworkify的主要優(yōu)點(diǎn)包括完全免費(fèi)、無需注冊(cè)、即時(shí)答案、全天候服務(wù)、多設(shè)備兼容、隱私保護(hù)和逐步解決方案。產(chǎn)品背景信息顯示，AI Homeworkify致力于通過技術(shù)手段減少教育不平等，為全球?qū)W生提供免費(fèi)的優(yōu)質(zhì)學(xué)習(xí)輔助服務(wù)。

AI 教育作業(yè)幫助

AI Voice Lab:在線將文字轉(zhuǎn)換為逼真的語音

AI Voice Lab免費(fèi) AI 文字轉(zhuǎn)語音神器是一個(gè)利用最新的類GPT AI語音模型技術(shù)，提供超級(jí)逼真的配音結(jié)果，支持20+種語言和100+種聲音，每天提供免費(fèi)使用次數(shù)，適用于視頻、音頻制作等多種場(chǎng)景，提高內(nèi)容吸引力。

AI語音文字轉(zhuǎn)語音配音

今日大家都在搜的詞：

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

AI視野：百度Apollo開放平臺(tái)9.0發(fā)布；OpenAI公布ChatGPT安全框架；Etched AI推AI推理加速芯片Sohu；美圖云修Pro版正式發(fā)布；Runway上線文字生成語音功能

今日大家都在搜的詞：

熱文

站長(zhǎng)商機(jī)

AI視野：百度Apollo開放平臺(tái)9.0發(fā)布；OpenAI公布ChatGPT安全框架；Etched AI推AI推理加速芯片Sohu；美圖云修Pro版正式發(fā)布；Runway上線文字生成語音功能