英特爾團(tuán)隊(duì)提出L-MAGIC新技術(shù) 通過結(jié)合語言模型讓圖像擴(kuò)散模型生成高質(zhì)量360度場景

2024-06-11 13:59 · 稿源：站長之家

站長之家（ChinaZ.com）6月11日消息:在CVPR2024上，美國英特爾研究院的蔡志鵬博士及其團(tuán)隊(duì)提出了一種名為L-MAGIC（Language Model Assisted Generation of Images with Coherence）的新技術(shù)。這項(xiàng)技術(shù)通過結(jié)合語言模型和圖像擴(kuò)散模型，實(shí)現(xiàn)了高質(zhì)量、多模態(tài)、零樣本泛化的360度場景生成。

核心特點(diǎn):

結(jié)合語言模型和擴(kuò)散模型:L-MAGIC利用自然圖像連接不同模態(tài)的輸入，并通過條件擴(kuò)散模型如ControlNet從各種模態(tài)輸入生成自然圖像。
迭代變形和填充:在獲得自然圖像后，L-MAGIC通過迭代變形（warping）和填充(inpainting)生成360度場景的多個(gè)視角，使用基于擴(kuò)散的圖像填充模型(如Stable Diffusion v2)生成缺失像素。
語言模型控制:L-MAGIC使用語言模型自動控制擴(kuò)散模型，根據(jù)每個(gè)視角需要生成的場景內(nèi)容，有效保持語言及擴(kuò)散模型的泛化性。
多樣化場景生成:L-MAGIC能夠生成多樣化的全局場景結(jié)構(gòu)，無需微調(diào)，從而實(shí)現(xiàn)多樣化場景的高質(zhì)量生成。
多模態(tài)輸入:除了自然圖像，L-MAGIC還能接受文字、手繪草圖、深度圖等多種模態(tài)的輸入。

實(shí)驗(yàn)結(jié)果表明:

L-MAGIC在圖像到360度場景生成及文字到360度場景生成任務(wù)中均達(dá)到了SOTA（State of the Art）。

能夠生成具有多樣化360度場景結(jié)構(gòu)的全景圖，并且能夠平滑地完成360度閉環(huán)。

除了文字和自然圖像，L-MAGIC還能夠使用ControlNet接受多樣化的輸入，如深度圖、設(shè)計(jì)草圖等。

技術(shù)應(yīng)用:

L-MAGIC還能夠利用深度估計(jì)模型生成場景的沉浸式視頻和三維點(diǎn)云，為場景理解和可視化提供了更多可能性。

項(xiàng)目主頁：https://zhipengcai.github.io/MMPano/

（舉報(bào)）

相關(guān)推薦
大家在看

關(guān)鍵詞：

英特爾

【騰訊云】11.11云上盛惠！云服務(wù)器首年1.8折起，買1年送3個(gè)月！

11.11云上盛惠！海量產(chǎn)品 · 輕松上云！云服務(wù)器首年1.8折起，買1年送3個(gè)月！超值優(yōu)惠，性能穩(wěn)定，讓您的云端之旅更加暢享。快來騰訊云選購吧！

Docker容器鏡像
去看看

Docker容器鏡像 60元/15天

爆款產(chǎn)品組合購
去看看

爆款產(chǎn)品組合購低至1元

騰訊云x NVIDIA加速計(jì)劃
去看看

騰訊云x NVIDIA加速計(jì)劃最高獲贈10萬元扶持基金

2核2G云服務(wù)器
去看看

2核2G云服務(wù)器 112元/1年

查看更多相關(guān)信息>>

騰訊云 12-20

廣告
薦剛剛，OpenAI發(fā)布sCM提升50倍效率，擴(kuò)散模型重大技術(shù)突破！

OpenAI發(fā)布了全新擴(kuò)散模型方法sCM，僅需2步就能生成高質(zhì)量圖片、3D模型等實(shí)現(xiàn)50倍時(shí)鐘加速，尤其是在高分辨率任務(wù)上相當(dāng)出色。通過sCM訓(xùn)練了一個(gè)15億參數(shù)的模型，在單個(gè)A100GPU上無需任何推理優(yōu)化0.11秒內(nèi)就能生成內(nèi)容。把這個(gè)技術(shù)用在Sora，應(yīng)該就快來了吧?目前，OpenAI已經(jīng)分享了該論文方法，是由兩位華人提出來的。

?OpenAI ?擴(kuò)散模型 ?高質(zhì)量圖片
百萬魯棒數(shù)據(jù)訓(xùn)練，3D場景大語言模型新SOTA！IIT等發(fā)布Robin3D

【新智元導(dǎo)讀】Robin3D通過魯棒指令數(shù)據(jù)生成引擎生成的大規(guī)模數(shù)據(jù)進(jìn)行訓(xùn)練，以提高模型在3D場景理解中的魯棒性和泛化能力，在多個(gè)3D多模態(tài)學(xué)習(xí)基準(zhǔn)測試中取得了優(yōu)異的性能，超越了以往的方法，且無需針對特定任務(wù)的微調(diào)。多模態(tài)大語言模型以文本模態(tài)為基礎(chǔ)，將其它各種模態(tài)對齊至語言模型的語義空間，從實(shí)現(xiàn)多模態(tài)的理解和對話能力。這種大幅的提升體現(xiàn)了對抗性數(shù)據(jù)對模型識別能力的提升。

?大語言模型 ?Robin3D
榮耀MagicOS 9.0開啟內(nèi)測招募：Magic6/V3系列等5款機(jī)型可升級

榮耀官方預(yù)告，MagicOS9.0發(fā)布會及開發(fā)者大會將于10月23日-10月24日在北京舉行，這是行業(yè)首個(gè)搭載跨應(yīng)用開放生態(tài)智能體的全場景AI操作系統(tǒng)?，F(xiàn)在榮耀正式開啟MagicOS9.0內(nèi)測招募活動，包括榮耀MagicV3、榮耀MagicVs3、榮耀MagicV2系列、榮耀Magic6系列、榮耀Magic5系列等等。未來MagicOS9.0呈現(xiàn)的AI能力不僅會在榮耀高端、中高端手機(jī)上呈現(xiàn)，在部分入門級手機(jī)上也會搭載，AI還是要普惠大?

?榮耀 ?MagicOS ?9.0
360安全大模型獲IDC首推，樹立網(wǎng)安行業(yè)新標(biāo)桿！

全球領(lǐng)先的IT市場研究和咨詢公司IDC發(fā)布《革新安全防護(hù)-基于大模型的安全能力品牌推薦與洞察-安全運(yùn)營，2024》報(bào)告，對國內(nèi)外網(wǎng)絡(luò)安全領(lǐng)域頭部企業(yè)進(jìn)行調(diào)研評估，360數(shù)字安全集團(tuán)憑借領(lǐng)先的技術(shù)能力和業(yè)務(wù)水平，在告警關(guān)聯(lián)、用戶和實(shí)體行為分析、編寫檢測規(guī)則、引導(dǎo)調(diào)查、自動運(yùn)行和實(shí)施劇本5個(gè)維度均獲IDC推薦，綜合實(shí)力領(lǐng)跑行業(yè)。從行業(yè)場景視角看，在IT領(lǐng)域，GenAI將在未來18個(gè)月內(nèi)對網(wǎng)絡(luò)空間安全與合規(guī)領(lǐng)域產(chǎn)生最具顛覆性的影響。360將堅(jiān)持推動安全大模型在各領(lǐng)域的實(shí)踐應(yīng)用，持續(xù)打造安全新質(zhì)生產(chǎn)力。

?網(wǎng)絡(luò)安全 ?大模型應(yīng)用 ?IDC報(bào)告
放大招！百度復(fù)旦視覺生成模型Hallo2或?qū)⒙涞財(cái)?shù)字人等場景

百度聯(lián)合復(fù)旦大學(xué)等發(fā)布Hallo2，一個(gè)可以生成長達(dá)數(shù)小時(shí)且分辨率為4K的人物動畫的視覺模型。Hallo2目前已經(jīng)在GitHub平臺開源，供全球開發(fā)者免費(fèi)使用和研究，預(yù)計(jì)將促進(jìn)視頻生成技術(shù)的廣泛應(yīng)用和發(fā)展。大會目前已開放免費(fèi)報(bào)名通道，可通過大會官網(wǎng)報(bào)名參會。

?視頻生成技術(shù) ?Hallo2模型 ?人像動畫
十方融海陳勱：以AI大語言模型為翼，探索數(shù)字職業(yè)教育新未來

在當(dāng)下這個(gè)科技日新月異的時(shí)代，AI大語言模型正以前所未有的速度重塑各行各業(yè)，教育領(lǐng)域也不例外。隨著AI技術(shù)的不斷成熟，其與職業(yè)教育的融合日益加深，為職業(yè)教育帶來了前所未有的變革機(jī)遇。她認(rèn)為：“隨著AI技術(shù)的不斷發(fā)展和應(yīng)用深化，數(shù)字職業(yè)教育將迎來更加廣闊的發(fā)展前景和無限可能。

?AI大語言模型 ?職業(yè)教育變革 ?數(shù)字化教育
被點(diǎn)名安全漏洞問題頻發(fā) 英特爾回應(yīng)：始終將產(chǎn)品安全和質(zhì)量放在首位

英特爾公司近日就外界對其產(chǎn)品漏洞頻發(fā)和高故障率的質(zhì)疑發(fā)表了官方聲明。英特爾強(qiáng)調(diào)了其對產(chǎn)品安全和質(zhì)量的持續(xù)承諾，并表明了與客戶及業(yè)界合作以確保產(chǎn)品安全性和可靠性的立場。英特爾通過此次聲明來回應(yīng)外界的擔(dān)憂，確保公眾對其產(chǎn)品的信心。

?英特爾 ?產(chǎn)品安全 ?質(zhì)量承諾
AI日報(bào)：王炸！ElevenLabs推聲音設(shè)計(jì)功能；全能型圖像生成模型OmniGen問世；快50倍！OpenAI推全新模型sCM

歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、ElevenLabs推出AI語音生成工具VoiceDesignElevenLabs最新推出的AI語音生成工具VoiceDesign開創(chuàng)了AI配音領(lǐng)域的新紀(jì)元，通過簡單的文本描述即可創(chuàng)建個(gè)性化語音，為用戶提供了直觀的文本提?

?ElevenLabs ?OmniGen
乘風(fēng)而行，CEMOY澳詩茉借助中國經(jīng)濟(jì)高質(zhì)量發(fā)展崛起

中國經(jīng)濟(jì)的快速發(fā)展不僅吸引了國內(nèi)外媒體的高度關(guān)注，更成為世界各國企業(yè)爭相學(xué)習(xí)的榜樣。作為繼美國之后的世界第二大經(jīng)濟(jì)體，中國在全球經(jīng)濟(jì)舞臺上的表現(xiàn)尤為亮眼，對全球經(jīng)濟(jì)增長的貢獻(xiàn)率已超過30%。中國的經(jīng)驗(yàn)告訴我們，只有堅(jiān)持改革開放、推動創(chuàng)新發(fā)展，才能實(shí)現(xiàn)經(jīng)濟(jì)的可持續(xù)增長，構(gòu)建持久穩(wěn)定的世界經(jīng)濟(jì)。

?中國經(jīng)濟(jì) ?外資企業(yè) ?護(hù)膚品牌
小罐茶杜國楹：以“征信”茶引領(lǐng)中國茶產(chǎn)業(yè)高質(zhì)量發(fā)展

在當(dāng)今快速變化的市場環(huán)境中，中國茶行業(yè)正面臨前所未有的挑戰(zhàn)。產(chǎn)能過剩、市場競爭激烈以及消費(fèi)者信任度下降等問題日益凸顯，尤其是茶葉品質(zhì)參差不齊和價(jià)格虛高現(xiàn)象嚴(yán)重打擊了消費(fèi)者的信心。然而，在這樣的背景下，北京小罐茶業(yè)有限公司創(chuàng)始人杜國楹以其獨(dú)到的眼光和創(chuàng)新思維，正在引領(lǐng)一場茶界的革新運(yùn)動，通過打造“征信茶”來重塑行業(yè)信用力，推動整個(gè)茶?

?中國茶行業(yè) ?茶葉品質(zhì) ?市場競爭

URL Parser Online:在線URL解析器，將URL轉(zhuǎn)換為適合大型語言模型的輸入格式。

URL Parser Online是一個(gè)在線工具，它能夠?qū)?fù)雜的URL轉(zhuǎn)換為適合大型語言模型（LLMs）使用的輸入格式。這項(xiàng)技術(shù)的重要性在于它能夠幫助開發(fā)者和研究人員更有效地處理和解析URL數(shù)據(jù)，尤其是在進(jìn)行網(wǎng)頁內(nèi)容分析和數(shù)據(jù)抽取時(shí)。產(chǎn)品背景信息顯示，隨著互聯(lián)網(wǎng)數(shù)據(jù)量的爆炸式增長，對URL的解析和處理需求日益增加。URL Parser Online以其簡潔的用戶界面和高效的解析能力，為用戶提供了一個(gè)便捷的解決方案。該產(chǎn)品目前提供免費(fèi)服務(wù)，定位于開發(fā)者和數(shù)據(jù)分析師。

URL解析數(shù)據(jù)抽取大型語言模型

AI Summarizer:全能AI摘要生成器，快速生成文本、PDF、視頻摘要。

AI Summarizer是一個(gè)強(qiáng)大的AI摘要生成器，支持文本、PDF、視頻等多種格式的摘要生成。它通過先進(jìn)的算法提取關(guān)鍵信息，幫助用戶快速理解內(nèi)容要點(diǎn)，提升工作和學(xué)習(xí)效率。產(chǎn)品支持超過50種語言，保障用戶隱私，不存儲任何上傳文件，并提供免費(fèi)的Chrome擴(kuò)展插件，方便用戶隨時(shí)隨地使用。

摘要 AI 生產(chǎn)力

Transcribro:Android平臺上的私有、設(shè)備端語音識別鍵盤和文字服務(wù)

Transcribro是一款運(yùn)行在Android平臺上的私有、設(shè)備端語音識別鍵盤和文字服務(wù)應(yīng)用，它使用whisper.cpp來運(yùn)行OpenAI Whisper系列模型，并結(jié)合Silero VAD進(jìn)行語音活動檢測。該應(yīng)用提供了語音輸入鍵盤，允許用戶通過語音進(jìn)行文字輸入，并且可以被其他應(yīng)用顯式使用，或者設(shè)置為用戶選擇的語音轉(zhuǎn)文字應(yīng)用，部分應(yīng)用可能會使用它來進(jìn)行語音轉(zhuǎn)文字。Transcribro的背景是為用戶提供一種更安全、更私密的語音轉(zhuǎn)文字解決方案，避免了云端處理可能帶來的隱私泄露問題。該應(yīng)用是開源的，用戶可以自由地查看、修改和分發(fā)代碼。

Android 語音識別鍵盤

Oasis:基于Transformer的實(shí)時(shí)開放世界AI模型

Oasis是由Decart AI開發(fā)的首個(gè)可玩、實(shí)時(shí)、開放世界的AI模型，它是一個(gè)互動視頻游戲，由Transformer端到端生成，基于逐幀生成。Oasis能夠接收用戶鍵盤和鼠標(biāo)輸入，實(shí)時(shí)生成游戲玩法，內(nèi)部模擬物理、游戲規(guī)則和圖形。該模型通過直接觀察游戲玩法學(xué)習(xí)，允許用戶移動、跳躍、拾取物品、破壞方塊等。Oasis被視為研究更復(fù)雜交互世界的基礎(chǔ)模型的第一步，未來可能取代傳統(tǒng)的游戲引擎。Oasis的實(shí)現(xiàn)需要模型架構(gòu)的改進(jìn)和模型推理技術(shù)的突破，以實(shí)現(xiàn)用戶與模型的實(shí)時(shí)交互。Decart AI采用了最新的擴(kuò)散訓(xùn)練和Transformer模型方法，并結(jié)合了大型語言模型（LLMs）來訓(xùn)練一個(gè)自回歸模型，該模型可以根據(jù)用戶即時(shí)動作生成視頻。此外，Decart AI還開發(fā)了專有的推理框架，以提供NVIDIA H100 Tensor Core GPU的峰值利用率，并支持Etched即將推出的Sohu芯片。

AI Transformer 實(shí)時(shí)互動

三頓智能助手:多功能AI助手，提供問答、寫作、繪圖等智能服務(wù)。

三頓智能助手是一個(gè)集成了多種AI功能的在線平臺，它通過提供問答、寫作、繪圖等多種服務(wù)，幫助用戶提高工作效率和創(chuàng)造力。該產(chǎn)品以其強(qiáng)大的AI技術(shù)背景和用戶友好的界面，為用戶提供了一個(gè)便捷的智能服務(wù)入口。價(jià)格方面，三頓智能助手提供免費(fèi)試用，同時(shí)也提供付費(fèi)服務(wù)以解鎖更多功能。

AI 智能助手問答

Light Novels:AI驅(qū)動的輕小說閱讀平臺，提供個(gè)性化推薦和翻譯

Explore Light Novels是一個(gè)AI驅(qū)動的輕小說閱讀平臺，旨在通過人工智能技術(shù)打破語言障礙，為全球讀者提供沉浸式的輕小說閱讀體驗(yàn)。平臺擁有數(shù)千部流行輕小說，并提供AI驅(qū)動的個(gè)性化推薦，每日更新新章節(jié)和根據(jù)讀者偏好定制的新鮮內(nèi)容。此外，平臺還提供AI生成的文化背景注釋，幫助讀者深入了解故事背景，并通過AI推薦系統(tǒng)學(xué)習(xí)用戶的輕小說偏好，推薦新作者和故事。平臺還設(shè)有AI主持的全球社區(qū)討論，以及AI生成的每日內(nèi)容，確保讀者總有新鮮內(nèi)容可讀。

AI翻譯個(gè)性化推薦跨文化交流

SDXL_EcomID_ComfyUI:ComfyUI的EcomID原生支持插件

SDXL_EcomID_ComfyUI是一個(gè)為ComfyUI提供原生SDXL-EcomID支持的插件。它通過增強(qiáng)肖像表示，提供更真實(shí)、審美上更令人愉悅的外觀，同時(shí)確保語義一致性和更大的內(nèi)部ID相似性。這個(gè)插件完全集成于ComfyUI，并且不使用diffusers，而是本地實(shí)現(xiàn)EcomID。它的重要性在于能夠提升圖像生成的質(zhì)量和一致性，特別是在處理人物肖像時(shí)，能夠保持不同年齡、發(fā)型、眼鏡等物理變化下的內(nèi)部特征一致性。

EcomID ComfyUI 圖像生成

Promega:通過ChatGPT加速制造、銷售和市場營銷。

Promega是一家在生命科學(xué)領(lǐng)域領(lǐng)先的公司，提供用于研究和應(yīng)用技術(shù)的開創(chuàng)性生物試劑和集成系統(tǒng)。Promega通過自上而下地采用ChatGPT，幫助員工更高效地管理數(shù)千種產(chǎn)品和超過60,000個(gè)賬戶，從而加速產(chǎn)品交付到生物技術(shù)生態(tài)系統(tǒng)。ChatGPT的使用不僅提高了工作效率，還增強(qiáng)了客戶關(guān)系，并在制造、銷售和市場營銷等多個(gè)領(lǐng)域發(fā)揮了重要作用。

ChatGPT AI 生命科學(xué)

Excerptor:從實(shí)體書籍中提取劃線或手寫標(biāo)記的文本

Excerptor是一個(gè)專門設(shè)計(jì)來從實(shí)體書籍中提取劃線或手寫標(biāo)記文本的工具。它通過圖像處理和光學(xué)字符識別技術(shù)，將書籍中的標(biāo)記文本轉(zhuǎn)換為數(shù)字格式，方便用戶編輯和保存。這項(xiàng)技術(shù)的重要性在于它能夠幫助用戶快速從大量書籍中提取關(guān)鍵信息，提高研究和學(xué)習(xí)的效率。Excerptor以其高效、準(zhǔn)確的文本識別能力和用戶友好的操作界面，滿足了學(xué)術(shù)研究、教育和個(gè)人學(xué)習(xí)等不同領(lǐng)域的需求。目前，Excerptor是免費(fèi)提供給用戶的，它的開發(fā)和維護(hù)由開源社區(qū)負(fù)責(zé)。

文本識別 OCR 圖像處理

Spafe Code:AI代碼翻譯器

Spafe Code是一個(gè)利用人工智能技術(shù)實(shí)現(xiàn)代碼翻譯的平臺，它能夠?qū)⒋a從一種編程語言翻譯成另一種編程語言。這項(xiàng)技術(shù)的重要性在于它能夠幫助開發(fā)者跨越語言障礙，提高代碼的可讀性和可維護(hù)性，促進(jìn)全球開發(fā)者之間的協(xié)作。Spafe Code以其高效的翻譯能力、易用性和對多種編程語言的支持而受到開發(fā)者的歡迎。目前，Spafe Code提供免費(fèi)試用，具體價(jià)格和定位信息需要進(jìn)一步查詢。

代碼翻譯人工智能開發(fā)者工具

Browser AI Kit:在瀏覽器中直接運(yùn)行的AI工具箱

Browser AI Kit是一個(gè)集成了多種AI工具的平臺，用戶可以在瀏覽器中直接使用這些工具，無需安裝或設(shè)置。它提供了音頻轉(zhuǎn)文本、去除背景、文本轉(zhuǎn)語音等多種功能，并且完全免費(fèi)。這個(gè)工具箱基于Transformers.js開發(fā)，強(qiáng)調(diào)數(shù)據(jù)安全和隱私保護(hù)，所有數(shù)據(jù)處理都在本地進(jìn)行，不上傳任何服務(wù)器。它的目標(biāo)是為用戶提供一個(gè)便捷、安全、多功能的AI工具平臺。

AI工具音頻處理圖像編輯

Emotive AI Actors by CreatorKit:視頻廣告中的情感AI演員

Emotive AI Actors by CreatorKit是一個(gè)利用人工智能技術(shù)創(chuàng)建用戶生成內(nèi)容（UGC）視頻和廣告的平臺。它通過與真實(shí)UGC演員和內(nèi)容策略師合作訓(xùn)練AI，使得用戶能夠快速創(chuàng)建出具有真實(shí)情感反應(yīng)的視頻廣告。這個(gè)產(chǎn)品的重要性在于它能夠以更低的成本、更快的速度和更好的性能來替代傳統(tǒng)的視頻制作方式，同時(shí)提供可擴(kuò)展的解決方案，允許用戶在幾分鐘內(nèi)創(chuàng)建出100個(gè)視頻廣告。AI Actors的主要優(yōu)點(diǎn)包括成本效益、快速制作、性能優(yōu)越和易于擴(kuò)展。

AI視頻制作用戶生成內(nèi)容視頻廣告

SELA:通過結(jié)合蒙特卡洛樹搜索和基于LLM的代理來增強(qiáng)自動化機(jī)器學(xué)習(xí)。

SELA是一個(gè)創(chuàng)新系統(tǒng)，它通過將蒙特卡洛樹搜索(MCTS)與基于大型語言模型(LLM)的代理結(jié)合起來，增強(qiáng)了自動化機(jī)器學(xué)習(xí)（AutoML）。傳統(tǒng)的AutoML方法經(jīng)常產(chǎn)生低多樣性和次優(yōu)的代碼，限制了它們在模型選擇和集成方面的有效性。SELA通過將管道配置表示為樹，使代理能夠智能地探索解決方案空間，并根據(jù)實(shí)驗(yàn)反饋迭代改進(jìn)其策略。

自動化機(jī)器學(xué)習(xí) 蒙特卡洛樹搜索大型語言模型

Universal-2:下一代語音AI，提供卓越的音頻數(shù)據(jù)處理能力。

Universal-2是AssemblyAI推出的最新語音識別模型，它在準(zhǔn)確度和精確度上超越了前一代Universal-1，能夠更好地捕捉人類語言的復(fù)雜性，為用戶提供無需二次檢查的音頻數(shù)據(jù)。這一技術(shù)的重要性在于它能夠?yàn)楫a(chǎn)品體驗(yàn)提供更敏銳的洞察力、更快的工作流程和一流的產(chǎn)品體驗(yàn)。Universal-2在專有名詞識別、文本格式化和字母數(shù)字識別方面都有顯著提升，減少了實(shí)際應(yīng)用中的詞錯(cuò)誤率。

語音識別音頻處理 AI模型

Laminar.ai:開源全棧平臺，為打造頂級LLM產(chǎn)品提供支持

Laminar是一個(gè)開源的全棧平臺，專注于從第一性原理出發(fā)進(jìn)行AI工程。它幫助用戶收集、理解和使用數(shù)據(jù)，以提高大型語言模型（LLM）應(yīng)用的質(zhì)量。Laminar支持對文本和圖像模型的追蹤，并且即將支持音頻模型。產(chǎn)品的主要優(yōu)點(diǎn)包括零開銷的可觀測性、在線評估、數(shù)據(jù)集構(gòu)建和LLM鏈管理。Laminar完全開源，易于自托管，適合需要構(gòu)建和管理LLM產(chǎn)品的開發(fā)者和團(tuán)隊(duì)。

AI工程 LLM 數(shù)據(jù)追蹤

HOVER:人形機(jī)器人多功能神經(jīng)全身控制器

HOVER是一個(gè)針對人形機(jī)器人的多功能神經(jīng)全身控制器，它通過模仿全身運(yùn)動來提供通用的運(yùn)動技能，學(xué)習(xí)多種全身控制模式。HOVER通過多模式策略蒸餾框架將不同的控制模式整合到一個(gè)統(tǒng)一的策略中，實(shí)現(xiàn)了在不同控制模式之間的無縫切換，同時(shí)保留了每種模式的獨(dú)特優(yōu)勢。這種控制器提高了人形機(jī)器人在多種模式下的控制效率和靈活性，為未來的機(jī)器人應(yīng)用提供了一個(gè)健壯且可擴(kuò)展的解決方案。

人形機(jī)器人神經(jīng)網(wǎng)絡(luò) 全身控制

LinkedIn Hiring Assistant:LinkedIn招聘助手，助力招聘流程自動化。

Hiring Assistant for Recruiter & Jobs是LinkedIn推出的一款A(yù)I助手，旨在幫助招聘人員自動化執(zhí)行耗時(shí)的任務(wù)，從而讓他們專注于更有影響力的、以人為中心的工作部分。這款產(chǎn)品代表了LinkedIn在利用人工智能技術(shù)優(yōu)化招聘流程方面邁出的重要一步，它通過自動構(gòu)建候選人管道、篩選頂級申請者、起草外展郵件甚至回答有關(guān)角色的基本問題來減輕招聘人員的工作負(fù)擔(dān)。產(chǎn)品背景信息顯示，LinkedIn一直致力于通過AI技術(shù)提升用戶體驗(yàn)，而Hiring Assistant的推出進(jìn)一步強(qiáng)化了這一點(diǎn)。產(chǎn)品定位于幫助招聘人員提高效率，同時(shí)保持對招聘過程的完全控制。

招聘 AI助手自動化

Fable:AI驅(qū)動的交互式產(chǎn)品演示軟件

Fable是一款A(yù)I驅(qū)動的交互式產(chǎn)品演示軟件，旨在幫助企業(yè)通過創(chuàng)建高轉(zhuǎn)化率的產(chǎn)品演示來吸引潛在客戶、完成交易并簡化產(chǎn)品上線流程。Fable通過其AI技術(shù)，允許用戶輕松創(chuàng)建個(gè)性化的演示，這些演示可以嵌入網(wǎng)站、通過電子郵件發(fā)送或添加到幫助中心。產(chǎn)品背景信息顯示，F(xiàn)able在G2上獲得了4.9的高評分，并被全球各地的GTM團(tuán)隊(duì)所信賴。Fable的價(jià)格定位是免費(fèi)試用和付費(fèi)，適合需要提高銷售轉(zhuǎn)化率和客戶滿意度的商業(yè)團(tuán)隊(duì)。

AI演示產(chǎn)品演示客戶轉(zhuǎn)化

Trieve:AI優(yōu)先的基礎(chǔ)設(shè)施API，提供搜索、推薦和RAG服務(wù)

Trieve是一個(gè)AI優(yōu)先的基礎(chǔ)設(shè)施API，結(jié)合了語言模型和工具，用于微調(diào)排名和相關(guān)性，提供一站式的搜索、推薦、RAG和分析解決方案。它能夠自動持續(xù)改進(jìn)，基于數(shù)十個(gè)反饋信號，確保相關(guān)性。Trieve支持語義向量搜索、BM25和SPlade全文搜索，以及混合搜索，結(jié)合全文搜索和語義向量搜索。此外，它還提供了商品推銷和相關(guān)性調(diào)整功能，幫助用戶通過API或無代碼儀表板調(diào)整搜索結(jié)果以實(shí)現(xiàn)KPI。Trieve建立在最佳基礎(chǔ)之上，使用開源嵌入模型和LLMs，運(yùn)行在自己的服務(wù)器上，確保數(shù)據(jù)安全。

搜索推薦 RAG

Open Source AI Definition:開源人工智能定義，推動AI領(lǐng)域的開放與合作

Open Source AI Definition（OSAID）是由Open Source Initiative（OSI）發(fā)布的行業(yè)首個(gè)開源人工智能定義。它提供了一個(gè)標(biāo)準(zhǔn)，通過社區(qū)領(lǐng)導(dǎo)的開放和公共評估來驗(yàn)證一個(gè)AI系統(tǒng)是否可以被認(rèn)為是開源AI。OSAID v1.0的發(fā)布是多年研究和合作的結(jié)果，經(jīng)過國際研討會和為期一年的共同設(shè)計(jì)過程。這個(gè)定義要求開源模型提供足夠的訓(xùn)練數(shù)據(jù)信息，以便熟練的人可以使用相同或類似的數(shù)據(jù)重建一個(gè)大致等效的系統(tǒng)。OSAID的發(fā)布對于推動AI領(lǐng)域的開放性、透明度和合作具有重要意義，它強(qiáng)調(diào)了開源原則在AI發(fā)展中的核心地位，并為獨(dú)立機(jī)器學(xué)習(xí)研究人員和大型AI開發(fā)者之間的透明度提供了支持。

開源人工智能定義

今日大家都在搜的詞：

熱文

3 天
7天

站長商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘