AI實驗

多圖像場景也能用DPO方法來對齊了!由上海交大、上海AI實驗室、港中文等帶來最新成果MIA-DPO。這是一個面向大型視覺語言模型的多圖像增強的偏好對齊方法。MIA-DPO的成功證明了通過偏好優(yōu)化對齊模型與人類反饋，在提升模型多圖像感知與推理能力的同時，也可以保持原有的單圖任務(wù)性能，為未來的研究奠定了堅實基礎(chǔ)。...

特別聲明：本頁面標(biāo)簽名稱與頁面內(nèi)容，系網(wǎng)站系統(tǒng)為資訊內(nèi)容分類自動生成，僅提供資訊內(nèi)容索引使用，旨在方便用戶索引相關(guān)資訊報道。如標(biāo)簽名稱涉及商標(biāo)信息，請訪問商標(biāo)品牌官方了解詳情，請勿以本站標(biāo)簽頁面內(nèi)容為參考信息，本站與可能出現(xiàn)的商標(biāo)名稱信息不存在任何關(guān)聯(lián)關(guān)系，對本頁面內(nèi)容所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。站長之家將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負(fù)責(zé)。任何單位或個人認(rèn)為本頁面內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，可及時向站長之家提出書面權(quán)利通知或不實情況說明，并提權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明（點擊查看反饋聯(lián)系地址）。本網(wǎng)站在收到上述反饋文件后，將會依法依規(guī)核實信息，第一時間溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

與“AI實驗”的相關(guān)熱搜詞：

相關(guān)“AI實驗” 的資訊19580篇

【騰訊云】11.11云上盛惠！云服務(wù)器首年1.8折起，買1年送3個月！

11.11云上盛惠！海量產(chǎn)品 · 輕松上云！云服務(wù)器首年1.8折起，買1年送3個月！超值優(yōu)惠，性能穩(wěn)定，讓您的云端之旅更加暢享。快來騰訊云選購吧！

Docker容器鏡像
去看看

Docker容器鏡像 60元/15天

爆款產(chǎn)品組合購
去看看

爆款產(chǎn)品組合購低至1元

騰訊云x NVIDIA加速計劃
去看看

騰訊云x NVIDIA加速計劃最高獲贈10萬元扶持基金

2核2G云服務(wù)器
去看看

2核2G云服務(wù)器 112元/1年

查看更多相關(guān)信息>>

騰訊云 12-20

廣告
薦多圖場景用DPO對齊，上海AI實驗室等提出新方法，無需人工標(biāo)注

多圖像場景也能用DPO方法來對齊了!由上海交大、上海AI實驗室、港中文等帶來最新成果MIA-DPO。這是一個面向大型視覺語言模型的多圖像增強的偏好對齊方法。MIA-DPO的成功證明了通過偏好優(yōu)化對齊模型與人類反饋，在提升模型多圖像感知與推理能力的同時，也可以保持原有的單圖任務(wù)性能，為未來的研究奠定了堅實基礎(chǔ)。

多圖像場景 DPO方法視覺語言模型
薦 AI日報：谷歌推Gemini 1.5 Pro實驗版本0801；圖像生成開源模型FLUX1橫空出世；極速3D圖像生成模型Stable Fast 3D發(fā)布；阿里語音合成模型CosyVoice更新

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、谷歌推超強多模態(tài)模型實驗版Gemini1.5Pro，排名領(lǐng)先GPT-4o、Claude-3.5Sonnet谷歌今天推出了Gemini1.5Pro實驗版本0801，在人工智能領(lǐng)域取得重大突破。ItiNera系統(tǒng)通過結(jié)合空間優(yōu)化與大型語言模型，提供個性化的城市行程規(guī)劃服務(wù)，為旅行者帶來全新的探索城市方式。

Gemini 1.5 Pro
智譜AI與中國銀聯(lián)成立大語言模型聯(lián)合實驗室

6月18日，北京智譜華章科技有限公司與中國銀聯(lián)股份有限公司大語言模型聯(lián)合實驗室簽約儀式在上海正式舉行。中國銀聯(lián)作為國內(nèi)領(lǐng)先的轉(zhuǎn)接清算機構(gòu)，擁有豐富的金融支付數(shù)據(jù)和業(yè)務(wù)場景，智譜AI作為行業(yè)領(lǐng)先的大模型公司，專注于做大模型的中國創(chuàng)新，模型研發(fā)能力位列全球前列，雙方具備大模型合作的堅實基礎(chǔ)。下一步雙方將推動大語言模型應(yīng)用的科技研發(fā)、聯(lián)合創(chuàng)新、

智譜AI 中國銀聯(lián) 大語言模型
AIGC重塑教育模式！360智能營銷云助力麗水市青田縣江南實驗學(xué)校打造人防元宇宙體驗中心

AI浪潮席卷來，數(shù)字化轉(zhuǎn)型不僅成為各行業(yè)對時代潮流的積極響應(yīng)，更是實現(xiàn)跨越式發(fā)展的必由之路。作為AI發(fā)展過程中的重要應(yīng)用領(lǐng)域，教育行業(yè)在前沿科技的探索上越來越關(guān)注AIGC的場景化落地。360智能營銷云將繼續(xù)深化與各類院校的合作，共同探索更多教育領(lǐng)域的應(yīng)用場景，在課程設(shè)計的實用性、個性化需求匹配度上持續(xù)提升元宇宙和AIGC產(chǎn)品的智能化能力，為學(xué)生提供更加優(yōu)質(zhì)、高效的學(xué)習(xí)體驗。

人工智能元宇宙教育行業(yè)
騰訊AI實驗室開發(fā)新型智能體框架TRANSAGENTS 專用于處理超長文學(xué)內(nèi)容的翻譯工作

騰訊AI實驗室開發(fā)的"TRANSAGENTS"是一個創(chuàng)新的多智能體框架，專門設(shè)計用于處理超長文學(xué)內(nèi)容的翻譯工作。這個系統(tǒng)通過創(chuàng)建一個虛擬的翻譯出版公司來模擬真實的翻譯流程，其中包含多個具有不同職責(zé)和專業(yè)技能的虛擬角色。這種新型的多智能體翻譯系統(tǒng)有望在未來的文學(xué)翻譯和跨文化交流中發(fā)揮重要作用。

智能體翻譯 AI頭條
報道稱:蘋果挖掘 AI 人才并建立秘密實驗室

蘋果近年來從谷歌挖走了多名員工，以擴大其全球人工智能和機器學(xué)習(xí)團隊。圖源備注：圖片由AI生成，圖片授權(quán)服務(wù)商Midjourney自2018年任命JohnGiannrea為首席AI執(zhí)行官以來，蘋果已至少吸引了36位專從谷歌加盟。文章還提到了蘋果在AI領(lǐng)域與競爭對手進行競爭的新計劃。

AI
極空間AI實驗室體驗入口 AI搜索圖像處理使用方法教程指南

極空間AI實驗室是北京天頂星智能信息技術(shù)有限公司推出的家庭私有云產(chǎn)品中的新功能。它包括自然語言搜索、相似圖片搜索和圖片文字識別等功能，旨在幫助用戶更快捷地管理和使用存儲在極空間中的圖片。點擊前往極空間AI實驗室體驗入口需求人群：適用于需要管理和快速檢索大量圖片的用戶，如家庭用戶、攝影師、設(shè)計師等。使用場景示例：使用自然語言搜索功能快速找

極空間AI實驗室
英偉達(dá)成立最壕AI實驗室專攻具身智能研究

英偉達(dá)最新宣布成立通用具身智能體研究小組，專注于發(fā)展具備理解、推理和與物理世界互動能力的智能系統(tǒng)。該研究小組由英偉達(dá)高級科學(xué)家JimFan和其隊友YukeZhu共同領(lǐng)導(dǎo)，他們認(rèn)為未來的移動機器人將成為自主體，如同iPhone般無處不在。他們之前在具身智能領(lǐng)域的研究成果已經(jīng)引起廣泛關(guān)注，未來的發(fā)展也備受期待。

英偉達(dá)
GRUP MEDIAPRO宣布與微軟成立AI合成媒體實驗室

GRUPMEDIAPRO在ISE展會的框架內(nèi)，宣布與微軟合作，啟動了一個人工智能和合成媒體實驗室。這是兩家公司為了為音像行業(yè)開發(fā)解決方案共享技術(shù)和商業(yè)知識的一個重要步驟?！坝性S多使用場景，可以讓行業(yè)成員的任務(wù)變得更容易，讓他們有更多的時間發(fā)揮創(chuàng)造力。

微軟人工智能 AI
上海AI實驗室開源科學(xué)大模型浦科化學(xué)，理科能力全線提升，免費商用

最新科學(xué)大模型浦科化學(xué)，發(fā)布即開源!這是上海AI實驗室最新開源成果，它基于書生·浦語2.0強大的基座模型能力，通過注入海量化學(xué)專業(yè)數(shù)據(jù)，使大模型獲得理解和處理化學(xué)相關(guān)專業(yè)任務(wù)的知識與能力。值得一提的是，在獲得化學(xué)能力同時，大模型的數(shù)理學(xué)科及推理能力還得到增強?；谄挚苹瘜W(xué)模型，人工智能可為化學(xué)研究提供智能化輔助，如化學(xué)合成路徑規(guī)劃、化學(xué)反應(yīng)條件優(yōu)化、實驗結(jié)果自動化分析等，從提升化學(xué)研究的效率和質(zhì)量。

科學(xué)大模型浦科化學(xué) Ai頭條
上海AI實驗室等開源，音頻、音樂統(tǒng)一開發(fā)工具包Amphion

上海AI實驗室、香港中文大學(xué)數(shù)據(jù)科學(xué)院、深圳大數(shù)據(jù)研究院聯(lián)合開源了一個名為Amphion的音頻、音樂和語音生成工具包。Amphion可幫助開發(fā)人員研究文本生成音頻、音樂等與音頻相關(guān)的領(lǐng)域，可以在一個框架內(nèi)完成，以解決生成模型黑箱、代碼庫分散、缺少評估指標(biāo)等難題。開發(fā)團隊表示，未來，會持續(xù)更新這個工具包，加入更多與語音相關(guān)的模型，打造成最好用的開源語音工具包之一。

Amphion AI工具 AI頭條
阿里巴巴通義實驗室開源AI圖像生成微調(diào)框架SCEdit

SCEdit是一個高效的生成式微調(diào)框架，由阿里巴巴通義實驗室基礎(chǔ)視覺智能團隊提出。該框架可以用于圖像生成任務(wù)的微調(diào)，并支持快速遷移到特定的生成場景中。在可控生成任務(wù)中，SCEdit可以實現(xiàn)對生成結(jié)果的精準(zhǔn)控制，并節(jié)省30%的內(nèi)存使用。
薦 AI視野：GPT-4 API曝出重大漏洞;阿里巴巴推AI畫圖框架SCEdit;上海AI實驗室浦醫(yī)2.0發(fā)布

上海AI實驗室升級發(fā)布“浦醫(yī)2.0”上海人工智能實驗室與上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院等在“2023健康中國思南峰會”上發(fā)布了醫(yī)療多模態(tài)基礎(chǔ)模型群“浦醫(yī)2.0”，為跨領(lǐng)域、跨疾病、跨模態(tài)的AI醫(yī)療應(yīng)用提供全面支持。用戶可定制圖?

浦醫(yī)2.0
上海AI實驗室升級發(fā)布“浦醫(yī)2.0”O(jiān)penMEDLab2.0

上海人工智能實驗室與上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院等合作伙伴在“2023健康中國思南峰會”上發(fā)布了醫(yī)療多模態(tài)基礎(chǔ)模型群“浦醫(yī)2.0”，旨在為跨領(lǐng)域、跨疾病、跨模態(tài)的AI醫(yī)療應(yīng)用提供能力支持。浦醫(yī)2.0新增了多領(lǐng)域模型，語言參數(shù)增量，涵蓋醫(yī)學(xué)圖像、醫(yī)學(xué)文本、生物信息、蛋白質(zhì)工程等多個數(shù)據(jù)模態(tài)。整個浦醫(yī)2.0實現(xiàn)了醫(yī)療大模型群的一站式開源，為實現(xiàn)人工智能?
騰訊AI實驗室聯(lián)合悉尼大學(xué)引入了GPT4Video 提升LLM的視頻生成能力

最近在多模態(tài)大型語言模型領(lǐng)域取得了顯著進展，但在多模態(tài)內(nèi)容生成方面仍存在明顯的空白。為了填補這一空白，騰訊AI實驗室和悉尼大學(xué)的合作引入了GPT4Video，這是一個統(tǒng)一的多模型框架，使得大型語言模型具備了視頻理解和生成的獨特能力。該研究還提出了一種簡單有效的微調(diào)方法，并發(fā)布了數(shù)據(jù)集，為未來的多模態(tài)LLMs研究提供了便利。

GPT4
谷歌推AI音樂實驗項目Instrument Playground 能模擬100多種樂器

谷歌最新實驗性AI項目“InstrumentPlayground”已面世，允許人們通過一個文本提示生成20秒的音樂曲目。與Meta的MusicGen等類似項目相比，谷歌的版本聲稱能夠模擬來自世界各地的100多種樂器，包括常見的鋼琴和中國的笛子等。期待在未來看到更多的發(fā)展。

AI音樂 AI頭條
Meta AI實驗室推三項新AI項目慶祝成立十周年：Ego-Exo4D、Audiobox等

為慶祝Meta基礎(chǔ)人工智能研究團隊成立十周年，公司隆重推出三個創(chuàng)新的人工智能項目，展示了引人注目的演示。Ego-Exo4D:官方項目介紹網(wǎng)址:https://ai.meta.com/blog/ego-exo4d-video-learning-perception/該項目以數(shù)據(jù)集及基準(zhǔn)測試的形式呈現(xiàn)，旨在支持視頻學(xué)習(xí)和多模態(tài)感知的人工智能研究。這三個項目的推出標(biāo)志著MetaFAIR團隊十年來在人工智能領(lǐng)域取得的巨大成就，并為未來的技術(shù)發(fā)展和創(chuàng)?

Meta Ego-Exo4D Audiobox
AI音樂創(chuàng)作、水墨畫、3D空間重建、6DoF，騰訊多媒體實驗室領(lǐng)先技術(shù)亮相數(shù)貿(mào)會

第二屆全球數(shù)字貿(mào)易博覽會在杭州開幕，為觀眾帶來數(shù)字貿(mào)易領(lǐng)域的新技術(shù)、新產(chǎn)品、新服務(wù)與新場景?！彬v訊云副總裁、騰訊多媒體實驗室負(fù)責(zé)人、騰訊杰出科學(xué)家劉杉博士表示。
上海AI實驗室、Meta聯(lián)合開發(fā)開源模型可為人體生成3D空間音頻

近期上海AI實驗室與Meta合作推出的開源模型標(biāo)志著在3D空間音頻領(lǐng)域邁出的一大步。該模型通過處理頭戴式麥克風(fēng)的輸入音頻信號和分析人體姿態(tài)關(guān)鍵點，成功地實現(xiàn)了為人體生成3D空間音頻的目標(biāo)。未來仍需進一步優(yōu)化和拓展，以滿足更廣泛的應(yīng)用場景和設(shè)備要求。

Meta
薦 AI Pin是一場瘋狂的實驗，而AI PC才是個人計算的文藝復(fù)興

是時候重新回味比爾·蓋茨在48年前的愿景了——“讓每個家庭都有一臺電腦”。這句話放到當(dāng)下，理應(yīng)升級成“讓每個家庭都有一臺AIPC”這應(yīng)該是人類創(chuàng)造更多可能性的新起點。這也是PC這一古老物種以AIPC之名的新生，是一場文藝復(fù)興。

AI
薦馬斯克正式「切腦」，Neuralink內(nèi)部實驗室照片曝光！7年計劃22000例手術(shù)，全力研發(fā)只為對抗超級AI

馬斯克傳記作者寫了一篇Neuralink最新進展的長文。從明年開始，Neuralink將開始為人類植入腦機接口。」盡管Neuralink想達(dá)成的目標(biāo)非常艱難，盡管這可能是馬斯克的吹的又一個牛，但這件事情一旦成功，確實將極大地改善許多人的生活。

馬斯克
實驗證明，基于AI的干預(yù)幫助大學(xué)生通過STEM課程

在當(dāng)前的STEM課程領(lǐng)域，美國大學(xué)生的畢業(yè)率比非STEM專業(yè)的同齡人低20%，這為更好地協(xié)助這些學(xué)生，特別是在他們的最初幾個學(xué)期里，提出了迫切的需求。盡管系統(tǒng)性、長期的轉(zhuǎn)變，如從講授式教學(xué)向共享基于證據(jù)的教學(xué)實踐的轉(zhuǎn)變，應(yīng)該會有所幫助，但學(xué)術(shù)界的慣性有時會減緩這些變革的采納速度。該團隊計劃進行更大規(guī)模、更長期的研究，以確定除了分?jǐn)?shù)之外的變量——如與課程相關(guān)的行為、對科學(xué)的看法、人口統(tǒng)計學(xué)等——是否能夠推廣和擴展這種干預(yù)方法，超越單一統(tǒng)一的課程。

AI
深藍(lán)推送OTA升級：新增“AI實驗室”可實現(xiàn)智能聊天等功能

旗下深藍(lán)SL03和S7將迎來全新版本的OTA升級。此次升級將針對導(dǎo)航、車機系統(tǒng)界面、應(yīng)用、手機APP以及DeepalGPT進行優(yōu)化，進一步提升用戶的駕乘體驗。深藍(lán)S7作為深藍(lán)的第二款車型，提供增程、純電兩種驅(qū)動模式，官方指導(dǎo)價為14.99-21.79萬元。
Datasaur推出LLM實驗室，助力企業(yè)構(gòu)建自定義AI應(yīng)用

SanFrancisco的AI初創(chuàng)公司Datasaur宣布推出LLMLab，這是一款全面的工具，旨在幫助企業(yè)構(gòu)建自定義的大型語言模型應(yīng)用，類似于ChatGPT。LLMLab可在云端或本地部署，為企業(yè)提供構(gòu)建內(nèi)部自定義生成式AI應(yīng)用的起點，同時減少了來自第三方服務(wù)的業(yè)務(wù)和數(shù)據(jù)隱私風(fēng)險。VentureBeat的使命是成為技術(shù)決策者獲取有關(guān)變革性企業(yè)技術(shù)并進行交易的數(shù)字城鎮(zhèn)廣場。

LLM
鴻海成立量子計算實驗室：專注于新一代 AI 與車用相關(guān)技術(shù)

鴻海精密工業(yè)股份有限公司日前在一份聲明中表示，作為鴻?！?3」轉(zhuǎn)型計劃的一部分，鴻海精密研究院昨天啟動了離子阱量子計算實驗室。根據(jù)鴻海的說法，「33」計劃是指通過使用人工智能、半導(dǎo)體和通信技術(shù)來發(fā)展三個新興領(lǐng)域——電動汽車、機器人和數(shù)字醫(yī)療。該實驗室還將結(jié)合鴻海集團在精密制造、半導(dǎo)體和封裝方面的能力和人才，加速量子硬件技術(shù)的發(fā)展，并進一?

鴻海人工智能量子計算
上海AI實驗室開源圖文混合創(chuàng)作大模型浦語靈筆

上海人工智能實驗室近日推出了首個圖文混合創(chuàng)作大模型書生·浦語靈筆，該模型能夠根據(jù)用戶提供的主題或圖片，自動創(chuàng)作出圖文并茂的文章，為大模型落地應(yīng)用提供更多可能。浦語靈筆是基于書生·浦語大語言模型的多模態(tài)擴展，書生·浦語是上海AI實驗室今年7月以來陸續(xù)開源的7B及20B版本的大語言模型，為業(yè)界提供了完整的大模型研發(fā)與應(yīng)用基座，以及全鏈條工具體系。浦

浦語靈筆 AI頭條
上海AI實驗室開源工具箱XTuner 8GB顯卡就可訓(xùn)練大模型

上海人工智能實驗室發(fā)布了一款面向大模型訓(xùn)練的開源工具箱XTuner，通過支持多種硬件適配，大幅降低了企業(yè)進行大模型訓(xùn)練的門檻，尤其是對中小企業(yè)具有重要意義。XTuner為各類開源模型提供了多樣的微調(diào)框架XTuner支持與多款開源大模型的無縫銜接，可執(zhí)行增量預(yù)訓(xùn)練、指令微調(diào)等任務(wù)類型。業(yè)內(nèi)人士表示，這將推動我國在人工智能核心領(lǐng)域的技術(shù)進步。
幻霄科技攜手濰坊坊華成立AI沉浸式教學(xué)聯(lián)合實驗室今日正式揭牌

進入“十四五”規(guī)劃新時期，職業(yè)教育的戰(zhàn)略定位越來越明確，社會對于職業(yè)技術(shù)人才的實踐能力要求也越來越高，推動著職業(yè)教育與先進科學(xué)技術(shù)深度融合，為高質(zhì)量人才培育之路奠定基礎(chǔ)。近日，幻霄科技（上海）有限公司與濰坊坊華科技中等職業(yè)學(xué)校達(dá)成戰(zhàn)略合作，宣告成立AI沉浸式教學(xué)聯(lián)合實驗室，為人才培養(yǎng)注入新動能。8 月 25 日，幻霄科技（上海）有限公司與濰坊
上海AI實驗室開源“書生·萬卷”1.0多模態(tài)預(yù)訓(xùn)練語料

上海AI實驗室聯(lián)合語料數(shù)據(jù)聯(lián)盟成員共同開源發(fā)布了高質(zhì)量多模態(tài)預(yù)訓(xùn)練語料“書生?萬卷”1.0。這個語料庫包含了文本數(shù)據(jù)集、圖文數(shù)據(jù)集和視頻數(shù)據(jù)集，總量超過2TB。該語料數(shù)據(jù)聯(lián)盟旨在通過聯(lián)合多方機構(gòu)打造高質(zhì)量的語料數(shù)據(jù)，探索形成可持續(xù)運行的激勵機制，打造國際化、開放型的大模型語料數(shù)據(jù)生態(tài)圈。
谷歌人工智能實驗室 DeepMind 涌現(xiàn)眾多隱形 AI 初創(chuàng)企業(yè)創(chuàng)始人

創(chuàng)立一年的初創(chuàng)公司InflectionAI宣布獲得由微軟和英偉達(dá)領(lǐng)投的13億美元融資，引起了媒體關(guān)注。這家初創(chuàng)公司于今年5月推出了其聊天機器人Pi，并由DeepMind人工智能研究實驗室聯(lián)合創(chuàng)始人MustafaSuleyman創(chuàng)建。DarkBlueLabs創(chuàng)始人KarlMoritzHermann表示，「由于AI通常意味著創(chuàng)始人在商業(yè)-to-商業(yè)環(huán)境中構(gòu)建高度專業(yè)化的產(chǎn)品」，因此他自2023年6月以來一直在秘密模式下開展第二個AI初創(chuàng)公司，?

DeepMind 人工智能 AI

熱文

3 天
7天

站長商機

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘