11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享。快來騰訊云選購吧!
多圖像場景也能用DPO方法來對齊了!由上海交大、上海AI實驗室、港中文等帶來最新成果MIA-DPO。這是一個面向大型視覺語言模型的多圖像增強的偏好對齊方法。MIA-DPO的成功證明了通過偏好優(yōu)化對齊模型與人類反饋,在提升模型多圖像感知與推理能力的同時,也可以保持原有的單圖任務(wù)性能,為未來的研究奠定了堅實基礎(chǔ)。
歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、谷歌推超強多模態(tài)模型實驗版Gemini1.5Pro,排名領(lǐng)先GPT-4o、Claude-3.5Sonnet谷歌今天推出了Gemini1.5Pro實驗版本0801,在人工智能領(lǐng)域取得重大突破。ItiNera系統(tǒng)通過結(jié)合空間優(yōu)化與大型語言模型,提供個性化的城市行程規(guī)劃服務(wù),為旅行者帶來全新的探索城市方式。
6月18日,北京智譜華章科技有限公司與中國銀聯(lián)股份有限公司大語言模型聯(lián)合實驗室簽約儀式在上海正式舉行。中國銀聯(lián)作為國內(nèi)領(lǐng)先的轉(zhuǎn)接清算機構(gòu),擁有豐富的金融支付數(shù)據(jù)和業(yè)務(wù)場景,智譜AI作為行業(yè)領(lǐng)先的大模型公司,專注于做大模型的中國創(chuàng)新,模型研發(fā)能力位列全球前列,雙方具備大模型合作的堅實基礎(chǔ)。下一步雙方將推動大語言模型應(yīng)用的科技研發(fā)、聯(lián)合創(chuàng)新、
AI浪潮席卷來,數(shù)字化轉(zhuǎn)型不僅成為各行業(yè)對時代潮流的積極響應(yīng),更是實現(xiàn)跨越式發(fā)展的必由之路。作為AI發(fā)展過程中的重要應(yīng)用領(lǐng)域,教育行業(yè)在前沿科技的探索上越來越關(guān)注AIGC的場景化落地。360智能營銷云將繼續(xù)深化與各類院校的合作,共同探索更多教育領(lǐng)域的應(yīng)用場景,在課程設(shè)計的實用性、個性化需求匹配度上持續(xù)提升元宇宙和AIGC產(chǎn)品的智能化能力,為學(xué)生提供更加優(yōu)質(zhì)、高效的學(xué)習(xí)體驗。
騰訊AI實驗室開發(fā)的"TRANSAGENTS"是一個創(chuàng)新的多智能體框架,專門設(shè)計用于處理超長文學(xué)內(nèi)容的翻譯工作。這個系統(tǒng)通過創(chuàng)建一個虛擬的翻譯出版公司來模擬真實的翻譯流程,其中包含多個具有不同職責(zé)和專業(yè)技能的虛擬角色。這種新型的多智能體翻譯系統(tǒng)有望在未來的文學(xué)翻譯和跨文化交流中發(fā)揮重要作用。
蘋果近年來從谷歌挖走了多名員工,以擴大其全球人工智能和機器學(xué)習(xí)團隊。圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney自2018年任命JohnGiannrea為首席AI執(zhí)行官以來,蘋果已至少吸引了36位專從谷歌加盟。文章還提到了蘋果在AI領(lǐng)域與競爭對手進行競爭的新計劃。
極空間AI實驗室 是北京天頂星智能信息技術(shù)有限公司推出的家庭私有云產(chǎn)品中的新功能。它包括自然語言搜索、相似圖片搜索和圖片文字識別等功能,旨在幫助用戶更快捷地管理和使用存儲在極空間中的圖片。點擊前往極空間AI實驗室體驗入口需求人群:適用于需要管理和快速檢索大量圖片的用戶,如家庭用戶、攝影師、設(shè)計師等。使用場景示例:使用自然語言搜索功能快速找
英偉達(dá)最新宣布成立通用具身智能體研究小組,專注于發(fā)展具備理解、推理和與物理世界互動能力的智能系統(tǒng)。該研究小組由英偉達(dá)高級科學(xué)家JimFan和其隊友YukeZhu共同領(lǐng)導(dǎo),他們認(rèn)為未來的移動機器人將成為自主體,如同iPhone般無處不在。他們之前在具身智能領(lǐng)域的研究成果已經(jīng)引起廣泛關(guān)注,未來的發(fā)展也備受期待。
GRUPMEDIAPRO在ISE展會的框架內(nèi),宣布與微軟合作,啟動了一個人工智能和合成媒體實驗室。這是兩家公司為了為音像行業(yè)開發(fā)解決方案共享技術(shù)和商業(yè)知識的一個重要步驟?!坝性S多使用場景,可以讓行業(yè)成員的任務(wù)變得更容易,讓他們有更多的時間發(fā)揮創(chuàng)造力。
最新科學(xué)大模型浦科化學(xué),發(fā)布即開源!這是上海AI實驗室最新開源成果,它基于書生·浦語2.0強大的基座模型能力,通過注入海量化學(xué)專業(yè)數(shù)據(jù),使大模型獲得理解和處理化學(xué)相關(guān)專業(yè)任務(wù)的知識與能力。值得一提的是,在獲得化學(xué)能力同時,大模型的數(shù)理學(xué)科及推理能力還得到增強?;谄挚苹瘜W(xué)模型,人工智能可為化學(xué)研究提供智能化輔助,如化學(xué)合成路徑規(guī)劃、化學(xué)反應(yīng)條件優(yōu)化、實驗結(jié)果自動化分析等,從提升化學(xué)研究的效率和質(zhì)量。
上海AI實驗室、香港中文大學(xué)數(shù)據(jù)科學(xué)院、深圳大數(shù)據(jù)研究院聯(lián)合開源了一個名為Amphion的音頻、音樂和語音生成工具包。Amphion可幫助開發(fā)人員研究文本生成音頻、音樂等與音頻相關(guān)的領(lǐng)域,可以在一個框架內(nèi)完成,以解決生成模型黑箱、代碼庫分散、缺少評估指標(biāo)等難題。開發(fā)團隊表示,未來,會持續(xù)更新這個工具包,加入更多與語音相關(guān)的模型,打造成最好用的開源語音工具包之一。
SCEdit是一個高效的生成式微調(diào)框架,由阿里巴巴通義實驗室基礎(chǔ)視覺智能團隊提出。該框架可以用于圖像生成任務(wù)的微調(diào),并支持快速遷移到特定的生成場景中。在可控生成任務(wù)中,SCEdit可以實現(xiàn)對生成結(jié)果的精準(zhǔn)控制,并節(jié)省30%的內(nèi)存使用。
上海AI實驗室升級發(fā)布“浦醫(yī)2.0”上海人工智能實驗室與上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院等在“2023健康中國思南峰會”上發(fā)布了醫(yī)療多模態(tài)基礎(chǔ)模型群“浦醫(yī)2.0”,為跨領(lǐng)域、跨疾病、跨模態(tài)的AI醫(yī)療應(yīng)用提供全面支持。用戶可定制圖?
上海人工智能實驗室與上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院等合作伙伴在“2023健康中國思南峰會”上發(fā)布了醫(yī)療多模態(tài)基礎(chǔ)模型群“浦醫(yī)2.0”,旨在為跨領(lǐng)域、跨疾病、跨模態(tài)的AI醫(yī)療應(yīng)用提供能力支持。浦醫(yī)2.0新增了多領(lǐng)域模型,語言參數(shù)增量,涵蓋醫(yī)學(xué)圖像、醫(yī)學(xué)文本、生物信息、蛋白質(zhì)工程等多個數(shù)據(jù)模態(tài)。整個浦醫(yī)2.0實現(xiàn)了醫(yī)療大模型群的一站式開源,為實現(xiàn)人工智能?
最近在多模態(tài)大型語言模型領(lǐng)域取得了顯著進展,但在多模態(tài)內(nèi)容生成方面仍存在明顯的空白。為了填補這一空白,騰訊AI實驗室和悉尼大學(xué)的合作引入了GPT4Video,這是一個統(tǒng)一的多模型框架,使得大型語言模型具備了視頻理解和生成的獨特能力。該研究還提出了一種簡單有效的微調(diào)方法,并發(fā)布了數(shù)據(jù)集,為未來的多模態(tài)LLMs研究提供了便利。
谷歌最新實驗性AI項目“InstrumentPlayground”已面世,允許人們通過一個文本提示生成20秒的音樂曲目。與Meta的MusicGen等類似項目相比,谷歌的版本聲稱能夠模擬來自世界各地的100多種樂器,包括常見的鋼琴和中國的笛子等。期待在未來看到更多的發(fā)展。
為慶祝Meta基礎(chǔ)人工智能研究團隊成立十周年,公司隆重推出三個創(chuàng)新的人工智能項目,展示了引人注目的演示。Ego-Exo4D:官方項目介紹網(wǎng)址:https://ai.meta.com/blog/ego-exo4d-video-learning-perception/該項目以數(shù)據(jù)集及基準(zhǔn)測試的形式呈現(xiàn),旨在支持視頻學(xué)習(xí)和多模態(tài)感知的人工智能研究。這三個項目的推出標(biāo)志著MetaFAIR團隊十年來在人工智能領(lǐng)域取得的巨大成就,并為未來的技術(shù)發(fā)展和創(chuàng)?
第二屆全球數(shù)字貿(mào)易博覽會在杭州開幕,為觀眾帶來數(shù)字貿(mào)易領(lǐng)域的新技術(shù)、新產(chǎn)品、新服務(wù)與新場景?!彬v訊云副總裁、騰訊多媒體實驗室負(fù)責(zé)人、騰訊杰出科學(xué)家劉杉博士表示。
近期上海AI實驗室與Meta合作推出的開源模型標(biāo)志著在3D空間音頻領(lǐng)域邁出的一大步。該模型通過處理頭戴式麥克風(fēng)的輸入音頻信號和分析人體姿態(tài)關(guān)鍵點,成功地實現(xiàn)了為人體生成3D空間音頻的目標(biāo)。未來仍需進一步優(yōu)化和拓展,以滿足更廣泛的應(yīng)用場景和設(shè)備要求。
是時候重新回味比爾·蓋茨在48年前的愿景了——“讓每個家庭都有一臺電腦”。這句話放到當(dāng)下,理應(yīng)升級成“讓每個家庭都有一臺AIPC”這應(yīng)該是人類創(chuàng)造更多可能性的新起點。這也是PC這一古老物種以AIPC之名的新生,是一場文藝復(fù)興。
馬斯克傳記作者寫了一篇Neuralink最新進展的長文。從明年開始,Neuralink將開始為人類植入腦機接口。」盡管Neuralink想達(dá)成的目標(biāo)非常艱難,盡管這可能是馬斯克的吹的又一個牛,但這件事情一旦成功,確實將極大地改善許多人的生活。
在當(dāng)前的STEM課程領(lǐng)域,美國大學(xué)生的畢業(yè)率比非STEM專業(yè)的同齡人低20%,這為更好地協(xié)助這些學(xué)生,特別是在他們的最初幾個學(xué)期里,提出了迫切的需求。盡管系統(tǒng)性、長期的轉(zhuǎn)變,如從講授式教學(xué)向共享基于證據(jù)的教學(xué)實踐的轉(zhuǎn)變,應(yīng)該會有所幫助,但學(xué)術(shù)界的慣性有時會減緩這些變革的采納速度。該團隊計劃進行更大規(guī)模、更長期的研究,以確定除了分?jǐn)?shù)之外的變量——如與課程相關(guān)的行為、對科學(xué)的看法、人口統(tǒng)計學(xué)等——是否能夠推廣和擴展這種干預(yù)方法,超越單一統(tǒng)一的課程。
旗下深藍(lán)SL03和S7將迎來全新版本的OTA升級。此次升級將針對導(dǎo)航、車機系統(tǒng)界面、應(yīng)用、手機APP以及DeepalGPT進行優(yōu)化,進一步提升用戶的駕乘體驗。深藍(lán)S7作為深藍(lán)的第二款車型,提供增程、純電兩種驅(qū)動模式,官方指導(dǎo)價為14.99-21.79萬元。
SanFrancisco的AI初創(chuàng)公司Datasaur宣布推出LLMLab,這是一款全面的工具,旨在幫助企業(yè)構(gòu)建自定義的大型語言模型應(yīng)用,類似于ChatGPT。LLMLab可在云端或本地部署,為企業(yè)提供構(gòu)建內(nèi)部自定義生成式AI應(yīng)用的起點,同時減少了來自第三方服務(wù)的業(yè)務(wù)和數(shù)據(jù)隱私風(fēng)險。VentureBeat的使命是成為技術(shù)決策者獲取有關(guān)變革性企業(yè)技術(shù)并進行交易的數(shù)字城鎮(zhèn)廣場。
鴻海精密工業(yè)股份有限公司日前在一份聲明中表示,作為鴻?!?3」轉(zhuǎn)型計劃的一部分,鴻海精密研究院昨天啟動了離子阱量子計算實驗室。根據(jù)鴻海的說法,「33」計劃是指通過使用人工智能、半導(dǎo)體和通信技術(shù)來發(fā)展三個新興領(lǐng)域——電動汽車、機器人和數(shù)字醫(yī)療。該實驗室還將結(jié)合鴻海集團在精密制造、半導(dǎo)體和封裝方面的能力和人才,加速量子硬件技術(shù)的發(fā)展,并進一?
上海人工智能實驗室近日推出了首個圖文混合創(chuàng)作大模型書生·浦語靈筆,該模型能夠根據(jù)用戶提供的主題或圖片,自動創(chuàng)作出圖文并茂的文章,為大模型落地應(yīng)用提供更多可能。浦語靈筆是基于書生·浦語大語言模型的多模態(tài)擴展,書生·浦語是上海AI實驗室今年7月以來陸續(xù)開源的7B及20B版本的大語言模型,為業(yè)界提供了完整的大模型研發(fā)與應(yīng)用基座,以及全鏈條工具體系。浦
上海人工智能實驗室發(fā)布了一款面向大模型訓(xùn)練的開源工具箱XTuner,通過支持多種硬件適配,大幅降低了企業(yè)進行大模型訓(xùn)練的門檻,尤其是對中小企業(yè)具有重要意義。XTuner為各類開源模型提供了多樣的微調(diào)框架XTuner支持與多款開源大模型的無縫銜接,可執(zhí)行增量預(yù)訓(xùn)練、指令微調(diào)等任務(wù)類型。業(yè)內(nèi)人士表示,這將推動我國在人工智能核心領(lǐng)域的技術(shù)進步。
進入“十四五”規(guī)劃新時期,職業(yè)教育的戰(zhàn)略定位越來越明確,社會對于職業(yè)技術(shù)人才的實踐能力要求也越來越高,推動著職業(yè)教育與先進科學(xué)技術(shù)深度融合,為高質(zhì)量人才培育之路奠定基礎(chǔ)。近日,幻霄科技(上海)有限公司與濰坊坊華科技中等職業(yè)學(xué)校達(dá)成戰(zhàn)略合作,宣告成立AI沉浸式教學(xué)聯(lián)合實驗室,為人才培養(yǎng)注入新動能。8 月 25 日,幻霄科技(上海)有限公司與濰坊
上海AI實驗室聯(lián)合語料數(shù)據(jù)聯(lián)盟成員共同開源發(fā)布了高質(zhì)量多模態(tài)預(yù)訓(xùn)練語料“書生?萬卷”1.0。這個語料庫包含了文本數(shù)據(jù)集、圖文數(shù)據(jù)集和視頻數(shù)據(jù)集,總量超過2TB。該語料數(shù)據(jù)聯(lián)盟旨在通過聯(lián)合多方機構(gòu)打造高質(zhì)量的語料數(shù)據(jù),探索形成可持續(xù)運行的激勵機制,打造國際化、開放型的大模型語料數(shù)據(jù)生態(tài)圈。
創(chuàng)立一年的初創(chuàng)公司InflectionAI宣布獲得由微軟和英偉達(dá)領(lǐng)投的13億美元融資,引起了媒體關(guān)注。這家初創(chuàng)公司于今年5月推出了其聊天機器人Pi,并由DeepMind人工智能研究實驗室聯(lián)合創(chuàng)始人MustafaSuleyman創(chuàng)建。DarkBlueLabs創(chuàng)始人KarlMoritzHermann表示,「由于AI通常意味著創(chuàng)始人在商業(yè)-to-商業(yè)環(huán)境中構(gòu)建高度專業(yè)化的產(chǎn)品」,因此他自2023年6月以來一直在秘密模式下開展第二個AI初創(chuàng)公司,?