11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享。快來騰訊云選購吧!
AI玩黑神話,第一個精英怪牯護院輕松拿捏啊。在本項研究中,數(shù)據(jù)集中的有效數(shù)據(jù)為1000條。
大語言模型還能向上突破,OpenAI再次證明了自己的實力。北京時間9月13日午夜,OpenAI正式公開一系列全新AI大模型,旨在專門解決難題。「除了新的o1系列模型,我們計劃繼續(xù)開發(fā)和發(fā)布我們的GPT系列模型。
只用強化學習來微調(diào),無需人類反饋,就能讓多模態(tài)大模型學會做決策!這種方法得到的模型,已經(jīng)學會了看圖玩撲克、算“12點”等任務(wù),表現(xiàn)甚至超越了GPT-4v。這是來自UC伯克利等高校最新提出的微調(diào)方法,研究陣容也是相當豪華:圖靈獎三巨頭之一、Meta首席AI科學家、紐約大學教授LeCunUC伯克利大牛、ALOHA團隊成員SergryLevineResNeXt一作、Sora基礎(chǔ)技術(shù)DiT作者謝賽寧香港大學數(shù)據(jù)科學學院院長、UC伯克利教授馬毅該方法名為RL4VLM,論文預(yù)印本已經(jīng)上線,相關(guān)代碼也已在GitHub中開源。從提示詞上看,這項研究采取了如下的提示過程作為多模態(tài)模型的輸入,并且給出了期望的輸出形式:消融實驗結(jié)果表明,如果這一過程中不采用思維鏈,則任務(wù)成功率會出現(xiàn)大幅下降。
在使用強化學習進行文本生成圖像時,質(zhì)量獎勵成為一個緊迫問題。盡管觀察到通過強化學習RL可能提高圖像質(zhì)量,但多個獎勵的聚合可能導致在某些度量中過度優(yōu)化在其他度量中降級。但在Parrot潛在生成不當內(nèi)容的能力方面引發(fā)了倫理關(guān)切,強調(diào)了在部署中進行審查和倫理考慮的必要性。
韓國首爾國立大學的研究人員致力于訓練能夠自主創(chuàng)作真正拼貼藝術(shù)品的AI代理人。目前市面上的AI工具可以生成類似拼貼的圖像,但缺乏真正的創(chuàng)作過程的真實性。通過用戶研究和客觀評估的驗證,這一突破為AI在藝術(shù)創(chuàng)作中開辟了新的道路,為機器在視覺藝術(shù)領(lǐng)域有意義地貢獻創(chuàng)造了前景。
迪士尼研究所在國際機器人大會上首次展示了一款可表達情感的新型四肢機器人。該機器人擁有一閃一閃的大眼睛、搖搖晃晃的腦袋和靈活擺動的觸角,走路時屁顛屁顛但十分穩(wěn)定。研究人員表示,這個情感機器人只是首個案例,通過模塊化和通用的強化學習流程,可以快速教會不同外觀、不同動作的機器人實現(xiàn)復雜的情感表達。
傳奇程序員卡馬克和強化學習之父薩頓聯(lián)手創(chuàng)辦了AI創(chuàng)業(yè)公司KeenTechnologies,他們的目標是在2030年向公眾展示通用人工智能的可行性。與主流方法不同,他們不依賴大模型是追求實時的在線學習。卡馬克和薩頓的合作將引領(lǐng)AI領(lǐng)域的發(fā)展,為實現(xiàn)人工智能的全面進化提供新的思路和方向。
在一場無人機比賽中,一架自主控制的無人機戰(zhàn)勝了頂級人類玩家。這架自主控制無人機是由來自蘇黎世大學的研究團隊設(shè)計研發(fā)的Swift系統(tǒng),研究成果登上了最新一期的《Nature》雜志封面。人類操控者規(guī)劃運動的時間尺度較短,最多只能預(yù)測未來一個競賽門。
斯坦福大學的研究團隊在自然語言處理領(lǐng)域取得了突破性進展,探究了強化學習智能體是否能在沒有明確語言監(jiān)督的情況下間接學習語言技能。研究的主要焦點是探索強化學習智能體是否能夠像通過與環(huán)境互動以實現(xiàn)非語言目標的方式學習語言技能。這些發(fā)現(xiàn)預(yù)計將推動自然語言處理的進步,并在理解和使用語言方面為人工智能系統(tǒng)的發(fā)展做出重要貢獻。
倫敦帝國理工學院和DeepMind的研究人員設(shè)計了一個AI框架,將語言作為強化學習智能體的核心推理工具。該框架利用了大型語言模型和視覺語言模型,能夠有效解決強化學習中的幾個基本問題,包括在獎勵稀疏環(huán)境中的高效探索、順序?qū)W習中的數(shù)據(jù)重用、新任務(wù)的能力調(diào)度以及從專家智能體的觀察中學習。研究結(jié)果表明,語言模型和視覺語言模型可以有效地成為強化學習智能體?
近日,神經(jīng)計算和機器學習領(lǐng)域極負盛名的頂級會議NeurIPS(Advances in Neural Information Processing Systems, 簡稱NeurIPS,前稱NIPS)揭曉論文收錄名單,網(wǎng)易伏羲實驗室的論文《學習利用獎賞塑形:獎賞塑形的新方式》(《Learning to Utilize Shaping Rewards: A New Approach of Reward Shaping》)入選,凸顯了國際頂尖的科研實力。NeurIPS(神經(jīng)信息處理系統(tǒng)大會)是人工智能、機器學習和計算神經(jīng)科學等領(lǐng)域的頂級學術(shù)會議
11月4日據(jù)36氪消息,在NeurIPS2019 強化學習賽上,百度繼 2018 年奪冠后再度奪得冠軍。百度基于飛槳的強化學習框架PARL不僅成功完成挑戰(zhàn),還大幅領(lǐng)先第二名 143 分。該比賽采用斯坦福國家醫(yī)學康復研究中心研發(fā)的Opensim人體骨骼高仿模型。參賽者需要根據(jù)該模型中多達 100 多維以上的狀態(tài)描述特征,來決定模型肌肉的信號,控制模型的肌體行走。
強化學習作為AI技術(shù)發(fā)展的重要分支,為各家AI公司高度重視。去年,百度首次參與NeurIPS2018 的強化學習賽事,就擊敗了多達 400 支來自全球研究機構(gòu)以及各大公司研究部門的參賽隊伍,大比分以絕對優(yōu)勢拿下了冠軍,并受邀在加拿大蒙特利爾舉辦的NeurIPS 2018 Competition Workshop上分享。近日,百度PaddlePaddle正式發(fā)布在賽事奪冠中起到關(guān)鍵作用的深度強化學習框架PARL,同時開源了基于該框架的NeurIPS2018 強化學習賽事的完整訓練
GoGoKid教研團隊發(fā)現(xiàn),每周上課頻次更高、更規(guī)律的孩子,在英語能力、學習習慣等方面的表現(xiàn),都要好于其他孩子?!皩W習語言需要大量且連貫的輸入,才能構(gòu)建出完整的知識體系,而時斷時續(xù)的學習,則會將知識體系塑造的如同奶酪一般,看似完整,實則內(nèi)部充滿漏洞,且隨著‘知識奶酪’的增大,漏洞會也會變得越來越多。”GoGoKid教研負責人解釋道。對此,兒童語言教育專家們也早已有過長期的研究,美國兒童語言教育學家朱迪斯(Judith
10月17日,視源股份旗下教育科技品牌希沃啟動2024希沃未來教育創(chuàng)新日活動,全網(wǎng)上線展示希沃AI多款創(chuàng)新應(yīng)用成果。希沃教學大模型2.0重磅亮相,賦能希沃全系列AI產(chǎn)品及方案,從校到家,助力課堂創(chuàng)新、跨學科與新教材的融合探索,以及學生的創(chuàng)造性思維培養(yǎng)。*從學校到家庭,希沃基于深厚的用戶基礎(chǔ)、專業(yè)的教育數(shù)據(jù)積累,以及廣泛的應(yīng)用場景,希沃將AI技術(shù)融入數(shù)字化?
Repeto是一款集AI問答、智能筆記、知識圖譜在內(nèi)的學習輔助工具。用戶可以上傳學習材料與AI對話提問,Repeto可以生成交互式測驗、關(guān)鍵詞定義等功能幫助用戶學習。欲了解更多詳細信息并體驗智能個性化學習,請訪問Repeto官方網(wǎng)站。
現(xiàn)如今,批改作業(yè)、找到適合自己孩子的練習題,成為了大多數(shù)家長每天要面對的難題。但家長們往往對此有心無力,不管是在輔導孩子的時間方面還是輔導孩子的方法上,家長們都捉襟見肘。而“不寫作業(yè)母慈子孝,一寫作業(yè)雞飛狗跳”這句網(wǎng)絡(luò)熱梗也一直都是反映家長與孩子之間就學習問題而產(chǎn)生的矛盾現(xiàn)狀。毫無疑問,承擔家庭輔導重任的父母需要一個“好幫手”。近?
隨著AI技術(shù)的發(fā)展突破,AI+教育已被寄予讓教育由“千人一面”轉(zhuǎn)變?yōu)椤扒饲妗钡南M?。通過人工智能技術(shù)在教育各個環(huán)節(jié)的應(yīng)用,后臺大數(shù)據(jù)可收集到學生全面的學習數(shù)據(jù),結(jié)合算法分析以及學生的情況為其規(guī)劃學習路徑,實現(xiàn)個性化教育的目的。讓AI智能“看得見”,猿輔導致力于關(guān)注每一個孩子的學習。當一堂猿輔導網(wǎng)課開始后,猿輔導業(yè)內(nèi)領(lǐng)先的“AI智能學情分析?
【TechWeb】7月13日消息,世界人工智能大會教育分論壇近日在云端開講。騰訊云副總裁、騰訊教育副總裁王濤出席大會并分享了其對人工智能與教育融合的思考,以及騰訊教育在疫情期間,如何利用科技手段助力教育管理部門、學校、教師和學生搭建“空中課堂”,解決在線學習痛點的探索成果。王濤表示,突如其來的大疫情對各行各業(yè)都帶來了非常大的沖擊,也使得行業(yè)的數(shù)字化進程得到了很大的加速。教育是一個積極擁抱智能時代的行業(yè)。疫?
周六,美國賓夕法尼亞大學的教室里,教育學院的師生們正在與一位中國學者進行激烈的學術(shù)討論。討論中,大家提及最多的詞語是“教育”、“數(shù)據(jù)”,還有“技術(shù)”。這與我們想象中的教育似乎有些不同。 回顧過去,不同大概是從兩份文件開始的。2010 年,美國制定并公布了最新一輪的國家教育技術(shù)計劃——《重塑美國教育:技術(shù)驅(qū)動下的教育變革》(Transforming American Education Learning Powered by Technology)。這份計劃中預(yù)想?