幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > DeepMind最新資訊  > 正文

DeepMind讓大模型學(xué)會(huì)歸納和演繹,GPT-4準(zhǔn)確率提升13.7%

2023-10-15 09:26 · 稿源: 機(jī)器之心公眾號(hào)

當(dāng)前,大型語(yǔ)言模型(LLM)在推理任務(wù)上表現(xiàn)出令人驚艷的能力,特別是在給出一些樣例和中間步驟時(shí)。然而,prompt 方法往往依賴于 LLM 中的隱性知識(shí),當(dāng)隱性知識(shí)存在錯(cuò)誤或者與任務(wù)不一致時(shí),LLM 就會(huì)給出錯(cuò)誤的回答。現(xiàn)在,來(lái)自谷歌、Mila 研究所等研究機(jī)構(gòu)的研究者聯(lián)合探索了一種

......

本文由站長(zhǎng)之家合作伙伴自媒體作者“機(jī)器之心公眾號(hào)”授權(quán)發(fā)布于站長(zhǎng)之家平臺(tái),本平臺(tái)僅提供信息索引服務(wù)。由于內(nèi)容發(fā)布時(shí)間超過(guò)平臺(tái)更新維護(hù)時(shí)間,為了保證文章信息的及時(shí)性,內(nèi)容觀點(diǎn)的準(zhǔn)確性,平臺(tái)將不提供完全的內(nèi)容展現(xiàn),本頁(yè)面內(nèi)容僅為平臺(tái)搜索索引使用。需閱讀完整內(nèi)容的用戶,請(qǐng)查看原文,獲取內(nèi)容詳情。

舉報(bào)

  • 相關(guān)推薦
  • 谷歌讓大模型更具“心智”,GPT-4任務(wù)準(zhǔn)確率大增

    谷歌聯(lián)合多所高校的一項(xiàng)最新研究,讓大模型開(kāi)始擁有了人類的“心智”。在新的提示策略下,大模型不僅能推測(cè)出人類所面臨的問(wèn)題學(xué)會(huì)了用推測(cè)的結(jié)論調(diào)整自己的行為。來(lái)自谷歌、卡耐基梅隆大學(xué)和的芝加哥大學(xué)的學(xué)者也參與了本項(xiàng)目。

  • 「深呼吸」讓大模型表現(xiàn)更佳!谷歌DeepMind利用大語(yǔ)言模型生成Prompt,還是AI更懂AI

    【新智元導(dǎo)讀】谷歌DeepMind提出了一個(gè)全新的優(yōu)化框架OPRO,僅通過(guò)自然語(yǔ)言描述就可指導(dǎo)大語(yǔ)言模型逐步改進(jìn)解決方案,實(shí)現(xiàn)各類優(yōu)化任務(wù)?!干詈粑徊揭徊降亟鉀Q這個(gè)問(wèn)題。這項(xiàng)研究首次提出并驗(yàn)證了使用大語(yǔ)言模型進(jìn)行優(yōu)化的有效性,為利用LLM進(jìn)行更廣泛優(yōu)化任務(wù)提供了框架和經(jīng)驗(yàn),是這個(gè)新的研究方向的開(kāi)拓性工作,具有重要意義。

  • DeepMind新AI模型AlphaMissense可預(yù)測(cè)遺傳疾病

    GoogleDeepMind發(fā)布了一款名為AlphaMissense的新型人工智能模型,該模型專注于分析DNA突變對(duì)健康的影響,預(yù)測(cè)基因錯(cuò)義變異的致病性,從加速了罕見(jiàn)疾病的研究。該模型不僅為醫(yī)學(xué)研究領(lǐng)域帶來(lái)了革命性的工具展示了人工智能在生物學(xué)中的廣泛應(yīng)用潛力。它可以幫助快速排除不太可能導(dǎo)致疾病的基因變異,但最終的診斷和治療仍需要深入的臨床研究。

  • Google DeepMind提出DRaFT算法以高效優(yōu)化擴(kuò)散模型

    擴(kuò)散模型已經(jīng)革新了各類數(shù)據(jù)的生成建模。但是在實(shí)際應(yīng)用中,如根據(jù)文本描述生成美觀圖像,仍需要微調(diào)模型。其效率、通用性和有效性使其成為機(jī)器學(xué)習(xí)和生成建模領(lǐng)域研究者和從業(yè)者的有價(jià)值工具。

  • 速度提高200倍!DeepMind推新的微調(diào)擴(kuò)散模型方法DRaFT

    擴(kuò)散模型徹底改變了各種數(shù)據(jù)類型的生成建模。在實(shí)際應(yīng)用中,例如從文本描述生成美觀的圖像,通常需要微調(diào)。DRaFT方法的效率、通用性和有效性,使其成為這個(gè)領(lǐng)域研究者和從業(yè)者的有價(jià)值工具。

  • 機(jī)器人研究迎來(lái)ImageNet時(shí)刻:一個(gè)數(shù)據(jù)集,讓DeepMind具身智能大模型突飛猛進(jìn)

    在大模型不斷取得突破的2023,把大模型當(dāng)做大腦來(lái)輔助運(yùn)行的具身智能機(jī)器人研究也在被迅速推進(jìn)。2個(gè)多月前,谷歌DeepMind推出了第一個(gè)控制機(jī)器人的視覺(jué)-語(yǔ)言-動(dòng)作模型——RT-2。未來(lái)的另一個(gè)方向是進(jìn)一步探索不同數(shù)據(jù)集的混合會(huì)如何影響跨具身智能體泛化,以及這種泛化是如何是實(shí)現(xiàn)的。

  • 34B參數(shù)量超越GPT-4!「數(shù)學(xué)通用大模型」MAmmoTH開(kāi)源:平均準(zhǔn)確率最高提升29%

    數(shù)學(xué)通才「猛犸」模型給開(kāi)源語(yǔ)言模型帶來(lái)了「推理春天」,面對(duì)GPT-4都有一戰(zhàn)之力!數(shù)學(xué)推理問(wèn)題是語(yǔ)言模型繞不過(guò)的痛點(diǎn),在各種黑科技的加持下,開(kāi)源模型的推理性能依然不夠看?;F盧大學(xué)、俄亥俄州立大學(xué)、香港科技大學(xué)、愛(ài)丁堡大學(xué)的研究人員聯(lián)合開(kāi)源了一個(gè)專為「通用數(shù)學(xué)問(wèn)題」定制的大模型MAmmoTH和一個(gè)指令調(diào)優(yōu)數(shù)據(jù)集MathInstruct.論文鏈接:https://arxiv.org/pdf/2309.05653

  • GPT-4還強(qiáng),20億參數(shù)模型做算術(shù)題,準(zhǔn)確率幾乎100%

    大型語(yǔ)言模型在處理NLP領(lǐng)域的各種下游任務(wù)方面已經(jīng)表現(xiàn)出卓越的能力。GPT-4、ChatGPT等開(kāi)創(chuàng)性模型已經(jīng)接受了大量文本數(shù)據(jù)的訓(xùn)練,使它們具備強(qiáng)大的文本理解和生成能力,能夠生成連貫且上下文相關(guān)的響應(yīng),在各種NLP任務(wù)中具有高度通用性。為了評(píng)估模型在不同年級(jí)數(shù)學(xué)問(wèn)題上的解決能力,該研究在K6數(shù)據(jù)集上測(cè)試評(píng)估了幾種模型的性能,包括:GPT-4、ChatGPT、Chinese-Alpaca-13B、MOSS-16B、Ziya-LLaMA-13B、Baichuan-7B、ChatGLM-6B、ChatGLM2-6B和MathGLM-GLM-10B,結(jié)果如下圖8所示。

  • DeepMind研究人員發(fā)現(xiàn),深度學(xué)習(xí)模型在圖像和音頻壓縮方面表現(xiàn)出色

    Google旗下的人工智能子公司DeepMind發(fā)布的一項(xiàng)研究表明,大型語(yǔ)言模型除了在文本數(shù)據(jù)處理方面表現(xiàn)出色之外具備出色的圖像和音頻數(shù)據(jù)壓縮能力。這一發(fā)現(xiàn)為重新審視LLMs的潛力提供了新的角度。這表明LLMs的性能與數(shù)據(jù)集的大小有關(guān),壓縮率可以作為評(píng)估模型對(duì)數(shù)據(jù)集信息學(xué)習(xí)的指標(biāo)。

  • 視覺(jué)Transformer中ReLU替代softmax,DeepMind新招讓成本速降

    Transformer架構(gòu)已經(jīng)在現(xiàn)代機(jī)器學(xué)習(xí)領(lǐng)域得到了廣泛的應(yīng)用。注意力是transformer的一大核心組件,其中包含了一個(gè)softmax,作用是產(chǎn)生token的一個(gè)概率分布。對(duì)于使用ReLU的S/8模型,這種門(mén)控機(jī)制會(huì)將實(shí)驗(yàn)所需的核心時(shí)間增多大約9.3%。

熱文

  • 3 天
  • 7天