幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 業(yè)界 > 關鍵詞  > MemWalker最新資訊  > 正文

Meta推大模型記憶增強方法MemWalker 靠prompt就能完成,無需額外訓練

2023-10-25 10:08 · 稿源:站長之家

要點:

1. 研究團隊開發(fā)了名為MemWalker的樹形記憶策略,使大型語言模型能夠突破窗口長度限制,實現(xiàn)長文本的閱讀和回答問題,而無需額外訓練。

2. MemWalker的工作原理分為記憶樹構建和導航檢索兩個階段,其中長文本被分割成小段,大模型對每段進行總結形成"葉子節(jié)點"和"非葉節(jié)點",非葉節(jié)點用于定位答案,葉子節(jié)點用于推理答案。

3. MemWalker還引入了工作記憶機制,將已經(jīng)訪問的節(jié)點內(nèi)容加入到當前內(nèi)容的上下文中,以提高準確度,而且整個過程只依賴于prompt,不需要額外訓練。

站長之家(ChinaZ.com)10月25日 消息:一項名為MemWalker的新技術,使大型語言模型能夠克服其窗口長度的限制,從而可以處理更長的文本并回答相關問題,而無需進行額外的訓練。這一技術的開發(fā)團隊使用了一種樹形記憶策略,該策略的工作原理包括兩個主要階段:記憶樹構建和導航檢索。

2_1698200025836_ai2023_Technology_Tree_Futurism_Technology_BlueThe_image_featur_2e08d71e-2f2f-41e9-8c05-cc16656d7383.png

圖源備注:圖片由AI生成,圖片授權服務商Midjourney

在記憶樹構建階段,長文本被分割成多個小段,每個小段都由大型語言模型進行總結,形成了"葉子節(jié)點"和"非葉節(jié)點"。這些葉子節(jié)點包含原始信息,而非葉節(jié)點只包含概括信息。非葉節(jié)點用于定位答案所在的葉子節(jié)點,而葉子節(jié)點用于推理出答案。整個過程是逐步的,從葉子節(jié)點到非葉節(jié)點,直到建立完整的樹形結構。

image.png

論文地址:https://arxiv.org/abs/2310.05029

導航檢索階段涉及從根節(jié)點開始,逐一讀取下一級子節(jié)點的內(nèi)容,然后推理出是否繼續(xù)前進或返回。這個過程一直持續(xù),直到找到合適的葉子節(jié)點生成答案或達到最大步數(shù)。如果模型發(fā)現(xiàn)進入了錯誤的路徑,還可以進行導航回退。此外,MemWalker還引入了工作記憶機制,將已經(jīng)訪問的節(jié)點內(nèi)容加入到當前內(nèi)容的上下文中,以提高準確度。

重要的是,整個過程只依賴于prompt,不需要進行額外的訓練。理論上,只要有足夠的算力,MemWalker可以處理無限長的文本,但記憶樹構建時的時間和空間復雜度會隨著文本長度的增長呈指數(shù)型增加。這一技術的發(fā)展由普林斯頓大學NLP實驗室的華人博士生Howard Chen領銜,得到了導師陳丹琦和Meta AI實驗室的學者的參與。整個研究成果使大型語言模型在處理長文本方面邁出了重要一步。

舉報

  • 相關推薦
  • 大家在看
  • CogVideoX1.5-5B-SAT:開源視頻生成模型,支持10秒視頻和更高分辨率。

    CogVideoX1.5-5B-SAT是由清華大學知識工程與數(shù)據(jù)挖掘團隊開發(fā)的開源視頻生成模型,是CogVideoX模型的升級版。該模型支持生成10秒視頻,并支持更高分辨率的視頻生成。模型包含Transformer、VAE和Text Encoder等模塊,能夠根據(jù)文本描述生成視頻內(nèi)容。CogVideoX1.5-5B-SAT模型以其強大的視頻生成能力和高分辨率支持,為視頻內(nèi)容創(chuàng)作者提供了一個強大的工具,尤其在教育、娛樂和商業(yè)領域有著廣泛的應用前景。

  • Ask The Post AI:華盛頓郵報的AI問答產(chǎn)品

    Ask The Post AI是華盛頓郵報推出的一款基于人工智能的產(chǎn)品,它允許讀者就自2016年以來發(fā)布的所有報道提出問題。該產(chǎn)品利用生成式AI技術和對話格式,依托華盛頓郵報長期以來基于事實、深入報道的新聞傳統(tǒng),以新的方式取悅并通知讀者。Ask The Post AI通過機器學習團隊對Climate Answers工具的數(shù)據(jù)進行提煉,優(yōu)化了如何檢索和匹配自2016年以來新聞室發(fā)布的所有報道中與用戶查詢相關的相關文章。

  • Mistral Moderation API:AI內(nèi)容審核服務,保護下游部署安全。

    Mistral Moderation API是Mistral AI推出的內(nèi)容審核服務,旨在幫助用戶檢測和過濾不受歡迎的文本內(nèi)容。該API是Le Chat中使用的審核服務的同一技術,現(xiàn)在對外開放,以便用戶可以根據(jù)特定的應用和安全標準定制和使用這一工具。該模型是一個基于LLM(大型語言模型)的分類器,能夠將文本輸入分類到9個預定義的類別中。Mistral AI的這一API支持原生多語言,特別針對阿拉伯語、中文、英語、法語、德語、意大利語、日語、韓語、葡萄牙語、俄語和西班牙語進行了訓練。該API的主要優(yōu)點包括提高審核的可擴展性和魯棒性,以及通過技術文檔提供的詳細政策定義和啟動指南,幫助用戶有效實施系統(tǒng)級的安全防護。

  • Medio AI:AI編輯工具,助力企業(yè)視頻營銷本地化。

    Medio AI是一個為企業(yè)提供AI編輯工具的平臺,專注于視頻翻譯和視頻配音,幫助企業(yè)無畏全球擴張,實現(xiàn)視頻營銷的本地化。產(chǎn)品背景信息顯示,Medio AI旨在幫助企業(yè)探索更多海外市場,通過AI技術提升視頻編輯效率,增強產(chǎn)品在國際市場上的競爭力。產(chǎn)品的主要優(yōu)點包括無需下載、在線使用、一鍵去除視頻水印、產(chǎn)品翻譯、視頻配音等。價格方面,Medio AI提供免費試用,并根據(jù)不同的功能需求提供不同的付費版本。

  • PodExtra AI:釋放播客的力量,用AI提升播客收聽體驗

    PodExtra AI是一款先進的AI工具,專為播客收聽和知識獲取設計。它通過生成播客內(nèi)容的摘要、思維導圖、大綱、亮點和要點,幫助用戶快速把握播客的核心內(nèi)容。產(chǎn)品背景信息顯示,播客愛好者平均每周消費超過8集,全球有超過400萬的節(jié)目可供選擇。PodExtra AI通過AI技術,使得用戶能夠快速瀏覽內(nèi)容,節(jié)省時間,提高效率。產(chǎn)品定位于幫助用戶從海量播客內(nèi)容中快速獲取有價值的信息,特別適合時間緊張但希望從播客中獲取知識的人群。

  • 語鯨:,智能語言處理平臺

    語鯨是一個專注于語言處理的平臺,它利用先進的自然語言處理技術,為用戶提供文本分析、翻譯、校對等服務。產(chǎn)品背景信息顯示,語鯨旨在幫助用戶提高寫作效率和質量,特別是在多語言環(huán)境中。語鯨的價格定位尚未明確,但考慮到其提供的服務,可能會有免費試用和付費版本。

  • CR-Mentor:AI驅動的代碼審查導師,提升代碼質量和審查效率。

    CR-Mentor AI CodeReview Mentor是一個基于人工智能的代碼審查工具,它通過積累的最佳實踐知識庫和大型語言模型(LLM)分析,為主流編程語言提供智能代碼審查。該產(chǎn)品支持自定義的代碼審查標準,能夠為單個文件代碼變更提供專業(yè)評分和改進建議,并通過LLM生成全面的審查報告,包括代碼走查、變更描述和時序圖。它與GitHub工作流程深度集成,實現(xiàn)自動化代碼審查,支持多語言反饋,幫助整個團隊提升代碼質量和審查效率。

  • Srcbook:開源、自托管、AI驅動的應用構建器。

    Srcbook是一個開源、自托管的AI驅動應用構建器,它允許用戶快速構建和部署各種應用程序。產(chǎn)品背景信息顯示,Srcbook旨在提供一個平臺,讓開發(fā)者和非技術用戶都能夠輕松地構建應用程序,從而提高生產(chǎn)力和創(chuàng)新能力。它支持多種應用場景,如項目管理工具、音樂發(fā)現(xiàn)頁面、技術文檔網(wǎng)站等。Srcbook的主要優(yōu)點包括開源性、靈活性和易用性,用戶可以根據(jù)自己的需求定制和擴展功能。

  • ReCapture:用戶視頻的生成性視頻攝像機控制

    ReCapture是一種從單一用戶提供的視頻生成新視頻和新穎攝像機軌跡的方法。該技術允許我們從完全不同的角度重新生成源視頻,并帶有電影級別的攝像機運動。ReCapture通過使用多視圖擴散模型或基于深度的點云渲染生成帶有新攝像機軌跡的嘈雜錨視頻,然后通過我們提出的掩蔽視頻微調技術將錨視頻重新生成為干凈且時間上一致的重新角度視頻。這種技術的重要性在于它能夠利用視頻模型的強大先驗,將近似的視頻重新生成為時間上一致且美觀的視頻。

  • AI Tattoo Generator.net:快速創(chuàng)建個性化紋身設計

    AI Tattoo Generator是一個利用人工智能技術幫助用戶快速創(chuàng)建個性化紋身設計的在線平臺。該平臺使用先進的機器學習算法,根據(jù)用戶輸入生成具有各種風格的現(xiàn)實感紋身概念圖,確保用戶的想法以視覺上引人入勝的方式呈現(xiàn)。它不僅能夠提供即時的設計結果,還能讓用戶根據(jù)自己的偏好進一步定制和細化設計,滿足個性化需求。

  • Unfaked:AI生成的逼真圖片庫

    Unfaked是一個提供由人工智能生成的逼真圖片的網(wǎng)站,這些圖片幾乎可以以假亂真。用戶可以免費下載并自由使用這些圖片。每周都會更新更多的圖片。這個平臺的重要性在于它為設計師、內(nèi)容創(chuàng)作者和營銷人員提供了一個免費的資源庫,他們可以在這里找到高質量的圖片資源,而無需擔心版權問題。

  • ComfyUI-GIMM-VFI:基于GIMM-VFI的ComfyUI幀插值工具

    ComfyUI-GIMM-VFI是一個基于GIMM-VFI算法的幀插值工具,使用戶能夠在圖像和視頻處理中實現(xiàn)高質量的幀插值效果。該技術通過在連續(xù)幀之間插入新的幀來提高視頻的幀率,從而使得動作看起來更加流暢。這對于視頻游戲、電影后期制作和其他需要高幀率視頻的應用場景尤為重要。產(chǎn)品背景信息顯示,它是基于Python開發(fā)的,并且依賴于CuPy庫,特別適用于需要進行高性能計算的場景。

  • 5ire:簡單易用,釋放AI的強大力量

    5ire是一個以簡潔和用戶友好為核心的AI產(chǎn)品,旨在讓即使是初學者也能輕松利用大型語言模型。它支持多種文檔格式的解析和向量化,具備本地知識庫、使用分析、提示庫、書簽和快速關鍵詞搜索等功能。作為一個開源項目,5ire提供免費下載,并且提供了按需付費的大型語言模型API服務。

  • AI Hear:一款在您電腦本地運行的私有軟件,提供多語種實時翻譯。

    AI Hear是一款在電腦本地運行的私有軟件,它通過一鍵開啟多語種實時翻譯功能,幫助用戶管理音頻、譯文和時間軸。產(chǎn)品不收集數(shù)據(jù),保護用戶隱私。它適用于多種場景,如線上會議、網(wǎng)課播客、游戲直播等,并且完全本地運行,相比市面上的實時翻譯產(chǎn)品更具性價比。

  • SD Image:使用最新的Stable Diffusion 3.5模型生成高質量圖像。

    SD Image的Stable Diffusion 3.5 Image Generator是一個在線圖像生成器,它利用最新的Stable Diffusion 3.5模型,包括Medium, Large, Large Turbo,來生成高質量的圖像。這項技術的重要性在于它能夠通過文本提示(prompt)快速生成圖像,為設計師、藝術家和創(chuàng)意工作者提供靈感和便利。產(chǎn)品背景信息顯示,SD Image是一個在線平臺,用戶可以通過它找到靈感、生成圖像、探索不同的prompt和模型。目前,該產(chǎn)品提供免費試用,適合需要快速生成圖像的用戶。

  • AI Homeworkify:下一代AI作業(yè)助手,免費獲取作業(yè)答案

    AI Homeworkify是一個基于人工智能的在線問答平臺,旨在幫助學生通過提供詳細的答案和解題步驟來學習和理解各種學術問題。該平臺不涉及版權侵犯,注重教育平等,提供免費、即時的作業(yè)幫助,支持多種學科和語言。AI Homeworkify的主要優(yōu)點包括完全免費、無需注冊、即時答案、全天候服務、多設備兼容、隱私保護和逐步解決方案。產(chǎn)品背景信息顯示,AI Homeworkify致力于通過技術手段減少教育不平等,為全球學生提供免費的優(yōu)質學習輔助服務。

  • AI Voice Lab:在線將文字轉換為逼真的語音

    AI Voice Lab免費 AI 文字轉語音神器是一個利用最新的類GPT AI語音模型技術,提供超級逼真的配音結果,支持20+種語言和100+種聲音,每天提供免費使用次數(shù),適用于視頻、音頻制作等多種場景,提高內(nèi)容吸引力。

  • LookAI:零基礎小白的Cursor AI編程學習平臺

    LookAI是一個專為零基礎小白設計的AI編程學習平臺,提供Cursor AI編程教程和實戰(zhàn)項目,幫助用戶認識、學會使用Cursor,落地創(chuàng)意和想法。該平臺以視頻教程、實戰(zhàn)項目和AI資源集合為特色,旨在賦能每一個普通人,讓他們在AI時代中能夠更好地發(fā)揮自己的創(chuàng)造力。LookAI平臺免費提供資源,適合所有對AI編程感興趣的初學者。

  • DataChain:現(xiàn)代Python數(shù)據(jù)框庫,專為人工智能設計。

    DataChain是一個現(xiàn)代的Python數(shù)據(jù)框庫,專為人工智能設計。它旨在將非結構化數(shù)據(jù)組織成數(shù)據(jù)集,并在本地機器上大規(guī)模處理數(shù)據(jù)。DataChain不抽象或隱藏AI模型和API調用,而是幫助將它們集成到后現(xiàn)代數(shù)據(jù)堆棧中。該產(chǎn)品以其高效性、易用性和強大的數(shù)據(jù)處理能力為主要優(yōu)點,支持多種數(shù)據(jù)存儲和處理方式,包括圖像、視頻、文本等多種數(shù)據(jù)類型,并且能夠與PyTorch和TensorFlow等深度學習框架無縫對接。DataChain是開源的,遵循Apache-2.0許可協(xié)議,免費供用戶使用。

  • PromptQL:AI驅動的數(shù)據(jù)訪問工具,提升私有數(shù)據(jù)的智能檢索效率。

    PromptQL是一個專為AI設計的代理數(shù)據(jù)訪問工具,它通過代理查詢規(guī)劃,像人類一樣檢索數(shù)據(jù),首先收集相關信息,然后應用合適的大型語言模型(LLM)進行分類和后續(xù)處理,以提高私有數(shù)據(jù)的檢索效率和準確性。這一技術的出現(xiàn),解決了傳統(tǒng)搜索算法在封閉領域中對數(shù)據(jù)檢索的局限性,特別是在用戶提出非標準化查詢時,PromptQL能夠更好地理解和響應。產(chǎn)品背景信息顯示,PromptQL旨在通過與用戶的緊密合作,免費構建首個代理,以評估和提升現(xiàn)有AI代理/助手的性能。

今日大家都在搜的詞:

熱文

  • 3 天
  • 7天