幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 業(yè)界 > 關(guān)鍵詞  > OpenAI最新資訊  > 正文

OpenAI開發(fā)者大會(huì)推出四大創(chuàng)新:提示詞緩存可減少50%輸入token成本

2024-10-02 11:30 · 稿源: TechWeb.com.cn
<a href="http://olivierpozzo.com/tags/OpenAI.shtml" target="_blank"><span>OpenAI</span></a> <a href="http://olivierpozzo.com/tags/895155.shtml" target="_blank"><span>DevDay</span></a> 2024: Introducing New Tools to Enhance AI Capabilities

OpenAI Unveils Groundbreaking Tools to Revolutionize AI Development

At its annual DevDay event on October 1st, OpenAI showcased a suite of innovative tools designed to empower developers and advance the field of AI.

Realtime API: Seamless Multimodal Dialogue Interactions

The Realtime API, currently in public beta, enables developers to build low-latency, multimodal dialogue experiences. It supports text and audio inputs and outputs, as well as function calls.

Powered by the GPT-4o model, the API allows developers to send any text or audio prompt to the model and receive a response in their chosen format.

The Realtime API simplifies the creation of voice assistants and other conversational AI tools, eliminating the need for complex model stitching for transcription, inference, and text-to-speech conversion.

Vision Fine-Tuning: Enhanced Image Understanding for Advanced Applications

GPT-4o, OpenAI's latest LLM, now features Vision Fine-Tuning, which enables developers to tailor the model for enhanced image understanding.

Similar to text fine-tuning, developers can prepare image datasets and upload them to OpenAI's platform. With as few as 100 images, they can significantly improve GPT-4o's performance on visual tasks, with further improvements possible using larger datasets.

For example, Grab, a Southeast Asian food delivery and ride-hailing company, leveraged this technology to enhance their mapping services.

Prompt Caching: Optimized Cost and Latency

Prompt Caching is a game-changing update that significantly reduces costs and latency for developers.

Many AI applications involve repeated use of the same context across multiple API calls, such as editing codebases or engaging in extended multi-turn conversations with chatbots.

Prompt Caching automatically reuses recently processed input tokens, resulting in a 50% discount and faster prompt processing times.

Model Distillation: Bringing Advanced Model Capabilities to Compact Models

OpenAI introduced a new Model Distillation offering that provides developers with an integrated workflow to manage the distillation process directly within the OpenAI platform.

This enables them to leverage the outputs of cutting-edge models like o1-preview and GPT-4o to fine-tune and improve the performance of more cost-effective models like GPT-4o mini.

Small companies can now benefit from capabilities similar to state-of-the-art models without incurring the computational costs associated with using them.

舉報(bào)

  • 相關(guān)推薦
  • 大家在看
  • URL Parser Online:在線URL解析器,將URL轉(zhuǎn)換為適合大型語言模型的輸入格式。

    URL Parser Online是一個(gè)在線工具,它能夠?qū)?fù)雜的URL轉(zhuǎn)換為適合大型語言模型(LLMs)使用的輸入格式。這項(xiàng)技術(shù)的重要性在于它能夠幫助開發(fā)者和研究人員更有效地處理和解析URL數(shù)據(jù),尤其是在進(jìn)行網(wǎng)頁內(nèi)容分析和數(shù)據(jù)抽取時(shí)。產(chǎn)品背景信息顯示,隨著互聯(lián)網(wǎng)數(shù)據(jù)量的爆炸式增長(zhǎng),對(duì)URL的解析和處理需求日益增加。URL Parser Online以其簡(jiǎn)潔的用戶界面和高效的解析能力,為用戶提供了一個(gè)便捷的解決方案。該產(chǎn)品目前提供免費(fèi)服務(wù),定位于開發(fā)者和數(shù)據(jù)分析師。

  • AI Summarizer:全能AI摘要生成器,快速生成文本、PDF、視頻摘要。

    AI Summarizer是一個(gè)強(qiáng)大的AI摘要生成器,支持文本、PDF、視頻等多種格式的摘要生成。它通過先進(jìn)的算法提取關(guān)鍵信息,幫助用戶快速理解內(nèi)容要點(diǎn),提升工作和學(xué)習(xí)效率。產(chǎn)品支持超過50種語言,保障用戶隱私,不存儲(chǔ)任何上傳文件,并提供免費(fèi)的Chrome擴(kuò)展插件,方便用戶隨時(shí)隨地使用。

  • Transcribro:Android平臺(tái)上的私有、設(shè)備端語音識(shí)別鍵盤和文字服務(wù)

    Transcribro是一款運(yùn)行在Android平臺(tái)上的私有、設(shè)備端語音識(shí)別鍵盤和文字服務(wù)應(yīng)用,它使用whisper.cpp來運(yùn)行OpenAI Whisper系列模型,并結(jié)合Silero VAD進(jìn)行語音活動(dòng)檢測(cè)。該應(yīng)用提供了語音輸入鍵盤,允許用戶通過語音進(jìn)行文字輸入,并且可以被其他應(yīng)用顯式使用,或者設(shè)置為用戶選擇的語音轉(zhuǎn)文字應(yīng)用,部分應(yīng)用可能會(huì)使用它來進(jìn)行語音轉(zhuǎn)文字。Transcribro的背景是為用戶提供一種更安全、更私密的語音轉(zhuǎn)文字解決方案,避免了云端處理可能帶來的隱私泄露問題。該應(yīng)用是開源的,用戶可以自由地查看、修改和分發(fā)代碼。

  • Oasis:基于Transformer的實(shí)時(shí)開放世界AI模型

    Oasis是由Decart AI開發(fā)的首個(gè)可玩、實(shí)時(shí)、開放世界的AI模型,它是一個(gè)互動(dòng)視頻游戲,由Transformer端到端生成,基于逐幀生成。Oasis能夠接收用戶鍵盤和鼠標(biāo)輸入,實(shí)時(shí)生成游戲玩法,內(nèi)部模擬物理、游戲規(guī)則和圖形。該模型通過直接觀察游戲玩法學(xué)習(xí),允許用戶移動(dòng)、跳躍、拾取物品、破壞方塊等。Oasis被視為研究更復(fù)雜交互世界的基礎(chǔ)模型的第一步,未來可能取代傳統(tǒng)的游戲引擎。Oasis的實(shí)現(xiàn)需要模型架構(gòu)的改進(jìn)和模型推理技術(shù)的突破,以實(shí)現(xiàn)用戶與模型的實(shí)時(shí)交互。Decart AI采用了最新的擴(kuò)散訓(xùn)練和Transformer模型方法,并結(jié)合了大型語言模型(LLMs)來訓(xùn)練一個(gè)自回歸模型,該模型可以根據(jù)用戶即時(shí)動(dòng)作生成視頻。此外,Decart AI還開發(fā)了專有的推理框架,以提供NVIDIA H100 Tensor Core GPU的峰值利用率,并支持Etched即將推出的Sohu芯片。

  • 三頓智能助手:多功能AI助手,提供問答、寫作、繪圖等智能服務(wù)。

    三頓智能助手是一個(gè)集成了多種AI功能的在線平臺(tái),它通過提供問答、寫作、繪圖等多種服務(wù),幫助用戶提高工作效率和創(chuàng)造力。該產(chǎn)品以其強(qiáng)大的AI技術(shù)背景和用戶友好的界面,為用戶提供了一個(gè)便捷的智能服務(wù)入口。價(jià)格方面,三頓智能助手提供免費(fèi)試用,同時(shí)也提供付費(fèi)服務(wù)以解鎖更多功能。

  • Light Novels:AI驅(qū)動(dòng)的輕小說閱讀平臺(tái),提供個(gè)性化推薦和翻譯

    Explore Light Novels是一個(gè)AI驅(qū)動(dòng)的輕小說閱讀平臺(tái),旨在通過人工智能技術(shù)打破語言障礙,為全球讀者提供沉浸式的輕小說閱讀體驗(yàn)。平臺(tái)擁有數(shù)千部流行輕小說,并提供AI驅(qū)動(dòng)的個(gè)性化推薦,每日更新新章節(jié)和根據(jù)讀者偏好定制的新鮮內(nèi)容。此外,平臺(tái)還提供AI生成的文化背景注釋,幫助讀者深入了解故事背景,并通過AI推薦系統(tǒng)學(xué)習(xí)用戶的輕小說偏好,推薦新作者和故事。平臺(tái)還設(shè)有AI主持的全球社區(qū)討論,以及AI生成的每日內(nèi)容,確保讀者總有新鮮內(nèi)容可讀。

  • SDXL_EcomID_ComfyUI:ComfyUI的EcomID原生支持插件

    SDXL_EcomID_ComfyUI是一個(gè)為ComfyUI提供原生SDXL-EcomID支持的插件。它通過增強(qiáng)肖像表示,提供更真實(shí)、審美上更令人愉悅的外觀,同時(shí)確保語義一致性和更大的內(nèi)部ID相似性。這個(gè)插件完全集成于ComfyUI,并且不使用diffusers,而是本地實(shí)現(xiàn)EcomID。它的重要性在于能夠提升圖像生成的質(zhì)量和一致性,特別是在處理人物肖像時(shí),能夠保持不同年齡、發(fā)型、眼鏡等物理變化下的內(nèi)部特征一致性。

  • Promega:通過ChatGPT加速制造、銷售和市場(chǎng)營(yíng)銷。

    Promega是一家在生命科學(xué)領(lǐng)域領(lǐng)先的公司,提供用于研究和應(yīng)用技術(shù)的開創(chuàng)性生物試劑和集成系統(tǒng)。Promega通過自上而下地采用ChatGPT,幫助員工更高效地管理數(shù)千種產(chǎn)品和超過60,000個(gè)賬戶,從而加速產(chǎn)品交付到生物技術(shù)生態(tài)系統(tǒng)。ChatGPT的使用不僅提高了工作效率,還增強(qiáng)了客戶關(guān)系,并在制造、銷售和市場(chǎng)營(yíng)銷等多個(gè)領(lǐng)域發(fā)揮了重要作用。

  • Excerptor:從實(shí)體書籍中提取劃線或手寫標(biāo)記的文本

    Excerptor是一個(gè)專門設(shè)計(jì)來從實(shí)體書籍中提取劃線或手寫標(biāo)記文本的工具。它通過圖像處理和光學(xué)字符識(shí)別技術(shù),將書籍中的標(biāo)記文本轉(zhuǎn)換為數(shù)字格式,方便用戶編輯和保存。這項(xiàng)技術(shù)的重要性在于它能夠幫助用戶快速?gòu)拇罅繒刑崛£P(guān)鍵信息,提高研究和學(xué)習(xí)的效率。Excerptor以其高效、準(zhǔn)確的文本識(shí)別能力和用戶友好的操作界面,滿足了學(xué)術(shù)研究、教育和個(gè)人學(xué)習(xí)等不同領(lǐng)域的需求。目前,Excerptor是免費(fèi)提供給用戶的,它的開發(fā)和維護(hù)由開源社區(qū)負(fù)責(zé)。

  • Spafe Code:AI代碼翻譯器

    Spafe Code是一個(gè)利用人工智能技術(shù)實(shí)現(xiàn)代碼翻譯的平臺(tái),它能夠?qū)⒋a從一種編程語言翻譯成另一種編程語言。這項(xiàng)技術(shù)的重要性在于它能夠幫助開發(fā)者跨越語言障礙,提高代碼的可讀性和可維護(hù)性,促進(jìn)全球開發(fā)者之間的協(xié)作。Spafe Code以其高效的翻譯能力、易用性和對(duì)多種編程語言的支持而受到開發(fā)者的歡迎。目前,Spafe Code提供免費(fèi)試用,具體價(jià)格和定位信息需要進(jìn)一步查詢。

  • Browser AI Kit:在瀏覽器中直接運(yùn)行的AI工具箱

    Browser AI Kit是一個(gè)集成了多種AI工具的平臺(tái),用戶可以在瀏覽器中直接使用這些工具,無需安裝或設(shè)置。它提供了音頻轉(zhuǎn)文本、去除背景、文本轉(zhuǎn)語音等多種功能,并且完全免費(fèi)。這個(gè)工具箱基于Transformers.js開發(fā),強(qiáng)調(diào)數(shù)據(jù)安全和隱私保護(hù),所有數(shù)據(jù)處理都在本地進(jìn)行,不上傳任何服務(wù)器。它的目標(biāo)是為用戶提供一個(gè)便捷、安全、多功能的AI工具平臺(tái)。

  • Emotive AI Actors by CreatorKit:視頻廣告中的情感AI演員

    Emotive AI Actors by CreatorKit是一個(gè)利用人工智能技術(shù)創(chuàng)建用戶生成內(nèi)容(UGC)視頻和廣告的平臺(tái)。它通過與真實(shí)UGC演員和內(nèi)容策略師合作訓(xùn)練AI,使得用戶能夠快速創(chuàng)建出具有真實(shí)情感反應(yīng)的視頻廣告。這個(gè)產(chǎn)品的重要性在于它能夠以更低的成本、更快的速度和更好的性能來替代傳統(tǒng)的視頻制作方式,同時(shí)提供可擴(kuò)展的解決方案,允許用戶在幾分鐘內(nèi)創(chuàng)建出100個(gè)視頻廣告。AI Actors的主要優(yōu)點(diǎn)包括成本效益、快速制作、性能優(yōu)越和易于擴(kuò)展。

  • SELA:通過結(jié)合蒙特卡洛樹搜索和基于LLM的代理來增強(qiáng)自動(dòng)化機(jī)器學(xué)習(xí)。

    SELA是一個(gè)創(chuàng)新系統(tǒng),它通過將蒙特卡洛樹搜索(MCTS)與基于大型語言模型(LLM)的代理結(jié)合起來,增強(qiáng)了自動(dòng)化機(jī)器學(xué)習(xí)(AutoML)。傳統(tǒng)的AutoML方法經(jīng)常產(chǎn)生低多樣性和次優(yōu)的代碼,限制了它們?cè)谀P瓦x擇和集成方面的有效性。SELA通過將管道配置表示為樹,使代理能夠智能地探索解決方案空間,并根據(jù)實(shí)驗(yàn)反饋迭代改進(jìn)其策略。

  • Universal-2:下一代語音AI,提供卓越的音頻數(shù)據(jù)處理能力。

    Universal-2是AssemblyAI推出的最新語音識(shí)別模型,它在準(zhǔn)確度和精確度上超越了前一代Universal-1,能夠更好地捕捉人類語言的復(fù)雜性,為用戶提供無需二次檢查的音頻數(shù)據(jù)。這一技術(shù)的重要性在于它能夠?yàn)楫a(chǎn)品體驗(yàn)提供更敏銳的洞察力、更快的工作流程和一流的產(chǎn)品體驗(yàn)。Universal-2在專有名詞識(shí)別、文本格式化和字母數(shù)字識(shí)別方面都有顯著提升,減少了實(shí)際應(yīng)用中的詞錯(cuò)誤率。

  • Laminar.ai:開源全棧平臺(tái),為打造頂級(jí)LLM產(chǎn)品提供支持

    Laminar是一個(gè)開源的全棧平臺(tái),專注于從第一性原理出發(fā)進(jìn)行AI工程。它幫助用戶收集、理解和使用數(shù)據(jù),以提高大型語言模型(LLM)應(yīng)用的質(zhì)量。Laminar支持對(duì)文本和圖像模型的追蹤,并且即將支持音頻模型。產(chǎn)品的主要優(yōu)點(diǎn)包括零開銷的可觀測(cè)性、在線評(píng)估、數(shù)據(jù)集構(gòu)建和LLM鏈管理。Laminar完全開源,易于自托管,適合需要構(gòu)建和管理LLM產(chǎn)品的開發(fā)者和團(tuán)隊(duì)。

  • HOVER:人形機(jī)器人多功能神經(jīng)全身控制器

    HOVER是一個(gè)針對(duì)人形機(jī)器人的多功能神經(jīng)全身控制器,它通過模仿全身運(yùn)動(dòng)來提供通用的運(yùn)動(dòng)技能,學(xué)習(xí)多種全身控制模式。HOVER通過多模式策略蒸餾框架將不同的控制模式整合到一個(gè)統(tǒng)一的策略中,實(shí)現(xiàn)了在不同控制模式之間的無縫切換,同時(shí)保留了每種模式的獨(dú)特優(yōu)勢(shì)。這種控制器提高了人形機(jī)器人在多種模式下的控制效率和靈活性,為未來的機(jī)器人應(yīng)用提供了一個(gè)健壯且可擴(kuò)展的解決方案。

  • LinkedIn Hiring Assistant:LinkedIn招聘助手,助力招聘流程自動(dòng)化。

    Hiring Assistant for Recruiter & Jobs是LinkedIn推出的一款A(yù)I助手,旨在幫助招聘人員自動(dòng)化執(zhí)行耗時(shí)的任務(wù),從而讓他們專注于更有影響力的、以人為中心的工作部分。這款產(chǎn)品代表了LinkedIn在利用人工智能技術(shù)優(yōu)化招聘流程方面邁出的重要一步,它通過自動(dòng)構(gòu)建候選人管道、篩選頂級(jí)申請(qǐng)者、起草外展郵件甚至回答有關(guān)角色的基本問題來減輕招聘人員的工作負(fù)擔(dān)。產(chǎn)品背景信息顯示,LinkedIn一直致力于通過AI技術(shù)提升用戶體驗(yàn),而Hiring Assistant的推出進(jìn)一步強(qiáng)化了這一點(diǎn)。產(chǎn)品定位于幫助招聘人員提高效率,同時(shí)保持對(duì)招聘過程的完全控制。

  • Fable:AI驅(qū)動(dòng)的交互式產(chǎn)品演示軟件

    Fable是一款A(yù)I驅(qū)動(dòng)的交互式產(chǎn)品演示軟件,旨在幫助企業(yè)通過創(chuàng)建高轉(zhuǎn)化率的產(chǎn)品演示來吸引潛在客戶、完成交易并簡(jiǎn)化產(chǎn)品上線流程。Fable通過其AI技術(shù),允許用戶輕松創(chuàng)建個(gè)性化的演示,這些演示可以嵌入網(wǎng)站、通過電子郵件發(fā)送或添加到幫助中心。產(chǎn)品背景信息顯示,F(xiàn)able在G2上獲得了4.9的高評(píng)分,并被全球各地的GTM團(tuán)隊(duì)所信賴。Fable的價(jià)格定位是免費(fèi)試用和付費(fèi),適合需要提高銷售轉(zhuǎn)化率和客戶滿意度的商業(yè)團(tuán)隊(duì)。

  • Trieve:AI優(yōu)先的基礎(chǔ)設(shè)施API,提供搜索、推薦和RAG服務(wù)

    Trieve是一個(gè)AI優(yōu)先的基礎(chǔ)設(shè)施API,結(jié)合了語言模型和工具,用于微調(diào)排名和相關(guān)性,提供一站式的搜索、推薦、RAG和分析解決方案。它能夠自動(dòng)持續(xù)改進(jìn),基于數(shù)十個(gè)反饋信號(hào),確保相關(guān)性。Trieve支持語義向量搜索、BM25和SPlade全文搜索,以及混合搜索,結(jié)合全文搜索和語義向量搜索。此外,它還提供了商品推銷和相關(guān)性調(diào)整功能,幫助用戶通過API或無代碼儀表板調(diào)整搜索結(jié)果以實(shí)現(xiàn)KPI。Trieve建立在最佳基礎(chǔ)之上,使用開源嵌入模型和LLMs,運(yùn)行在自己的服務(wù)器上,確保數(shù)據(jù)安全。

  • Open Source AI Definition:開源人工智能定義,推動(dòng)AI領(lǐng)域的開放與合作

    Open Source AI Definition(OSAID)是由Open Source Initiative(OSI)發(fā)布的行業(yè)首個(gè)開源人工智能定義。它提供了一個(gè)標(biāo)準(zhǔn),通過社區(qū)領(lǐng)導(dǎo)的開放和公共評(píng)估來驗(yàn)證一個(gè)AI系統(tǒng)是否可以被認(rèn)為是開源AI。OSAID v1.0的發(fā)布是多年研究和合作的結(jié)果,經(jīng)過國(guó)際研討會(huì)和為期一年的共同設(shè)計(jì)過程。這個(gè)定義要求開源模型提供足夠的訓(xùn)練數(shù)據(jù)信息,以便熟練的人可以使用相同或類似的數(shù)據(jù)重建一個(gè)大致等效的系統(tǒng)。OSAID的發(fā)布對(duì)于推動(dòng)AI領(lǐng)域的開放性、透明度和合作具有重要意義,它強(qiáng)調(diào)了開源原則在AI發(fā)展中的核心地位,并為獨(dú)立機(jī)器學(xué)習(xí)研究人員和大型AI開發(fā)者之間的透明度提供了支持。

今日大家都在搜的詞:

熱文

  • 3 天
  • 7天