AI實(shí)時(shí)對(duì)話系統(tǒng)WhisperFusion：集成大模型，與AI無縫語(yǔ)音對(duì)話

2024-01-31 13:44 · 稿源：站長(zhǎng)之家

**劃重點(diǎn):**
1. ??? 實(shí)時(shí)語(yǔ)音轉(zhuǎn)文本:利用OpenAI WhisperLive實(shí)現(xiàn)即時(shí)將口語(yǔ)轉(zhuǎn)換為文本。
2. ?? 大型語(yǔ)言模型整合:集成Mistral大型語(yǔ)言模型，提升對(duì)轉(zhuǎn)錄文本的理解和上下文把握。
3. ?? TensorRT優(yōu)化:LLM和Whisper均經(jīng)過TensorRT引擎優(yōu)化，確保高性能和低延遲處理。

站長(zhǎng)之家（ChinaZ.com）1月31日消息:WhisperFusion是一個(gè)基于WhisperLive和WhisperSpeech技術(shù)的AI對(duì)話系統(tǒng)，通過在實(shí)時(shí)語(yǔ)音轉(zhuǎn)文本流程中集成Mistral大型語(yǔ)言模型（LLM），實(shí)現(xiàn)了與AI的無縫對(duì)話。

LLM和Whisper均經(jīng)過TensorRT引擎優(yōu)化，以最大程度提高性能和實(shí)時(shí)處理能力。WhisperSpeech則通過torch.compile進(jìn)行優(yōu)化，通過JIT編譯PyTorch代碼，加速推斷過程。

根據(jù)項(xiàng)目介紹，WhisperFusion特色功能包括:

-實(shí)時(shí)語(yǔ)音轉(zhuǎn)文本:利用OpenAI WhisperLive實(shí)現(xiàn)即時(shí)將口語(yǔ)轉(zhuǎn)換為文本。

- 大型語(yǔ)言模型整合: 集成Mistral大型語(yǔ)言模型，提升對(duì)轉(zhuǎn)錄文本的理解和上下文把握。

- 性能優(yōu)化:: LLM和Whisper均經(jīng)過TensorRT引擎優(yōu)化，確保高性能和低延遲處理。

- 推理加速:利用 torch.compile 對(duì) WhisperSpeech 進(jìn)行優(yōu)化，通過即時(shí)編譯（JIT）PyTorch 代碼，進(jìn)一步加快了處理速度。

產(chǎn)品入口：https://top.aibase.com/tool/whisperfusion

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

薦AI日?qǐng)?bào)：階躍星辰內(nèi)測(cè)視頻大模型Step-Video；即夢(mèng)AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、階躍星辰視頻生成大模型Step-Video開啟內(nèi)測(cè)可在躍問視頻申請(qǐng)階躍星辰的Step-Video模型正式開啟內(nèi)測(cè)，用戶可以通過躍問視頻官網(wǎng)申請(qǐng)資格。用戶可在最新版本的WPSOffice中輕松找到?

?人工智能 ?視頻生成 ?技術(shù)趨勢(shì)
思必馳智能語(yǔ)音攜手茅臺(tái)，打造“國(guó)酒級(jí)”AI大模型智能會(huì)議方案

茅臺(tái)集團(tuán)是中國(guó)乃至全球知名的白酒企業(yè)，自 1951 年成立以來，始終堅(jiān)守傳統(tǒng)工藝與創(chuàng)新精神的融合之道。 1996 年，茅臺(tái)酒的釀造工藝被正式確認(rèn)為國(guó)家機(jī)密，受到嚴(yán)格保護(hù)。 2001 年，這一傳統(tǒng)工藝榮獲國(guó)家級(jí)首批物質(zhì)文化遺產(chǎn)的殊榮。思必馳是國(guó)內(nèi)專業(yè)的大模型對(duì)話式人工智能平臺(tái)型企業(yè)。公司以“溝通萬(wàn)物、打理萬(wàn)事”為使命，基于公司自主研發(fā)的全鏈路智能對(duì)話系統(tǒng)定?

?茅臺(tái)集團(tuán) ?白酒行業(yè) ?傳統(tǒng)工藝
薦AI日?qǐng)?bào)：百川智能金融大模型發(fā)布；ChatGPT新增跨對(duì)話記憶功能；DeepSeek大模型一開發(fā)者將加盟小米；OpenAI最強(qiáng)推理模型o3

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI發(fā)布o(jì)3:AI推理能力的重大突破，得分高達(dá)87.5%OpenAI最近推出了其最新的o-Model推理系列模型o3，標(biāo)志著在數(shù)學(xué)和科學(xué)推理領(lǐng)域的重大進(jìn)展。閃極還推出了一個(gè)吸引人的促銷活動(dòng)，用戶在300天內(nèi)打卡200天可獲得全額退款。

?人工智能 ?OpenAI ?推理能力
薦AI大模型時(shí)代，人才的需求已經(jīng)變了

什么是AI發(fā)展的第一驅(qū)動(dòng)力?最近，全球科技大廠都在用行動(dòng)告訴我們:人才。谷歌NotebookLM的核心團(tuán)隊(duì)共同宣布離職創(chuàng)業(yè)，他們新公司的網(wǎng)站已經(jīng)進(jìn)入了「建設(shè)中」的狀態(tài)。但要真正解決AI人才短缺的問題需要更多企業(yè)、高校和社會(huì)各界的共同努力。

?大模型
薦視頻生成大模型賽道，只是看上去擁擠

2024年最后一個(gè)月，國(guó)產(chǎn)大模型落地應(yīng)用突然加速。尤其視頻生成模型，就像密集射出子彈后的槍管，熱得發(fā)燙。AI一天，人間一年。

?國(guó)產(chǎn)大模型 ?視頻生成模型 ?AI導(dǎo)演
灰豚AI數(shù)字人重磅突破，國(guó)內(nèi)最強(qiáng)數(shù)字人AI口播軟件大模型來襲

只要對(duì)著鏡頭說123，321，1234567，AI就能生成高質(zhì)量口播短視頻軟件。一度成為短視頻主播們的香悖悖軟件，畢竟以后不用自己出鏡了，然而不到幾個(gè)月， 123 口播數(shù)字人分身又被迭代了。AI的技術(shù)發(fā)展真是超乎人們的想象。近期溫州專幫科技信息有限公司旗下灰豚AI數(shù)字人發(fā)布了最新的AI口播大模型，直接淘汰了123AI口播軟件，效果令人驚嘆。被稱之為國(guó)內(nèi)最強(qiáng)數(shù)字人AI口播大模?

?AI口播軟件 ?短視頻制作 ?數(shù)字人技術(shù)
硅谷趨勢(shì)：智庫(kù)型VC Fusion Fund如何布局AI和深科技投資？

生成式AI浪潮席卷全球，然隨著AI落地深入，其開發(fā)、部署成本、快速迭代所需精力及商業(yè)回報(bào)速度引人擔(dān)憂。“面對(duì)AI時(shí)代的挑戰(zhàn)，人們正在追求更高效的AI軟件及算法，以及更可持續(xù)的解決方案。FusionFund將繼續(xù)基于獨(dú)特的智庫(kù)型VC打法，在這些領(lǐng)域中尋找機(jī)會(huì)，推動(dòng)AI技術(shù)的不斷進(jìn)化，以及在更多行業(yè)商業(yè)化應(yīng)用。

?生成式AI ?AI基礎(chǔ)設(shè)施 ?硅谷投資
薦50多款AI眼鏡來了，大模型找到了應(yīng)用救星？

一開始并不被扎克伯格重視的RaybanMeta現(xiàn)在已經(jīng)成為了硅谷科技達(dá)人的時(shí)尚單品，發(fā)售至今9個(gè)月，RaybanMeta眼鏡第二代已經(jīng)賣出了100多萬(wàn)臺(tái)第一代產(chǎn)品在1年半內(nèi)僅僅賣出去了30萬(wàn)臺(tái)。這款由Meta和Rayban聯(lián)名推出的AI眼鏡，第二代因?yàn)榻尤肓薓eta自研的大模型LIama3，提升了攝像/拍照水平，實(shí)現(xiàn)語(yǔ)音交互、物體識(shí)別、文字翻譯等功能，憑借不錯(cuò)的產(chǎn)品力，一下子成為了智能硬件領(lǐng)域的一匹黑馬。強(qiáng)大如Meta一年也才賣出百萬(wàn)臺(tái)，這是手機(jī)廠商們發(fā)布新品時(shí)3天就能達(dá)到的銷量，中國(guó)的AI眼鏡或許容不下太多玩家。

?Rayban ?Meta ?智能眼鏡
薦AI日?qǐng)?bào)：廣電總局整治AI“魔改”視頻亂象；Hailuo AI上線AI語(yǔ)音克隆功能；OpenAI將發(fā)布全新Sora

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、廣電總局發(fā)布“管理提示”整治AI“魔改”現(xiàn)象，經(jīng)典影視遭惡搞廣電總局針對(duì)AI“魔改”視頻現(xiàn)象發(fā)布管理提示，強(qiáng)調(diào)治理措施以保護(hù)經(jīng)典文化。凱特?克勞福德教授在講座中指出，若不采取可持續(xù)性措施，生成式人工智能的能耗將在一年內(nèi)達(dá)到與日本相當(dāng)?shù)乃健?/p>

?AI管理 ?短視頻平臺(tái) ?經(jīng)典文化
業(yè)界首次！中國(guó)聯(lián)通AI大模型存算分離技術(shù)新突破

快科技12月8日消息，中國(guó)聯(lián)通宣布，中國(guó)聯(lián)通研究院日前與浙江聯(lián)通、聯(lián)通服裝制造軍團(tuán)協(xié)同攻關(guān)，針對(duì)AI敏感數(shù)據(jù)的本地存儲(chǔ)異地訓(xùn)練需求提出了創(chuàng)新的業(yè)務(wù)模式，并成功在杭州與金華兩地間實(shí)施了業(yè)界首次30TB樣本數(shù)據(jù)的跨200公里存算分離拉遠(yuǎn)訓(xùn)練。經(jīng)過實(shí)際測(cè)算，訓(xùn)練效率高達(dá)97%以上。中國(guó)聯(lián)通表示，上述業(yè)務(wù)模式為業(yè)界首例，實(shí)現(xiàn)了AI大模型存算分離技術(shù)的突破。通過測(cè)試，充分驗(yàn)證了存算分離技術(shù)的安全性、可行性和高效性，為未來AI技術(shù)的發(fā)展提供了新的思路和方向。據(jù)介紹，存算分離技術(shù)是指將存儲(chǔ)數(shù)據(jù)的倉(cāng)庫(kù)和對(duì)數(shù)據(jù)進(jìn)行計(jì)算的加工廠獨(dú)立?

?中國(guó)聯(lián)通 ?AI敏感數(shù)據(jù) ?存算分離技術(shù)

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

AI實(shí)時(shí)對(duì)話系統(tǒng)WhisperFusion：集成大模型，與AI無縫語(yǔ)音對(duì)話

薦AI日?qǐng)?bào)：階躍星辰內(nèi)測(cè)視頻大模型Step-Video；即夢(mèng)AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

思必馳智能語(yǔ)音攜手茅臺(tái)，打造“國(guó)酒級(jí)”AI大模型智能會(huì)議方案

薦AI日?qǐng)?bào)：百川智能金融大模型發(fā)布；ChatGPT新增跨對(duì)話記憶功能；DeepSeek大模型一開發(fā)者將加盟小米；OpenAI最強(qiáng)推理模型o3

薦AI大模型時(shí)代，人才的需求已經(jīng)變了

薦視頻生成大模型賽道，只是看上去擁擠

灰豚AI數(shù)字人重磅突破，國(guó)內(nèi)最強(qiáng)數(shù)字人AI口播軟件大模型來襲

硅谷趨勢(shì)：智庫(kù)型VC Fusion Fund如何布局AI和深科技投資？

薦50多款AI眼鏡來了，大模型找到了應(yīng)用救星？

薦AI日?qǐng)?bào)：廣電總局整治AI“魔改”視頻亂象；Hailuo AI上線AI語(yǔ)音克隆功能；OpenAI將發(fā)布全新Sora

業(yè)界首次！中國(guó)聯(lián)通AI大模型存算分離技術(shù)新突破

熱文

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

京東發(fā)布年終獎(jiǎng)通知部分員工年前可收到年終獎(jiǎng)

雷軍：小米是北方車廠 SU7研發(fā)之初就要做冬季電車?yán)m(xù)航之王

央視曝光未成年人繞開防沉迷只需4元：通過租用游戲賬號(hào)規(guī)避

李斌回應(yīng)螢火蟲外觀設(shè)計(jì)：看過實(shí)車的人都喜歡這個(gè)設(shè)計(jì)

消息稱OpenAI新模型GPT-5研發(fā)未達(dá)到預(yù)期：成本高昂效果欠佳

沒網(wǎng)也能聯(lián)絡(luò)！小米15系列星辰無網(wǎng)通12月底升級(jí)6km級(jí)通話范圍

不得使用惡俗惡趣味微短劇片名！廣電總局出手整治“霸總愛上我

FF再獲3000萬(wàn)美元新一輪融資加速第二品牌FX戰(zhàn)略推進(jìn)

美團(tuán)：冬至期間將針對(duì)餃子等應(yīng)時(shí)食品訂單提供“超時(shí)保護(hù)”

英偉達(dá)AI芯片最大買家揭曉！微軟力壓同行霸榜

微信朋友圈崩了上熱搜騰訊客服：請(qǐng)嘗試這幾種方法

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

小紅書封號(hào)上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

極越員工萬(wàn)字怒懟ceo：公關(guān)總監(jiān)徐繼業(yè)怒罵員工蒼蠅

京東發(fā)布年終獎(jiǎng)通知部分員工年前可收到年終獎(jiǎng)

馬斯克將推出X Mail電子郵箱服務(wù)

極越員工善后方案已出爐：?jiǎn)T工獲“N+1”賠償由百度吉利出資

螞蟻集團(tuán)否認(rèn)借殼上市：目前沒有上市計(jì)劃

未成年人成部分博主流量密碼抖音治理涉“網(wǎng)紅兒童”違規(guī)內(nèi)容

站長(zhǎng)商機(jī)

AI實(shí)時(shí)對(duì)話系統(tǒng)WhisperFusion：集成大模型，與AI無縫語(yǔ)音對(duì)話

熱文

站長(zhǎng)商機(jī)

AI實(shí)時(shí)對(duì)話系統(tǒng)WhisperFusion：集成大模型，與AI無縫語(yǔ)音對(duì)話