智源開源中英文語(yǔ)義向量模型BGE 支持免費(fèi)商用

2023-08-07 15:52 · 稿源：站長(zhǎng)之家

站長(zhǎng)之家（ChinaZ.com）8月7日消息:近日，智源發(fā)布最強(qiáng)開源可商用中英文語(yǔ)義向量模型BGE（BAAI General Embedding），在中英文語(yǔ)義檢索精度與整體語(yǔ)義表征能力均超越了社區(qū)所有同類模型，如OpenAI 的text embedding002等。

此外，BGE 保持了同等參數(shù)量級(jí)模型中的最小向量維度，使用成本更低。

據(jù)介紹，中文語(yǔ)義向量綜合表征能力評(píng)測(cè) C-MTEB 的實(shí)驗(yàn)結(jié)果顯示，BGE中文模型（BGE-zh）在對(duì)接大語(yǔ)言模型最常用到的檢索能力上領(lǐng)先優(yōu)勢(shì)尤為顯著，檢索精度約為 OpenAI Text Embedding002的1.4倍。

與中文能力相類似，BGE 英文模型（BGE-en）的語(yǔ)義表征能力同樣出色。根據(jù)英文評(píng)測(cè)基準(zhǔn) MTEB 的評(píng)測(cè)結(jié)果(Table2)，盡管社區(qū)中已有不少優(yōu)秀的基線模型，BGE 依然在總體指標(biāo)(Average)與檢索能力(Retrieval)兩個(gè)核心維度超越了此前開源的所有同類模型。

同時(shí)，BGE 的各項(xiàng)能力都顯著超越社區(qū)中最為流行的選項(xiàng):OpenAI Text Embedding002。

微信截圖_20230807155429.png

BGE 模型鏈接:

https://huggingface.co/BAAI/

BGE 代碼倉(cāng)庫(kù):

https://github.com/FlagOpen/FlagEmbedding

C-MTEB 評(píng)測(cè)基準(zhǔn)鏈接:

https://github.com/FlagOpen/FlagEmbedding/tree/master/benchmark

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

智源開源中英文語(yǔ)義向量模型訓(xùn)練數(shù)據(jù)集MTP

智源研究院發(fā)布面向中英文語(yǔ)義向量模型訓(xùn)練的大規(guī)模文本對(duì)數(shù)據(jù)集MTP。這是全球最大的中、英文文本對(duì)訓(xùn)練數(shù)據(jù)集，數(shù)據(jù)規(guī)模達(dá)3億對(duì)，希望推動(dòng)解決中文模型訓(xùn)練數(shù)據(jù)集缺乏問(wèn)題。作為中國(guó)大模型開源生態(tài)圈的代表機(jī)構(gòu)，智源持續(xù)進(jìn)行包括數(shù)據(jù)在內(nèi)的大模型全棧技術(shù)開源，推動(dòng)人工智能協(xié)同創(chuàng)新。
薦開源大模型正在“殺死”閉源？

“OpenAI不足為懼，開源會(huì)慢慢趕上來(lái)?！北藭r(shí)HuggingFace創(chuàng)始人ClemDelangue的一句預(yù)言，正在迅速成為現(xiàn)實(shí)。這也足以說(shuō)明，開源還是閉源，或許只是階段和位置的不同，但可以肯定的是，大模型時(shí)代，已經(jīng)加速進(jìn)入下一賽段。

?大模型
元象開源70億參數(shù)通用大模型 XVERSE-7B 免費(fèi)可商用

元象宣布開源70億參數(shù)通用大模型XVERSE-7B底座與對(duì)話版，這是一款全開源、免費(fèi)可商用的模型。相比之前的XVERSE-13B，7B版本更小巧，可以在單張消費(fèi)級(jí)顯卡上運(yùn)行，并且推理量化后最低只需6GB顯存，大大降低了開發(fā)門檻和推理成本?！馲VERSE-7B-Chat是底座模型經(jīng)SFT指令精調(diào)后的中英文對(duì)話模型，大幅提升了理解和生成內(nèi)容的準(zhǔn)確度，也更符合人類的認(rèn)知偏好。
支付寶上線境外租車服務(wù)：提供24小時(shí)中英文客服服務(wù)

快科技9月27日消息，中秋與國(guó)慶雙節(jié)假期即將來(lái)臨，不少游客選擇自駕游，支付寶為此上線了境外租車”服務(wù)，聯(lián)合租租車為用戶提供全球近200個(gè)國(guó)家和地區(qū)的租車服務(wù)。用戶上支付寶搜支付寶租車”，選擇境外租車”即可預(yù)定，租車服務(wù)地包含了國(guó)人熱門出境游目的地國(guó)家，如：泰國(guó)、韓國(guó)、意大利、美國(guó)、澳大利亞、新西蘭等。并由租租車提供24小時(shí)的中英文客服服務(wù)，幫助用戶的用車答疑、事故跟進(jìn)處理等，保證了租車用戶去到任何時(shí)區(qū)的國(guó)家和地區(qū)，都能享受到全天候客服保障。據(jù)了解，9月28日前，用戶還可在頁(yè)面免費(fèi)辦理國(guó)際駕照認(rèn)證件（TIDL）?
薦開源標(biāo)桿！最強(qiáng)中英雙語(yǔ)大模型來(lái)了，340億參數(shù)，超越 Llama2-70B等所有開源模型

開源界最強(qiáng)的中英雙語(yǔ)大模型，悟道·天鷹34B，來(lái)了!有多強(qiáng)?一言蔽之:不僅模型夠大夠能打還一口氣送上整套“全家桶”級(jí)豪華周邊。能有如此大手筆的，正是中國(guó)大模型開源派先鋒——智源研究院。Aquila2模型全系開源地址:https://github.com/FlagAI-Open/Aquila2https://model.baai.ac.cn/https://huggingface.co/BAAIAquilaSQL開源倉(cāng)庫(kù)地址:https://github.com/FlagAI-Open/FlagAI/tree/master/examples/Aquila/Aquila-sqlFlagAttenti

?Llama2 ?開源模型
智源研究院開源中英雙語(yǔ)大模型悟道·天鷹340億Aquila2-34B

智源研究院發(fā)布了最強(qiáng)開源中英雙語(yǔ)大模型——悟道?天鷹340億。這個(gè)新模型在推理、泛化等方面表現(xiàn)出色，在智能體、代碼生成、文獻(xiàn)檢索等場(chǎng)景方面取得了一系列成績(jī)。智源研究院還發(fā)布了FlagScale高效并行訓(xùn)練框架和FlagAttention高性能Attention算子集，進(jìn)一步推動(dòng)大模型研究的發(fā)展。
智源團(tuán)隊(duì)推出「生長(zhǎng)策略」解決大模型訓(xùn)練算力成本過(guò)高問(wèn)題

智源研究院聯(lián)合中科院計(jì)算所、南洋理工大學(xué)、電子科技大學(xué)、哈爾濱工業(yè)大學(xué)的研究團(tuán)隊(duì)共同提出了一種「生長(zhǎng)策略」，以解決大模型算力成本極高的問(wèn)題。研究團(tuán)隊(duì)基于「生長(zhǎng)策略」逐步構(gòu)建了一個(gè)具有1010億參數(shù)的FLM-101B大模型。實(shí)驗(yàn)結(jié)果顯示，F(xiàn)LM-101B在這些評(píng)測(cè)任務(wù)上表現(xiàn)出了非常好的能力。
融資1億美元的類ChatGPT模型開源啦！可商用，8個(gè)模型

「AIGC開放社區(qū)」為大家介紹了融資1億美元的生成式AI平臺(tái)Writer。該企業(yè)能在短短3年時(shí)間獲得1.26億美元總?cè)谫Y成為ChatGPT的主要競(jìng)爭(zhēng)對(duì)手之一，與其精湛的技術(shù)密不可分，同時(shí)充分證明其模型有成功的應(yīng)用案例并獲得資本、用戶的認(rèn)可。Palmyra非常值得那些希望將大語(yǔ)言模型實(shí)現(xiàn)商業(yè)化的開發(fā)者們，研究其模型架構(gòu)和功能借鑒其成功經(jīng)驗(yàn)。

?Palmyra ?ChatGPT ?AI頭條
挑戰(zhàn)GPT-4V！清華唐杰&智譜開源國(guó)產(chǎn)多模態(tài)模型CogVLM-17B

清華大學(xué)與智譜AI合作開發(fā)的CogVLM-17B是一款國(guó)產(chǎn)多模態(tài)模型，具有卓越的性能。該模型不僅可以識(shí)別圖像中的對(duì)象能分辨完整可見和部分可見的物體。其深度融合方法的創(chuàng)新性標(biāo)志著多模態(tài)模型訓(xùn)練范式的改變，為未來(lái)的研究和應(yīng)用提供了新的思路和可能性。

?多模態(tài)模型
清華等開源多智能體框架AgentVerse 可讓多個(gè)模型之間進(jìn)行協(xié)作

AgentVerse是一個(gè)旨在促進(jìn)多個(gè)大型語(yǔ)言模型之間協(xié)作的多智能體框架。雖然單個(gè)LLM在各種任務(wù)上表現(xiàn)出色，但面對(duì)復(fù)雜任務(wù)或需要提高效率的情況，多個(gè)智能體之間的協(xié)作變得至關(guān)重要。這一框架的發(fā)展對(duì)于推動(dòng)自然語(yǔ)言處理和人工智能領(lǐng)域的研究和應(yīng)用具有重要意義。

?AgentVerse ?AI頭條

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

智源開源中英文語(yǔ)義向量模型BGE 支持免費(fèi)商用

智源開源中英文語(yǔ)義向量模型訓(xùn)練數(shù)據(jù)集MTP

薦開源大模型正在“殺死”閉源？

元象開源70億參數(shù)通用大模型 XVERSE-7B 免費(fèi)可商用

支付寶上線境外租車服務(wù)：提供24小時(shí)中英文客服服務(wù)

薦開源標(biāo)桿！最強(qiáng)中英雙語(yǔ)大模型來(lái)了，340億參數(shù)，超越 Llama2-70B等所有開源模型

智源研究院開源中英雙語(yǔ)大模型悟道·天鷹340億Aquila2-34B

智源團(tuán)隊(duì)推出「生長(zhǎng)策略」解決大模型訓(xùn)練算力成本過(guò)高問(wèn)題

融資1億美元的類ChatGPT模型開源啦！可商用，8個(gè)模型

挑戰(zhàn)GPT-4V！清華唐杰&智譜開源國(guó)產(chǎn)多模態(tài)模型CogVLM-17B

清華等開源多智能體框架AgentVerse 可讓多個(gè)模型之間進(jìn)行協(xié)作

熱文

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

雷軍：小米是北方車廠 SU7研發(fā)之初就要做冬季電車?yán)m(xù)航之王

沒網(wǎng)也能聯(lián)絡(luò)！小米15系列星辰無(wú)網(wǎng)通12月底升級(jí)6km級(jí)通話范圍

消息稱OpenAI新模型GPT-5研發(fā)未達(dá)到預(yù)期：成本高昂效果欠佳

李斌回應(yīng)螢火蟲外觀設(shè)計(jì)：看過(guò)實(shí)車的人都喜歡這個(gè)設(shè)計(jì)

美團(tuán)：冬至期間將針對(duì)餃子等應(yīng)時(shí)食品訂單提供“超時(shí)保護(hù)”

不得使用惡俗惡趣味微短劇片名！廣電總局出手整治“霸總愛上我

央視曝光未成年人繞開防沉迷只需4元：通過(guò)租用游戲賬號(hào)規(guī)避

QQ音樂年度聽歌報(bào)告發(fā)布：誰(shuí)是你最喜歡的歌手？

FF再獲3000萬(wàn)美元新一輪融資加速第二品牌FX戰(zhàn)略推進(jìn)

英偉達(dá)AI芯片最大買家揭曉！微軟力壓同行霸榜

微信朋友圈崩了上熱搜騰訊客服：請(qǐng)嘗試這幾種方法

極越員工萬(wàn)字怒懟ceo：公關(guān)總監(jiān)徐繼業(yè)怒罵員工蒼蠅

小紅書封號(hào)上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

馬斯克將推出X Mail電子郵箱服務(wù)

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

極越員工善后方案已出爐：?jiǎn)T工獲“N+1”賠償由百度吉利出資

螞蟻集團(tuán)否認(rèn)借殼上市：目前沒有上市計(jì)劃

小紅書被吐槽無(wú)理由封號(hào) 客服回應(yīng)：未說(shuō)明處罰時(shí)間就是永封

未成年人成部分博主流量密碼抖音治理涉“網(wǎng)紅兒童”違規(guī)內(nèi)容

站長(zhǎng)商機(jī)