幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁(yè) > 熱點(diǎn) > 關(guān)鍵詞  > 正文

智源開源中英文語(yǔ)義向量模型BGE 支持免費(fèi)商用

2023-08-07 15:52 · 稿源:站長(zhǎng)之家

站長(zhǎng)之家(ChinaZ.com)8月7日 消息:近日,智源發(fā)布最強(qiáng)開源可商用中英文語(yǔ)義向量模型BGE(BAAI General Embedding),在中英文語(yǔ)義檢索精度與整體語(yǔ)義表征能力均超越了社區(qū)所有同類模型,如OpenAI 的text embedding002等。

此外,BGE 保持了同等參數(shù)量級(jí)模型中的最小向量維度,使用成本更低。

據(jù)介紹,中文語(yǔ)義向量綜合表征能力評(píng)測(cè) C-MTEB 的實(shí)驗(yàn)結(jié)果顯示,BGE中文模型(BGE-zh)在對(duì)接大語(yǔ)言模型最常用到的檢索能力上領(lǐng)先優(yōu)勢(shì)尤為顯著,檢索精度約為 OpenAI Text Embedding002的1.4倍。

與中文能力相類似,BGE 英文模型(BGE-en)的語(yǔ)義表征能力同樣出色。根據(jù)英文評(píng)測(cè)基準(zhǔn) MTEB 的評(píng)測(cè)結(jié)果(Table2),盡管社區(qū)中已有不少優(yōu)秀的基線模型,BGE 依然在總體指標(biāo)(Average)與檢索能力(Retrieval)兩個(gè)核心維度超越了此前開源的所有同類模型。

同時(shí),BGE 的各項(xiàng)能力都顯著超越社區(qū)中最為流行的選項(xiàng):OpenAI Text Embedding002。

微信截圖_20230807155429.png

BGE 模型鏈接:

https://huggingface.co/BAAI/

BGE 代碼倉(cāng)庫(kù):

https://github.com/FlagOpen/FlagEmbedding

C-MTEB 評(píng)測(cè)基準(zhǔn)鏈接:

https://github.com/FlagOpen/FlagEmbedding/tree/master/benchmark

舉報(bào)

  • 相關(guān)推薦
  • 開源中英文語(yǔ)義向量模型訓(xùn)練數(shù)據(jù)集MTP

    智源研究院發(fā)布面向中英文語(yǔ)義向量模型訓(xùn)練的大規(guī)模文本對(duì)數(shù)據(jù)集MTP。這是全球最大的中、英文文本對(duì)訓(xùn)練數(shù)據(jù)集,數(shù)據(jù)規(guī)模達(dá)3億對(duì),希望推動(dòng)解決中文模型訓(xùn)練數(shù)據(jù)集缺乏問(wèn)題。作為中國(guó)大模型開源生態(tài)圈的代表機(jī)構(gòu),智源持續(xù)進(jìn)行包括數(shù)據(jù)在內(nèi)的大模型全棧技術(shù)開源,推動(dòng)人工智能協(xié)同創(chuàng)新。

  • 開源大模型正在“殺死”閉?

    “OpenAI不足為懼,開源會(huì)慢慢趕上來(lái)?!北藭r(shí)HuggingFace創(chuàng)始人ClemDelangue的一句預(yù)言,正在迅速成為現(xiàn)實(shí)。這也足以說(shuō)明,開源還是閉源,或許只是階段和位置的不同,但可以肯定的是,大模型時(shí)代,已經(jīng)加速進(jìn)入下一賽段。

  • 元象開源70億參數(shù)通用大模型 XVERSE-7B 免費(fèi)商用

    元象宣布開源70億參數(shù)通用大模型XVERSE-7B底座與對(duì)話版,這是一款全開源、免費(fèi)可商用的模型。相比之前的XVERSE-13B,7B版本更小巧,可以在單張消費(fèi)級(jí)顯卡上運(yùn)行,并且推理量化后最低只需6GB顯存,大大降低了開發(fā)門檻和推理成本?!馲VERSE-7B-Chat是底座模型經(jīng)SFT指令精調(diào)后的中英文對(duì)話模型,大幅提升了理解和生成內(nèi)容的準(zhǔn)確度,也更符合人類的認(rèn)知偏好。

  • 支付寶上線境外租車服務(wù):提供24小時(shí)中英文客服服務(wù)

    快科技9月27日消息,中秋與國(guó)慶雙節(jié)假期即將來(lái)臨,不少游客選擇自駕游,支付寶為此上線了境外租車”服務(wù),聯(lián)合租租車為用戶提供全球近200個(gè)國(guó)家和地區(qū)的租車服務(wù)。用戶上支付寶搜支付寶租車”,選擇境外租車”即可預(yù)定,租車服務(wù)地包含了國(guó)人熱門出境游目的地國(guó)家,如:泰國(guó)、韓國(guó)、意大利、美國(guó)、澳大利亞、新西蘭等。并由租租車提供24小時(shí)的中英文客服服務(wù),幫助用戶的用車答疑、事故跟進(jìn)處理等,保證了租車用戶去到任何時(shí)區(qū)的國(guó)家和地區(qū),都能享受到全天候客服保障。據(jù)了解,9月28日前,用戶還可在頁(yè)面免費(fèi)辦理國(guó)際駕照認(rèn)證件(TIDL)?

  • 開源標(biāo)桿!最強(qiáng)中英雙語(yǔ)大模型來(lái)了,340億參數(shù),超越 Llama2-70B等所有開源模型

    開源界最強(qiáng)的中英雙語(yǔ)大模型,悟道·天鷹34B,來(lái)了!有多強(qiáng)?一言蔽之:不僅模型夠大夠能打還一口氣送上整套“全家桶”級(jí)豪華周邊。能有如此大手筆的,正是中國(guó)大模型開源派先鋒——智源研究院。Aquila2模型全系開源地址:https://github.com/FlagAI-Open/Aquila2https://model.baai.ac.cn/https://huggingface.co/BAAIAquilaSQL開源倉(cāng)庫(kù)地址:https://github.com/FlagAI-Open/FlagAI/tree/master/examples/Aquila/Aquila-sqlFlagAttenti

  • 智源研究院開源中英雙語(yǔ)大模型悟道·天鷹340億Aquila2-34B

    智源研究院發(fā)布了最強(qiáng)開源中英雙語(yǔ)大模型——悟道?天鷹340億。這個(gè)新模型在推理、泛化等方面表現(xiàn)出色,在智能體、代碼生成、文獻(xiàn)檢索等場(chǎng)景方面取得了一系列成績(jī)。智源研究院還發(fā)布了FlagScale高效并行訓(xùn)練框架和FlagAttention高性能Attention算子集,進(jìn)一步推動(dòng)大模型研究的發(fā)展。

  • 團(tuán)隊(duì)推出「生長(zhǎng)策略」 解決大模型訓(xùn)練算力成本過(guò)高問(wèn)題

    智源研究院聯(lián)合中科院計(jì)算所、南洋理工大學(xué)、電子科技大學(xué)、哈爾濱工業(yè)大學(xué)的研究團(tuán)隊(duì)共同提出了一種「生長(zhǎng)策略」,以解決大模型算力成本極高的問(wèn)題。研究團(tuán)隊(duì)基于「生長(zhǎng)策略」逐步構(gòu)建了一個(gè)具有1010億參數(shù)的FLM-101B大模型。實(shí)驗(yàn)結(jié)果顯示,F(xiàn)LM-101B在這些評(píng)測(cè)任務(wù)上表現(xiàn)出了非常好的能力。

  • 融資1億美元的類ChatGPT模型開源啦!可商用,8個(gè)模型

    「AIGC開放社區(qū)」為大家介紹了融資1億美元的生成式AI平臺(tái)Writer。該企業(yè)能在短短3年時(shí)間獲得1.26億美元總?cè)谫Y成為ChatGPT的主要競(jìng)爭(zhēng)對(duì)手之一,與其精湛的技術(shù)密不可分,同時(shí)充分證明其模型有成功的應(yīng)用案例并獲得資本、用戶的認(rèn)可。Palmyra非常值得那些希望將大語(yǔ)言模型實(shí)現(xiàn)商業(yè)化的開發(fā)者們,研究其模型架構(gòu)和功能借鑒其成功經(jīng)驗(yàn)。

  • 挑戰(zhàn)GPT-4V!清華唐杰&開源國(guó)產(chǎn)多模態(tài)模型CogVLM-17B

    清華大學(xué)與智譜AI合作開發(fā)的CogVLM-17B是一款國(guó)產(chǎn)多模態(tài)模型,具有卓越的性能。該模型不僅可以識(shí)別圖像中的對(duì)象能分辨完整可見和部分可見的物體。其深度融合方法的創(chuàng)新性標(biāo)志著多模態(tài)模型訓(xùn)練范式的改變,為未來(lái)的研究和應(yīng)用提供了新的思路和可能性。

  • 清華等開源多智能體框架AgentVerse 可讓多個(gè)模型之間進(jìn)行協(xié)作

    AgentVerse是一個(gè)旨在促進(jìn)多個(gè)大型語(yǔ)言模型之間協(xié)作的多智能體框架。雖然單個(gè)LLM在各種任務(wù)上表現(xiàn)出色,但面對(duì)復(fù)雜任務(wù)或需要提高效率的情況,多個(gè)智能體之間的協(xié)作變得至關(guān)重要。這一框架的發(fā)展對(duì)于推動(dòng)自然語(yǔ)言處理和人工智能領(lǐng)域的研究和應(yīng)用具有重要意義。

熱文

  • 3 天
  • 7天