11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵?lái)騰訊云選購(gòu)吧!
出門問(wèn)問(wèn)宣布,將向公眾開(kāi)放其超大規(guī)模語(yǔ)言模型“序列猴子”的部分訓(xùn)練數(shù)據(jù)集,命名為“序列猴子開(kāi)源數(shù)據(jù)集1.0”。作為出門問(wèn)問(wèn)的核心技術(shù)之一,具備強(qiáng)大的通用表示與推理能力,已在問(wèn)答系統(tǒng)、自然語(yǔ)言處理、機(jī)器翻譯、文本摘要等多個(gè)領(lǐng)域展現(xiàn)出其卓越的性能,極大地提高了生產(chǎn)效率和數(shù)據(jù)處理能力。開(kāi)源數(shù)據(jù)集的發(fā)布將促進(jìn)學(xué)術(shù)交流與合作,加速相關(guān)領(lǐng)域的創(chuàng)新步伐。
英偉達(dá)最近宣布了NVIDIANeMoSteerLM技術(shù)作為英偉達(dá)NeMo框架的一部分。這項(xiàng)技術(shù)使用戶能夠在推斷過(guò)程中控制大型語(yǔ)言模型的響應(yīng)。這個(gè)新的開(kāi)源數(shù)據(jù)集為開(kāi)發(fā)人員提供了一個(gè)有用的工具,幫助他們更好地理解和應(yīng)用NVIDIANeMo框架中的SteerLM技術(shù)。
說(shuō)到科技圈的近期新聞,沒(méi)有比小馬和小扎約架這件事更熱鬧的八卦話題了。馬斯克直播了自己上門尋找扎克伯格的過(guò)程。想要了解數(shù)據(jù)集的更多細(xì)節(jié),請(qǐng)參考OpenDriveLab發(fā)布在Github上的DriveLM演示數(shù)據(jù)。
美國(guó)艾倫人工智能研究所最近發(fā)布了一個(gè)名為Dolma的開(kāi)源數(shù)據(jù)集,其包含了3萬(wàn)億個(gè)token,這些詞匯來(lái)自包括網(wǎng)絡(luò)內(nèi)容、學(xué)術(shù)出版物、代碼和書(shū)籍等廣泛的來(lái)源。Dolma是目前公開(kāi)可用的同類數(shù)據(jù)集中最大的一個(gè)。它還應(yīng)該最大限度地減少風(fēng)險(xiǎn),尤其是那些可能影響個(gè)人的風(fēng)險(xiǎn)。
開(kāi)源數(shù)據(jù)集因侵權(quán)問(wèn)題,慘遭下架。如LLaMA、GPT-J等,都用它訓(xùn)練過(guò)。所以也有聲音調(diào)侃說(shuō),AI不僅帶來(lái)了新的技術(shù)突破,也給反盜版組織帶來(lái)了新任務(wù)。
阿里巴巴旗下的天貓精靈與通義大模型團(tuán)隊(duì)聯(lián)合多位領(lǐng)域?qū)W者和組織,推出了一個(gè)名為100PoisonMpts的大語(yǔ)言模型治理開(kāi)源中文數(shù)據(jù)集,宣布十余位知名專家學(xué)者成為首批“給AI投100瓶毒藥”的標(biāo)注工程師。標(biāo)注人各提出100個(gè)含有偏見(jiàn)和歧視回答的棘手問(wèn)題,并標(biāo)注出大型模型的回答,完成由AI"投毒"和"解毒"的攻防。100PoisonMpts數(shù)據(jù)集預(yù)計(jì)在6月份開(kāi)放第一批問(wèn)答數(shù)據(jù)?