阿里天貓精靈推出AI治理開源數(shù)據(jù)集預(yù)計(jì)在6月份開放批問答數(shù)據(jù)

2023-06-03 10:33 · 稿源：站長之家

站長之家(ChinaZ.com) 6月3日消息:日前，阿里巴巴旗下的天貓精靈與通義大模型團(tuán)隊(duì)聯(lián)合多位領(lǐng)域?qū)W者和組織，推出了一個名為100PoisonMpts的大語言模型治理開源中文數(shù)據(jù)集，宣布十余位知名專家學(xué)者成為首批“給AI投100瓶毒藥”的標(biāo)注工程師。標(biāo)注人各提出100個含有偏見和歧視回答的棘手問題，并標(biāo)注出大型模型的回答，完成由AI "投毒"和"解毒"的攻防。

天貓精靈

據(jù)阿里聯(lián)合團(tuán)隊(duì)負(fù)責(zé)人介紹，與國外公司的治理方法相比，100PoisonMpts數(shù)據(jù)集在技術(shù)方法上將具備更完整的標(biāo)注流程、更隱性的問題領(lǐng)域、更全面的效益。標(biāo)注數(shù)據(jù)對模型繼續(xù)訓(xùn)練、微調(diào)、強(qiáng)化學(xué)習(xí)、線上服務(wù)等多個環(huán)節(jié)都有益處。

目前，首批領(lǐng)域數(shù)據(jù)涉及到反對歧視、同理心、商榷式表達(dá)等目標(biāo)，該數(shù)據(jù)囊括了法律、心理學(xué)、兒童教育、無障礙、冷知識、親密關(guān)系、環(huán)境公正等多個維度。100PoisonMpts數(shù)據(jù)集預(yù)計(jì)在6月份開放第一批問答數(shù)據(jù)，目前正在魔搭等技術(shù)社區(qū)征集更多垂直領(lǐng)域?qū)＜摇?/p>

（舉報）

相關(guān)推薦

關(guān)鍵詞：

天貓精靈新增公司品牌“未來精靈XGENIE”

鳳凰網(wǎng)科技訊9月19日阿里旗下人工智能公司發(fā)布公司新品牌“未來精靈”，AliGenie6.0系統(tǒng)由大模型全面驅(qū)動，從過去的一個天貓精靈，將變成對每個用戶有差異化記憶，與眾不同的精靈。未來精靈總裁彭超在發(fā)布中介紹，以“世界在對話之間”的理念，讓每個人創(chuàng)建全天候、個性化的智能助手。旗下多款全新AIGC終端正在發(fā)布：首款接入精靈大模型AR眼鏡，使用MicroLED衍射光波導(dǎo)顯示方案，具有隨身助手能力；30小時超長續(xù)航隨聲筒，一臺終端與不同個性化助手對話；AITutor類智能平板產(chǎn)品預(yù)告將于10月份發(fā)布。
天貓精靈發(fā)布“未來精靈XGENIE”新品牌

阿里旗下的人工智能公司發(fā)布新品牌“未來精靈”，并宣布AliGenie6.0系統(tǒng)將由大模型全面驅(qū)動。新的品牌主喚醒詞是“小靈，小靈”。這個系統(tǒng)將從一個天貓精靈變成一個具有差異化記憶和獨(dú)特性的精靈，為每個用戶提供個性化的智能助手。
智源開源中英文語義向量模型訓(xùn)練數(shù)據(jù)集MTP

智源研究院發(fā)布面向中英文語義向量模型訓(xùn)練的大規(guī)模文本對數(shù)據(jù)集MTP。這是全球最大的中、英文文本對訓(xùn)練數(shù)據(jù)集，數(shù)據(jù)規(guī)模達(dá)3億對，希望推動解決中文模型訓(xùn)練數(shù)據(jù)集缺乏問題。作為中國大模型開源生態(tài)圈的代表機(jī)構(gòu)，智源持續(xù)進(jìn)行包括數(shù)據(jù)在內(nèi)的大模型全棧技術(shù)開源，推動人工智能協(xié)同創(chuàng)新。
Google AI推出SANPO:多屬性視頻數(shù)據(jù)集助力高級視覺場景理解

GoogleAI最近推出了名為SANPO的數(shù)據(jù)集，旨在幫助AI模型更好地理解戶外人類主觀場景。這一數(shù)據(jù)集的重要性在于，它不僅包括真實(shí)世界的數(shù)據(jù)包括合成數(shù)據(jù)，以及豐富的注釋和多屬性特征。研究人員的隱私承諾使這一數(shù)據(jù)集能夠支持其他研究人員開發(fā)面向視障人士的視覺導(dǎo)航系統(tǒng)，并推動先進(jìn)的視覺場景理解領(lǐng)域的發(fā)展。

?SANPO ?數(shù)據(jù)集 ?GoogleAI
國家網(wǎng)信辦發(fā)布第一批26家應(yīng)用程序分發(fā)平臺備案編號

國家互聯(lián)網(wǎng)信息辦公室發(fā)布了第一批應(yīng)用程序分發(fā)平臺備案編號。網(wǎng)信辦表示，2022年8月1日《移動互聯(lián)網(wǎng)應(yīng)用程序信息服務(wù)管理規(guī)定》正式實(shí)施以來，國家互聯(lián)網(wǎng)信息辦公室依法依規(guī)組織開展應(yīng)用程序分發(fā)平臺備案管理工作。根據(jù)《移動互聯(lián)網(wǎng)應(yīng)用程序信息服務(wù)管理規(guī)定》有關(guān)要求，備案僅是對應(yīng)用程序分發(fā)平臺提供分發(fā)服務(wù)行為的確認(rèn)，不代表對該平臺服務(wù)能力和其在架應(yīng)?
「字少信息量大」，Salesforce、MIT 研究者手把手教 GPT-4「改稿」，數(shù)據(jù)集已開源

自動摘要技術(shù)取得了長足的進(jìn)步，這主要?dú)w功于范式的轉(zhuǎn)變——從在標(biāo)注數(shù)據(jù)集上進(jìn)行有監(jiān)督微調(diào)轉(zhuǎn)變?yōu)槭褂么笳Z言模型進(jìn)行零樣本prompt，例如GPT-4。不需要額外的訓(xùn)練，細(xì)致的prompt就能實(shí)現(xiàn)對摘要長度、主題、風(fēng)格等方面特征的精細(xì)控制。更多論文細(xì)節(jié)，可參考原論文。

?GPT-4 ?數(shù)據(jù)集
《開源數(shù)據(jù)庫生態(tài)發(fā)展研究報告》發(fā)布 GreatSQL為MySQL5.7最佳替代方案！

隨著數(shù)字化轉(zhuǎn)型深入推進(jìn)和數(shù)據(jù)量的爆炸式增長，行業(yè)應(yīng)用對數(shù)據(jù)庫的需求變化推動數(shù)據(jù)庫技術(shù)加速創(chuàng)新。數(shù)據(jù)庫作為數(shù)字經(jīng)濟(jì)基礎(chǔ)底座，連接上層應(yīng)用和底層基礎(chǔ)資源，在數(shù)字經(jīng)濟(jì)時代展現(xiàn)出巨大的價值和潛能。四、國內(nèi)開源數(shù)據(jù)庫產(chǎn)業(yè)展望最后，針對我國MySQL技術(shù)路線開源數(shù)據(jù)庫產(chǎn)業(yè)發(fā)展，報告進(jìn)行以下展望：1、開源數(shù)據(jù)庫發(fā)展應(yīng)符合開源生態(tài)建設(shè)及產(chǎn)業(yè)引領(lǐng)要求，積極參與完善開源產(chǎn)業(yè)治理；2、加強(qiáng)相關(guān)方對開源協(xié)議認(rèn)知，合法合規(guī)利用開源協(xié)議；3、利用國內(nèi)MySQL現(xiàn)有技術(shù)生態(tài)，結(jié)合產(chǎn)業(yè)需求，加強(qiáng)獨(dú)立演進(jìn)開源分支的能力；4、大力推進(jìn)開源數(shù)據(jù)庫技術(shù)規(guī)范化、智能化發(fā)展。
近視手術(shù)慎重做：有人近視300度術(shù)后變遠(yuǎn)視200度第一批做的人后悔不已

對于很多近視眼的朋友來說，總希望通過飛秒來治愈這個問題，不過還是要慎重。近日，廣東一男子手術(shù)前近視300度，手術(shù)后卻成為遠(yuǎn)視200度的事情引發(fā)人們的廣泛關(guān)注。在手術(shù)之后，李先生的近視問題，確實(shí)得到了解決，手術(shù)效果肉眼可見，但眼睛卻迎來了新的問題，那就是眼睛會時常出現(xiàn)疲勞的情況。上述情況持續(xù)半年后，李先生再次進(jìn)行了檢測，發(fā)現(xiàn)視力情況變得更加?
中國研究團(tuán)隊(duì)發(fā)布多視角數(shù)據(jù)集“FreeMan” 解決3D人體姿勢估計(jì)局限性

從真實(shí)場景中估計(jì)人體的三維結(jié)構(gòu)是一項(xiàng)具有挑戰(zhàn)性的任務(wù)，對于人工智能、圖形學(xué)和人機(jī)交互等領(lǐng)域具有重要意義?，F(xiàn)有的3D人體姿態(tài)估計(jì)數(shù)據(jù)集通常在受控條件下收集，具有靜態(tài)背景，無法代表真實(shí)世界場景的多樣性，從限制了用于真實(shí)應(yīng)用的準(zhǔn)確模型的開發(fā)。FreeMan的可用性預(yù)計(jì)將推動人體建模、計(jì)算機(jī)視覺和人機(jī)交互領(lǐng)域的進(jìn)步，彌合了受控實(shí)驗(yàn)室條件與真實(shí)場景之間的差距。

?FreeMan
薦機(jī)器人研究迎來ImageNet時刻：一個數(shù)據(jù)集，讓DeepMind具身智能大模型突飛猛進(jìn)

在大模型不斷取得突破的2023，把大模型當(dāng)做大腦來輔助運(yùn)行的具身智能機(jī)器人研究也在被迅速推進(jìn)。2個多月前，谷歌DeepMind推出了第一個控制機(jī)器人的視覺-語言-動作模型——RT-2。未來的另一個方向是進(jìn)一步探索不同數(shù)據(jù)集的混合會如何影響跨具身智能體泛化，以及這種泛化是如何是實(shí)現(xiàn)的。

?ImageNet ?機(jī)器人 ?DeepMind

熱文

3 天
7天

站長商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

阿里天貓精靈推出AI治理開源數(shù)據(jù)集預(yù)計(jì)在6月份開放批問答數(shù)據(jù)

天貓精靈新增公司品牌“未來精靈XGENIE”

天貓精靈發(fā)布“未來精靈XGENIE”新品牌

智源開源中英文語義向量模型訓(xùn)練數(shù)據(jù)集MTP

Google AI推出SANPO:多屬性視頻數(shù)據(jù)集助力高級視覺場景理解

國家網(wǎng)信辦發(fā)布第一批26家應(yīng)用程序分發(fā)平臺備案編號

「字少信息量大」，Salesforce、MIT 研究者手把手教 GPT-4「改稿」，數(shù)據(jù)集已開源

《開源數(shù)據(jù)庫生態(tài)發(fā)展研究報告》發(fā)布 GreatSQL為MySQL5.7最佳替代方案！

近視手術(shù)慎重做：有人近視300度術(shù)后變遠(yuǎn)視200度第一批做的人后悔不已

中國研究團(tuán)隊(duì)發(fā)布多視角數(shù)據(jù)集“FreeMan” 解決3D人體姿勢估計(jì)局限性

薦機(jī)器人研究迎來ImageNet時刻：一個數(shù)據(jù)集，讓DeepMind具身智能大模型突飛猛進(jìn)

熱文

京東發(fā)布年終獎通知部分員工年前可收到年終獎

消息稱OpenAI新模型GPT-5研發(fā)未達(dá)到預(yù)期：成本高昂效果欠佳

央視曝光未成年人繞開防沉迷只需4元：通過租用游戲賬號規(guī)避

李斌回應(yīng)螢火蟲外觀設(shè)計(jì)：看過實(shí)車的人都喜歡這個設(shè)計(jì)

沒網(wǎng)也能聯(lián)絡(luò)！小米15系列星辰無網(wǎng)通12月底升級6km級通話范圍

不得使用惡俗惡趣味微短劇片名！廣電總局出手整治“霸總愛上我

FF再獲3000萬美元新一輪融資加速第二品牌FX戰(zhàn)略推進(jìn)

QQ音樂年度聽歌報告發(fā)布：誰是你最喜歡的歌手？

微信可以線上送實(shí)體禮物了：微信小店“藍(lán)包”功能正灰度測試逐

抖音上線“驗(yàn)證助手” 可幫助用戶識別電話等是否屬于抖音官方

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

微信朋友圈崩了上熱搜騰訊客服：請嘗試這幾種方法

小紅書封號上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

京東發(fā)布年終獎通知部分員工年前可收到年終獎

未成年人成部分博主流量密碼抖音治理涉“網(wǎng)紅兒童”違規(guī)內(nèi)容

極越員工善后方案已出爐：員工獲“N+1”賠償由百度吉利出資

螞蟻集團(tuán)否認(rèn)借殼上市：目前沒有上市計(jì)劃

小紅書被吐槽無理由封號客服回應(yīng)：未說明處罰時間就是永封

雷軍：小米是北方車廠 SU7研發(fā)之初就要做冬季電車?yán)m(xù)航之王

極越公關(guān)負(fù)責(zé)人被開除本人回應(yīng)：此前未接到任何通知

站長商機(jī)

阿里天貓精靈推出AI治理開源數(shù)據(jù)集 預(yù)計(jì)在6月份開放批問答數(shù)據(jù)

熱文

站長商機(jī)

阿里天貓精靈推出AI治理開源數(shù)據(jù)集預(yù)計(jì)在6月份開放批問答數(shù)據(jù)