站長之家(ChinaZ.com) 6月3日 消息:日前,阿里巴巴旗下的天貓精靈與通義大模型團(tuán)隊(duì)聯(lián)合多位領(lǐng)域?qū)W者和組織,推出了一個名為100PoisonMpts的大語言模型治理開源中文數(shù)據(jù)集,宣布十余位知名專家學(xué)者成為首批“給AI投100瓶毒藥”的標(biāo)注工程師。標(biāo)注人各提出100個含有偏見和歧視回答的棘手問題,并標(biāo)注出大型模型的回答,完成由AI "投毒"和"解毒"的攻防。
據(jù)阿里聯(lián)合團(tuán)隊(duì)負(fù)責(zé)人介紹,與國外公司的治理方法相比,100PoisonMpts數(shù)據(jù)集在技術(shù)方法上將具備更完整的標(biāo)注流程、更隱性的問題領(lǐng)域、更全面的效益。標(biāo)注數(shù)據(jù)對模型繼續(xù)訓(xùn)練、微調(diào)、強(qiáng)化學(xué)習(xí)、線上服務(wù)等多個環(huán)節(jié)都有益處。
目前,首批領(lǐng)域數(shù)據(jù)涉及到反對歧視、同理心、商榷式表達(dá)等目標(biāo),該數(shù)據(jù)囊括了法律、心理學(xué)、兒童教育、無障礙、冷知識、親密關(guān)系、環(huán)境公正等多個維度。100PoisonMpts數(shù)據(jù)集預(yù)計(jì)在6月份開放第一批問答數(shù)據(jù),目前正在魔搭等技術(shù)社區(qū)征集更多垂直領(lǐng)域?qū)<摇?/p>
(舉報)