站長之家(ChinaZ.com)8月15日 消息:最近,Meta AI 提出了一種新的語言模型叫做 "牧羊人"(Shepherd),用于評估其他模型生成的文本,并給出改進建議。這個模型使用了約70億個參數(shù),并通過社區(qū)反饋和人工標注的數(shù)據(jù)集來進行訓練。
"牧羊人" 模型的評估結果顯示,在與其他競爭模型進行比較時,它的平均勝率為53-87%,遠高于其他模型。此外,在人工評估中,"牧羊人" 模型的表現(xiàn)也優(yōu)于其他模型,與 ChatGPT 相當。
該模型的特點之一是能夠生成自然語言的反饋,包括總體判斷、一般建議以及領域知識等。它可以識別文本中的問題,如事實性、邏輯錯誤、連貫性和一致性,并提出改進建議。
論文地址:https://arxiv.org/pdf/2308.04592.pdf
為了微調(diào)和評估 "牧羊人" 模型,研究人員創(chuàng)建了一個高質(zhì)量的反饋數(shù)據(jù)集,包括社區(qū)反饋和人工標注的反饋。通過使用 GPT-4作為評估工具,并選擇了6個涵蓋廣泛主題和推理技能的數(shù)據(jù)集進行評估。
研究人員發(fā)現(xiàn),"牧羊人" 模型在批判模型生成方面的能力優(yōu)于其他模型,尤其是在提供正確判斷的反饋方面。同時,社區(qū)反饋和人工標注的反饋數(shù)據(jù)對模型的性能有不同的影響,社區(qū)反饋更多樣化但非正式,而人工標注的數(shù)據(jù)信息量更大。
總的來說,"牧羊人" 模型展示出了令人印象深刻的結果,在多個下游任務中表現(xiàn)優(yōu)于其他模型。這一研究對于改進語言模型生成的可靠性非常有益。
語言模型的特點包括:
能夠生成連貫、有語境和語義的文本。
能夠識別問題,并提供改進建議。
可以涉及領域知識,給出相關的建議。
可以通過社區(qū)反饋和人工標注的數(shù)據(jù)進行微調(diào)和評估。
在批判模型生成方面表現(xiàn)優(yōu)于其他模型。
在多個下游任務中的表現(xiàn)優(yōu)于其他模型。
對不同類型的任務都能提供反饋。
(舉報)