卓世科技提示詞壓縮專利技術(shù)揭秘

2024-10-14 11:34 · 稿源：站長之家用戶

提示工程是一種在機(jī)器學(xué)習(xí)模型，尤其是預(yù)訓(xùn)練語言模型中，通過精心設(shè)計(jì)輸入提示（prompt）來引導(dǎo)模型輸出期望結(jié)果的技術(shù)。在大語言模型的使用中，提示詞通常是一段文本，用來引導(dǎo)模型生成特定的輸出或完成特定的任務(wù)。

在多文檔搜索、問答系統(tǒng)、文檔自動(dòng)摘要生成以及閱讀理解等多樣化且復(fù)雜的應(yīng)用場景中，往往會面臨輸入提示（prompt）長度顯著增加的挑戰(zhàn)。這種超長prompt不僅加大了大型語言模型（LLM）的推理成本，還顯著延長了推理時(shí)間，從而嚴(yán)重限制了其在需要即時(shí)響應(yīng)的實(shí)時(shí)應(yīng)用場景中的適用性。為了克服這一難題，優(yōu)化prompt設(shè)計(jì)，如通過壓縮技術(shù)精簡關(guān)鍵信息、采用更有效的prompt格式或結(jié)構(gòu)，變得尤為關(guān)鍵。這樣的策略旨在平衡模型性能與實(shí)時(shí)性需求，確保LLM能夠在復(fù)雜多變的場景下依然保持有效、準(zhǔn)確的響應(yīng)能力。

基于以上背景，卓世科技創(chuàng)新的中文提示詞壓縮技術(shù)應(yīng)運(yùn)而生。

卓世科技對提示詞進(jìn)行壓縮的技術(shù)旨在保證推理效果的前提下降低推理成本，提升推理速度。其主要的思路如下：

（1）定義長prompt的結(jié)構(gòu)：

Prompt=instruction+documents/demonstrations+question。

（2）小語言模型和大語言模型的分布對齊

使用小語言模型（small LLM）估計(jì)長prompt的各個(gè)部分的重要程度，為了縮小大語言模型（LLM）和小語言模型之間的概率分布差距，通過在LLM生成的數(shù)據(jù)上進(jìn)行指令微調(diào)來有效小語言模型，使得小語言模型更好地模擬LLM的分布。

（3）對documents/demonstrations部分進(jìn)行兩個(gè)層次的壓縮。

3.1、示例層次的壓縮

documents/demonstrations部分中通常包含多個(gè)文檔/示例，而每個(gè)文檔/示例包含有多個(gè)段落。針對每個(gè)文檔/示例的每個(gè)段落，計(jì)算出段落與question的相關(guān)性，保留得分前 3 的段落作為該文檔/示例的代表上下文x_doc。同時(shí)，可計(jì)算出該文檔/示例中所有段落的平均相關(guān)性s_k。

然后根據(jù)question部分和文檔/示例的代表上下文x_doc計(jì)算文檔/示例級別的困惑度r_k。最終文檔/示例的評分為s1=s_k*r_k。

此時(shí)，每個(gè)文檔/示例計(jì)算出三個(gè)分?jǐn)?shù)，評分s1、平均相關(guān)性s_k以及困惑度r_k。利用這三個(gè)分?jǐn)?shù)從長prompt的documents/demonstrations部分中刪除部分文檔/示例。

3. 2 重排序

由于模型對prompt的不同位置處的信息的敏感度不同，通常模型對prompt首尾位置處的信息敏感度較好，中間位置的敏感度較差。為了確保prompt的效果，可依據(jù)評分對保留的文檔進(jìn)行重排序處理，使得評分較高的文檔排列在首位，評分較低排列在中間位置。

3. 3 文檔/示例壓縮率計(jì)算

針對重排序后的prompt，用戶可自定義在詞語層次上的壓縮率。按照上述文檔/示例的排序，使用[1， 2*Kc]的均勻離散分布，來初始化每個(gè)文檔/示例的壓縮率。

3. 4 詞語層次的壓縮

在刪減文檔/示例后的documents/demonstrations部分，可計(jì)算每個(gè)token的條件困惑度差異。

為了確保壓縮后的語義完整，可使用雙向比較大匹配分詞法，以獲取到最長的分詞詞語。同時(shí)，為了適應(yīng)垂直領(lǐng)域，可結(jié)合垂直領(lǐng)域內(nèi)的專業(yè)詞匯表進(jìn)行分詞，盡量保留垂直領(lǐng)域內(nèi)的專業(yè)詞匯。

然后可基于前述計(jì)算出的token的條件困惑度差異以及分詞的結(jié)果，對每個(gè)詞語進(jìn)行打分。假設(shè)一個(gè)中文詞語word_i有k個(gè)token組成，按照該中文詞語word_i是否屬于垂直領(lǐng)域的詞匯，使用不同的計(jì)算方式對其評分。

最后針對每個(gè)文檔/示例，利用文檔/示例中每個(gè)詞匯的評分，按照得分高低順序壓縮文檔/示例，使得其滿足文檔/示例的壓縮率。

（4）壓縮后的prompt可輸入至大語言模型中，得到響應(yīng)。

至此，整個(gè)提示詞壓縮的方案介紹完畢，該技術(shù)方案相比于其他壓縮方案，更加適配中文的詞語粒度，尤其在垂直領(lǐng)域可避免丟失專業(yè)詞匯，在保證語義完整的情況下刪減了冗余信息，可有效降低提升推理效率，節(jié)約計(jì)算成本。

（推廣）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)，對本頁面內(nèi)容所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任，相關(guān)信息僅供參考。站長之家將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實(shí)，并對任何自主決定的行為負(fù)責(zé)。任何單位或個(gè)人認(rèn)為本頁面內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，可及時(shí)向站長之家提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明（點(diǎn)擊查看反饋聯(lián)系地址）。本網(wǎng)站在收到上述法律文件后，將會依法依規(guī)核實(shí)信息，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

相關(guān)推薦

關(guān)鍵詞：

三星憑借深厚技術(shù)積累為用戶帶來多元科技好物與移動(dòng)新體驗(yàn)

TrendForce集邦咨詢發(fā)布最新調(diào)查，2024年第三季度恰逢智能手機(jī)銷售旺季，伴隨各大品牌接連推出旗艦新機(jī)，帶動(dòng)生產(chǎn)總數(shù)環(huán)比增長7%，約達(dá)3.1億部，與去年同期持平。三星手機(jī)產(chǎn)量近5900萬部，環(huán)比增長9%，以19%的市占排名第一，傲視群雄。相信憑借這一企業(yè)理念，三星未來還會打造更加出色的高端旗艦產(chǎn)品，引領(lǐng)行業(yè)發(fā)展，為消費(fèi)者帶來更出色的產(chǎn)品。

?智能手機(jī) ?三星手機(jī) ?Galaxy
AIGC技術(shù)興起，海同科技專業(yè)課程助力職業(yè)發(fā)展

在人工智能技術(shù)持續(xù)穩(wěn)健推進(jìn)的浪潮中，AIGC正以前所未有的速度在全球范圍內(nèi)展現(xiàn)出其巨大的發(fā)展?jié)摿Α＿@一技術(shù)的興起，不僅標(biāo)志著計(jì)算機(jī)在內(nèi)容創(chuàng)作領(lǐng)域邁出了革命性的一步，更為眾多有志于投身這一新興領(lǐng)域的學(xué)員提供了廣闊的舞臺。海同科技的AIGC課程可以為學(xué)員提供豐富的專業(yè)知識和實(shí)踐經(jīng)驗(yàn)，為他們未來的職業(yè)發(fā)展奠定堅(jiān)實(shí)的基礎(chǔ)，使他們能夠在這一充滿希望的行業(yè)中勇往直前。

?AIGC ?人工智能 ?職業(yè)培訓(xùn)
薦剛剛，沈向洋官宣通用視覺大模型！無需提示，就能識別萬物

無需用戶提示，AI就可以識別萬物!且精度更高、速度更快。IDEA研究院創(chuàng)院理事長沈向洋官宣IDEA研究院最新成果:通用視覺大模型DINO-X。另一方面結(jié)合自研的“視覺提示優(yōu)化”方法，無需更改模型結(jié)構(gòu)，不用重新訓(xùn)練模型，實(shí)現(xiàn)小樣本下的場景化定制。

?沈向洋 ?通用視覺大模型 ?人工智能
愛奇藝涉嫌虛假宣傳：“尖叫之夜”活動(dòng)提示抽中門票實(shí)際無法兌獎(jiǎng)

根據(jù)國內(nèi)媒體報(bào)道：據(jù)多名網(wǎng)友反映，稱自己在愛奇藝舉辦的尖叫之夜”活動(dòng)抽獎(jiǎng)環(huán)節(jié)遭遇問題。他們在活動(dòng)頁面上成功抽中了門票，但在查看時(shí)卻發(fā)現(xiàn)并沒有對應(yīng)的門票信息。除了積分抽獎(jiǎng)和購買星鉆會員年卡抽獎(jiǎng)外，愛奇藝還推出了必得入場券”的尖叫實(shí)體禮盒，分為680元、1080元、1480元、1980元四個(gè)款式，分別對應(yīng)不同的看臺和內(nèi)場坐席。

?愛奇藝 ?尖叫之夜 ?抽獎(jiǎng)問題
薦“抽象”變遷史：從亞文化到年度關(guān)鍵詞

2015年9月1日，在成都街頭的一個(gè)燒烤攤上，網(wǎng)絡(luò)主播李贛宣布“抽象工作室”正式成立。在此之前的2年時(shí)間里，李贛頻頻在直播間中使用“真的抽象”這一口頭禪，并通過各種具有創(chuàng)新性的直播方式在互聯(lián)網(wǎng)站穩(wěn)了腳跟，將自己和“抽象”一詞高度綁定，成為“抽象文化”最開始的代言人。說不清是莊周夢蝶是蝶夢莊周。

?抽象
支付寶新技術(shù)斬獲浙江科技進(jìn)步一等獎(jiǎng)：節(jié)省成本16.9億元

11月22日，浙江省2023年度科學(xué)技術(shù)進(jìn)步獎(jiǎng)公布。支付寶聯(lián)合浙江大學(xué)、諧云科技、阿里云共同研發(fā)的基于云原生的大規(guī)模云邊協(xié)同關(guān)鍵技術(shù)及應(yīng)用”，獲得科學(xué)技術(shù)進(jìn)步一等獎(jiǎng)！項(xiàng)目的部分核心技術(shù)已開源，其中安全容器技術(shù)KataContainers已成為OpenInfraFoudation的頂級項(xiàng)目。

?云邊協(xié)同 ?分布式計(jì)算 ?科學(xué)技術(shù)進(jìn)步獎(jiǎng)
首度揭秘：研祥金碼「可靠性」測試！

一臺讀碼器在送到客戶手里前要經(jīng)過多嚴(yán)格的可靠性測試？↓《“讀碼專家”出廠記》勇闖“九九八十一關(guān)”，let’sgo！測試結(jié)果：實(shí)驗(yàn)后過程中產(chǎn)品抗干擾能力強(qiáng)讀取數(shù)據(jù)準(zhǔn)確、通信穩(wěn)定RegemMarr研祥金碼智能讀碼器產(chǎn)品電磁兼容設(shè)計(jì)防抖模式，適用于惡劣工作環(huán)境中！

?讀碼器 ?可靠性測試 ?震動(dòng)測試
2024年最佳免費(fèi)AI圖片轉(zhuǎn)提示工具

在當(dāng)今快節(jié)奏的創(chuàng)意世界中，圖像到提示工具已變得不可或缺。它們可以自動(dòng)生成圖像提示，為您節(jié)省時(shí)間和精力。這些知識可以幫助您了解如何使用這些工具并增強(qiáng)您的創(chuàng)意輸出。

?圖像生成 ?創(chuàng)意工具 ?內(nèi)容制作
“水”知道！谷醫(yī)堂正糖名家揭秘腎臟健康密碼

忙碌的生活中，我們往往忽視了身體發(fā)出的微小信號。不僅是生命的源泉，更是腎臟健康的“晴雨表”。讓我們攜手共進(jìn)，守護(hù)生命之源，共創(chuàng)健康未來！

?腎臟健康 ?喝水習(xí)慣 ?糖尿病護(hù)理
走進(jìn)谷醫(yī)堂中醫(yī)講堂，揭秘孤獨(dú)癥診療新篇章

在這個(gè)快節(jié)奏的社會中，我們往往容易忽視那些安靜的角落，以及那些需要更多理解與關(guān)懷的心靈。有一檔節(jié)目——《健康e起來》，通過谷醫(yī)堂與湖南長沙廣播電視臺的聯(lián)合努力，為公眾揭開一個(gè)常被誤解的醫(yī)學(xué)領(lǐng)域——神經(jīng)系統(tǒng)發(fā)育性障礙，特別是孤獨(dú)癥，為無數(shù)家庭帶去了一線光明。谷醫(yī)堂將繼續(xù)攜手各界，共同點(diǎn)亮更多家庭的希望之光，讓健康與愛同行。

?孤獨(dú)癥 ?神經(jīng)系統(tǒng)發(fā)育性障礙 ?健康教育

熱文

3 天
7天

站長商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

卓世科技提示詞壓縮專利技術(shù)揭秘

三星憑借深厚技術(shù)積累為用戶帶來多元科技好物與移動(dòng)新體驗(yàn)

AIGC技術(shù)興起，海同科技專業(yè)課程助力職業(yè)發(fā)展

薦剛剛，沈向洋官宣通用視覺大模型！無需提示，就能識別萬物

愛奇藝涉嫌虛假宣傳：“尖叫之夜”活動(dòng)提示抽中門票實(shí)際無法兌獎(jiǎng)

薦“抽象”變遷史：從亞文化到年度關(guān)鍵詞

支付寶新技術(shù)斬獲浙江科技進(jìn)步一等獎(jiǎng)：節(jié)省成本16.9億元

首度揭秘：研祥金碼「可靠性」測試！

2024年最佳免費(fèi)AI圖片轉(zhuǎn)提示工具

“水”知道！谷醫(yī)堂正糖名家揭秘腎臟健康密碼

走進(jìn)谷醫(yī)堂中醫(yī)講堂，揭秘孤獨(dú)癥診療新篇章

熱文

小紅書封號上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

小紅書被吐槽無理由封號客服回應(yīng)：未說明處罰時(shí)間就是永封

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

極越公關(guān)負(fù)責(zé)人被開除本人回應(yīng)：此前未接到任何通知

微信緊急提醒：警惕木馬病毒將加強(qiáng)對此類行為打擊

馬斯克稱星鏈可實(shí)現(xiàn)火星玩游戲：但存在約4到20分鐘延遲

雷軍：小米是北方車廠 SU7研發(fā)之初就要做冬季電車?yán)m(xù)航之王

美團(tuán)：冬至期間將針對餃子等應(yīng)時(shí)食品訂單提供“超時(shí)保護(hù)”

不得使用惡俗惡趣味微短劇片名！廣電總局出手整治“霸總愛上我

英偉達(dá)AI芯片最大買家揭曉！微軟力壓同行霸榜

微信朋友圈崩了上熱搜騰訊客服：請嘗試這幾種方法

極越員工萬字怒懟ceo：公關(guān)總監(jiān)徐繼業(yè)怒罵員工蒼蠅

馬斯克將推出X Mail電子郵箱服務(wù)

百度回應(yīng)進(jìn)軍短?。寒?dāng)前內(nèi)容生態(tài)的一個(gè)重點(diǎn)發(fā)展方向

極越員工善后方案已出爐：員工獲“N+1”賠償由百度吉利出資

螞蟻集團(tuán)否認(rèn)借殼上市：目前沒有上市計(jì)劃

小紅書封號上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

阿里74億元出售銀泰！銀泰集團(tuán)回應(yīng)：與銀泰百貨無直接關(guān)聯(lián)

小紅書被吐槽無理由封號客服回應(yīng)：未說明處罰時(shí)間就是永封

站長商機(jī)