人工智能大模型帶來(lái)了強(qiáng)大的創(chuàng)造力,并被應(yīng)用于內(nèi)容生產(chǎn)領(lǐng)域。但是你是否想過(guò)我們普通人日常生活中有哪些場(chǎng)景可以借助大模型的能力呢?翻譯就是一個(gè)最接近普通用戶的場(chǎng)景。在競(jìng)爭(zhēng)全球化的今天,我們可能需要閱讀專業(yè)的外文文獻(xiàn)提升自身專業(yè)技能、和來(lái)自全球的客戶打交道做生意,高質(zhì)量的機(jī)器翻譯能夠大大提升工作效率,降低溝通成本,擴(kuò)展知識(shí)的輸入面,并幫助企業(yè)和個(gè)人更好地融入全球市場(chǎng)。
近日一份整合市面8大主流大模型,通過(guò)10大維度深度測(cè)試的大模型翻譯測(cè)評(píng)報(bào)告發(fā)布。報(bào)告顯示,基本上大模型都具備了很成熟的翻譯能力,國(guó)產(chǎn)大模型追平甚至超過(guò)了ChatGPT-4o 。其中騰訊元寶的表現(xiàn)優(yōu)秀,翻譯專家打分排名首先,用戶打分排名第二。無(wú)論是經(jīng)典詩(shī)歌、專業(yè)資格考試題目、日常生活場(chǎng)景的翻譯,都讓人眼前一亮。其穩(wěn)定性和準(zhǔn)確性在實(shí)際應(yīng)用中表現(xiàn)尤為突出。
測(cè)試場(chǎng)景具有極強(qiáng)的應(yīng)用實(shí)踐性。例如,在英文專業(yè)資料翻譯這一典型場(chǎng)景,該測(cè)評(píng)選擇AI領(lǐng)域《Attention Is All You Need》(Transformer模型論文),考察模型對(duì)科技術(shù)語(yǔ)、復(fù)雜句式、邏輯關(guān)系的理解和翻譯的準(zhǔn)確性。本篇科技論文約3.9萬(wàn)個(gè)單詞,給到統(tǒng)一的提示詞后,騰訊元寶能夠和 GPT-4o 可直接全文翻譯,并保持原文的格式。
文書(shū)撰寫領(lǐng)域,該測(cè)評(píng)以英文簽證信為例。日常生活中,出國(guó)旅游、學(xué)習(xí)或工作都可能需要寫簽證信,這是一種常見(jiàn)的應(yīng)用場(chǎng)景。簽證信的寫作需要清晰表達(dá)申請(qǐng)人的意圖、行程安排等信息。該測(cè)評(píng)模擬了旅游場(chǎng)景,選擇生活中首先次出國(guó)時(shí)所需的簽證信寫作,考察模型在此類正式場(chǎng)合的英文表達(dá)能力,估其在正式信函翻譯方面的表現(xiàn),評(píng)估模型在語(yǔ)法、用詞和格式上的表現(xiàn)。而各個(gè)模型在這一領(lǐng)域都表現(xiàn)良好,其中騰訊元寶不僅翻譯準(zhǔn)確,翻譯速度也比較快。而且格式很清晰,結(jié)構(gòu)合理,涵蓋了簽證申請(qǐng)信所需的所有要點(diǎn)。使用的語(yǔ)言正式且尊重申請(qǐng)國(guó)文化和習(xí)慣。
同聲傳譯場(chǎng)景幫助用戶進(jìn)行信息的及時(shí)抓取與反饋。該測(cè)評(píng)選取最經(jīng)典的演講之一《喬布斯斯坦福大學(xué)演講》,實(shí)時(shí)傳給大模型,重點(diǎn)考察各工具在長(zhǎng)篇演講翻譯方面的準(zhǔn)確性、流暢性、對(duì)演講風(fēng)格的把握。結(jié)果顯示,騰訊元寶在同聲傳譯方面還不錯(cuò),適合實(shí)時(shí)性要求高的場(chǎng)景,Kimi、ChatGPT-4o 和訊飛星火在準(zhǔn)確性、流暢度和即時(shí)性上更優(yōu)秀一些,適合需要高精度和高實(shí)時(shí)性的用戶。豆包和智譜清言表現(xiàn)也相對(duì)優(yōu)異。
值得注意的是,在多模態(tài)翻譯領(lǐng)域,大模型還有很大的進(jìn)步空間。在外出旅行時(shí),我們可能會(huì)遇到地圖難以看懂、菜單需要翻譯的情況,想問(wèn)當(dāng)?shù)厝擞中哂陂_(kāi)口,這時(shí)候如果能拍照問(wèn)AI將帶來(lái)很大的便利。因此該測(cè)評(píng)選擇日常生活中常見(jiàn)的餐牌,包括國(guó)外只有文字的和國(guó)內(nèi)還有圖片的菜單,測(cè)試模型能否準(zhǔn)確翻譯并捕捉所有菜名和描述,評(píng)估模型在多模態(tài)識(shí)圖和翻譯方面的綜合能力。最終結(jié)果不盡人意。ChatGPT-4o:基本能夠譯出菜品名稱,少量遺漏,中英對(duì)照能夠更清晰地展示菜單中的菜品。騰訊元寶:菜品名稱、描述和價(jià)格基本能夠識(shí)別和翻譯,基本不存在引起誤解的歧義和直譯。而有幾個(gè)模型無(wú)法做到完全識(shí)別圖片內(nèi)容并翻譯,且部分翻譯的機(jī)翻痕跡很重,就是字面意思。
AI大模型在翻譯場(chǎng)景的應(yīng)用雖然不算美好,但依然極大的提升了傳統(tǒng)翻譯的效率和質(zhì)量。未來(lái)隨著模型性能的持續(xù)提升,應(yīng)用場(chǎng)景將更加廣泛,也有望滲透到更多行業(yè)和領(lǐng)域,成為在競(jìng)爭(zhēng)全球化背景下人們?nèi)粘9ぷ骱蜕畹挠欣ぞ摺?/p>
(推廣)