9 月 7 日, 2023 騰訊全球數(shù)字生態(tài)大會在深圳國際會展中心舉行,聚焦產(chǎn)業(yè)未來發(fā)展新趨勢以及自研技術(shù)產(chǎn)品的最 新進(jìn)展,展示了全方位的行業(yè)前沿與智慧洞見。在行業(yè)大模型及智能應(yīng)用專場上,騰訊云副總裁、騰訊云智能研發(fā)負(fù)責(zé)人、騰訊企點(diǎn)研發(fā)負(fù)責(zé)人吳永堅(jiān)發(fā)表《MaaS助力應(yīng)用升級 重塑智能時代生產(chǎn)力》主題演講?;贏I大模型技術(shù),騰訊云更新升級近 10 款智能應(yīng)用和解決方案,進(jìn)一步加快模型產(chǎn)業(yè)落地。
騰訊云副總裁、騰訊云智能研發(fā)負(fù)責(zé)人、騰訊企點(diǎn)研發(fā)負(fù)責(zé)人 吳永堅(jiān)
吳永堅(jiān)認(rèn)為,AI大模型應(yīng)用,催生“效率革命”,讓智能應(yīng)用表現(xiàn)出更強(qiáng)的能力、更高的效率。例如,在AIGC應(yīng)用方面,騰訊混元大模型正式通過騰訊云對外開放,用戶可以通過自然語言給模型輸入內(nèi)容生成指令,提升文案創(chuàng)作效率。依托騰訊自研的AI繪畫模型,騰訊云AI繪畫實(shí)現(xiàn)輸入文本、圖片智能生成圖像,支持超過 25 種繪畫風(fēng)格,共同為高質(zhì)量、有效率的內(nèi)容創(chuàng)作提供支持,加快在內(nèi)容社區(qū)、電商等場景落地。
同時,騰訊云依托行業(yè)大模型解決方案,提升了圖像識別、數(shù)據(jù)分析、人機(jī)交互等多款智能應(yīng)用生產(chǎn)效率,將更多元化的,即插即用的產(chǎn)品、服務(wù)推向市場,重塑智能時代生產(chǎn)力。
吳永堅(jiān)介紹,在圖像識別領(lǐng)域,TI-OCR訓(xùn)練平臺集成OCR大模型,借助端到端算法,助力客戶解決特定場景識別難題,減少訓(xùn)練成本和訓(xùn)練時長;在數(shù)據(jù)分析領(lǐng)域,騰訊企點(diǎn)分析·AI助手通過分析大模型,實(shí)現(xiàn)零門檻對話式分析,讓人人都能擁有專業(yè)數(shù)據(jù)分析能力,為業(yè)務(wù)一線提供決策支持。在人機(jī)交互方面,通過行業(yè)大模型中樞,對接海量知識和工具,實(shí)現(xiàn)文字、語言、視頻等多模態(tài)意圖理解,生成智能、準(zhǔn)確答案輸出,支持更智能、更有效、更自然的智能客服、AI助手、數(shù)智人應(yīng)用落地。
吳永堅(jiān)表示,未來騰訊云將繼續(xù)推動AI大模型等先進(jìn)技術(shù),應(yīng)用于內(nèi)部PaaS、SaaS產(chǎn)品,驗(yàn)證MaaS服務(wù)的可用性、易用性。另一方面,也將持續(xù)打造更多開箱即用的AI大模型產(chǎn)品、服務(wù),打通AI產(chǎn)業(yè)落地全鏈條,助力客戶實(shí)現(xiàn)數(shù)智化升級。
以下為吳永堅(jiān)主題演講內(nèi)容整理:
各位線上的觀眾、媒體朋友們,大家好!我是騰訊的吳永堅(jiān),今天我分享的主題是《MaaS助力應(yīng)用升級 重塑智能時代生產(chǎn)力》。
今年 6 月,我們正式發(fā)布了騰訊云行業(yè)大模型解決方案,助力客戶將AI大模型應(yīng)用于產(chǎn)業(yè)場景。與此同時,我們也推動內(nèi)部實(shí)踐,基于行業(yè)大模型,推出騰訊企點(diǎn)智能客服、企點(diǎn)AI助手兩款產(chǎn)品,通過技術(shù)創(chuàng)新解決智能客服“不智能”,數(shù)據(jù)分析門檻高的難題。
隨后,我們將AI大模型能力應(yīng)用到更廣泛的PaaS、SaaS產(chǎn)品。一方面,驗(yàn)證我們MaaS服務(wù)的可用性、易用性。另一方面,也將更多開箱即用的產(chǎn)品、服務(wù),向客戶開放,推動大模型在實(shí)際生產(chǎn)、運(yùn)營場景發(fā)揮效用。
今天,借數(shù)字生態(tài)大會,和大家分享一下我們的比較新實(shí)踐。
依托騰訊云多年深耕產(chǎn)業(yè)互聯(lián)網(wǎng)的經(jīng)驗(yàn),我們從產(chǎn)業(yè)需求出發(fā),基于自研騰訊混元大模型,同時支持主流開源模型應(yīng)用,在TI平臺內(nèi)置高質(zhì)量行業(yè)大模型,為客戶提供不同規(guī)模的模型服務(wù)。通過升級大模型訓(xùn)練、精調(diào)工具鏈,助力企業(yè)快速生成專屬模型,升級智能應(yīng)用,加快模型產(chǎn)業(yè)落地。
首先和大家分享,我們基于騰訊混元大模型,在AIGC應(yīng)用方面的探索。
過去,在文案創(chuàng)作場景,傳統(tǒng)創(chuàng)作以“人工”為核心,容易產(chǎn)生創(chuàng)意不足、時效性不足、質(zhì)量不可控等問題。今天,騰訊混元大模型正式通過騰訊云對外開放,用戶可以通過自然語言給模型輸入內(nèi)容生成指令,提升文案創(chuàng)作效率;通過參數(shù)選擇、多輪輸入,對生成內(nèi)容進(jìn)行控制、調(diào)優(yōu),提升文案創(chuàng)作效果;根據(jù)營銷、創(chuàng)作、效率等不同場景需求,生成對應(yīng)專屬內(nèi)容,提升文案可用性。同時,還可以與廣告平臺、UGC平臺、SaaS服務(wù)實(shí)現(xiàn)快速連接,加速落地,為各類場景提供更準(zhǔn)確、有效的商業(yè)文案創(chuàng)作工具。
同樣,傳統(tǒng)繪畫創(chuàng)作,也需要耗費(fèi)大量的時間和精力,并且嚴(yán)重依賴于創(chuàng)作者的專業(yè)水平和主觀經(jīng)驗(yàn),給企業(yè)帶來較大的運(yùn)營成本。我們推出騰訊云AI繪畫,輸入文本、圖片即可智能生成圖像,支持超過 25 種繪畫風(fēng)格。值得注意的是,依托騰訊自研的AI繪畫模型,騰訊云AI繪畫具有強(qiáng)大的中文理解能力,可以更好地支持中文元素的圖像生成,例如古詩詞理解、水墨剪紙等;我們也大幅降低了API接口耗時,相較業(yè)內(nèi)平均水平降低50%,為高質(zhì)量、有效率的內(nèi)容創(chuàng)作提供支持。
深入產(chǎn)業(yè),我們發(fā)現(xiàn)在內(nèi)容社區(qū)、電商等場景,圖文結(jié)合的形式,可以提供更豐富、更個性、更有創(chuàng)意的廣告信息,有效提升轉(zhuǎn)化率?;趧倓偨榻B的兩種方式,用戶只需輸入主題和產(chǎn)品描述,即可一鍵生成種草文案、商品詳情描述等內(nèi)容。AI繪畫,還可以在內(nèi)容配圖,宣傳海報等環(huán)節(jié),提供創(chuàng)意輔助,實(shí)現(xiàn)智能營銷+智能創(chuàng)意雙重提效。現(xiàn)在,歡迎大家申請?jiān)囉抿v訊混元大模型,也可以登錄騰訊云官網(wǎng)試用AI繪畫。
在此之外,今年 6 月,我們還公布了騰訊云行業(yè)大模型解決方案。
由大量專業(yè)知識學(xué)習(xí),以及強(qiáng)大推理能力,構(gòu)建出的專屬行業(yè)大模型,在特定領(lǐng)域的表現(xiàn)力及適應(yīng)性更強(qiáng)?;诖耍覀冞M(jìn)一步提升了圖像識別、數(shù)據(jù)分析、數(shù)智人、客服等智能應(yīng)用生產(chǎn)效率,將更多元化的,即插即用的產(chǎn)品、服務(wù)推向市場。
在圖像識別領(lǐng)域,既往OCR文字識別,需要經(jīng)過圖片輸入、檢測、識別、結(jié)構(gòu)化等多個流程。一方面,多流程操作容易導(dǎo)致錯誤累積,降低模型準(zhǔn)確率;另一方面,每一個業(yè)務(wù)場景的圖片識別需求有所不同,導(dǎo)致單一模型難以復(fù)用于新場景,每一次定制都需要增加成本。
升級為“端到端”的OCR大模型后,從圖像到文字,一步生成識別結(jié)果。比如,針對票據(jù)示例,可直接提問“委托日期是什么時候”,大模型在理解圖片后給出回答,大幅縮減識別流程,提升識別準(zhǔn)確度。針對發(fā)票混貼的場景下,一個模型可支持多種類型圖像識別,泛化性進(jìn)一步提高。
與傳統(tǒng)模型相比,OCR大模型突破技術(shù)局限,有效降低了落地成本。例如,針對手寫體,復(fù)雜表格難識別的問題,OCR大模型通過全面理解圖片,直接提取相關(guān)字段,提升識別準(zhǔn)確度;針對拍攝背景復(fù)雜的圖片,OCR大模型可以借助端到端算法,避開干擾信息,直接回答相關(guān)問題;針對訓(xùn)練成本,在特定場景下,傳統(tǒng)模型訓(xùn)練提升指標(biāo),需要依賴超過 2000 個訓(xùn)練樣本, 48 到 60 個小時訓(xùn)練,而OCR大模型,只需要 50 到 100 個訓(xùn)練樣本,訓(xùn)練 2 個小時,即可實(shí)現(xiàn)3%到20%的效果提升。
目前,OCR大模型已經(jīng)集成到TI-OCR訓(xùn)練平臺,供客戶依據(jù)自身業(yè)務(wù)場景,進(jìn)行小樣本精調(diào)使用。
以新能源領(lǐng)域?yàn)槔蛻敉ㄟ^TI-OCR 訓(xùn)練平臺進(jìn)行圖片標(biāo)注,以小樣本企業(yè)數(shù)據(jù)對OCR大模型進(jìn)行精調(diào),實(shí)現(xiàn)對彎曲電線字符、水印銘牌、復(fù)雜電表圖片等識別,推動自動化信息審核。在OCR大模型輔助下,字符讀取準(zhǔn)確率達(dá)到98%以上,自動化審核預(yù)計(jì)為客戶節(jié)省超過80%的人力投入。
在數(shù)據(jù)分析場景,當(dāng)用戶希望了解“最近的銷量情況”時,傳統(tǒng)數(shù)據(jù)分析流程復(fù)雜,需要高度依賴專業(yè)人員,經(jīng)過分析思路拆解、數(shù)據(jù)指標(biāo)導(dǎo)入等環(huán)節(jié),才能生成結(jié)論,鏈路長效率低。面對同一個問題,通用大模型因?yàn)槿狈Ψ治鰧I(yè)知識和洞察力,則容易生成冗余、或無效的答案。
為此,我們打造了支持零門檻對話式數(shù)據(jù)分析的分析大模型。
和通用大模型相比,分析大模型內(nèi)化了專業(yè)的數(shù)據(jù)分析知識、不同行業(yè)的分析指標(biāo)體系,可以依據(jù)行業(yè)特點(diǎn)進(jìn)行意圖理解、思路拆解、數(shù)據(jù)推理,從分析師視角生成結(jié)論。
例如,通過分析大模型的意圖理解能力,銷量這個詞匯會被關(guān)聯(lián)為“銷售額”、“訂單數(shù)”,“最近”被關(guān)聯(lián)為“近 7 天”,經(jīng)過與用戶交互,明確分析任務(wù)為近 7 天的訂單數(shù)趨勢。
通過分析大模型的數(shù)據(jù)推理能力,還將進(jìn)一步建議用戶從不同銷售渠道,分析訂單數(shù)變化原因。
基于分析大模型,我們升級推出騰訊企點(diǎn)分析AI助手,覆蓋對話式分析,輔助數(shù)據(jù)配置,提取智能結(jié)論、一鍵生成報告四大場景。今年 9 月,企點(diǎn)分析AI助手正式向大客戶開放內(nèi)測申請。未來,人人都能擁有專業(yè)數(shù)據(jù)分析能力,讓數(shù)據(jù)跑得更快,為業(yè)務(wù)一線提供決策支持。
在人機(jī)交互方面,我們通過行業(yè)大模型中樞,對接海量知識和工具,實(shí)現(xiàn)文字、語言、視頻等多模態(tài)意圖理解,生成智能、準(zhǔn)確答案輸出。接下來,我將詳細(xì)為大家介紹智能客服、語音助手、數(shù)智人方向的探索。
圍繞客服場景,今年 6 月騰訊企點(diǎn)發(fā)布全新一代智能客服,引入大模型能力,對對話交互、人工輔助和知識構(gòu)建三個層面進(jìn)行提升。最近,我們進(jìn)一步升級了管理端配置能力,提升知識構(gòu)建效率,優(yōu)化C端用戶體驗(yàn)。同時,我們積極與各行各業(yè)進(jìn)行產(chǎn)業(yè)實(shí)踐,在文旅、泛政、地產(chǎn)等領(lǐng)域落地標(biāo)桿案例。
例如,在知識構(gòu)建方面,通過企業(yè)專屬知識“導(dǎo)入-校驗(yàn)-調(diào)優(yōu)”閉環(huán),可以提升復(fù)雜文檔讀取、理解效果,進(jìn)一步優(yōu)化冷啟動效率,降低運(yùn)維成本。在文字文檔基礎(chǔ)上,我們增加了對圖文混排、多列排版等復(fù)雜文檔接入。通過語義切塊,生成向量,以高可用、可擴(kuò)展向量數(shù)據(jù)庫方案,豐富問答組合及內(nèi)容;通過快速生成問答對,以及問答原文的回溯,提高問答校驗(yàn)的效率;通過提供對話測試和運(yùn)營工具,讓運(yùn)營人員快速實(shí)現(xiàn)調(diào)優(yōu),提升問答準(zhǔn)確率。
在對話交互層面,大模型迭代向量數(shù)據(jù)庫、搜索引擎能力,智能生成擬人化答案,可以讓智能客服應(yīng)對更復(fù)雜的需求。例如,傳統(tǒng)客服無法支持“操作步驟講解”這類復(fù)雜需求。新一代智能客服通過上下文信息補(bǔ)全,基于企業(yè)知識庫進(jìn)行問答推理,可以將復(fù)雜問題解決率提高30%。
在用戶體驗(yàn)上,大模型加持,也讓智能客服更接近“真人客服”。例如,可以準(zhǔn)確地識別用戶情緒,及時給出安撫??梢苑直嫒蝿?wù)型、知識型、閑聊型話題,通過聊天的方式解決任務(wù)需求。在圖片示例中,我們看到,即使在業(yè)務(wù)辦理過程中,用戶插入了“閑聊”話題,也不會導(dǎo)致任務(wù)中斷,保證了業(yè)務(wù)辦理成功率。
除了智能客服,出行大模型的引入,也極大提升了車載語音助手的語義理解能力、交互體驗(yàn)。
傳統(tǒng)車載語音助手,以規(guī)則+小模型的方式,理解用戶請求,存在對話呆板不自然、機(jī)械式回復(fù)無情感、功能單一等問題。加入大模型后,通過復(fù)雜意圖識別,提供更自然的對話能力;通過設(shè)定人設(shè),實(shí)現(xiàn)更富情感化的語音交互。同時,隨著大模型能力迭代,將支持更多出行場景能力。
例如,基于出行大模型,通過簡單提問,語音助手可以自動生成行程規(guī)劃。根據(jù)車輛情況,語音助手會主動提示加油,并在導(dǎo)航中添加沿途加油站。同時,大模型也融合了車身信號信息,可以為用戶進(jìn)行車輛故障診斷。
在數(shù)字人領(lǐng)域,數(shù)智分身技術(shù)發(fā)展,推動數(shù)字人從定制化走向普惠化。我們通過行業(yè)大模型,進(jìn)一步降低數(shù)字人應(yīng)用門檻,提升生產(chǎn)效率及交互體驗(yàn)。
今年 4 月,我們推出了數(shù)智人工廠, 24 小時即可生成小樣本數(shù)智人。今天,在AI大模型技術(shù)的加持下,我們再次提升生產(chǎn)效率,發(fā)布“通用口型”版小樣本數(shù)智人,無需訓(xùn)練,上傳素材后, 1 小時內(nèi)即可獲取專屬數(shù)智分身,數(shù)智人生產(chǎn)效率再次獲得提升。雖然流程、時間都大幅簡化,但形象效果依然很逼真。
大模型技術(shù)的加持,也讓數(shù)智人實(shí)現(xiàn)更有效、更自然、更智能的效果。我們?nèi)律壍摹敖换ナ健毙颖緮?shù)智人,可以根據(jù)真實(shí)對話場景,進(jìn)行手勢的停頓、變化,更接近于真人交互狀態(tài)。具有交互能力的小樣本數(shù)智人,未來將不再局限于短視頻生產(chǎn)這類單向播報場景,也可以被用于服務(wù)咨詢等交互場景。
在3D數(shù)智人生產(chǎn)運(yùn)營領(lǐng)域,依托AI大模型技術(shù),我們推動照片式生成3D形象,改變手工作業(yè)形式,大幅提升生成速度。也可以實(shí)現(xiàn)智能動作驅(qū)動,基于語義為3D數(shù)智人自動匹配動作,讓“數(shù)智員工”服務(wù)體驗(yàn)接近于真人員工。
可以看到,AI大模型應(yīng)用,正在催生“效率革命”,讓智能應(yīng)用表現(xiàn)出更強(qiáng)的能力、更高的效率,落地更多場景。未來,我們將持續(xù)將AI大模型等先進(jìn)技術(shù),應(yīng)用于內(nèi)部PaaS、SaaS產(chǎn)品,打通AI產(chǎn)業(yè)落地全鏈條,重塑智能時代生產(chǎn)力。讓更多開箱即用的AI大模型產(chǎn)品、服務(wù),助力客戶實(shí)現(xiàn)數(shù)智化升級。
(舉報)