4月23日,商湯科技于北京舉辦新品發(fā)布會,重磅推出人工智能大模型“日日新5.0”。
日日新5.0采用先進(jìn)的混合專家架構(gòu)(MOE),增強了模型處理復(fù)雜任務(wù)時的效率和精準(zhǔn)度。
該模型經(jīng)過海量數(shù)據(jù)(超過10TB tokens)的深度學(xué)習(xí)訓(xùn)練,具備高達(dá)200K的推理上下文窗口。這賦予了模型在處理長文本和復(fù)雜推理任務(wù)時,全面捕捉上下文信息的強大能力。
日日新5.0在知識、推理、數(shù)學(xué)、代碼等多方面全面對標(biāo)GPT-4 Turbo,展示了其卓越的綜合實力。
作為商湯科技的大模型體系,日日新不僅包含自然語言處理模型“商量”(SenseChat),還涵蓋文生圖模型“秒畫”(SenseSketch)和數(shù)字人視頻生成平臺“如影”(SenseAvatar)等模塊。這些模塊協(xié)同運作,為用戶提供豐富且全面的服務(wù)。
日日新大模型體系于2023年4月由商湯科技董事長兼首席執(zhí)行官徐立宣布推出,并于同年8月正式上線。自上線以來,該模型已廣泛應(yīng)用于多個領(lǐng)域,取得了卓越的成果。
日日新大模型的核心功能包括自然語言生成、文生圖、感知模型標(biāo)注和模型研發(fā)。用戶可通過自然語言輸入,利用模型的意圖識別、邏輯理解和代碼解釋器能力,自動將數(shù)據(jù)轉(zhuǎn)化為有價值的分析和可視化結(jié)果。該功能在智能客服、智能寫作、智能設(shè)計等場景具有廣闊的應(yīng)用前景。
(舉報)