幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 業(yè)界 > 關鍵詞  > DeepSeek最新資訊  > 正文

為什么說DeepSeek是2025年的Kimi

2025-01-02 11:04 · 稿源: 航通社公眾號

聲明:本文來自于微信公眾號 航通社,作者:書航,授權站長之家轉載發(fā)布。

DeepSeek是否能定義“低成本訓練”概念?

歲末年初,杭州的大模型創(chuàng)業(yè)公司“深度求索”DeepSeek 不斷放出大新聞。它所公布的一個開源模型DeepSeek-V3,在各種基準測試等方面,能夠大致打平需要付錢的GPT-4o。

而一個更重要的問題是,這是中國公司在受到制裁,算力有限,不能購買足夠數(shù)量顯卡的基礎上,使用小數(shù)據(jù)集蒸餾等方法,而得到的一個更節(jié)省成本的模型。

官方技術論文披露,v3模型的總訓練成本僅為557.6萬美元,相比之下GPT-4o等模型的訓練成本約為1億美元。因此DeepSeek還被稱為“AI界拼多多”。

這條新聞的重大意義在于,它可能會減少人們對于“大模型的智能程度=英偉達提供的算力”這樣一個認知的依賴。因此,消息還被認為是間接影響了英偉達的股價。

在整個消息發(fā)酵的過程當中,是非常有趣的“出口轉內銷”然后再出去的,變來變去的方式。

兔撕雞在即刻上總結說,國外的消息被引到國內的時候,大家都看闌夕發(fā)的微博。但那條微博正確地指出了,DeepSeek 突破的真正意義在于GPU需求變小?!斑@標志著美國對中國的AI封鎖戰(zhàn)略不算成功,也不需要搭建GPU萬卡集群,就能獲得不錯的效果?!?/p>

AI教育 演講 人工智能 (3)

圖源備注:圖片由AI生成,圖片授權服務商Midjourney

這一層意思被重新譯介回Twitter/X上面,又讓硅谷的那幫人回過神來了,所以影響英偉達的股價。而且還需要對沖,the information說字節(jié)將會700億采購英偉達芯片,然后字節(jié)否認。如果這個消息不是真實的,那么可以認為,發(fā)出這個消息的,就是算力相關股票的護盤手。

總之,這種猜測甚是玄學。由此產(chǎn)生了兩個段子:

其一,杭州新四小龍:宇樹科技、DeepSeek、游戲科學、影視颶風

其二,闌心一言,一個字近億美元

12月27日,原先在DeepSeek的羅福莉加入小米的消息大范圍流傳,其實之前她早就自我官宣過,而且也在大模型業(yè)界小范圍流通。但是自從有媒體將羅形容為“95后天才少女”之后,情況就不一樣了。

這條消息獲得營銷加成,與其說利好小米,更不如說是加碼營銷了羅福莉的前東家DeepSeek,也就是證明了他們的團隊確實有實力,足夠優(yōu)秀的人可以在團隊內做出非常厲害的事。

不得不說,在DeepSeek出圈前,AI業(yè)界對它的評價都非常高。因為,即使人們發(fā)現(xiàn)它的訓練數(shù)據(jù)集有可能使用了來自ChatGPT的輸出結果——它曾在很多情況下都自稱為ChatGPT——這也只是無傷大雅的插曲。你行你也上啊,如果只要用ChatGPT輸出就能做這么好,你也可以試一試。

畢竟谷歌也在這么做。谷歌Gemini的事實核查人員是外包的,用來檢查雙子座模型所生成的結果是否屬實。而谷歌被曝光要放低人工核對的標準,讓人員檢查跟自己本專業(yè)能力不相關的答案的準確性,同時還允許他們借助類似Claude這樣的,其他模型生成的結果來核對。

當某個階段你所做出的成績,是僅此一家別無分店的時候,那就說明潑天的富貴將會降臨到你的身上。

最近呢,當然是快手的可靈,在Sora之前吸干了屬于它的關注度。之前另外一個華裔的作品Pika也類似。但Pika在初期版本比Runway強不少,之后就比較后勁乏力,連帶著聯(lián)合創(chuàng)始人郭文景,也不再繼續(xù)被稱作“天才少女”刷屏了。

但是這當中最典型的案例則是月之暗面(Kimi)。

在差不多一年前。Kimi成為AI界當紅炸子雞,因為它在國內外的競品當中,最早提出了一個新的概念,就是“超長文本(tokens)”。長文本成為各大模型開始卷的領域,而Kimi依靠這個單獨概念對用戶心智的教育,牢牢的吸了一波粉絲和媒體關注。

自從長文本概念首倡以后,Kimi獲得融資的規(guī)模和頻次就像瘋了一樣,終于到達了需要老股東掐架的程度。在這一年當中,Kimi的產(chǎn)品發(fā)布,包括智能體、深度思考、聯(lián)網(wǎng),以及尚未發(fā)布的視頻生成,都只能說是按部就班。

但是Kimi獲得了充足的彈藥,不僅在開發(fā)周期上面可以比較舒緩,沒有壓力,而且可以鉚足了勁兒,在B站砸錢營銷,使得大模型推廣的價格水漲船高。

在豆包積極跟進廝殺之余,連騰訊都熬不住這么玩了。目前混元大模型的能力被植入微信、QQ、讀書、輸入法等具體的產(chǎn)品內,單行版元寶則處于放養(yǎng)狀態(tài),不再用力宣傳。

這就是為什么社長認為,在今年,如果各家大廠還想要新的投資標的的話,最合適的選擇就是DeepSeek。因為這一次輪到它提出新概念了,這個概念是“低成本訓練”。

如果論資本市場的青睞程度,能跟月之暗面媲美的還有智譜。但智譜的融資輪數(shù)已經(jīng)太多了,從目前的發(fā)展來看,它也沒有持續(xù)領先。

其實就算是強如OpenAI,也不可能永遠“炸裂顛覆嚇尿革命”。它可能只需要一次嬰兒的啼哭,向世界證明它此時此刻是領先的。對它來說這個概念叫“ChatGPT”。

這樣的機會,這種對一個概念的定義權,只要一個創(chuàng)業(yè)公司擁有一次,就已經(jīng)足夠幸運。在此之后它是否還能定義第二個概念,或許不太重要;蜂擁而至的融資將會是對它之前定義概念的獎賞。

舉報

  • 相關推薦
  • DeepSeek-V3 是怎么訓練的|深度拆解

    DeepSeek-V3低調發(fā)布,在國際上狠狠秀了一波肌肉:只用了500多萬美金的成本,帶來了不輸Claude3.5的成績,并開源!下面,讓我們以更加系統(tǒng)的方式,來看看這次的DeepSeek-V3,是這么煉成的。本文將從性能、架構、工程、預訓練和后訓練五個緯度來拆解V3,所用到的圖表、數(shù)據(jù)源于技術報告:《DeepSeek-V3TechnicalReport》。安全和倫理類數(shù)據(jù):包含了用于提升模型安全性和符合倫理規(guī)范的指?

  • 2025年的私域:877家公司之挑戰(zhàn)與機遇

    會涌現(xiàn)出哪些機會?投入會向哪里流動?身處其中的從業(yè)者們,要經(jīng)歷什么挑戰(zhàn)?和私域相關的鏈條會發(fā)生什么變化?這些是當下大家最關心的話題。

  • 京東科技宣布落實20薪:計劃到2025年實現(xiàn)

    作為京東集團旗下的業(yè)務子集團,專注于為客戶提供金融科技產(chǎn)品與技術服務,近日宣布了一項新的薪酬計劃。該公司計劃到2025年實現(xiàn)全員平均20薪,這是繼2024年年終獎發(fā)放計劃和超過2萬名京東客服漲薪通知后,京東在年底前再次實施的大規(guī)模加薪計劃。通過這一薪酬計劃,京東旨在吸引和保留人才,同時激勵員工的工作熱情和創(chuàng)造力,以推動公司的長期發(fā)展和市場競爭力。

  • 2025年,每一個公眾號都該擁有自己的智能體

    大模型只是開始,智能體是下一個里程碑。在OpenAI通往AGI的五大等級中,Agent智能體位于L3,是具備推理能力后的大模型的下一步,也是走向通用人工智能的重要一步?!痹谶@個充滿無限可能的時代,每一個人都有機會成為頭號玩家。

  • 進入2025年,支付寶“碰一下”的線下之戰(zhàn)來到新階段

    2025年來臨,支付體系的雙寡頭:支付寶和微信支付這場大戲仍舊你方唱罷我方休,不斷上演著他們的“愛恨情仇”,讓我們從支付寶碰一下的視角一起見證過去不平凡又跌宕起伏的2024吧!1.支付寶“宿敵”微信支付1.1市場主導地位;常言道:既生瑜何生亮這不正是支付寶與微信支付這一對宿敵嗎?現(xiàn)如今,支付寶與微信支付共占據(jù)國內支付市場90%的市場份額,形成雙寡頭格局。兩者都是擁有自身生態(tài)體系、聯(lián)通外部多平臺應用場景的支付行業(yè)領先布局者,通過生態(tài)內場景的聯(lián)通與支付體系的先發(fā)布局,優(yōu)先確立了國內移動個人商業(yè)支付行業(yè)的雙領先地位。隨著技術的不斷進步和用戶習慣的逐漸培養(yǎng),支付寶有望通過這一創(chuàng)新功能,扭轉線下支付場景情況,讓支付寶進一步提升其在數(shù)字支付領域的競爭力。

  • 雷軍曬健身房照片:2025年第一次打卡

    快科技1月2日消息,今天一早,雷軍在微博上曬出了他在健身房的照片,并配文:2025年第一次打卡!”這張照片不僅展示了他積極向上的生活態(tài)度,也透露出他對新的一年充滿了期待與規(guī)劃。原來,對于雷軍來說,堅持健身已經(jīng)成為了他2025年的一個重要目標之一。實際上,在過去的幾周里,他已完成了十多次的鍛煉。根據(jù)他的計劃,在接下來的一年中,雷軍希望能夠將這一良?

  • 元旦佳節(jié),知希五恒與您溫暖共度,攜手共進2025年

    轉眼間我們即將告別2024,迎來充滿希望的2025。在這個辭舊迎新的時刻,知希五恒全體員工攜手廣大客戶,共度元旦佳節(jié),向您致以最誠摯的祝福和衷心的感謝!敬請關注知希五恒,讓我們攜手共進,共創(chuàng)美好未來!

  • 百利好:2025年美股市場是否將延續(xù)漲勢?

    2024年,美股市場在人工智能熱潮、美聯(lián)儲降息周期等因素的推動下,表現(xiàn)驚艷,三大股指延續(xù)前一年漲勢,并多次刷新歷史紀錄。百利好作為專業(yè)的投資交易平臺,為投資者提供了豐富的美股投資機會和專業(yè)的市場分析。百利好擁有專業(yè)的團隊,能夠為投資者提供專業(yè)的投資建議和風險管理方案,幫助投資者更好地應對美股市場的不確定性和風險,實現(xiàn)資產(chǎn)的穩(wěn)健增值。

  • 雷軍千萬年薪挖角95后AI天才少女 DeepSeek羅福莉將加入小米

    小米公司近期在人工智能領域邁出了重要一步,DeepSeek開源大模型DeepSeek-V2的關鍵開發(fā)者羅福莉將加盟小米,擔任小米AI實驗室的領導,并負責大模型團隊的建設。這一人事變動在業(yè)界引起了廣泛關注,特別是在小米尋求加強其在大模型領域布局的背景下。羅福莉的加入預計將進一步推動小米在AI大模型領域的發(fā)展,加強公司在該領域的競爭力。

  • 雷軍曬2025年首款新機:紅運在握 一紅到底!

    小米創(chuàng)始人雷軍在微博上分享了2025年的首款新機REDMITurbo4的消息。他滿懷熱情地宣布:2025首款新機,一起紅運在握,一紅到底!”這樣的評價無疑反映了公眾對這款即將發(fā)布的新品的高度期待和認可。