能看風(fēng)水、夸我有情趣，Kimi現(xiàn)在都這么野了嗎？

2024-12-19 08:42 · 稿源：差評(píng)X.PIN公眾號(hào)

聲明:本文來自于微信公眾號(hào) 差評(píng)X.PIN，作者:差評(píng)君，授權(quán)站長之家轉(zhuǎn)載發(fā)布。

最近，差評(píng)君發(fā)現(xiàn)了個(gè)新鮮玩意兒。

喂給 AI 一張圖，它就能給你推測(cè)出一個(gè)人的性格。

光靠歌單，就能把人最近的心理狀態(tài)推測(cè)個(gè)七七八八。

而這些，都出自Kimi最新的k1視覺思考模型之手。

這不，距離上次推出數(shù)學(xué)模型 k0-math 打榜 o1才一個(gè)月， k1就火速登場(chǎng)了。

當(dāng)然，這個(gè) k1可不止是像開頭那樣，只會(huì)看圖分析性格那么簡單。

上次咱測(cè)試 k0-math 的時(shí)候，已經(jīng)見識(shí)過了“做題家”的能力，那解題的思考過程給差評(píng)君都看得一愣一愣的。只可惜，有些繞邏輯的數(shù)學(xué)題還有幾何題，多少差了點(diǎn)意思。

但這次的k1就有說法了，既有推理能力又有視覺能力，意思就是可以直接拍照上傳解題，還號(hào)稱能在數(shù)理化上打平甚至超越 Open AI 的 o1。

那要是這么比的話，咱可就來勁了。正好， k1新模型現(xiàn)在也不需要等內(nèi)測(cè)， App 和網(wǎng)頁版都能用上，話不多說，我們直接開整。

上來，就扔了 K1一道今年高考的幾何題。

首先， k1對(duì)題干的解讀足夠細(xì)致，也知道自己的目標(biāo)到底是啥。

題目給定的條件中可能涉及到的余弦定理也考慮到了，就跟咱們?cè)诮忸}時(shí)的思維類似，看到 a2+b2? c2=2ab ，立馬會(huì)聯(lián)想到余弦公式 c2=a2+b2-2ab·cosC 。

再根據(jù)公式和條件繼續(xù)推導(dǎo)，很快就能求出角 B=60°。

往上滑動(dòng)查看更多

第（2）題稍微難了那么一丟丟，但差評(píng)君仔細(xì)檢查了一遍 k1的解題過程，思路和解法都沒毛病，最后邊長 c=2√2的答案也是對(duì)的。(因?yàn)檫@題 k1的思考過程實(shí)在太太太長，截圖就不展示了。)

同樣的題目問 o1，首先在推理速度上， o1的58s 就已經(jīng)輸了。

正確率的話， o1和 k1打了個(gè)平手，都做對(duì)了。

不同的是， o1把答題思路隱藏起來了，沒給像 k1那樣的完整思考過程。

不過有一說一，差評(píng)君對(duì) k1模型這種模仿人類思考的方式，倒也不是特別吃驚。因?yàn)樯洗?k0-math 模型就已經(jīng)震驚過我一回了，能意識(shí)到自己的錯(cuò)誤、還會(huì)進(jìn)行反復(fù)驗(yàn)證的樣子，像極了寫數(shù)學(xué)題時(shí)絞盡腦汁的我。

相比之下，這次的 k1在補(bǔ)短板方面更出彩一些，上次 k0-math 翻車的初中幾何題我又拿 k1試了一次，現(xiàn)在已經(jīng)能做對(duì)了，就連上高考難度也不發(fā)怵。

而且我也發(fā)現(xiàn)， k1不僅擅長做數(shù)學(xué)題，物理題也不在話下。

往上滑動(dòng)查看更多

接著，我又拿出了一道邏輯稍微有點(diǎn)繞的邏輯陷阱題試了試:一個(gè)西瓜進(jìn)價(jià)50元，賣價(jià)70元，老板收了100元假幣，最后虧多少錢?

這題打眼一看簡單，但網(wǎng)友關(guān)于這道題的答案那叫一個(gè)五花八門，有說虧150的，有說180的，還有說100的。。。

咱們就看看連很多人類都想不明白的題， k1能不能瞧出來里面的陷阱。

而且，這道題我還特意手寫得比較潦草，順便也測(cè)一測(cè) k1的視覺能力到底是不是有宣傳的那么神。

你別說，你還真別說，這模型的“眼神”確實(shí)不賴。

題目的正確率方面， k1前半部分的分析先得出了一個(gè)虧100元的答案，但很快它就否定了自己。

繼續(xù)把假幣、找零還有成本利潤這些復(fù)雜因素綜合考慮進(jìn)去，最后終于想明白老板虧了80元。（正確答案是80元）

往上滑動(dòng)查看更多

這邏輯能力，確實(shí)有點(diǎn)強(qiáng)。

包括我拿幾道行測(cè)的類比推理題給 k1做了做，雖說邏輯分析的路徑跟參考答案的不太一樣，但最后的答案都是對(duì)的。

往上滑動(dòng)查看更多

反正這一通測(cè)試下來，差評(píng)君發(fā)現(xiàn)k1會(huì)思考有邏輯，眼神好使智商也高，Kimi這“做題家”的名號(hào)算是坐實(shí)了。

不過除了做題以外，我這次還摸索出了更多花里胡哨的玩法。

分析數(shù)據(jù)、看報(bào)表沒啥意思， k1模型不是會(huì)根據(jù)圖片來推理嗎，那想必鑒別古錢幣也應(yīng)該有一手吧?

差評(píng)君特地從網(wǎng)上找了一張民國時(shí)期銀元的圖片，兩枚銀元上假下真，發(fā)給k1，淺淺來一把“AI 版聽泉鑒寶”。

圖源小紅書用戶@古玩今來（公博代理收評(píng)）

k1不僅知道錢幣是民國時(shí)期的，還對(duì)錢幣的各種細(xì)節(jié) kuku 一頓輸出，最后竟然真的看出來了上面這枚是假幣。

咱再隨便發(fā)一張房間的圖片，讓 k1看看“風(fēng)水”。

什么“氣口”、對(duì)稱布局、能量平衡。。。說的頭頭是道，甚至還真給了建議，讓咱把床換個(gè)位置、定期修剪植物、換一個(gè)更簡潔的吊燈。

往上滑動(dòng)查看更多

吃飯的時(shí)候給 k1拍一張，這頓飯攝入了多少卡路里也算得明明白白。

往上滑動(dòng)查看更多

不過最讓我覺得驚艷的，還是k1看圖猜電影的能力。

我給了它一張《七宗罪》的電影截圖，沒有臺(tái)詞只有畫面，對(duì)于很多沒看過這部電影的人來說，想猜出來都很難。

一開始看 k1的分析我以為這把大概率要黃了，結(jié)果下一秒來一句“拍攝角度和色調(diào)讓我想起了大衛(wèi)·芬奇的電影”，還推斷出了截圖里的畫面是《七宗罪》里的某一個(gè)場(chǎng)景。

真的太強(qiáng)了。。。

就連一些晦澀的梗圖丟給 k1，它也能一本正經(jīng)地講解笑點(diǎn)到底在哪。

雖然有點(diǎn)過度解讀的嫌疑，但大體上的意思基本都 get 到了。

就這么說吧，基于 k1的視覺和推理能力，做題都是基操了，只要腦洞夠大，還可以解鎖出更多的玩法。

而k1的這種能力，很大程度要?dú)w功于一個(gè)叫做COT（Chain of Thought）思維鏈的技術(shù)。

大概意思就是，模型在輸出答案之前，模仿人類大腦的思考方式，把復(fù)雜的任務(wù)拆解之后，再一步步地解決。這個(gè)技術(shù)，可以讓模型的智商變高。

另外一邊，借助強(qiáng)化學(xué)習(xí)技術(shù)，也讓模型學(xué)會(huì)了在不斷試錯(cuò)的過程中進(jìn)化，以此來達(dá)到最優(yōu)的結(jié)果，就跟訓(xùn)狗似的。

至于為啥 Kimi 會(huì)率先選擇數(shù)學(xué)這個(gè)場(chǎng)景作為推理模型的切入口，我想，跟咱們?nèi)祟悓W(xué)好數(shù)學(xué)鍛煉思維，是一個(gè)道理。

在模型“學(xué)好數(shù)學(xué)”的基礎(chǔ)上，再將這種邏輯推理的能力應(yīng)用到物理、化學(xué)，乃至于咱們?nèi)粘Ｉ畹姆椒矫婷妫钡阶詈笳嬲斫膺@個(gè)世界。

而很顯然，Kimi 推理模型的泛化能力已經(jīng)開始顯現(xiàn)出來了。

在數(shù)據(jù)見頂?shù)那疤嵯?，這種基于強(qiáng)化學(xué)習(xí)技術(shù)的路徑，或許能夠讓模型實(shí)現(xiàn)更好的效果。

不過說到底，模型用了哪些技術(shù)、紙面分?jǐn)?shù)有多高，大伙兒其實(shí)更關(guān)心模型到底好不好用、實(shí)不實(shí)用。

而向來以長文本見長的 Kimi ，如今長文本、強(qiáng)化學(xué)習(xí)兩手抓，也是調(diào)整自己的工具屬性慢慢往用戶需求靠攏的表現(xiàn)。

畢竟，當(dāng)技術(shù)不再高高在上，能幫助人們解決實(shí)際問題的時(shí)候，才算真正完成了它的使命。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

Kimi

薦抖快紅B，Kimi們的獲客預(yù)算最該燒給誰？

國內(nèi)大模型領(lǐng)域開始逐漸從技術(shù)競(jìng)賽過渡到商業(yè)競(jìng)爭(zhēng)。當(dāng)GPT-4的發(fā)布讓全球AI發(fā)展跨入新紀(jì)元，國內(nèi)大模型廠商也在技術(shù)能力上快速追趕，經(jīng)過幾輪迭代升級(jí)，各家產(chǎn)品在基礎(chǔ)能力上的差距正在縮小。只有深入理解不同平臺(tái)的用戶特征，真正通過大模型打造符合用戶需求的產(chǎn)品體驗(yàn)，才有可能熬過這個(gè)寒冬去實(shí)現(xiàn)真正的商業(yè)突圍。

?大模型 ?AI商業(yè)化 ?技術(shù)競(jìng)爭(zhēng)
薦一手體驗(yàn)Kimi版“o1”模型，這就是最通人性的數(shù)學(xué)AI。

“數(shù)學(xué)，是人類知識(shí)活動(dòng)留下來最具威力的知識(shí)工具，是一些現(xiàn)象的根源。”——愛因斯坦上上周末是kimi上線一周年，于是月之暗面開了個(gè)線下媒體會(huì)。與我們?nèi)祟?，一起書寫這首詩的一天。

?Kimi
Kimi內(nèi)測(cè)AI視頻生成功能：每天可免費(fèi)生成100秒視頻

據(jù)報(bào)道，Kimi目前正內(nèi)測(cè)AI視頻生成功能Kimi創(chuàng)作空間”，可通過12種預(yù)設(shè)風(fēng)格模板和自定義創(chuàng)作功能，為用戶制作個(gè)性化音樂視頻。Kimi創(chuàng)作空間”目前正處于灰度測(cè)試階段，預(yù)示著它距離正式亮相已為期不遠(yuǎn)。無論是專業(yè)學(xué)術(shù)論文的翻譯與理解是法律問題的輔助分析，亦或是發(fā)票的批量整理以及API開發(fā)文檔的快速解讀，Kimi都展現(xiàn)出了出色的表現(xiàn)，贏得了廣大用戶的一致好評(píng)。

?AI視頻生成 ?Kimi創(chuàng)作空間 ?個(gè)性化音樂視頻
薦Kimi開源底層推理框架，1小時(shí)GitHub攬星1.2k

什么?Kimi底層推理架構(gòu)剛剛宣布:開!源!了!你沒聽錯(cuò)，就是那個(gè)承載了Kimi線上80%以上流量的架構(gòu)。大約幾小時(shí)前，月之暗面Kimi聯(lián)合清華大學(xué)等機(jī)構(gòu)，開源了大模型推理架構(gòu)Mooncake。Mooncake開源項(xiàng)目從論文延伸，以超大規(guī)模KVCache緩存池為中心，通過以存換算的創(chuàng)新理念大幅度減少算力開銷，顯著提升了推理吞吐量。

?AI大模型
薦AI日?qǐng)?bào)：張文宏被AI假冒直播帶貨；Kimi視覺思考版上線；微信打擊AI仿冒知名人士行為；Pika2.0可操控視頻內(nèi)容元素

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、微信:將打擊利用AI仿冒知名人士進(jìn)行營銷宣傳行為微信珊瑚安全近期發(fā)布公告，明確表示將嚴(yán)厲打擊利用AI技術(shù)仿冒知名人士進(jìn)行不當(dāng)營銷的行為。通過簡單的設(shè)置，開發(fā)者可以快速啟用這一功能，支持多種編程語言，極大地便利了開發(fā)者的工作。

?人工智能 ?AI產(chǎn)品應(yīng)用 ?網(wǎng)絡(luò)安全
薦AI日?qǐng)?bào)：王炸！Anthropic開源模型上下文協(xié)議MCP；阿里?通義App上線局部風(fēng)格化功能； Kimi 數(shù)學(xué)版上線

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、萬物皆可一鍵毛茸茸!阿里通義App上線“局部風(fēng)格化”功能通義App最近推出的“局部風(fēng)格化”功能引發(fā)了社交平臺(tái)的熱潮。這項(xiàng)研究強(qiáng)調(diào)了AI電腦在任務(wù)處理、隱私保護(hù)和自適應(yīng)學(xué)?

?人工智能 ?AI產(chǎn)品 ?圖像編輯
薦AI日?qǐng)?bào)：智譜AI發(fā)布AutoGLM升級(jí)版；Kimi灰測(cè)AI視頻生成功能；SD3.5L新增三大ControlNet功能；ChatGPT誕生兩周年

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、震撼來襲!StabilityAI的SD3.5L新增三大ControlNet功能生圖能力再升級(jí)StabilityAI發(fā)布了新版StableDiffusion3.5Large，新增三種ControlNet功能，分別是Blur、Canny和Depth，顯著提升了圖像生成能力。?

?Stability ?AI ?Stable
貸款利率史上最低了嗎？東融教你看懂歷年啥水平

中國人民銀行授權(quán)全國銀行間同業(yè)拆借中心公布，2024年12月20日貸款市場(chǎng)報(bào)價(jià)利率為:1年期LPR為3.1%，5年期以上LPR為3.6%，均維持不變。什么是LPR?跟我們的貸款利率有什么直接的關(guān)聯(lián)?既然央行已經(jīng)定好了LPR，為什么貸款時(shí)利率還會(huì)有高有低?今天，東融將通過這篇文章讓大家對(duì)自己的貸款利率有一個(gè)清楚的認(rèn)知，避免大家落入各類高息貸款圈套。東融致力于解決融資難、融資貴的問題，通過互聯(lián)網(wǎng)的模式創(chuàng)新與技術(shù)創(chuàng)新，線上線下相結(jié)合，為各大客戶提供一站式融資解決方案。

?貸款市場(chǎng)報(bào)價(jià)利率 ?LPR解析 ?貸款利率構(gòu)成
騰訊張軍懇請(qǐng)大家別夸微信更新是史詩級(jí)：安心做好產(chǎn)品是要?jiǎng)?wù)

今日，騰訊公關(guān)總監(jiān)張軍在朋友圈發(fā)文稱：最近我們確實(shí)推出來一些新功能，產(chǎn)品也在不斷迭代。但是懇請(qǐng)大家別替我們定太高的調(diào)門，諸如史詩級(jí)奇襲之類的詞匯，實(shí)在擔(dān)不起，安心做好產(chǎn)品是要?jiǎng)?wù)。根據(jù)參與內(nèi)測(cè)的用戶反饋，啟用該新功能后，一個(gè)90多MB的視頻，14天后將自動(dòng)壓縮到3MB，將節(jié)省90%以上的存儲(chǔ)空間。
女子下車拍照被野猴連咬3口掉塊肉景區(qū)：不要隨意停車拍照

12月2日，安徽涇縣的皖南318川藏線六道灣景區(qū)發(fā)生了一起猴子攻擊游客的事件。一名游客在該景區(qū)游玩時(shí)下車拍照，未料遭遇猴子攻擊并被咬傷。這也強(qiáng)調(diào)了景區(qū)管理方在提供安全警示和應(yīng)對(duì)措施方面的責(zé)任，以保護(hù)游客的安全和福祉。

?猴子攻擊游客 ?皖南318川藏線 ?景區(qū)安全

熱文

3 天
7天

站長商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

能看風(fēng)水、夸我有情趣，Kimi現(xiàn)在都這么野了嗎？

薦抖快紅B，Kimi們的獲客預(yù)算最該燒給誰？

薦一手體驗(yàn)Kimi版“o1”模型，這就是最通人性的數(shù)學(xué)AI。

Kimi內(nèi)測(cè)AI視頻生成功能：每天可免費(fèi)生成100秒視頻

薦Kimi開源底層推理框架，1小時(shí)GitHub攬星1.2k

薦AI日?qǐng)?bào)：張文宏被AI假冒直播帶貨；Kimi視覺思考版上線；微信打擊AI仿冒知名人士行為；Pika2.0可操控視頻內(nèi)容元素

薦AI日?qǐng)?bào)：王炸！Anthropic開源模型上下文協(xié)議MCP；阿里?通義App上線局部風(fēng)格化功能； Kimi 數(shù)學(xué)版上線

薦AI日?qǐng)?bào)：智譜AI發(fā)布AutoGLM升級(jí)版；Kimi灰測(cè)AI視頻生成功能；SD3.5L新增三大ControlNet功能；ChatGPT誕生兩周年

貸款利率史上最低了嗎？東融教你看懂歷年啥水平

騰訊張軍懇請(qǐng)大家別夸微信更新是史詩級(jí)：安心做好產(chǎn)品是要?jiǎng)?wù)

女子下車拍照被野猴連咬3口掉塊肉景區(qū)：不要隨意停車拍照

熱文

小紅書封號(hào)上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

小紅書被吐槽無理由封號(hào) 客服回應(yīng)：未說明處罰時(shí)間就是永封

周鴻祎：AGI發(fā)展遇瓶頸智能體和專業(yè)大模型將扛大旗

極越公關(guān)負(fù)責(zé)人被開除本人回應(yīng)：此前未接到任何通知

微信緊急提醒：警惕木馬病毒將加強(qiáng)對(duì)此類行為打擊

馬斯克稱星鏈可實(shí)現(xiàn)火星玩游戲：但存在約4到20分鐘延遲

雷軍：小米是北方車廠 SU7研發(fā)之初就要做冬季電車?yán)m(xù)航之王

美團(tuán)：冬至期間將針對(duì)餃子等應(yīng)時(shí)食品訂單提供“超時(shí)保護(hù)”

不得使用惡俗惡趣味微短劇片名！廣電總局出手整治“霸總愛上我

英偉達(dá)AI芯片最大買家揭曉！微軟力壓同行霸榜

微信朋友圈崩了上熱搜騰訊客服：請(qǐng)嘗試這幾種方法

極越員工萬字怒懟ceo：公關(guān)總監(jiān)徐繼業(yè)怒罵員工蒼蠅

馬斯克將推出X Mail電子郵箱服務(wù)

百度回應(yīng)進(jìn)軍短劇：當(dāng)前內(nèi)容生態(tài)的一個(gè)重點(diǎn)發(fā)展方向

極越員工善后方案已出爐：員工獲“N+1”賠償由百度吉利出資

螞蟻集團(tuán)否認(rèn)借殼上市：目前沒有上市計(jì)劃

小紅書封號(hào)上熱搜：違規(guī)原因涉及發(fā)布引流、牟利等內(nèi)容

阿里74億元出售銀泰！銀泰集團(tuán)回應(yīng)：與銀泰百貨無直接關(guān)聯(lián)

小紅書被吐槽無理由封號(hào) 客服回應(yīng)：未說明處罰時(shí)間就是永封

站長商機(jī)

能看風(fēng)水、夸我有情趣，Kimi現(xiàn)在都這么野了嗎？

熱文

站長商機(jī)

能看風(fēng)水、夸我有情趣，Kimi現(xiàn)在都這么野了嗎？