實(shí)測來了!Kimi發(fā)布k1視覺思考模型,實(shí)力顛覆K12教育賽道,涌現(xiàn)能力強(qiáng)得可怕,免費(fèi)可用!網(wǎng)友:國產(chǎn)之光! 原創(chuàng)
編輯 | 言征
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
Kimi最近太猛了!所有的教育產(chǎn)品感覺都要被顛覆了。
今天,Kimi上線發(fā)布一款相當(dāng)炸裂的AI功能——視覺思考模型k1。可以說顛覆了“K12賽道”的傳統(tǒng)搜題解題的產(chǎn)品!
小編驚呼:有了Kimi,學(xué)生們還需要手機(jī)里安裝各種拍照搜題找答案的軟件嗎?可以預(yù)想到,從幼兒園到大學(xué),整個教育賽道恐怕要掀起一股驚濤駭浪!
Kimi,果真越來越“學(xué)霸”了!話不多說,直接上干貨。
光看這個名字“k1”,就能讓大家聯(lián)想到1個月前kimi推出的對標(biāo)OpenAI o1系列的 k0-math模型,自然是類o1模型的重大升級。的確是這樣,官方介紹道:視覺思考模型k1,同樣是強(qiáng)化學(xué)習(xí)技術(shù)打造,但不同的是——
這次的k1模型原生支持端到端圖像理解和思維鏈技術(shù),并將能力擴(kuò)展到數(shù)學(xué)之外的更多基礎(chǔ)科學(xué)領(lǐng)域。
簡單理解,這次的k1有兩點(diǎn)創(chuàng)新:一是原生支持端到端的圖像理解,二是數(shù)理化難題全都能拿下了!
在數(shù)學(xué)、物理、化學(xué)等基礎(chǔ)科學(xué)學(xué)科的基準(zhǔn)能力測試中,初代 k1 模型的表現(xiàn)超過了全球標(biāo)桿模型 OpenAI o1、GPT-4o以及 Claude 3.5 Sonnet。
圖片
1.Kimi實(shí)測,當(dāng)之無愧的大模型學(xué)霸
上個月,清華學(xué)霸楊植麟冷不防就丟出了k0-math模型,各種奧數(shù)級別的難題都可以解決,但也存在不足:由于主要支持LaTeX等格式的文本輸入,依賴圖形理解能力的部分幾何圖形題則難以應(yīng)對。
不過現(xiàn)在,這個問題在k1視覺思考模型就解決了。借助端到端的圖像理解能力,解鎖了包括幾何圖形題在內(nèi)更加全面的數(shù)學(xué)能力。
圖片
在不同階段的幾何和圖形題專項(xiàng)基準(zhǔn)能力測試中,k1-preview 成績追平或超過了 OpenAI 的 o1 模型。
kimi有測試一道普通幾何題:
圖片
這當(dāng)然還不算完,除了算幾何題,學(xué)霸自然是文理全通,數(shù)理化都得不在話下。
除了數(shù)學(xué)能力,k1視覺思考模型將能力擴(kuò)展到了物理、化學(xué)等領(lǐng)域。在基礎(chǔ)科學(xué)學(xué)科教育階段(這不就是K12嘛)的物理和化學(xué)能力測試中,k1 模型的表現(xiàn)同樣不輸全球領(lǐng)先的玩家 OpenAI 和 Anthropic。
我們來看一道 k1 視覺思考模型解答經(jīng)典物理電路題的例子:
圖片
再來個化學(xué)題目,kimi的同學(xué)將一張?jiān)@得諾貝爾化學(xué)獎的技術(shù)原理圖去掉大部分文字說明,只留下“QD”兩個字母,看 k1 是如何一步一步分析出原理圖是在講什么。
圖片
小編實(shí)測了下,果真是學(xué)霸,大學(xué)物理也被Kimi搞定了!一個電荷電場的計(jì)算難題——
圖片
圖片
最后自己被自己感動了,還不失淘氣的說:真是令人欣慰呀!
2.大模型理解圖像,如何做到的?
之前拍照搜題更多采用的是視覺理解模型,圖像分割和圖像識別等技術(shù),當(dāng)然效果也不錯,但也存在很多問題。比如,這種技術(shù)要求拍照或者照片的內(nèi)容的質(zhì)量要足夠高,亮度不能太暗,如果是手寫,字跡也不能潦草。
但用了k1模型,就不用在顧忌這些了,完全“端到端”的解決!
不用再擔(dān)心自己拍照技術(shù)不夠硬、給大模型輸入的素材不夠清晰!包括照片灰暗、圖像模糊、多題一起拍、手寫字跡干擾、純手寫的題目、傾斜的拍攝角度等問題,k1這回一下都解決了!
圖片
Kimi專門測試了更接近真實(shí)使用場景的 k1 模型表現(xiàn)。在“噪聲”場景下,多項(xiàng)基準(zhǔn)測試數(shù)據(jù)顯示,k1 模型相比OpenAI 和 Anthropic 的視覺語言模型,有更顯著的領(lǐng)先優(yōu)勢。
數(shù)據(jù)顯示,其他大部分模型在視覺噪聲場景下,能力水平下降了一半多,k1 則依靠超強(qiáng)的視覺識別能力,保持了最低的能力損失幅度。
圖片
我們來看一個例子。
下圖是一位月之暗面的同事在平板電腦上手動推演的公式。
圖片
看看 k1 模型是怎么一步一步分析出作者意圖的。
圖片
3.實(shí)測K1:李永樂線性代數(shù)筆記
眼見未必為實(shí),小編自然要實(shí)際操練一下,趕緊從網(wǎng)上找了一份自己多年不看的李永樂的線性代數(shù)筆記,這筆記的字跡實(shí)在是有點(diǎn)讓人看不清,不過既然是考驗(yàn)k1,用它最合適。
圖片
kimi,快幫我看看上面都有哪些數(shù)學(xué)知識點(diǎn)?
圖片
結(jié)果果然令人滿意,不僅一字不差地給出了筆記照片中的文字內(nèi)容——
圖片
還梳理了這張手寫筆記涉及的數(shù)學(xué)知識點(diǎn),包括:
怎么弄判斷矩陣排列的奇偶性、如何按排列展開行列式、高階行列式的計(jì)算方法等等。
圖片
可能會有人說,思維鏈、圖像理解的能力,這些并不新鮮,年初就有了。但思維鏈+端到端的圖像理解對于大模型而言,Kimi這次絕對是一個“aha”級別的創(chuàng)新!
4.驚喜——讓大模型具備數(shù)理化思維回答問題的能力找到《荷馬史詩》、《幾何原本》的作者
學(xué)霸的厲害之處,不僅可以做題拿高分,更重要的是可以用數(shù)理化思維和視角去看待和解決和回答生活中遇到的問題,一般人可沒這個能力。
據(jù)介紹,在發(fā)布k0-math時(shí),月之暗面就發(fā)現(xiàn) Kimi 數(shù)學(xué)版不只會做數(shù)學(xué)題,它還會用數(shù)學(xué)思維來解釋任何問題。比如你問“一顆心值多少錢”,Kimi 數(shù)學(xué)版經(jīng)過一番分析,可能給出讓我們驚喜的答案:一顆心是無價(jià)的。
這次視覺思考模型k1,在學(xué)習(xí)了代數(shù)、幾何、物理、化學(xué)、生物等更多基礎(chǔ)科學(xué)的難題之后,同樣涌現(xiàn)出更多通用能力。
小編為此設(shè)置了兩道難題,來考驗(yàn)k1的數(shù)理化思維。
第一個是,識別一張“荷馬史詩”的手寫殘頁,然后給出作者和作品是誰。
圖片
可以說想法步驟都沒問題,首先看手稿外觀、再看語種是希臘語、在進(jìn)一步分析手稿中的文字里提到的詞匯,來判斷出可能是在公元前5世紀(jì)至公元2世紀(jì)之間寫成的,最后鎖定是亞里士多德的自然哲學(xué)或者數(shù)學(xué)著作。
不過這個結(jié)果是錯誤的,這說明Kimi對于希臘文學(xué)的知識儲備還需要繼續(xù)精進(jìn)一下,當(dāng)然也存在小編這次的照片實(shí)在太過模糊的問題。
好的,讓我們一步步解開這個謎題。我面前有一張古老的手稿圖片,任務(wù)是推測其作者及內(nèi)容。這確實(shí)是一項(xiàng)充滿挑戰(zhàn)的任務(wù),但我們可以循序漸進(jìn)地進(jìn)行。
首先,我仔細(xì)觀察手稿的外觀。紙張泛黃,字跡用墨水書寫,顯得古樸而莊重。頁面上布滿了緊密排列的文本,幾乎沒有留白,這表明作者在書寫時(shí)非常用心,力求內(nèi)容的完整與精確。文本中還包含了一些編號和邊注,這可能意味著作者在進(jìn)行某種形式的學(xué)術(shù)研究或理論推導(dǎo)。
從語言的角度來看,這顯然不是現(xiàn)代英語。它更像是一種古典語言,可能是拉丁文或希臘文??紤]到其古老的特點(diǎn),我傾向于認(rèn)為這是希臘文,尤其是因?yàn)槟承┳帜缚雌饋硐袷窍ED字母。這讓我聯(lián)想到古希臘的學(xué)者,他們以其深邃的哲學(xué)和科學(xué)著作而聞名于世。
接下來,我們嘗試解讀一些具體的段落。手稿中有一段文字提到了“παραδειγμα”(范例)和“δηλοσθαι”(表明),這些詞匯在古希臘文中頗為常見,常用于哲學(xué)或修辭學(xué)的討論。另一段文字中出現(xiàn)了“αριθμοι”(數(shù)字)和“γεωμετρια”(幾何),這表明手稿可能涉及數(shù)學(xué)或邏輯學(xué)的內(nèi)容。
進(jìn)一步分析,手稿中還包含了一些公式或定理的陳述,如“εαν”(如果)和“οστιν”(因?yàn)椋?,這些詞匯通常用于邏輯推理或數(shù)學(xué)證明。這讓我聯(lián)想到歐幾里得的《幾何原本》,其中充滿了嚴(yán)謹(jǐn)?shù)倪壿嬐茖?dǎo)和幾何證明。
然而,我們不能忽視其他可能性。手稿中還提到了“φυσικη”(自然)和“μεταφυσικη”(形而上學(xué)),這些詞匯在亞里士多德的著作中頻繁出現(xiàn)。亞里士多德不僅是一位杰出的哲學(xué)家,還是一位博學(xué)的科學(xué)家,他的著作涵蓋了從邏輯學(xué)到物理學(xué)的廣泛領(lǐng)域。
為了更全面地理解手稿的內(nèi)容,我們還可以考慮其歷史背景。如果這是古希臘的手稿,那么它可能是在公元前5世紀(jì)到公元2世紀(jì)之間寫成的,這是古希臘文化和科學(xué)的鼎盛時(shí)期。這一時(shí)期的學(xué)者們不僅在哲學(xué)上有著深刻的見解,還在數(shù)學(xué)、天文學(xué)、醫(yī)學(xué)等領(lǐng)域取得了顯著的成就。
綜上所述,結(jié)合手稿的外觀、語言特征和內(nèi)容分析,我們可以推測這份手稿的作者很可能是古希臘的一位著名學(xué)者,如歐幾里得或亞里士多德。手稿的內(nèi)容則可能涉及數(shù)學(xué)、邏輯學(xué)或哲學(xué)的討論,尤其是幾何學(xué)或形而上學(xué)的領(lǐng)域。
然而,且慢,或許我過于草率地將其斷定為希臘文。若這實(shí)為拉丁文手稿,又將如何?許多古代文獻(xiàn)皆有拉丁文譯本,尤其是在中世紀(jì)時(shí)期。然而,某些字母似乎更貼近希臘字母,例如,我注意到一個類似于“Ω”的符號,這在希臘字母表中代表“歐米茄”,而在拉丁文中則無此字母。這進(jìn)一步堅(jiān)定了我認(rèn)定其為希臘文的信心。
現(xiàn)在,讓我們來探討這份手稿可能涉及的內(nèi)容。鑒于其中包含諸多技術(shù)術(shù)語和公式,它很可能是一本教科書或?qū)W術(shù)論文。手稿中不僅有編號的段落,還有旁注,這表明作者在系統(tǒng)地闡述某個主題,可能是數(shù)學(xué)定理或哲學(xué)論證。
讓我們仔細(xì)審視手稿中的一個特定段落,以期獲得更深入的理解。我看到一個段落以“Δι?? ειπερ”(意為“因此”)開頭,這表明作者在進(jìn)行邏輯推導(dǎo)。接著,文中提到了“?ριθμο?”(數(shù)字)和“μ?γεθη”(大小或量),這進(jìn)一步證實(shí)了數(shù)學(xué)是主要話題。
然而,這究竟是哪種數(shù)學(xué)呢?是純粹的數(shù)學(xué),還是應(yīng)用數(shù)學(xué)?考慮到文中還提到了“φ?σι?”(自然),這可能意味著這是一本關(guān)于自然哲學(xué)的著作,即我們今天所說的物理學(xué)。
我開始認(rèn)為,這份手稿可能是亞里士多德或歐幾里得等古希臘學(xué)者的作品。亞里士多德以其廣泛的自然哲學(xué)著作而聞名,而歐幾里得則是幾何學(xué)之父。然而,沒有更多的背景信息,很難確定具體是哪一位作者。
讓我們考慮一下歷史背景。如果這是一份古希臘手稿,它可能是在公元前5世紀(jì)至公元2世紀(jì)之間寫成的,這一時(shí)期正是古典希臘文明的鼎盛時(shí)期。這一時(shí)期的學(xué)者不僅在數(shù)學(xué)和哲學(xué)領(lǐng)域做出了重要貢獻(xiàn),還在天文學(xué)、醫(yī)學(xué)和修辭學(xué)等領(lǐng)域有所建樹。
然而,我也可能忽略了顯而易見的線索。手稿中是否有任何獨(dú)特的符號或術(shù)語可以明確指向某個特定的作者或?qū)W派?我注意到一些類似于歐幾里得《幾何原本》中的命題陳述,這使我更加傾向于認(rèn)為這可能是歐幾里得的作品。
但且慢,還有一個想法:這份手稿可能是中世紀(jì)時(shí)期對古希臘作品的注釋或解釋。中世紀(jì)的學(xué)者經(jīng)常研究和注釋古典文本,有時(shí)會添加自己的見解和解釋。手稿中的旁注和參考編號可能正是這種學(xué)術(shù)傳統(tǒng)的產(chǎn)物。
為了驗(yàn)證這一點(diǎn),我可以將手稿中的語言和術(shù)語與已知的古典希臘文本進(jìn)行比較。如果它與歐幾里得或亞里士多德的著作相符,這將支持我的假設(shè)。然而,沒有外部資源,我必須依賴自己的知識。
回顧手稿,我看到一個段落以“Ουκ ουν”(意為“因此不是”)開頭,這在邏輯推理中是典型的表達(dá)方式。這可能表明作者在進(jìn)行某種形式的辯證法,這是亞里士多德等哲學(xué)家常用的論證方式。
綜合所有這些線索——希臘字母、數(shù)學(xué)和哲學(xué)術(shù)語、邏輯推理的結(jié)構(gòu)——我傾向于認(rèn)為這份手稿是亞里士多得斯的自然哲學(xué)或數(shù)學(xué)著作的一部分??紤]到亞里士多得斯對多個學(xué)科的廣泛影響,這似乎合乎情理。
然而,我仍不完全確定。為了更精確,我應(yīng)該考慮這份手稿是否可能屬于其他古典作者,如柏拉圖或赫拉克利特。然而,柏拉圖的著作更多是對話形式,而赫拉克利特的著作則以 fragmentary(片段式) 和隱晦著稱,這似乎與手稿的系統(tǒng)性結(jié)構(gòu)不太相符。
因此,經(jīng)過深思熟慮,我得出結(jié)論:這份手稿很可能是亞里士多得斯的自然哲學(xué)或數(shù)學(xué)著作的一部分。其系統(tǒng)性的結(jié)構(gòu)、技術(shù)性語言和邏輯推理與亞里士多得斯的寫作風(fēng)格一致,使這一結(jié)論顯得合情合理。
\boxed{\text{這份手稿很可能是亞里士多得斯的自然哲學(xué)或數(shù)學(xué)著作的一部分。}}
第二個則是幾何原本的問題,小編在網(wǎng)上找到一份幾何原本的手稿照片,發(fā)給 Kimi 視覺思考版,看它如何一步一步,引人入勝地推理,這次不失所望,推理成功!
圖片
圖片
好的,讓我們一步步來解決這個問題。我手中有一張打開的書頁照片,書中包含一些幾何圖形和文字說明。我的任務(wù)是推測這本書的作者,并具體說明書中所講述的內(nèi)容。
首先,我仔細(xì)觀察這張照片。這是一本舊書,書頁已經(jīng)泛黃,顯得十分古老。書頁上有一些手繪的幾何圖形,主要是圓和三角形,還有一些彩色的陰影部分。書頁上的文字是英文,但有些地方不太清晰。我注意到有“BOOK III. PROP. XXI. THEOR.”和“BOOK III. PROP. XXII. THEOR.”的字樣,這表明這是第三卷中的第二十一和第二十二個命題。
從這些信息來看,這似乎是一本幾何教科書,可能是在講解歐幾里得幾何。但為了更準(zhǔn)確地確定作者和內(nèi)容,我需要進(jìn)一步分析。
首先,關(guān)于作者。提到“BOOK III”讓我聯(lián)想到歐幾里得的《幾何原本》,這是歷史上最著名的幾何教科書之一。然而,歐幾里得的《幾何原本》共有13卷,而這里的書頁編號為104和105,不太可能是《幾何原本》的直接版本,因?yàn)椤稁缀卧尽返木頂?shù)通常不會這樣編號?;蛟S這是一本基于《幾何原本》的后續(xù)教科書。
接著,我仔細(xì)觀察書頁上的內(nèi)容。在“BOOK III. PROP. XXI. THEOR.”下方,有一個命題:“THE angles ( ) in the fame fegment of a circle are equal.” 這里的“fame fegment”可能是指“same segment”。因此,命題的意思是:在同一個圓弧所對的圓周角相等。這與歐幾里得《幾何原本》第三卷中的命題非常相似,特別是命題21。
再看“BOOK III. PROP. XXII. THEOR.”,命題是:“THE opposite angles and of any quadrilateral figure in?cribed in a circle, are together equal to two right angles.” 這個命題的意思是:任何內(nèi)接于圓的四邊形的對角之和等于兩個直角。這與歐幾里得《幾何原本》第三卷中的命題22完全一致。
綜上所述,這本書很可能是基于歐幾里得的《幾何原本》編寫的教科書,具體講解了圓的性質(zhì)和相關(guān)的幾何定理。書中的命題和圖形與《幾何原本》第三卷中的內(nèi)容高度吻合,因此可以推測這本書的作者可能是歐幾里得,或者是一本基于歐幾里得《幾何原本》的后續(xù)教科書。
讓我嘗試將這段文字變得更加清晰和優(yōu)雅:
---
“在圓的同一段弧中,這些角( )相等?!?
接下來的部分:
“在圓內(nèi)接的任意四邊形中,對角線所夾的角之和等于兩個直角?!?
盡管某些字母的古體形式略顯晦澀,但依稀可以辨認(rèn)??雌饋?,這本書在討論圓內(nèi)接角和圓內(nèi)接四邊形的性質(zhì)。
現(xiàn)在,讓我們回顧一下幾何學(xué)的歷史。歐幾里得的《幾何原本》深入探討了這些主題,尤其是第三卷,專門討論圓的性質(zhì)。這些命題與歐幾里得的《幾何原本》第三卷中的命題21和22非常相似。
然而,為了確保結(jié)論的準(zhǔn)確性,我們不妨再仔細(xì)檢查一下。歐幾里得的《幾何原本》第三卷確實(shí)涵蓋了圓內(nèi)接角和圓內(nèi)接四邊形的性質(zhì)。命題21指出,在圓的同一段弧中,圓內(nèi)接角相等。命題22則指出,在圓內(nèi)接四邊形中,對角線所夾的角之和等于兩個直角。
鑒于此,這本書很可能在討論歐幾里得的《幾何原本》第三卷中的命題。但是否可以斷定作者就是歐幾里得呢?考慮到這些書頁的年代久遠(yuǎn)和內(nèi)容的相似性,這似乎合情合理。然而,我們?nèi)孕柚?jǐn)慎,因?yàn)檫@些內(nèi)容也可能是后來對歐幾里得作品的注釋或改編。
為了進(jìn)一步驗(yàn)證,我們不妨看看是否有任何額外的線索。書頁上有一些注釋和符號,如“Q. E. D.”,這是“quod erat demonstrandum”的縮寫,意為“證畢”,這是歐幾里得證明中常用的表達(dá)。此外,圖示的風(fēng)格和命題的表述方式與歐幾里得的風(fēng)格相符。
然而,仍有一個疑慮:如果這是歐幾里得的《幾何原本》,為何卷數(shù)不是連續(xù)的?或許這是一本特定的版本,只包含某些卷,或者是一本練習(xí)本,其中包含了這些命題的練習(xí)。
綜上所述,根據(jù)這些命題的內(nèi)容、歷史背景以及書頁的年代特征,我傾向于認(rèn)為這本書的作者是歐幾里得,內(nèi)容涉及他的《幾何原本》第三卷中的命題,特別是命題21和22,討論圓內(nèi)接角和圓內(nèi)接四邊形的性質(zhì)。
\boxed{\text{這本書很可能是歐幾里得的《幾何原本》第三卷,討論圓內(nèi)接角和圓內(nèi)接四邊形的性質(zhì)。}}
---
希望這段文字能夠更加流暢和優(yōu)美地表達(dá)你的思考過程。
讓我換個思路?;蛟S這并不是歐幾里得的著作,而是其他古典幾何學(xué)家的作品,如阿波羅尼奧斯或阿基米德。然而,阿波羅尼奧斯以其圓錐曲線的研究而著稱,而阿基米德則更多涉獵微積分和力學(xué),因此他們的著作可能不會如此集中于基礎(chǔ)的圓的性質(zhì)。
另一種可能是,這是一本文藝復(fù)興時(shí)期或更晚時(shí)期的教科書,采用了古典方法。圖示的風(fēng)格似乎更符合那個時(shí)期的特征。
然而,我仍傾向于認(rèn)為這是歐幾里得的《幾何原本》,因?yàn)槠鋵A的性質(zhì)的系統(tǒng)性處理在幾何學(xué)教科書中獨(dú)具一格。
至于內(nèi)容,根據(jù)命題,書中討論了圓內(nèi)接角的相等性以及圓內(nèi)接四邊形對角的性質(zhì)。具體而言:
- **命題21**:在圓的同一段弧中,所有圓內(nèi)接角都相等。
- **命題22**:在圓內(nèi)接四邊形中,對角的和等于兩個直角。
這些性質(zhì)對于理解圓的幾何至關(guān)重要,是歐幾里得《幾何原本》中建立的更廣泛幾何原理的基石。
綜上所述,經(jīng)過深思熟慮并排除其他可能性后,我得出結(jié)論:這本書的作者很可能是歐幾里得,內(nèi)容涉及《幾何原本》第三卷中的圓的性質(zhì),特別是圓內(nèi)接角和圓內(nèi)接四邊形的性質(zhì)。
\boxed{\text{這本書是歐幾里得的《幾何原本》第三卷,討論了圓內(nèi)接角和圓內(nèi)接四邊形的性質(zhì)。}}
5.寫在最后:Kimi也許會顛覆K12賽道
這次k1模型的模型,真的可以說是對于月之暗面來說意義不同尋常。從下半年月之暗面k0-math的發(fā)布再到底層推理架構(gòu)的開源,再到此次k1模型的發(fā)布,我們看到了一個從追趕OpenAI的Kimi正在發(fā)生新的變化:
Kimi似乎在追趕中找到了很多產(chǎn)品的創(chuàng)新,也找到了更多適合中國土壤的大模型產(chǎn)品的賽道和方向,k0解決數(shù)學(xué)強(qiáng)化推理、k1解決K12教育的拍照搜題解題的難題,這次實(shí)測,也讓小編看到了以Kimi為代表的大模型在重構(gòu)教育互聯(lián)網(wǎng)產(chǎn)品的極大的可能。
但小編認(rèn)為,這種能力還可以泛化,因?yàn)榫驮趧倓?,我還用k1幫忙讀了非常專業(yè)的AI技術(shù)報(bào)告——我在微軟剛推出的phi-4模型報(bào)告中,找到一個復(fù)雜的圖表,可以直接丟給Kimi,請幫忙解讀。
k1給出了正確的最終結(jié)論:
關(guān)鍵token是指那些使成功概率變化≥0.2的token,用方框標(biāo)出,并帶有表示概率變化的下標(biāo)。它們與低概率token(概率≤0.1,用下劃線標(biāo)出)不同,因?yàn)殛P(guān)鍵token對整體成功有顯著影響,而不僅僅是概率低。
好的,讓我們深入探討這張圖的解讀。首先,我們需要明確這張圖的來源和背景。這是來自微軟phi-4技術(shù)報(bào)告中的一張圖,涉及GPT-4o在MATH基準(zhǔn)測試中的表現(xiàn)。圖中展示的是在溫度為1的情況下,不同tokens對成功概率的影響。初始成功概率為0.31,每個token根據(jù)其后獨(dú)立完成的成功概率進(jìn)行著色,紅色表示\( p(\text{success}) = 0 \),藍(lán)色表示\( p(\text{success}) = 1 \)。
圖中還標(biāo)出了那些使\( p(\text{success}) \)變化≥0.2的tokens,并用下劃線標(biāo)出概率≤0.1的tokens,以區(qū)分關(guān)鍵tokens和低概率tokens。特別地,"negative"和"a"的token概率分別為0.31和0.12,而貪婪tokens的概率分別為0.66和0.88。
首先,我們來看圖的結(jié)構(gòu)。這是一個時(shí)間序列圖,x軸表示tokens的序列位置,y軸表示成功概率\( p(\text{success}) \)。圖中有一條折線,表示隨著tokens的生成,成功概率的變化。每個token用一個點(diǎn)表示,顏色從紅色到藍(lán)色漸變,表示成功概率從0到1的變化。
初始成功概率為0.31,這在圖的起點(diǎn)處可以看到。隨著tokens的生成,成功概率在0到1之間波動。圖中標(biāo)注了幾個關(guān)鍵點(diǎn),這些點(diǎn)是關(guān)鍵tokens,它們對成功概率的影響顯著。
關(guān)鍵tokens是指那些使成功概率變化≥0.2的tokens。例如,圖中標(biāo)注了"negative"和"a"這兩個tokens,它們的概率分別為0.31和0.12。這些tokens對模型的成功率有顯著影響。
此外,圖中用下劃線標(biāo)出了概率≤0.1的tokens,這些是低概率tokens,與關(guān)鍵tokens區(qū)分開來。關(guān)鍵tokens雖然不一定具有最高的概率,但它們對成功概率的影響是顯著的。
圖中還提到了貪婪tokens,例如"product"和"i",它們的概率分別為0.66和0.88。貪婪tokens是指在每一步選擇概率最高的token,而不考慮整體的成功率。
為了更深入地理解這張圖,我們可以將其分為幾個部分來分析:
1. **初始狀態(tài)**:初始成功概率為0.31,這是模型在生成任何tokens之前的成功概率。
2. **tokens生成過程**:隨著tokens的生成,成功概率在0到1之間波動。每個生成的token都會影響后續(xù)的成功概率。
3. **關(guān)鍵tokens**:這些tokens使成功概率變化≥0.2。例如,"negative"和"a",它們的概率分別為0.31和0.12。這些tokens雖然不一定是最高的概率,但它們對成功率的影響是顯著的。
4. **低概率tokens**:這些tokens的概率≤0.1,用下劃線標(biāo)出。它們對成功率的影響較小,但仍然可能在某些情況下起到關(guān)鍵作用。
5. **貪婪tokens**:這些是在每一步選擇概率最高的token,如"product"和"i",概率分別為0.66和0.88。貪婪策略可能會導(dǎo)致局部最優(yōu),但不一定能全局最優(yōu)。
通過這些分析,我們可以看到,雖然高概率的貪婪tokens在每一步看起來更優(yōu),但關(guān)鍵tokens在整體成功率上可能起到?jīng)Q定性的作用。這表明在模型的生成過程中,某些特定的tokens雖然概率不高,但對最終的成功率有顯著的正面或負(fù)面影響。
為了驗(yàn)證這一點(diǎn),我們可以考慮一個具體的例子。假設(shè)在生成過程中,模型面臨一個選擇:選擇一個概率為0.6的token,這個token可能會引導(dǎo)生成過程進(jìn)入一個成功率較低的路徑;或者選擇一個概率為0.4的token,這個token雖然概率較低,但可能會引導(dǎo)生成過程進(jìn)入一個成功率較高的路徑。關(guān)鍵tokens就像這些概率較低但對成功率有顯著正面影響的token。
因此,關(guān)鍵tokens的重要性在于它們能夠顯著改變生成過程的成功率,即使它們在每一步的概率不高。這與低概率tokens不同,后者對成功率的影響較小。
綜上所述,這張圖展示了在GPT-4o模型的生成過程中,不同tokens對成功概率的影響。關(guān)鍵tokens雖然不一定具有最高的概率,但它們對成功率的影響是顯著的,這表明在生成過程中,某些特定的tokens能夠顯著改變生成的成敗。
讓我再仔細(xì)檢查一下我對圖中信息的解讀是否準(zhǔn)確。圖中顯示,關(guān)鍵token如“negative”和“a”對成功概率有顯著影響,而貪婪token如“product”和“i”則具有較高的概率。這表明,盡管貪婪token在每一步可能看起來更優(yōu),但關(guān)鍵token在整體成功中起著至關(guān)重要的作用。
因此,關(guān)鍵token是指那些對整體成功概率有顯著影響的token,即使它們在每一步的出現(xiàn)概率并不高。這與低概率token形成鮮明對比,后者對成功概率的影響微乎其微。
最終結(jié)論是:關(guān)鍵token是指那些使成功概率變化≥0.2的token,用方框標(biāo)出,并帶有表示概率變化的下標(biāo)。它們與低概率token(概率≤0.1,用下劃線標(biāo)出)不同,因?yàn)殛P(guān)鍵token對整體成功有顯著影響,而不僅僅是概率低。
\boxed{\text{關(guān)鍵token是指那些使成功概率變化≥0.2的token,用方框標(biāo)出,并帶有表示概率變化的下標(biāo)。它們與低概率token(概率≤0.1,用下劃線標(biāo)出)不同,因?yàn)殛P(guān)鍵token對整體成功有顯著影響,而不僅僅是概率低。
所以Kimi的持續(xù)創(chuàng)新,帶來的想象空間將會越來越大,不止K12的拍照搜題,所有知識類的工具可能都會被k1重塑!
最后,正如網(wǎng)友所說:Kimi,大模型國產(chǎn)之光,加油!
本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:言征
