自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

小米殺入推理大模型賽道!MiMo-7B以小搏大,數(shù)學(xué)代碼雙殺32B參數(shù)巨頭

發(fā)布于 2025-5-1 21:34
瀏覽
0收藏

昨天科技圈被小米的一條重磅消息刷屏了——全球首個專為推理設(shè)計的大型開源模型 Xiaomi MiMo 正式亮相!更令人震驚的是,這個僅 70億參數(shù) 的小模型,在數(shù)學(xué)推理(AIME24-25)和代碼競賽(LiveCodeBench v5)測評中,直接碾壓了OpenAI閉源的 o1-mini 和阿里開源的 QwQ-32B-Preview。

小米殺入推理大模型賽道!MiMo-7B以小搏大,數(shù)學(xué)代碼雙殺32B參數(shù)巨頭-AI.x社區(qū)

在DeepSeek-R1掀起強化學(xué)習(xí)(RL)熱潮的當(dāng)下,小米用MiMo-7B交出了一份驚艷答卷:
數(shù)學(xué)推理:AIME24-25測試中,MiMo解題準(zhǔn)確率遠超同賽道選手,甚至能處理復(fù)雜微積分和幾何證明;代碼能力:LiveCodeBench v5競賽級題目中,它生成的代碼邏輯嚴(yán)謹,調(diào)試效率直逼人類工程師:

小米殺入推理大模型賽道!MiMo-7B以小搏大,數(shù)學(xué)代碼雙殺32B參數(shù)巨頭-AI.x社區(qū)

能以小模型搏大場面,背后是小米AI團隊的兩板斧:
在預(yù)訓(xùn)練階段,小米合成了海量數(shù)學(xué)論文、編程題庫和邏輯謎題,通過三階段漸進式訓(xùn)練(從簡單到復(fù)雜),讓模型啃透25T tokens的“推理硬菜”。而在后訓(xùn)練階段,則通過強化學(xué)習(xí)優(yōu)化效果:

小米這次不玩“閉源炫技”,而是直接把MiMo全系列模型扔上了HuggingFace(鏈接見文末),開發(fā)者可免費商用。

小米的野心:AGI長征才剛開始

盡管MiMo-7B已展現(xiàn)驚人潛力,但小米清醒地表示:2025年只是大模型下半場的起點,AGI之路道阻且長。不過,從手機到汽車再到AI,這家公司正用實際行動證明——中國科技企業(yè),完全能在基礎(chǔ)模型層面與全球巨頭掰手腕。

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦