深夜重磅!DeepSeek升級(jí)版來(lái)了!671B推理怪獸Prover-V2炸場(chǎng)開(kāi)源
就在大家準(zhǔn)備開(kāi)啟假期模式時(shí),DeepSeek 果然又祭出了祖?zhèn)鞯募偃胀灰u技能,這次不是網(wǎng)傳的R2,而是推理核彈級(jí)模型——DeepSeek-Prover-V2-671B。
核心參數(shù):
? 671B參數(shù)巨無(wú)霸,MoE架構(gòu)火力全開(kāi)
? 每層都是MoE!256專(zhuān)家陣列+共享專(zhuān)家
? 單token激活8專(zhuān)家,中間層2048寬
? 逆天163k上下文窗口,直接改寫(xiě)長(zhǎng)文檔認(rèn)知邊界
升級(jí)版剛上線HuggingFace,就狂攬100+星,技術(shù)宅們怕不是已經(jīng)組隊(duì)開(kāi)始?jí)毫y(cè)試了。
所以問(wèn)題來(lái)了:
- 這次"假期特別版"會(huì)不會(huì)又藏著什么數(shù)學(xué)推理黑科技?
- 之前Prover系列的邏輯證明能力會(huì)有多大飛躍?
- 繼128k之后直接翻倍到163k,文檔理解要革命?
贊
收藏
回復(fù)
分享
微博
QQ
微信
舉報(bào)

回復(fù)
相關(guān)推薦