2小時(shí)登頂全球最強(qiáng)開(kāi)源模型!Qwen3力壓DeepSeek-R1和OpenAI o1,登頂開(kāi)源王座!
最近,阿里Qwen3 正式開(kāi)源,兩小時(shí)就狂攬17k星,直接登頂全球最強(qiáng)開(kāi)源模型,暴擊DeepSeek-R1和OpenAI o1,中國(guó)AI的牌面支棱起來(lái)了!
這次開(kāi)源的Qwen3主要有以下核心亮點(diǎn):
1?? 混合推理模式:首創(chuàng)非思考模式+慢思考雙模式:對(duì)于追求速度的問(wèn)題,可使用非思考模式實(shí)現(xiàn)秒速回應(yīng),遇到復(fù)雜任務(wù)則轉(zhuǎn)為慢思考模式,進(jìn)行深度推演;
2?? 低成本高性能:Qwen3采用36萬(wàn)億token預(yù)訓(xùn)練。并且在數(shù)學(xué)能力方面,Qwen3在A(yíng)IME25 中獲得81.5分;代碼能力同樣很強(qiáng):在LiveCodeBench中以 70+分全面碾壓其他大模型。
性能大幅提升的同時(shí),Qwen3 的部署成本還大幅下降,僅需 4 張 H20 即可部署滿(mǎn)血版,顯存占用僅為性能相近模型的三分之一,在手機(jī)端也能絲滑運(yùn)行;
3?? 支持多種語(yǔ)言:Qwen3支持119種語(yǔ)言,就連方言也不在話(huà)下。
有網(wǎng)友甚至調(diào)侃:“Meta LlamaCon還沒(méi)開(kāi),風(fēng)頭就被阿里截胡了?!?/p>
這波就像開(kāi)源界的《流浪地球》,中國(guó)技術(shù)再次以實(shí)力輸出全球。
只能說(shuō),OpenAI和DeepSeek的板凳該坐熱了…
