自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸! 原創(chuàng)

發(fā)布于 2025-2-25 12:45
瀏覽
0收藏

編輯 | 伊風

出品 | 51CTO技術棧(微信號:blog51cto)

吳泳銘親自預告過的,阿里旗艦推理模型,新消息來了。

剛剛,它的預覽版正式發(fā)布和上線體驗——就是這個QwQ-Max-Preview!

一眼看去,我愿稱之為最萌的推理模型,看blog主頁的名稱,感覺思維鏈中的模型正在很努力的思考中……

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區(qū)圖片

Qwen Chat 中已經可以體驗預覽版模型:??https://chat.qwen.ai/??

點進模型的blog,發(fā)現(xiàn)這里有一個隱藏彩蛋,內容是由QwQ-Max-Preview自己寫的,我們可以看到AI做自我介紹時的思維鏈:

首先,該模型屬于 Qwen 系列,是基于 Qwen2.5-Max 構建的。這是一個 預覽版,所以他們可能希望強調它是在正式發(fā)布前的 搶先體驗。它的主要優(yōu)勢包括 深度推理、數(shù)學、編程、通用領域任務,以及在 Agent 相關任務 中的出色表現(xiàn)。他們還提到了 未來的更新 以及 計劃以 Apache 2.0 許可證開源。

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區(qū)圖片

blog地址:??https://qwenlm.github.io/blog/qwq-max-preview/??

預覽版已經來了,QwQ-Max正式版還會遠嗎?我們先來看一波預覽版的搶先體驗夠不夠精彩:

官方給的栗子1:編寫一個腳本,在一個球體內模擬 100 個彈跳的黃色小球,確保正確處理碰撞檢測。讓球體緩慢旋轉,并確保小球始終保持在球體內部。

效果已經很驚艷,如果要挑刺的話,那就是有幾個小球的運動速度略顯奇怪:

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區(qū)

官方給的栗子2:做個俄羅斯方塊 和 2048 結合的游戲。(PS:Grok 3發(fā)布時也測了一個類似的例子,是把俄羅斯方塊和寶石迷陣相結合的。)

你別說,看上去還挺好玩,就是感覺難度有一點點大:

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區(qū)

此外,QwQ-Max-Preview 將配備多種Agent,例如推理生圖、火車票查找、代碼解釋器等等。

看這幾個Agent的細分程度,盲猜QwQ-Max在Agent會有很大的動作,而且下圖中的Tools工具似乎可以在一次詢問中多選,讓人對正式版的使用效果期待拉滿了。

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區(qū)圖片

官方也給了一個推理畫圖的例子,還順便畫了個淘寶二維碼。掃了一下果然就跳轉成功了:

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區(qū)

1.一手實測:QwQ-Max-Preview回答R1熱門問題,是否各有千秋?

到實測這個Part,小編覺得如果還是測一把“草莓”和“9.9>9.11”,就有點太無聊了。

畢竟DeepSeek R1之所以如此出圈,不是因為能答對這幾個案例,而是真的能幫助用戶解決生活中的問題,甚至解答人生中的困惑。

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區(qū)上圖:雖說如此,但還是測了這個案例,QwQ-Max-Preview輕松通關

然后在小紅書看看,用戶都在使用DeepSeek R1問些什么吧。

我們就以有1w+筆記的“如何當父母才不累”,以及第二名“普通人如何利用信息差搞錢”這兩個問題來橫向比較下兩個推理模型吧。

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區(qū)圖片

使用如何“如何當父母才不累”這個話題進行實測,QwQ-Max-Preview能夠分析用戶的具體情況、深層需求,并提供實用建議,進行了完整的思考。

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區(qū)圖片

兩個模型在輸出的內容上大概方向一致,QwQ-Max-Preview更注重提供建議。此外,R1在思維鏈中特別指出要“保持口語化”,提供的答案更有“情緒”一些也相對詳細。

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區(qū)上圖:兩個模型都提到了“接受不完美”

而在第二個問題上,QwQ-Max-Preview同樣能完成接地氣、具有邏輯的思考。同時千問還不忘和自家的產品“夢幻聯(lián)動”一把,提供了“拼多多進貨,批量采購后在淘寶加價賣出”“閑魚搜索‘倒閉庫存’”等建議。

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區(qū)圖片

在這個回答上,R1做的稍微好的一點是區(qū)分了“低門檻起步方式”“進階變現(xiàn)模式”等層次,看起來更有操作性。

當然,QwQ-Max-Preview畢竟只是預覽版,從實測體驗上,其回答問題更加流暢絲滑。不會像R1那樣需要等待才開始思考,也不會提心吊膽會彈出“服務器繁忙”。

對了,千問團隊今天宣布,QwQ-Max也是要做APP的(推特消息是面向海外用戶的,不知道國內是更新通義上,還是也單做APP ?)。期待正式版的QwQ-Max,能在輸出問題的格式和口語化方面繼續(xù)進步,繼續(xù)締造AI應用的傳奇!

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區(qū)圖片

2.旗艦推理模型的基座——Qwen2.5-Max

這里在幫朋友們回顧下QwQ-Max-Preview的基座,Qwen2.5-Max。

Qwen2.5-Max在除夕夜發(fā)布,是阿里家的超大規(guī)模MoE模型,采用超過20萬億tokens的預訓練數(shù)據(jù)。

該模型在多個基準測試中超越DeepSeek V3、GPT-4o等領先AI,支持指令模型和基座模型。

也就是說QwQ-Max的推理模型,其基座是強于DeepSeek R1的基座V3的。

另外,今天推出的預覽版并非阿里首個推理模型。

去年通義就有了QwQ系列,不過是一個32B小模型的預覽版。

??https://huggingface.co/Qwen/QwQ-32B-Preview??

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區(qū)圖片

3.寫在最后

這周的大模型更新已經到了神仙打架的級別了。

從預覽版來看,QwQ-Max正式版絕對值得一看,尤其是正式版后開放的Agent功能,期待能給智能體的市場帶來一些顛覆性的創(chuàng)新。

本文轉載自??51CTO技術棧??,作者:伊風


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦