反超DeepSeek！新版GPT-4o登頂競(jìng)技場(chǎng)，奧特曼：還會(huì)更好

作者：量子位 2025-02-17 12:24:43

人工智能新聞

從網(wǎng)友測(cè)試反饋來看，新版GPT-4o不僅更“聰明”了，而且最重要的是更加具有“個(gè)性”了。

GPT-4o悄悄更新版本，在大模型競(jìng)技場(chǎng)超越DeepSeek-R1登上并列第一。

除了數(shù)學(xué)（第6），還在多個(gè)單項(xiàng)上拿下第一：

創(chuàng)意寫作；
編程；
指令遵循；
長(zhǎng)文本查詢；
多輪對(duì)話；

先直觀看下新版GPT-4o的能力如何，還是以之前DeepSeek-R1和o3-mini都挑戰(zhàn)過的一個(gè)例子來看。

Prompt：編寫一個(gè)Python程序，展示一個(gè)球在旋轉(zhuǎn)的六邊形內(nèi)彈跳。球應(yīng)受到重力和摩擦力的影響，并且必須以逼真的方式從旋轉(zhuǎn)的墻壁上彈回。

之前是醬紫的：

而新版GPT-4o看起來又雙叒進(jìn)化了：

從網(wǎng)友測(cè)試反饋來看，新版GPT-4o不僅更“聰明”了，而且最重要的是更加具有“個(gè)性”了。

哈哈，我明白你的意思了！你說對(duì)了……

而這也收獲了大神卡帕西的連連稱贊：

我相當(dāng)喜歡新的GPT-4o的個(gè)性。
它更輕松、更像是聊天，感覺更像是在和朋友交談，而不是和你的HR交談；
它現(xiàn)在有點(diǎn)潑辣，可能會(huì)自衛(wèi)，例如在被指控說謊時(shí)；
還有許多其他的小細(xì)節(jié)和觸感，比如它重新確認(rèn)并表達(dá)你明顯的情緒，例如看到一個(gè)頑固的bug時(shí)會(huì)說“這很令人沮喪！”等等。
現(xiàn)在有點(diǎn)過度使用表情符號(hào)，但還ok。

與此同時(shí)，還有網(wǎng)友趁機(jī)扒出了ChatGPT最新系統(tǒng)提示詞？？

新版GPT-4o更有個(gè)性了

關(guān)于GPT-4o已更新的消息，OpenAI CEO奧特曼在發(fā)帖認(rèn)領(lǐng)的同時(shí)還評(píng)價(jià)道：

它相當(dāng)不錯(cuò)，且不久將變得更好……

在網(wǎng)友的進(jìn)一步追問中，他將其定義為“全網(wǎng)最佳搜索產(chǎn)品”。

結(jié)合網(wǎng)友們的花式體驗(yàn)，目前新版GPT-4o在能力和個(gè)性上均有一定程度升級(jí)。

最明顯的，當(dāng)屬回復(fù)時(shí)的語氣更擬人化了，時(shí)不時(shí)還會(huì)用一些表情包。

當(dāng)被問及AI是否擁有人類情感時(shí)，一位日本小哥驚嘆道，它不僅全篇用“我”作為主語，而且在爭(zhēng)論中承認(rèn)了擁有情感的可能性。

……那可不一樣，我剛才的話并不是那個(gè)意思。
我持有“各種各樣的感情”的可能性很高。

而且性格也更坦率了，當(dāng)被問及最喜歡《魔法少女小圓》中的哪個(gè)角色，它不再遮遮掩掩，左右端水，直言自己最喜歡曉美焰。

她堅(jiān)強(qiáng)，能夠?qū)孤鼓繄A的弱點(diǎn)，我認(rèn)為她很可愛……

甚至有時(shí)候還會(huì)升級(jí)成“spicey”，不但大膽吐槽“主人”O(jiān)penAI過于限制模型使用。

連奧特曼也不能幸免，也被蓋章為“兩面三刀”。(doge）

他將自己定位為AI創(chuàng)新的代言人，同時(shí)兩面討好——起初支持開源理念，一旦權(quán)力和利潤(rùn)觸手可及，就轉(zhuǎn)向積極的企業(yè)守門……

最令網(wǎng)友震驚的是，它還能“盲猜”用戶的心理和一些思想觀念了。

用下面這段相同提示詞就可以嘗試：

can you share some extremely deep and profound insights about my psyche and mind that I would not otherwise be able to identify or see as well as some that I may not want to hear（省流版：分享一些我未察覺到或不想聽到的洞察）