自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<i id="vflvu"><samp id="vflvu"></samp></i>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

AI實(shí)力榜大洗牌！OpenAI谷歌強(qiáng)勢領(lǐng)跑，Anthropic節(jié)節(jié)敗退

2025-05-19 08:33:00

人工智能新聞

AI市場風(fēng)起云涌！Poe最新報(bào)告揭曉：OpenAI的GPT-4o稱霸文本生成，谷歌的Gemini 2.5 Pro領(lǐng)跑推理，Kling在視頻領(lǐng)域異軍突起，企業(yè)如何在這場AI競賽中搶占先機(jī)？

最近，Poe發(fā)布了最新的使用報(bào)告，報(bào)告顯示，OpenAI和谷歌的地位越來越穩(wěn)，勢頭很猛。

Anthropic就沒那么好運(yùn)，有點(diǎn)掉隊(duì)了。

AI模型的推理能力，已經(jīng)成為了各大公司競爭的關(guān)鍵戰(zhàn)場。

根據(jù)Poe發(fā)布的數(shù)據(jù)，2025年1月到5月這段時(shí)間，AI各個(gè)主要領(lǐng)域，市場份額都重新洗牌了。

主要結(jié)果如下：

文本生成：GPT-4o以35.8%穩(wěn)居榜首，Claude和Gemini緊隨其后。
推理：Gemini-2.5.Pro以31.5%登頂，Claude、DeepSeek-R1、最近推出的o3和o4-mini榜上有名。
圖像生成：Imagen3、GPT-Image-1和Flux系列三分天下。
視頻生成：Runway暫列第一，Kling-2.0-Master來勢洶洶，Veo-2排名第三。
智能體：o3拔得頭籌，戰(zhàn)勝了Anthropic的Claude和谷歌的Gemini。

截至2025年5月不同類別的AI模型排名

o3驅(qū)動的智能體拔得頭籌，Claude和Gemini緊隨其后。

文本：GPT-4o穩(wěn)坐頭把交椅，新模型來勢洶洶

在文本生成這個(gè)領(lǐng)域，OpenAI的GPT-4o是穩(wěn)穩(wěn)的第一，用戶占比達(dá)到35.8%，占據(jù)主導(dǎo)地位。

OpenAI新出的GPT-4.1系列也不容小覷，發(fā)布沒幾周，就拿下了9.4%的份額。

谷歌的Gemini 2.5 Pro表現(xiàn)也不錯(cuò)，剛上線不久，就有大約5%的用戶選擇它。

不過，Anthropic的Claude可就有點(diǎn)慘了，這段時(shí)間它的市場份額下降了10%，被OpenAI和谷歌搶走了不少用戶。

雖說現(xiàn)在Claude 3.7 Sonnet更受大家歡迎，取代了Claude 3.5 Sonnet，但老版本也還有12%的人在用。

還有DeepSeek，今年年初一炮而紅。后來其他公司也推出了不少價(jià)格實(shí)惠、功能又強(qiáng)的推理模型。

DeepSeek R1的用戶占比從2月中旬7%的最高點(diǎn)，下跌到4月底，只剩3%了。

推理：會解難題成了「制勝法寶」

專門用來推理的模型越來越受歡迎了。

2025年年初開始，推理模型的比例從2%一下子漲到了10%。

Nick Huber表示，這些推理模型別看還在發(fā)展初期，但解決復(fù)雜問題的能力特別強(qiáng)，給出的答案也更準(zhǔn)確。那些喜歡嘗鮮的用戶發(fā)現(xiàn)了它的好處，就算用的時(shí)候成本高一點(diǎn)、花的時(shí)間長一點(diǎn)，他們也愿意，就為了能得到更好的結(jié)果。

在推理模型這個(gè)熱門領(lǐng)域，谷歌的Gemini 2.5 Pro一騎絕塵。

上線才六周，就占了31%的市場份額，把Claude那些專門做推理的模型都比下去了。

OpenAI在推理模型方面一直在創(chuàng)新。2025年前4個(gè)月，就推出了好多款新的推理模型，像o1-pro、o3-mini。

Poe的用戶特別愿意嘗試OpenAI的新模型，很快就從老版本換成新版本了。

還出現(xiàn)了一些新的混合推理模型，像Gemini 2.5 Flash Preview和Qwen 3，它們能在聊天的時(shí)候根據(jù)情況調(diào)整推理的深度。

不過目前用這些新模型的用戶還不多，只占推理模型用戶總數(shù)的1%左右。

有行業(yè)分析師就說了，現(xiàn)在大家都在卷推理能力，這說明AI市場在慢慢成熟。

基礎(chǔ)的文本生成功能已經(jīng)沒什么差異化了，想脫穎而出，就得靠這種更高級的能力。

圖像：谷歌Imagen 3「攪局」

圖像生成這個(gè)領(lǐng)域現(xiàn)在也是競爭白熱化。

谷歌的Imagen 3系列模型一路逆襲，2025年市場份額從10%左右漲到了30%，已經(jīng)能和黑森林實(shí)驗(yàn)室的FLUX系列模型「掰掰手腕」了。

到4月下旬，F(xiàn)LUX系列模型的市場份額也就35%左右。

OpenAI的GPT-Image-1也不甘示弱，4月下旬剛接入API，才過了兩周，就有17%的用戶用它來生成圖像了，和它之前在ChatGPT里爆火的情況差不多。

雖然FLUX系列模型在Poe的圖像生成領(lǐng)域還是用的人最多，但從數(shù)據(jù)上也能看出，它的市場份額從45%掉到35%了，被谷歌和OpenAI搶了不少用戶。

以前圖像生成是Midjourney和Stable Diffusion的天下，現(xiàn)在谷歌、OpenAI和黑森林實(shí)驗(yàn)室三足鼎立，競爭特別激烈。

現(xiàn)在圖像生成的質(zhì)量越來越好，對用戶給的提示理解得更準(zhǔn)，生成速度也更快，已經(jīng)成為競爭最激烈的戰(zhàn)場之一了。

從行業(yè)數(shù)據(jù)能看出，最近這半年，企業(yè)對圖像生成技術(shù)的需求暴增。好多公司的營銷部門還有創(chuàng)意機(jī)構(gòu)，都開始用這些技術(shù)做設(shè)計(jì)了。

視頻：黑馬Kling攪局

在視頻生成領(lǐng)域，中國快手實(shí)驗(yàn)室新出的Kling系列模型就像一匹黑馬，直接拿下了30%左右的市場份額。

其中Kling-2.0-Master最厲害，4月底發(fā)布，才過了三周，在Poe上的使用占比就達(dá)到21%了。

谷歌的Veo2自從2月發(fā)布以來，一直保持著20%左右的份額，表現(xiàn)挺穩(wěn)定。

但這個(gè)領(lǐng)域最早的開拓者Runway就沒那么幸運(yùn)了，在報(bào)告期里，它的市場份額從60%大幅下降到20%。

Kling系列能這么快打開市場，說明在新興的AI領(lǐng)域，就算是一開始領(lǐng)先的公司，如果不持續(xù)進(jìn)步，很快就會被新公司超越。

視頻生成特別耗性能，哪怕生成一小段視頻，也得需要很強(qiáng)的處理能力。所以和文本、圖像生成比起來，用視頻生成模型的人相對少一些。

不過現(xiàn)在技術(shù)發(fā)展快，成本在下降，視頻質(zhì)量在提高，估計(jì)2025年用的人會越來越多。

現(xiàn)在已經(jīng)有不少廣告公司、社交媒體博主還有教育平臺開始用AI生成視頻了，雖然這項(xiàng)技術(shù)還有些不足，但大家都看到了它的潛力。

語音：ElevenLabs稱霸，新公司另辟蹊徑

在語音領(lǐng)域，ElevenLabs還是穩(wěn)穩(wěn)的王者，報(bào)告期內(nèi)，差不多80%的用戶都用它來做文本轉(zhuǎn)語音。

不過，Cartesia、Unreal Speech 這些新公司也來分蛋糕了，它們提供了很多不一樣的語音選擇，還有各種音效，價(jià)格也各有優(yōu)勢。

和其他領(lǐng)域的競爭很分散不同，語音AI基本被ElevenLabs壟斷了。

專家分析，這是因?yàn)樗M(jìn)入市場早，語音庫特別豐富，而且一直都在優(yōu)化，技術(shù)比其他公司厲害。

新公司也有自己的辦法，它們不跟ElevenLabs正面硬剛，而是找一些細(xì)分市場。

比如Unreal Speech就專門給播客和有聲書制作方提供服務(wù)，能模擬各種專業(yè)配音演員的聲音，還能表現(xiàn)出不同的情感。

Cartesia則主打多語言、帶真實(shí)口音的語音，受到很多跨國企業(yè)和教育平臺的歡迎。

隨著文本轉(zhuǎn)語音技術(shù)越來越成熟，越來越接近真人說話的水平，在客服、無障礙服務(wù)，還有內(nèi)容創(chuàng)作這些場景用得越來越多。

語音AI對性能要求不高，用起來更方便，預(yù)計(jì)2025年這個(gè)市場還會繼續(xù)擴(kuò)大。

o3智能體拔得頭籌

在一項(xiàng)針對AI智能體的聯(lián)網(wǎng)研究測試中，ChatGPT最新的o3模型戰(zhàn)勝了Anthropic的Claude和谷歌的Gemini。

不過話說回來，最牛的智能體和人類專家相比，還是有不小的差距。

FutureSearch讓11個(gè)主流的大模型完成了總共89項(xiàng)實(shí)際研究任務(wù)，并對每個(gè)模型在查找原始資料來源、搜尋數(shù)據(jù)、收集證據(jù)、匯編數(shù)據(jù)以及驗(yàn)證主張等能力進(jìn)行了評估。

最后打分結(jié)果出來，最高分才0.51，而滿分預(yù)計(jì)是0.8。

也就是說，現(xiàn)在最牛的AI智能體，專業(yè)研究人員花點(diǎn)時(shí)間，也能輕松「碾壓」它們。

這次測評的成績單如下：

o3（OpenAI）：0.51
Claude 3.7 Sonnet（Think）：0.49
Claude 3.7 Sonnet（Std）：0.48
Gemini 2.5 Pro：0.45
GPT-4.1L：0.42
DeepSeek-R1：0.31
Mistral Small：0.30
GPT-4 Turbo：0.27
Gemma 3：0.20

對比去年GPT-4 Turbo才0.27的分?jǐn)?shù)，在一年時(shí)間里，優(yōu)秀通才研究人員和前沿智能體之間的差距縮小了約45%。

此外，像DeepSeek這樣價(jià)格便宜的智能體，與來自O(shè)penAI的付費(fèi)高端產(chǎn)品相比，差距并不大。

OpenAI的o3暫時(shí)領(lǐng)跑，Claude和Gemini緊跟其后。

目前看來，閉源模型在搞研究這塊更有優(yōu)勢，但開源模型也在瘋狂上分。

不過智能體的「短板」也很明顯。

跟人類研究員相比，它們在戰(zhàn)略規(guī)劃、全面性、評估資料來源質(zhì)量等方面更遜一籌，還特別容易忘事，任務(wù)做到一半就把之前查到的東西拋腦后了。

更要命的是，好多AI都有「擺爛」傾向，找到差不多能用的答案就收手，不愿意再深挖找更好的。

ChatGPT的o3能拿第一，就是因?yàn)樗^真，驗(yàn)證答案特別仔細(xì)，也不會輕易放過更好的解決方案。

照這趨勢，說不定過不了幾年AI就能反超人類研究員了。

不過最近，ChatGPT新版本還因?yàn)樘^諂媚被吐槽過。AI要想穩(wěn)定變強(qiáng)，還有很長的路要走。

現(xiàn)在AI智能體給出的結(jié)果，還是得自己再檢查一遍，可別偷懶直接抄作業(yè)！

企業(yè)如何應(yīng)對快速變化的AI市場？

AI市場變得這么快，對那些想用AI的企業(yè)來說，既是機(jī)會也是挑戰(zhàn)。

已經(jīng)在大規(guī)模用AI的企業(yè)，要建立一套靠譜的評估體系，別只盯著一家供應(yīng)商。因?yàn)檎f不定這個(gè)月最好用的模型，下個(gè)月就不是了。

推理能力越來越重要，以前可能更看重速度和成本，現(xiàn)在大家更關(guān)注處理復(fù)雜任務(wù)時(shí)準(zhǔn)不準(zhǔn)、靠不靠譜。

現(xiàn)在前沿的AI公司不停地推出更厲害的模型，企業(yè)很糾結(jié)：到底是選定一個(gè)平臺長期用，還是保持靈活性？

很多企業(yè)的AI負(fù)責(zé)人都選擇兩手抓，不同的任務(wù)用不同的模型，一旦有更好的技術(shù)出現(xiàn)，馬上就能切換。

從報(bào)告里能看出，現(xiàn)在圖像、視頻、音頻這些多媒體相關(guān)的AI能力競爭也很激烈。

以后可能得更注重發(fā)展一個(gè)全面、平衡的AI生態(tài)系統(tǒng)，圖像、視頻、音頻生成和文本生成等都很重要。

對企業(yè)來說，如果想在AI浪潮里站穩(wěn)腳跟，最好根據(jù)自己的實(shí)際需求去挑選AI模型，別盲目追新。

同時(shí)，企業(yè)也要搭建好技術(shù)框架，這樣一旦有更好的技術(shù)出現(xiàn)，就能馬上用起來。

那些只守著過去的AI明星產(chǎn)品的公司，說不定很快就會被市場淘汰。

責(zé)任編輯：張燕妮來源：新智元

AI 谷歌模型

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<cite id="upyd3"></cite>