OpenAI發(fā)布突破性AI模型o1系列,推理能力大幅躍升重塑行業(yè)格局
圖片
9月13日,人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI正式對(duì)外發(fā)布了一系列革命性的AI大模型,命名為o1系列。這一新模型在復(fù)雜推理能力方面取得了顯著突破,展現(xiàn)出前所未有的問題解決能力,尤其在科學(xué)、數(shù)學(xué)和編程等專業(yè)領(lǐng)域表現(xiàn)卓越,引發(fā)業(yè)界廣泛關(guān)注。
o1系列的首款模型o1-preview已在ChatGPT和大模型API中推出。該模型在多項(xiàng)高難度基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,相較于前代模型GPT-4o有質(zhì)的飛躍。在國(guó)際數(shù)學(xué)奧林匹克(IMO)資格考試中,o1模型正確解答了83%的問題,而GPT-4o僅為13%。這一成績(jī)相當(dāng)于美國(guó)數(shù)學(xué)競(jìng)賽前500名的水平,甚至超過(guò)了美國(guó)數(shù)學(xué)奧林匹克競(jìng)賽的分?jǐn)?shù)線。
圖片
在編程能力方面,o1系列同樣表現(xiàn)出色。經(jīng)過(guò)進(jìn)一步訓(xùn)練的o1-ioi模型在2024年國(guó)際信息學(xué)奧林匹克競(jìng)賽(IOI)中獲得了213分,達(dá)到了排名前49%的水平。在模擬的Codeforces競(jìng)賽中,o1模型的Elo評(píng)分為1807,表現(xiàn)優(yōu)于93%的人類競(jìng)爭(zhēng)對(duì)手。
圖片
OpenAI在o1系列的開發(fā)中創(chuàng)新性地運(yùn)用了強(qiáng)化學(xué)習(xí)技術(shù)。這種方法使模型能夠像人類一樣在回答問題前進(jìn)行深入思考,形成"思維鏈"(Chain of Thought)。通過(guò)這種方式,模型能夠識(shí)別并糾正錯(cuò)誤,嘗試不同策略,從而大幅提高其推理能力。OpenAI發(fā)現(xiàn),隨著更多的強(qiáng)化學(xué)習(xí)訓(xùn)練和更長(zhǎng)的思考時(shí)間,o1的性能持續(xù)提升。
除了o1-preview,OpenAI還推出了更快速、更經(jīng)濟(jì)的o1-mini版本。o1-mini在STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué))領(lǐng)域的表現(xiàn)與o1-preview相當(dāng),但成本降低了80%,為開發(fā)者提供了更高效的解決方案。在高中AIME數(shù)學(xué)競(jìng)賽中,o1-mini的表現(xiàn)(70.0%)與o1(74.4%)相當(dāng),遠(yuǎn)超o1-preview(44.6%)。
圖片
在安全性方面,OpenAI表示,思維鏈推理為模型安全和對(duì)齊提供了新的思路。通過(guò)將行為策略整合到模型的思維鏈中,可以更有效、穩(wěn)健地教導(dǎo)人類價(jià)值觀和原則。o1-preview在關(guān)鍵越獄評(píng)估和內(nèi)部安全基準(zhǔn)上都取得了顯著改進(jìn)。
圖片
目前,ChatGPT Plus和Team版用戶已可有限度使用這些新模型。每位用戶每周可向o1-preview發(fā)送30條消息,向o1-mini發(fā)送50條消息。企業(yè)版和教育版用戶將從下周開始可以使用這兩個(gè)模型。對(duì)于API用戶,達(dá)到5級(jí)API使用量的開發(fā)者可以立即開始使用這兩個(gè)模型開發(fā)應(yīng)用原型,但限速為20 RPM。
圖片
OpenAI表示,未來(lái)將持續(xù)改進(jìn)模型性能,并計(jì)劃添加網(wǎng)絡(luò)瀏覽、文件和圖像上傳等功能,以提升模型的實(shí)用性。同時(shí),公司還將繼續(xù)開發(fā)和發(fā)布GPT系列模型。
這一突破性進(jìn)展不僅再次證明了OpenAI在AI領(lǐng)域的領(lǐng)先地位,也為AI在科學(xué)研究、編程、數(shù)學(xué)等專業(yè)領(lǐng)域的應(yīng)用開辟了新的可能性。o1系列模型的發(fā)布標(biāo)志著AI技術(shù)進(jìn)入了一個(gè)新的發(fā)展階段,有望在解決復(fù)雜問題、推動(dòng)科技創(chuàng)新等方面發(fā)揮更大的作用,為人類社會(huì)帶來(lái)深遠(yuǎn)影響。
本文轉(zhuǎn)載自 ??芝士AI吃魚??,作者: 愛滑冰的咸魚
