自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

OpenAI模型終于更新!強(qiáng)大視聽(tīng)能力的GPT-4o將面向所有用戶,其前身正是神秘的gpt2! 原創(chuàng)

發(fā)布于 2024-5-14 13:48
瀏覽
0收藏

編輯 | 伊風(fēng)

出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)

春季終于如約而至!GPT系列的模型終于等到了久違的更新——GPT-4o浮出水面。

而且此前頗具神秘氣息的“im-also-a-good-gpt2-chatbot”,正是其測(cè)試版本。

本場(chǎng)更新并未見(jiàn)到奧特曼的身影,而是由OpenAI CTO 穆里-穆拉提(Muri Murati)主持。此前她曾因?yàn)樵诓稍L中對(duì)OpenAI的訓(xùn)練數(shù)據(jù)語(yǔ)焉不詳而受到過(guò)一些爭(zhēng)議。

OpenAI在春季發(fā)布上都說(shuō)了啥呢?一句話概括,GPT-4o更快、更多模態(tài)、而且更加便宜了!

OpenAI模型終于更新!強(qiáng)大視聽(tīng)能力的GPT-4o將面向所有用戶,其前身正是神秘的gpt2!-AI.x社區(qū)圖片

1.最新模型GPT-4o

讓奧特曼直呼“amazing work”的模型更新來(lái)了!

OpenAI模型終于更新!強(qiáng)大視聽(tīng)能力的GPT-4o將面向所有用戶,其前身正是神秘的gpt2!-AI.x社區(qū)圖片

可以看到GPT-4o的性能一騎絕塵。(題外話,通義千問(wèn)大模型在這張圖的右側(cè)默默上榜了)。

新的大型語(yǔ)言模型是在互聯(lián)網(wǎng)的海量數(shù)據(jù)基礎(chǔ)上訓(xùn)練出來(lái)的,將更擅長(zhǎng)處理文本和音頻,并可處理 50 種語(yǔ)言。

OpenAI 更新的 GPT-4o 生成式人工智能模型,將在未來(lái)幾周內(nèi)正式面向開(kāi)發(fā)者和消費(fèi)者推出。新模型將面向所有用戶,穆拉提補(bǔ)充說(shuō),付費(fèi)用戶將繼續(xù) "擁有五倍于免費(fèi)用戶的容量限制"。

OpenAI 首席技術(shù)官穆里-穆拉提(Muri Murati)說(shuō),GPT-4o 提供了 "GPT-4 級(jí) "的智能,但改進(jìn)了 GPT-4 在文本、視覺(jué)和音頻方面的能力。

"穆拉提在 OpenAI 辦公室舉行的主題演講中說(shuō):"GPT-4o 的優(yōu)勢(shì)在于它能跨越語(yǔ)音、文本和視覺(jué)。"這一點(diǎn)非常重要,因?yàn)槲覀冋谡雇祟惻c機(jī)器互動(dòng)的未來(lái)。

GPT-4是OpenAI之前的領(lǐng)先模型,它是由圖像和文本組合訓(xùn)練而成的,可以分析圖像和文本,完成從圖像中提取文本甚至描述圖像內(nèi)容等任務(wù)。但 GPT-4o 在此基礎(chǔ)上增加了語(yǔ)音功能。

這吻合了此前大家猜測(cè)的方向:“ChatGPT+Voice Agent”!

OpenAI模型終于更新!強(qiáng)大視聽(tīng)能力的GPT-4o將面向所有用戶,其前身正是神秘的gpt2!-AI.x社區(qū)英偉達(dá)的科學(xué)家Jim Fan在更新直播前的預(yù)測(cè)


2.GPT-4o強(qiáng)大的“視聽(tīng)”能力

OpenAI 首席執(zhí)行官山姆-阿爾特曼(Sam Altman)發(fā)布消息稱,該模型是 "原生多模態(tài) "的,這意味著該模型可以生成內(nèi)容或理解語(yǔ)音、文本或圖像命令。

GPT-4o在語(yǔ)音方面具體可以實(shí)現(xiàn)什么呢?

GPT-4o 極大地改善了 ChatGPT 的體驗(yàn)--ChatGPT 是 OpenAI 的病毒式人工智能聊天機(jī)器人。ChatGPT 長(zhǎng)期以來(lái)一直提供語(yǔ)音模式,使用文本到語(yǔ)音模型轉(zhuǎn)錄 ChatGPT 中的文本。但 GPT-4o 對(duì)此進(jìn)行了改進(jìn),讓用戶可以更像使用助手一樣與 ChatGPT 互動(dòng)。

例如,用戶可以向由 GPT-4o 支持的 ChatGPT 提問(wèn),并在 ChatGPT 回答時(shí)打斷它。OpenAI 表示,該模型可以提供 "實(shí)時(shí) "響應(yīng),甚至可以捕捉用戶聲音中的情感,并生成 "一系列不同情感風(fēng)格 "的語(yǔ)音。

GPT-4o 還提高了 ChatGPT 的視覺(jué)能力。如果給定一張照片或一個(gè)桌面屏幕,ChatGPT 現(xiàn)在可以快速回答相關(guān)問(wèn)題,從 "這個(gè)軟件代碼是怎么回事 "到 "這個(gè)人穿的是什么牌子的襯衫?"

"穆拉提說(shuō):"我們知道這些模型越來(lái)越復(fù)雜,但我們希望交互體驗(yàn)實(shí)際上變得更加自然、輕松,讓你完全不用關(guān)注用戶界面,而只關(guān)注與 [GPT] 的協(xié)作。

OpenAI 聲稱,GPT-4o 的多語(yǔ)言性也更強(qiáng),在 50 種不同語(yǔ)言中的性能都有所提高。Altman 在 X 上補(bǔ)充說(shuō),想要使用 GPT-4o 的開(kāi)發(fā)者可以訪問(wèn) API,其價(jià)格是 GPT-4-turbo 的一半,速度是 GPT-4-turbo 的兩倍。

3.寫(xiě)在最后

OpenAI具有強(qiáng)大音頻能力的模型GPT-4o的推出,讓我們進(jìn)一步看到了虛擬助手的未來(lái)。

有知情的科技博主表示,此時(shí)的發(fā)布也是OpenAI和蘋(píng)果已經(jīng)達(dá)成交易的信號(hào)。這意味著Siri的未來(lái)可能是由ChatGPT進(jìn)行支持的!

OpenAI模型終于更新!強(qiáng)大視聽(tīng)能力的GPT-4o將面向所有用戶,其前身正是神秘的gpt2!-AI.x社區(qū)圖片

如果OpenAI與微軟、蘋(píng)果都牽起了手,那么谷歌這個(gè)"AI屆汪峰"真的要陷入孤軍奮戰(zhàn)的尷尬中了。

明天,谷歌的開(kāi)發(fā)者大會(huì)將如約而至。OpenAI 趕在此時(shí)發(fā)布產(chǎn)品更新頗有些搶奪谷歌風(fēng)頭的意思!

那么,你認(rèn)為谷歌發(fā)布什么產(chǎn)品才可以為自己扳回一局呢?

參考鏈接:

1.https://techcrunch.com/2024/05/13/openais-newest-model-is-gpt-4o/

2.??https://www.theverge.com/2024/5/13/24155493/openai-gpt-4o-launching-free-for-all-chatgpt-users?showComments=1??

本文轉(zhuǎn)載自51CTO技術(shù)棧,作者:伊風(fēng)

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦