OpenAI內(nèi)測Sora圖像生成器,代號「papaya」,DALL-E 4即將推出?
一則非常重要的消息:除了已有的視頻生成功能,OpenAI 似乎還在為 Sora 推出圖像生成功能做準(zhǔn)備。
OpenAI 正在內(nèi)部測試這些圖像生成功能:包括一個新的隱藏切換按鈕,能允許用戶在提示欄中直接在視頻和圖像生成之間切換。如果切換到圖像,提示欄的描述會提示你描述一幅圖像。
OpenAI 還對 Sora 的視頻推送進行了改版,將其分為「Best」和「Top」兩個類別?!窧est」很可能與目前的特色頻道類似。不過,「Top」類別可能允許按某個時間段進行篩選,并可能根據(jù)點贊數(shù)或其他標(biāo)準(zhǔn)對視頻進行排名。
OpenAI 的這個動作讓很多人重新興奮起來,因為現(xiàn)有的 DALL-E 3 已經(jīng)非常過時了 —— 至少和 Midjourney 比起來是這樣。
該功能目前還未投入使用,但左側(cè)導(dǎo)航欄上還有一個「Images Internal」類別。目前,它打開的是視頻推送。不過,將來用戶也有可能在這里找到圖片推送。目前還不清楚 OpenAI 將添加何種圖像生成功能,也不清楚將由哪款模型提供。
有人猜測我們可能會「在某個時候看到 DALL-E 4」,但 OpenAI 官方?jīng)]有對此進行確認(rèn)。
但 Sora 中的圖像生成模型應(yīng)該不是 DALL-E 4。OpenAI 在去年首次發(fā)布 Sora 時就提到了圖像生成功能,所以一種可能是:它將由現(xiàn)有的「sora-turbo」模型驅(qū)動。
此外,有人突然想起:我們還沒有在 ChatGPT 上看到來自 GPT-4o 的多模態(tài)圖像生成功能。
還有消息說,Sora 中的文本到圖像生成器代號為「papaya」:
回想起來,OpenAI 發(fā)布 DALL-E 3 距今也有一年半了,下一代模型會有怎樣的創(chuàng)新?你有何期待?
參考鏈接:https://x.com/testingcatalog/status/1888256244063838527