自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

DeepSeek開源Janus-Pro-7B:多模態(tài)AI模型性能超越DALL-E 3 和 Stable Diffusion 3!

人工智能 新聞
DeepSeek又宣布開源新一代多模態(tài)模型Janus-Pro-7B,該模型在圖像生成、視覺問答等任務(wù)中全面超越 OpenAI 的 DALL-E 3 和 Stable Diffusion 3,并以“理解-生成雙路徑”架構(gòu)和極簡部署方案引發(fā)AI社區(qū)轟動。

中國人工智能公司 DeepSeek 的 R1“推理”人工智能已經(jīng)引起了廣泛關(guān)注,位居應(yīng)用商店排行榜首位并改變了股市。隨后DeepSeek又宣布開源新一代多模態(tài)模型Janus-Pro-7B,該模型在圖像生成、視覺問答等任務(wù)中全面超越 OpenAI 的 DALL-E 3 和 Stable Diffusion 3,并以“理解-生成雙路徑”架構(gòu)和極簡部署方案引發(fā)AI社區(qū)轟動。

性能表現(xiàn):小模型吊打行業(yè)巨頭

Janus-Pro-7B雖僅有70億參數(shù)(約為GPT-4的1/25),卻在關(guān)鍵測試中碾壓對手:

  • 文生圖質(zhì)量:在GenEval測試中以80%準(zhǔn)確率擊敗DALL-E 3(67%)和Stable Diffusion 3(74%)
  • 復(fù)雜指令理解:在DPG-Bench測試中達(dá)84.19%準(zhǔn)確率,能精準(zhǔn)生成如“山腳下有藍(lán)色湖泊的雪山”等復(fù)雜場景
  • 多模態(tài)問答:視覺問答準(zhǔn)確率超越GPT-4V,MMBench測試得分79.2分接近專業(yè)分析模型

技術(shù)突破:像“雙面神”分工協(xié)作

傳統(tǒng)模型讓同一套視覺編碼器既理解圖片又生成圖片,如同讓廚師同時設(shè)計菜單和炒菜。Janus-Pro-7B創(chuàng)新地將視覺處理拆分為兩條獨(dú)立路徑:

  • 理解路徑:用SigLIP-L視覺編碼器快速提取圖片核心信息(如“這是一只橘貓在沙發(fā)上”)
  • 生成路徑:通過VQ分詞器將圖像分解為像素點(diǎn)陣,像拼樂高一樣逐步繪制細(xì)節(jié)(如毛發(fā)紋理、光影效果) 這種“分頭行動”的設(shè)計解決了傳統(tǒng)模型的角色沖突問題,訓(xùn)練時還混合了7200萬張合成圖像與真實數(shù)據(jù),提升生成穩(wěn)定性。

開源與商業(yè)使用

  • 免費(fèi)商用:采用MIT開源協(xié)議,允許無限制商業(yè)使用
  • 極簡部署:提供1.5B(需16GB顯存)和7B(需24GB顯存)版本,普通顯卡即可運(yùn)行
  • 一鍵生成:官方提供Gradio交互界面,輸入generate_image(prompt="夕陽下的雪山", num_images=4)即可批量出圖

相關(guān)鏈接

  • GitHub倉庫:https://github.com/deepseek-ai/Janus
  • 模型下載:https://huggingface.co/deepseek-ai/Janus-Pro-7B

應(yīng)用場景:從藝術(shù)到隱私保護(hù)

  • 創(chuàng)意產(chǎn)業(yè):設(shè)計師輸入文本生成海報原型,游戲開發(fā)者快速構(gòu)建場景素材
  • 教育工具:教師用模型生成火山噴發(fā)動態(tài)示意圖輔助地理教學(xué)
  • 企業(yè)隱私:醫(yī)院、銀行可本地部署,避免患者病歷、金融數(shù)據(jù)上傳云端
  • 文化傳播:能識別全球地標(biāo)并生成帶文化符號的圖片
責(zé)任編輯:張燕妮 來源: AIGC Studio
相關(guān)推薦

2025-02-07 10:21:42

AI生成模型

2024-03-06 13:58:00

測評模型

2023-08-02 16:09:16

2023-11-13 07:03:13

OpenAI一致性解碼器

2023-10-20 08:26:50

2022-08-31 08:54:57

AIDALL-E 2OpenAI

2023-11-28 09:42:07

OpenAIWindows 11

2022-08-17 15:52:24

AI

2025-05-06 08:40:00

2024-06-13 17:45:16

2024-03-01 13:31:06

2024-02-19 00:09:49

開源模型

2024-02-04 12:04:37

OpenAI微軟漏洞

2025-04-10 09:15:00

模型AI數(shù)據(jù)

2023-09-21 07:54:22

人工智能DALL-E 3

2023-12-20 07:22:03

DALL-E 3微軟鍵盤

2025-02-05 12:53:21

2023-04-07 08:13:35

AIChatGPTDall-E 2

2024-06-12 13:58:00

2022-06-06 14:29:20

圖像模型任務(wù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號