自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<pre id="dvelf"><strike id="dvelf"><input id="dvelf"></input></strike></pre>

<sub id="dvelf"><big id="dvelf"></big></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

3D生成競技場來了！比拼360°環(huán)繞視頻，最強模型由你pick

發(fā)布于 2024-5-28 12:56

瀏覽

0收藏

3D生成也有自個兒的人工評測競技場了～

來自復(fù)旦大學(xué)和上海AI lab的研究人員搞了個3DGen-Arena，和大語言模型的Chatbot-Arena、GenAI-Arena等一脈相承，要讓大伙兒對3D生成模型來一場公開、匿名的評測。

3D生成競技場來了！比拼360°環(huán)繞視頻，最強模型由你pick-AI.x社區(qū)

3DGen-Arena同樣是讓兩個模型進(jìn)行比較，分文生3D、圖生3D兩個賽道。

展示形式上考慮到3D生成的復(fù)雜性，3DGen-Arena同時提供3D資產(chǎn)的法線圖、無紋理幾何圖和貼紋理RGB圖的360°環(huán)繞視頻。

第一步點擊“Sample”選擇prompt（共有1000+條），第二步點擊“Send”讓模型生成，第三步分別從幾何合理性、幾何精細(xì)度、紋理質(zhì)量、幾何-紋理一致性、文本/圖像-3D一致性這5個維度上對模型投票，投完票就能看到背后模型的真面目了。

目前場上已有19個開源3D生成模型，其中9個文生3D模型，13個圖生3D模型。

3D生成競技場來了！比拼360°環(huán)繞視頻，最強模型由你pick-AI.x社區(qū)

3D生成競技場來了！比拼360°環(huán)繞視頻，最強模型由你pick-AI.x社區(qū)

除匿名投票外，3DGen-Arena還支持參與者與指定模型進(jìn)行比較，以及與單個模型交互。

已開賽，來pick

近兩年，得益于Diffusion模型在2D領(lǐng)域取得的巨大成功，以及Objaverse系列大規(guī)模3D數(shù)據(jù)集的開源，3D物體生成領(lǐng)域已經(jīng)進(jìn)入迅速發(fā)展階段，3D生成模型數(shù)量激增。

然鵝，如何科學(xué)、公平地評價這些模型成為了領(lǐng)域內(nèi)公認(rèn)的難題。

目前已有的3D評測指標(biāo)大多沿用了2D領(lǐng)域的范式。其中，Clip系列模型表現(xiàn)出的強大圖文對齊能力使得基于Clip的方法尤為受歡迎，如Clip-Similarity、Clip R-Precision等。

但由于2D和3D領(lǐng)域間存在不容忽視的域差異（domain gap），這類不具備3D先驗知識的2D指標(biāo)，在實際應(yīng)用中，常常并不能滿足人們的需要。

例如，3D工作者們關(guān)心的幾何合理性、3D一致性、紋理偽影等等關(guān)鍵問題，2D指標(biāo)遠(yuǎn)遠(yuǎn)無法達(dá)到令人滿意表征水平。

于是，目前工作中更具可信度的評價大多來自于定性的用戶評價（user-study），但缺少一個統(tǒng)一、多樣的prompt集，使得不同模型間的user-study并不那么容易對齊。

最近，因大語言模型以及多模態(tài)大模型表現(xiàn)出的優(yōu)異性能，出現(xiàn)了一些基于大模型問答的3D評測體系。但此類依賴黑盒模型的評測系統(tǒng)，可能會引入一些潛在的系統(tǒng)性誤差，而且不具備好的可解釋性。

3D生成評測是一項不適定問題（ill-posed problem），需要綜合考慮幾何質(zhì)量、紋理質(zhì)量、以及與輸入信息的匹配程度。

自動化評測系統(tǒng)的探索面臨很多技術(shù)難題，但令人振奮的是，語言和圖像領(lǐng)域為我們提供了人工評測的新思路。

由此，來自復(fù)旦大學(xué)和上海AI lab的開發(fā)者推出了3DGen-Arena。

為實現(xiàn)多維度、全方位的評估，3DGen-Arena劃分出的5個獨立維度各有側(cè)重，互為補充：

“幾何合理性”是3D模型的基本要求，能夠衡量生成模型習(xí)得的3D先驗水平；

“幾何精細(xì)度”則是更高層次的要求，是提升生成質(zhì)量的關(guān)鍵方向；

“紋理質(zhì)量”直接影響生成的3D資產(chǎn)的視覺效果，視角一致、富有美學(xué)的紋理貼圖是紋理優(yōu)化的目標(biāo)；

“幾何-紋理一致性”在現(xiàn)實世界中，常常被忽略。但在生成過程中，我們發(fā)現(xiàn)保證一致的貼圖并不總是容易的；

“文本/圖像-3D一致性”是條件生成方式的內(nèi)在要求，實現(xiàn)跨模態(tài)精準(zhǔn)控制是不斷追求的目標(biāo)。

3D生成競技場來了！比拼360°環(huán)繞視頻，最強模型由你pick-AI.x社區(qū)

除了匿名模型投票外，3DGen-Arena還允許參與者指定模型進(jìn)行比較，以及與單個模型交互，滿足社區(qū)的多樣需求。

開發(fā)人員表示，考慮到部分文生3D模型漫長的訓(xùn)練時長，以及復(fù)雜的數(shù)據(jù)后處理，目前3DGen-Arena暫不支持開放式輸入的在線生成功能。

但他們精心設(shè)計了1k+條prompt，其中文生3D和圖生3D各500余條，是現(xiàn)有其他評測系統(tǒng)prompt集數(shù)量的10倍（~10x），涵蓋了“交通工具”、“動物”、“植物”、“食物”、“室內(nèi)物品”、“室外物品”等6大基礎(chǔ)類別。

3D生成競技場來了！比拼360°環(huán)繞視頻，最強模型由你pick-AI.x社區(qū)

為了觀察3D生成模型對prompt復(fù)雜程度的敏感程度，除了單個物體生成外，開發(fā)人員還設(shè)計了物體間的多種排列組合方式，以及一些帶有交互的“微場景”。

截至目前，3DGen-Arena平臺已經(jīng)內(nèi)嵌了1w+個3D資產(chǎn)，可以提供5.8w組不同的比較對。

開發(fā)人員還表示，之后將繼續(xù)維護和完善3DGen-Arena：增添更多的開源、甚至閉源模型；定期維護、更新排名榜；上線支持開放式輸入的在線生成服務(wù)……

3D生成為何需要一個科學(xué)、全面、魯棒的評價體系？這當(dāng)中益處不言而喻。

一方面，通過質(zhì)量評測，深入理解現(xiàn)有生成模型的優(yōu)缺點，挖掘潛在的發(fā)展方向，進(jìn)而指導(dǎo)模型改進(jìn)和新算法的開發(fā)，不斷探索AIGC的能力邊界。

另一方面，多維度的3D質(zhì)量評測對實踐應(yīng)用有指導(dǎo)性作用，便于針對不同的下游需求，把握關(guān)鍵維度，權(quán)衡次要維度。

話不多說了，從事3D生成的或者對3D生成任務(wù)感興趣的家人們，快去pick你喜歡的模型吧～

本文轉(zhuǎn)自量子位，作者：量子位

原文鏈接:??https://mp.weixin.qq.com/s/VYdc4K-t9B7dYRGSoXWsLw??

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

開源模型首勝GPT-4！競技場最新戰(zhàn)報引熱議，Karpathy：這是我唯二信任的榜單

Crystalcxt ? 2129瀏覽 ? 0回復(fù)
GPT-4升級被曝引入Q*，推理/數(shù)學(xué)更強廢話更少，競技場重奪王位

Crystalcxt ? 2390瀏覽 ? 0回復(fù)
大模型競技場全面測評結(jié)果出爐：Llama3 70B成開源模型中最強王者！

AIGC最前線 ? 5821瀏覽 ? 0回復(fù)
無需3D數(shù)據(jù)也能訓(xùn)練，港科&港中文聯(lián)手華為推出3D自動駕駛場景生成模型

Crystalcxt ? 2792瀏覽 ? 0回復(fù)
2D頭像生成3D虛擬人開視頻會，谷歌新作讓人難繃

輕薄滴假象 ? 2188瀏覽 ? 0回復(fù)
浙大、螞蟻集團推出MaPa：文本生成超真實3D模型

Aceryt ? 2967瀏覽 ? 0回復(fù)
首個多模態(tài)視頻競技場Video-MME來了！Gemini全面超越GPT-4o，Jeff Dean連轉(zhuǎn)三次

duhorse ? 2520瀏覽 ? 0回復(fù)
DreamTech聯(lián)合南大和牛津發(fā)布最強3D內(nèi)容生成大模型——Direct3D

angel ? 2945瀏覽 ? 0回復(fù)
僅需1分鐘，文本生成高質(zhì)量3D模型—Meta 3D-Gen

Aceryt ? 3060瀏覽 ? 0回復(fù)
3D版"裁縫"開源來襲！Tailor3D:自定義3D編輯和資產(chǎn)生成（港大&上海AI-Lab&港中文）

angel ? 2458瀏覽 ? 0回復(fù)
開源視頻模型SV4D，一鍵創(chuàng)建8角度動態(tài)3D視頻

Aceryt ? 2826瀏覽 ? 0回復(fù)
ECCV 2024 | 引入DiT的原生3D通用框架，適用任意神經(jīng)場、秒級生成

輕薄滴假象 ? 2409瀏覽 ? 0回復(fù)
Lumina-T2X: 一款集成圖像、視頻、音頻和3D生成的多模態(tài)擴散模型

sword_hero ? 2709瀏覽 ? 0回復(fù)
精準(zhǔn)可控新視角視頻生成+場景級3D生成！北大&港中文&騰訊等開源ViewCrafter

angel ? 2560瀏覽 ? 0回復(fù)
麻省理工創(chuàng)新模型：用2D視頻擴散，生成 3D 視頻

Aceryt ? 2791瀏覽 ? 0回復(fù)
3D生成基礎(chǔ)模型來了！只需5秒，高質(zhì)量3D資產(chǎn)規(guī)?；?em>生成！南洋理工等重磅開源3DTopia-XL

angel ? 2389瀏覽 ? 0回復(fù)
生成任意3D和4D場景！GenXD：通用3D-4D聯(lián)合生成框架 | 新加坡國立&微軟

angel ? 2113瀏覽 ? 0回復(fù)
3D任意部位分割：FIND 3D模型實現(xiàn)零樣本開放世界文本查詢分割

AIGC最前線 ? 1959瀏覽 ? 0回復(fù)
革新3D材質(zhì)生成！Material Anything：端到端打造任意3D物體的高質(zhì)量材質(zhì)！

angel ? 2578瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

何愷明開辟分形圖像生成新范式！計算效率提高4000倍，首次實現(xiàn)高分辨率逐像素生成 2025-02-26 11:59:41發(fā)布
達(dá)摩院開源VideoLLaMA3：僅7B大小，視頻理解拿下SOTA | 在線可玩 2025-02-14 13:02:21發(fā)布

熱門推薦

擺脫云端限制！Qwen3+MCP+Ollama 本地工具調(diào)用實戰(zhàn)教程 0回復(fù)

Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 1回復(fù)

2025年最值得關(guān)注的十大多模態(tài)大語言模型！ 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

從零到一構(gòu)建Agent系統(tǒng)：四大模塊 + 框架生態(tài)詳解 0回復(fù)

上一篇：多模態(tài)CoT思維鏈架構(gòu)來了，現(xiàn)已開源｜來自廈大&騰訊優(yōu)圖

下一篇： Karpathy新教程爆火，網(wǎng)友搶著送他H100：從頭復(fù)現(xiàn)GPT-2訓(xùn)練

社區(qū)精華內(nèi)容

目錄