自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

3D人臉黑科技!Pixel3DMM:單張RGB圖像秒變3D人臉,姿勢表情精準還原,幾何精度碾壓競品15%!

發(fā)布于 2025-5-14 07:00
瀏覽
0收藏

慕尼黑工業(yè)大學和倫敦大學學院提出了一款經過微調的 DINO ViT模型 Pixel3DMM,用于逐像素表面法線和 UV 坐標預測。從上到下,下圖展示了 FFHQ 輸入圖像、估計的表面法線、根據(jù)預測的 UV 坐標估計的二維頂點,以及針對上述兩個線索的 FLAME 擬合結果。

3D人臉黑科技!Pixel3DMM:單張RGB圖像秒變3D人臉,姿勢表情精準還原,幾何精度碾壓競品15%!-AI.x社區(qū)圖片

使用Pixel3DMM 進行野外追蹤。

從左到右:輸入、預測法線、預測二維頂點、跟蹤覆蓋、FLAME 跟蹤。

3D人臉黑科技!Pixel3DMM:單張RGB圖像秒變3D人臉,姿勢表情精準還原,幾何精度碾壓競品15%!-AI.x社區(qū)

單幅圖像重建

給定一個輸入圖像(右上),下圖展示了 DECA、FlowFace 和 Ours 相對于地面真實 COLMAP 點云的幾何重建。

3D人臉黑科技!Pixel3DMM:單張RGB圖像秒變3D人臉,姿勢表情精準還原,幾何精度碾壓競品15%!-AI.x社區(qū)

給定一個輸入圖像(右上),我們展示了 DECA、FlowFace 和 Ours 相對于地面真實 COLMAP 點云的中性幾何重建。

3D人臉黑科技!Pixel3DMM:單張RGB圖像秒變3D人臉,姿勢表情精準還原,幾何精度碾壓競品15%!-AI.x社區(qū)

相關鏈接

論文介紹

我們致力于從單張 RGB 圖像進行人臉的 3D 重建。為此,我們提出了 Pixel3DMM,這是一組高度泛化的視覺變換器,能夠預測每個像素的幾何線索,從而限制 3D 可變形人臉模型 (3DMM) 的優(yōu)化。我們利用 DINO 基礎模型的潛在特征,并引入了定制的表面法線和 uv 坐標預測頭。我們通過將三個高質量的 3D 人臉數(shù)據(jù)集與 FLAME 網(wǎng)格拓撲進行配準來訓練我們的模型,最終共計生成超過 1,000 個身份和 976,000 張圖像。對于 3D 人臉重建,我們提出了一種 FLAME 擬合優(yōu)化方法,該方法可以根據(jù) uv 坐標和法線估計值求解 3DMM 參數(shù)。為了評估我們的方法,我們引入了一個用于單圖像人臉重建的新基準,該基準具有高度多樣化的面部表情、視角和種族特征。至關重要的是,我們的基準是第一個同時評估姿勢面部和中性面部幾何形狀的基準。最終,我們的方法在姿勢面部表情的幾何精度方面比最具競爭力的基線高出 15% 以上。

方法概述

3D人臉黑科技!Pixel3DMM:單張RGB圖像秒變3D人臉,姿勢表情精準還原,幾何精度碾壓競品15%!-AI.x社區(qū)

  • 左圖:我們的網(wǎng)絡由 DINO 主干網(wǎng)絡和輕量級預測頭組成。我們在 NPHM、FaceScape 和 Ava256 數(shù)據(jù)集上訓練模型,并使用 FLAME 和非剛性配準將這些數(shù)據(jù)集轉換為統(tǒng)一的格式。
  • 右圖:在推理階段,我們使用法線和 UV 坐標預測作為 FLAME 擬合過程中的優(yōu)化目標。雖然法線約束很簡單,但我們首先使用最近鄰查找法預測二維頂點位置,從而將 UV 坐標預測納入其中。

實驗結果

表面法線估計

給定一個輸入圖像(左),下圖展示了幾個表面法線估計器(右上)和誤差圖(右下)的預測

3D人臉黑科技!Pixel3DMM:單張RGB圖像秒變3D人臉,姿勢表情精準還原,幾何精度碾壓競品15%!-AI.x社區(qū)

3D人臉黑科技!Pixel3DMM:單張RGB圖像秒變3D人臉,姿勢表情精準還原,幾何精度碾壓競品15%!-AI.x社區(qū)

3D人臉黑科技!Pixel3DMM:單張RGB圖像秒變3D人臉,姿勢表情精準還原,幾何精度碾壓競品15%!-AI.x社區(qū)

本文轉載自?????AIGC Studio?????,作者:AIGC Studio 

收藏
回復
舉報
回復
相關推薦