自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<samp id="cel3p"></samp>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

ControlNet作者又出爆款！一張圖生成繪畫全過程，兩天狂攬1.4k Star 精華

輕薄滴假象

發(fā)布于 2024-7-12 08:27

瀏覽

0收藏

ControlNet 作者 Lvmin Zhang 又開始整活了！這次瞄準繪畫領(lǐng)域。

新項目 PaintsUndo 剛上線不久，就收獲 1.4k star（還在瘋狂漲）。

ControlNet作者又出爆款！一張圖生成繪畫全過程，兩天狂攬1.4k Star-AI.x社區(qū)

項目地址：https://github.com/lllyasviel/Paints-UNDO

通過該項目，用戶輸入一張靜態(tài)圖像，PaintsUndo 就能自動幫你生成整個繪畫的全過程視頻，從線稿到成品都有跡可循。

ControlNet作者又出爆款！一張圖生成繪畫全過程，兩天狂攬1.4k Star-AI.x社區(qū)

繪制過程，線條變化多端甚是神奇，最終視頻結(jié)果和原圖像非常相似：

ControlNet作者又出爆款！一張圖生成繪畫全過程，兩天狂攬1.4k Star-AI.x社區(qū)

我們再來看一個完整的繪畫過程。PaintsUndo 先是用簡單的線條勾勒出人物主體，然后畫出背景，涂上顏色，最后精調(diào)成和原圖相似。

ControlNet作者又出爆款！一張圖生成繪畫全過程，兩天狂攬1.4k Star-AI.x社區(qū)

PaintsUndo 不止局限于單一圖像風格，對于不同類型的圖像，也會生成相應(yīng)的繪畫過程視頻。

ControlNet作者又出爆款！一張圖生成繪畫全過程，兩天狂攬1.4k Star-AI.x社區(qū)

戴著頭巾的柯基犬眼神溫柔地望向遠方：

ControlNet作者又出爆款！一張圖生成繪畫全過程，兩天狂攬1.4k Star-AI.x社區(qū)

用戶也可以輸入單張圖像，輸出多個視頻：

ControlNet作者又出爆款！一張圖生成繪畫全過程，兩天狂攬1.4k Star-AI.x社區(qū)

不過，PaintsUndo 也存在缺點，比如處理復(fù)雜的構(gòu)圖存在困難，作者表示項目還在不斷完善。

ControlNet作者又出爆款！一張圖生成繪畫全過程，兩天狂攬1.4k Star-AI.x社區(qū)

PaintsUndo 之所以如此強大，背后是一系列模型的支持，它們以圖像作為輸入，然后輸出該圖像的繪制序列。模型復(fù)現(xiàn)了各種人類行為，包括但不限于素描、上墨、著色、陰影、變換、左右翻轉(zhuǎn)、顏色曲線調(diào)整、更改圖層的可見性，甚至在繪制過程中更改整體思路。

本地部署過程非常簡單，幾行代碼就能完成：

git clone https://github.com/lllyasviel/Paints-UNDO.git

cd Paints-UNDO

conda create -n paints_undo pythnotallow=3.10

conda activate paints_undo

pip install xformers

pip install -r requirements.txt

python gradio_app.py

模型介紹

項目作者在 Nvidia 4090 和 3090TI 上使用 24GB VRAM 進行推理測試。作者估計，在極端優(yōu)化（包括權(quán)重卸載和注意力切片）的情況下，理論上 VRAM 需求最小約為 10-12.5 GB。PaintsUndo 預(yù)計可以在大約 5 到 10 分鐘內(nèi)處理一張圖像，具體取決于相關(guān)設(shè)置，通常會得到時長 25 秒，分辨率為 320x512、512x320、384x448 或 448x384 的視頻。

目前該項目發(fā)布了兩個模型：單幀模型 paints_undo_single_frame 和多幀模型 paints_undo_multi_frame。

單幀模型采用 SD1.5 的修改架構(gòu)，以一幅圖像和一個操作步驟作為輸入，輸出一幅圖像。假設(shè)一件藝術(shù)品通常需要經(jīng)過 1000 次人工操作才能創(chuàng)作出來（例如一筆是一次操作），那么操作步長是 0-999 之間的整數(shù)。數(shù)字 0 是最終完成的藝術(shù)品，數(shù)字 999 是在純白畫布上繪制的第一筆。

多幀模型基于 VideoCrafter 系列模型，但沒有使用原始 Crafter 的 lvdm，所有訓練 / 推理代碼完全從頭開始實現(xiàn)。項目作者對神經(jīng)網(wǎng)絡(luò)的拓撲進行了很多修改，并且經(jīng)過大量訓練后，神經(jīng)網(wǎng)絡(luò)的行為與原始 Crafter 有很大不同。

多幀模型的整體架構(gòu)類似于 Crafter，包含 5 個組件：3D-UNet、VAE、CLIP、CLIP-Vision、Image Projection。

多幀模型以兩幅圖像作為輸入，輸出兩幅輸入圖像之間的 16 個中間幀。多幀模型的結(jié)果比單幀模型更加一致，但速度也慢得多，「創(chuàng)意」更少，并且僅限于 16 幀。

PaintsUndo 默認一起使用單幀模型和多幀模型。首先會用單幀模型推斷大約 5-7 次，得到 5-7 個「關(guān)鍵幀」，然后使用多幀模型對這些關(guān)鍵幀進行「插值」，最終生成一個相對較長的視頻。

本文轉(zhuǎn)自機器之心，作者：機器之心

原文鏈接:??https://mp.weixin.qq.com/s/3vSNOXFGiIqs-OB0xwmhTw??

標簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

開源版AI程序員來了：GPT-4加持，能力比肩Devin，一天1.4k Star

輕薄滴假象 ? 3800瀏覽 ? 0回復(fù)
AI大神Karpathy新項目剛上線就狂攬2.5k星

duhorse ? 2868瀏覽 ? 0回復(fù)
一張照片+音頻即可生成數(shù)字人

duhorse ? 2138瀏覽 ? 0回復(fù)
ControlNet作者新作爆火：P照片換背景不求人，AI打光完美融入

Crystalcxt ? 3147瀏覽 ? 0回復(fù)
從零復(fù)現(xiàn)Llama3代碼庫爆火，大神Kapathy一鍵三連，GitHub狂攬2k+

Crystalcxt ? 2314瀏覽 ? 0回復(fù)
ControlNet作者搞起大模型：讓天下沒有難寫的生圖提示詞，一句話變構(gòu)圖小作文

Crystalcxt ? 2891瀏覽 ? 0回復(fù)
快手可靈團隊最新開源項目火了：大叔實時變身少女，GitHub狂攬7.5K星

Crystalcxt ? 2709瀏覽 ? 0回復(fù)
只要一張圖就能「還原」繪畫過程，這篇論文比爆火的Paints-UNDO實現(xiàn)得更早

輕薄滴假象 ? 2513瀏覽 ? 0回復(fù)
怎么用ai文字生成繪畫圖？一分鐘教你學會ai文生圖

行走的小非 ? 3380瀏覽 ? 0回復(fù)
只需一張圖片！實現(xiàn)任意3D/4D場景生成！港科大&清華&生數(shù)發(fā)布DimensionX

angel ? 4141瀏覽 ? 0回復(fù)
李飛飛的“空間魔術(shù)”：一張圖生成可探索的3D世界

云原生AI百寶箱 ? 3485瀏覽 ? 0回復(fù)
ICLR 2025驚現(xiàn)滿分論文，ControlNet作者再出佳作

AI論文解讀 ? 4804瀏覽 ? 0回復(fù)
苦于 DeepSeek 無法生成 PPT？那是你沒結(jié)合這兩款 AI 工具一起用

wsp_ping ? 3295瀏覽 ? 0回復(fù)
微軟發(fā)布創(chuàng)新大模型：一張圖片就能生成游戲，游戲界ChatGPT來了

Aceryt ? 1701瀏覽 ? 0回復(fù)
一張圖生成舞蹈視頻！字節(jié)等發(fā)布黑科技X-Dancer：零樣本音樂驅(qū)動，真實感碾壓3D方案

angel ? 1804瀏覽 ? 0回復(fù)
又一爆款！港大&字節(jié)開源GigaTok首次破解圖像重建與生成矛盾，30億參數(shù)登頂SOTA！

angel ? 1285瀏覽 ? 0回復(fù)
ControlNet作者：視頻生成論文Frameback，超低顯存生成高質(zhì)量視頻，ComfyUI必備組件！

石映飛云 ? 890瀏覽 ? 0回復(fù)
只需一張圖，萬物皆可插！Insert Anything開源啦！開創(chuàng)AI圖像插入新時代｜浙大&哈佛等

angel ? 1315瀏覽 ? 0回復(fù)
只需一張圖，一鍵生成沉浸式4D全景世界！HoloTime重塑VR/AR體驗（北大等）

angel ? 700瀏覽 ? 0回復(fù)

輕薄滴假象

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

DeepSeek一口氣開源3個項目，還有梁文鋒親自參與，昨晚API大降價 2025-02-27 12:40:06發(fā)布
全球首個AI CUDA工程師來了！將PyTorch原生實現(xiàn)提速10-100倍 2025-02-21 13:20:31發(fā)布

熱門推薦

擺脫云端限制！Qwen3+MCP+Ollama 本地工具調(diào)用實戰(zhàn)教程 0回復(fù)

Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 1回復(fù)

2025年最值得關(guān)注的十大多模態(tài)大語言模型！ 0回復(fù)

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復(fù)

從零到一構(gòu)建Agent系統(tǒng)：四大模塊 + 框架生態(tài)詳解 0回復(fù)

上一篇： ICML 2024高分論文 | 零階優(yōu)化器微調(diào)大模型，大幅降低內(nèi)存

下一篇： CVPR'24 Highlight｜一個框架搞定人物動作生成，精細到手部運動

社區(qū)精華內(nèi)容

目錄