自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<big id="aqde9"><code id="aqde9"><option id="aqde9"></option></code></big>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

Gemini的AI生圖消失數(shù)月終重返！Imagen 3或成谷歌“大招”，為避免Deepfake絞盡腦汁，網(wǎng)友：最逼真的AI人像原創(chuàng)

51CTO技術(shù)棧

發(fā)布于 2024-8-30 17:02

瀏覽

0收藏

編輯 | 伊風(fēng)

出品 | 51CTO技術(shù)棧（微信號(hào)：blog51cto）

谷歌Gemini的AI生圖功能在漫長(zhǎng)的沉寂后官宣重返！并推出了重大升級(jí)后的模型Imagen 3！

此前，Gemini的這項(xiàng)功能因?yàn)檫^分注重“政治正確”而被群嘲。例如生成了黑人形象的華盛頓等等，在引起廣泛爭(zhēng)議之后，這項(xiàng)功能隨之被禁用。

現(xiàn)在，谷歌對(duì)其進(jìn)行了升級(jí)，并準(zhǔn)備在“未來幾天”向部分用戶進(jìn)行灰度測(cè)試，該早期版本暫時(shí)只支持英語(yǔ)。

時(shí)隔數(shù)月，想必Imagen 3被谷歌寄于厚望，準(zhǔn)備干票大的，“一雪前恥”。

Gemini的AI生圖消失數(shù)月終重返！Imagen 3或成谷歌“大招”，為避免Deepfake絞盡腦汁，網(wǎng)友：最逼真的AI人像-AI.x社區(qū) 圖片

谷歌本月早些時(shí)候通過其AI Test Kitchen推出了Imagen 3，悄悄試水。

Gemini的AI生圖消失數(shù)月終重返！Imagen 3或成谷歌“大招”，為避免Deepfake絞盡腦汁，網(wǎng)友：最逼真的AI人像-AI.x社區(qū) 圖片

現(xiàn)在它即將支持在Gemini中進(jìn)行使用。據(jù)說，升級(jí)后的工具能夠生成從逼真的風(fēng)景到紋理豐富的油畫，而且只需“幾個(gè)詞的描述”即可。

那么，Imagen 3的效果究竟如何？與搭載了FLUX模型的Gork-2誰(shuí)更能打？Gemini的生圖功能一落千丈的口碑還能撿起來嗎？

1.Imagen 3：足夠驚艷但來遲一步

谷歌周二宣布對(duì)其Gemini AI平臺(tái)進(jìn)行了重大更新，推出了“Gems”個(gè)性化AI助手和改進(jìn)的圖像生成模型Imagen 3。

谷歌的Imagen 3 AI模型生成的數(shù)字插圖展示了一個(gè)充滿活力的幻想場(chǎng)景，其中一只小龍正在從蛋殼中孵化出來。該圖像展示了該模型逼真的細(xì)節(jié)渲染和以及根據(jù)文字提示生成想象場(chǎng)景的能力。

Gemini的AI生圖消失數(shù)月終重返！Imagen 3或成谷歌“大招”，為避免Deepfake絞盡腦汁，網(wǎng)友：最逼真的AI人像-AI.x社區(qū) 圖片

推友@ChatGPT研究所試用后表示：生成圖像的質(zhì)量令人嘆為觀止。

Gemini的AI生圖消失數(shù)月終重返！Imagen 3或成谷歌“大招”，為避免Deepfake絞盡腦汁，網(wǎng)友：最逼真的AI人像-AI.x社區(qū) 圖片

prompt：夜晚近距離拍攝一位男性沖浪者，他正騎在海浪上，一支紅色照明彈舉過頭頂，表情緊張，臉上有輕微的胡茬。他以動(dòng)感姿勢(shì)站在沖浪板上，紅光照亮了翻騰的海浪，照明彈后面拖著火花和煙霧。背景是星空，畫面風(fēng)格逼真，色彩鮮艷，動(dòng)態(tài)感十足。

對(duì)比小編用GPT-4o生成的同一圖像，Gemini給的圖更加真實(shí)，且動(dòng)作也符合邏輯。

Gemini的AI生圖消失數(shù)月終重返！Imagen 3或成谷歌“大招”，為避免Deepfake絞盡腦汁，網(wǎng)友：最逼真的AI人像-AI.x社區(qū) 圖片

Gemini生成的女性肖像同樣表現(xiàn)優(yōu)越，給定的圖片中充滿了細(xì)節(jié)，皮膚的機(jī)理和肌肉都十分清晰，擺脫了之前AI重度磨皮的bug，讓人看起來非常舒適。

Gemini的AI生圖消失數(shù)月終重返！Imagen 3或成谷歌“大招”，為避免Deepfake絞盡腦汁，網(wǎng)友：最逼真的AI人像-AI.x社區(qū) 圖片

prompt：一位美麗的年輕女子的肖像，她穿著色彩鮮艷的藍(lán)色花卉圖案和服，頭上戴著飾有花朵的華麗發(fā)飾，臉上帶著溫柔的微笑。畫面采用暖色調(diào)照明，整體呈現(xiàn)出傳統(tǒng)的氛圍。

不過，谷歌似乎過于謹(jǐn)慎地進(jìn)行了漫長(zhǎng)的整改。

在經(jīng)過了FLUX深度偽造級(jí)別的TED照片，以及Grok-2各種生成梗圖的狂轟亂炸以后，谷歌Imagen 3在AI社區(qū)激起的浪花稍顯不足。

2.Deepfake：如何在道德保障下推動(dòng)AI生成圖像的邊界

在收回Gemini的生圖功能之后，谷歌此番動(dòng)作變得更為謹(jǐn)慎。

在生成人物圖像方面，谷歌寄于了更多的限制。包括不再生成逼真的公共人物圖像，以及拒絕暴力色情相關(guān)的請(qǐng)求。

為應(yīng)對(duì)對(duì)深度偽造和錯(cuò)誤信息的擔(dān)憂，谷歌實(shí)施了安全措施，包括SynthID水印技術(shù)。然而，這些措施的有效性尚待觀察，可能會(huì)引發(fā)關(guān)于負(fù)責(zé)任的AI開發(fā)和使用的持續(xù)爭(zhēng)論。

然而，谷歌的擔(dān)憂并非空穴來風(fēng)，所做的種種限制也絕非多此一舉。

近期，韓國(guó)就爆出了一起利用AI深度偽造（Deepfake）的社會(huì)事件，被看作是采用新犯罪手段的“N號(hào)房”卷土重來。

不法分子們使用AI技術(shù)，將個(gè)人的聲音、面部表情及身體動(dòng)作拼接合成虛假內(nèi)容并進(jìn)行傳播。韓國(guó)網(wǎng)民在通訊軟件“電報(bào)”（Telegram）上發(fā)現(xiàn)大量聊天群，其中有成員創(chuàng)建和分享露骨的性“深度偽造”圖像，對(duì)象甚至涉及未成年女孩。

據(jù)外媒報(bào)道，在付費(fèi)Deepfake電報(bào)頻道中，男性訂閱用戶提供女性照片，交錢后由頻道制作成色情圖片。目前全國(guó)涉及深度偽造犯罪的人數(shù)可能達(dá)到22萬(wàn)，眾多女性因此陷入不安和恐懼之中。

為了反擊，韓國(guó)警方開始研究Deepfake的檢測(cè)技術(shù)。據(jù)警方透露，如果在相關(guān)軟件上傳疑似人工智能深偽的視頻，大約5至10分鐘就能辨別真?zhèn)?。警方表示，與以西方人為主的信息構(gòu)成的現(xiàn)有探測(cè)軟件不同，該軟件學(xué)習(xí)了5400人的520萬(wàn)條個(gè)人信息，其中包括100萬(wàn)條韓國(guó)人的信息。但是該軟件的探測(cè)率約為80%，尚未達(dá)到100%。因此，比起證據(jù)資料，警方計(jì)劃將其作為設(shè)定調(diào)查方向的信息。

但是，值得深思的是，一旦受害者被制作了換臉的色情圖像，當(dāng)那些備有用心之人傳播著內(nèi)容并為此洋洋得意時(shí)，傷害就已經(jīng)實(shí)際的產(chǎn)生了。

如果不能從源頭遏制這種犯罪，再?gòu)?qiáng)大的檢測(cè)技術(shù)也只能在事后進(jìn)行彌補(bǔ)。更何況，互聯(lián)網(wǎng)往往都是謠言的聲浪高過澄清，沒有真正有效的武器讓不安中的女性保護(hù)自己免受AI換臉的毒害。

3.AI巨頭的較量：谷歌在擁擠市場(chǎng)中的戰(zhàn)略舉動(dòng)

雖然AI生圖技術(shù)存在著相當(dāng)?shù)娘L(fēng)險(xiǎn)，但谷歌也無法放棄這方面的開發(fā)。

在過去一年中，包括OpenAI、微軟、Meta、Anthropic和Hugging Face在內(nèi)的公司都推出了可定制的AI chatbot，整個(gè)行業(yè)正向個(gè)性化AI體驗(yàn)轉(zhuǎn)變。

從Sora在年初的炸場(chǎng)，到FLUX給AI社區(qū)帶來的億些震撼，都表明擁抱多模態(tài)是一個(gè)不可撼動(dòng)的大趨勢(shì)。

Gems和Imagen 3的推出似乎是谷歌試圖趕上甚至超越其競(jìng)爭(zhēng)對(duì)手的努力。

盡管谷歌長(zhǎng)期以來一直是AI研究的先驅(qū)，transformer的架構(gòu)最早就誕生于谷歌。然而，在ChatGPT爆發(fā)之后，谷歌在面向消費(fèi)者的AI產(chǎn)品推向市場(chǎng)方面有時(shí)有所滯后。

最近，谷歌推出自己的Pixel 9系列時(shí)，所搭載的AI功能讓人小小的驚艷了一把。

這表明，隨著AI技術(shù)的不斷成熟，主要參與者正在爭(zhēng)相成為最用戶友好、最強(qiáng)大且道德責(zé)任感最強(qiáng)的平臺(tái)。這樣的內(nèi)卷，倒是可以多來一些。

參考鏈接：

1.https://venturebeat.com/ai/googles-gemini-ai-gets-major-upgrade-with-gems-assistants-and-imagen-3/

2.??https://www.bloomberg.com/news/articles/2024-08-28/google-to-let-some-users-generate-images-of-people-after-scandal?srnd=phx-technology??

本文轉(zhuǎn)載自??51CTO技術(shù)棧??，作者：伊風(fēng)

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

音頻驅(qū)動(dòng)逼真人像動(dòng)畫合成！人人都是歌手！

angel ? 4101瀏覽 ? 0回復(fù)
微軟炸裂級(jí)單圖生數(shù)字人，Sora同款思路，“比AI劉強(qiáng)東還真”

Crystalcxt ? 3420瀏覽 ? 0回復(fù)
谷歌發(fā)布文生圖模型Imagen 3，寫實(shí)效果超強(qiáng)！

Aceryt ? 3815瀏覽 ? 0回復(fù)
谷歌卷視頻到語(yǔ)音，逼真音效讓AI視頻告別無聲！

輕薄滴假象 ? 2430瀏覽 ? 0回復(fù)
AI生圖可“量身定制”了，華為&清華聯(lián)手打造個(gè)性化多模態(tài)生成方法PMG

Crystalcxt ? 2355瀏覽 ? 0回復(fù)
人像逼真細(xì)節(jié)拉滿，攝影級(jí)畫面秒生成

duhorse ? 2503瀏覽 ? 0回復(fù)
史上最強(qiáng)文生圖模型？谷歌Imagen3內(nèi)部詳細(xì)評(píng)估資料解讀

angel ? 4342瀏覽 ? 0回復(fù)
前谷歌大佬祭出AI生圖2.0，全網(wǎng)驚艷實(shí)測(cè)

duhorse ? 2028瀏覽 ? 0回復(fù)
谷歌發(fā)布Imagen 3，超過SD3、DALL?E-3

Aceryt ? 2218瀏覽 ? 0回復(fù)
史上最強(qiáng)文生圖模型？谷歌Imagen3內(nèi)部詳細(xì)評(píng)估資料解讀

angel ? 2789瀏覽 ? 0回復(fù)
谷歌放大招開源SynthID Text，火眼金睛鑒別AI，還能為AI生成的多媒體內(nèi)容添加隱形水?。?/a>

51CTO技術(shù)棧 ? 2202瀏覽 ? 0回復(fù)
RAG 或 Fine Tume - 為您的用例選擇正確方法的權(quán)威指南

sulu637 ? 1946瀏覽 ? 0回復(fù)
谷歌和Meta勝算很大！AI投資人爆料：Meta承接谷歌搜索后，或收購(gòu)某獨(dú)角獸

51CTO技術(shù)棧 ? 2139瀏覽 ? 0回復(fù)
谷歌AI發(fā)布Gemini 2.0 Flash：比Gemini 1.5 Pro快2倍的新AI模型

Halo咯咯 ? 5805瀏覽 ? 0回復(fù)
RAG 或 Fine Tume - 為您的用例選擇正確方法的權(quán)威指南

sulu637 ? 1991瀏覽 ? 0回復(fù)
Gemini 2.0 Flash Thinking：谷歌放大招！能"直播思考"的AI來了，推理能力吊打OpenAI？

Halo咯咯 ? 4634瀏覽 ? 0回復(fù)
HuggingFace：AI開發(fā)者的“GitHub”，你真的會(huì)用嗎？

凝固的雨_1 ? 1332瀏覽 ? 0回復(fù)
0.72秒生成3D世界！建模提速15倍！極佳&北大等的WonderTurbo強(qiáng)勢(shì)登場(chǎng)，可實(shí)時(shí)交互！

angel ? 1527瀏覽 ? 0回復(fù)
谷歌推出Veo 2，生成8秒超逼真視頻

Aceryt ? 1241瀏覽 ? 0回復(fù)

51CTO技術(shù)棧

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

熱門推薦

支付巨頭被打臉！曾放話AI能頂700名人類客服，年省4千萬(wàn)刀；一年后又把員工招回來了！ 0回復(fù)

擺脫云端限制！Qwen3+MCP+Ollama 本地工具調(diào)用實(shí)戰(zhàn)教程 0回復(fù)

Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 1回復(fù)

2025年最值得關(guān)注的十大多模態(tài)大語(yǔ)言模型！ 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：頂穿天花板！AI編程初創(chuàng)公司挑戰(zhàn)1億上下文窗口，編碼能力超級(jí)加倍！

下一篇：我們對(duì)OpenAI 模型進(jìn)行了軟件開發(fā)基準(zhǔn)測(cè)試評(píng)估

社區(qū)精華內(nèi)容

目錄