Gemini的AI生圖消失數(shù)月終重返!Imagen 3或成谷歌“大招”,為避免Deepfake絞盡腦汁,網(wǎng)友:最逼真的AI人像 原創(chuàng)
編輯 | 伊風(fēng)
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
谷歌Gemini的AI生圖功能在漫長(zhǎng)的沉寂后官宣重返!并推出了重大升級(jí)后的模型Imagen 3!
此前,Gemini的這項(xiàng)功能因?yàn)檫^分注重“政治正確”而被群嘲。例如生成了黑人形象的華盛頓等等,在引起廣泛爭(zhēng)議之后,這項(xiàng)功能隨之被禁用。
現(xiàn)在,谷歌對(duì)其進(jìn)行了升級(jí),并準(zhǔn)備在“未來幾天”向部分用戶進(jìn)行灰度測(cè)試,該早期版本暫時(shí)只支持英語(yǔ)。
時(shí)隔數(shù)月,想必Imagen 3被谷歌寄于厚望,準(zhǔn)備干票大的,“一雪前恥”。
圖片
谷歌本月早些時(shí)候通過其AI Test Kitchen推出了Imagen 3,悄悄試水。
圖片
現(xiàn)在它即將支持在Gemini中進(jìn)行使用。據(jù)說,升級(jí)后的工具能夠生成從逼真的風(fēng)景到紋理豐富的油畫,而且只需“幾個(gè)詞的描述”即可。
那么,Imagen 3的效果究竟如何?與搭載了FLUX模型的Gork-2誰(shuí)更能打?Gemini的生圖功能一落千丈的口碑還能撿起來嗎?
1.Imagen 3:足夠驚艷 但來遲一步
谷歌周二宣布對(duì)其Gemini AI平臺(tái)進(jìn)行了重大更新,推出了“Gems”個(gè)性化AI助手和改進(jìn)的圖像生成模型Imagen 3。
谷歌的Imagen 3 AI模型生成的數(shù)字插圖展示了一個(gè)充滿活力的幻想場(chǎng)景,其中一只小龍正在從蛋殼中孵化出來。該圖像展示了該模型逼真的細(xì)節(jié)渲染和以及根據(jù)文字提示生成想象場(chǎng)景的能力。
圖片
推友@ChatGPT研究所試用后表示:生成圖像的質(zhì)量令人嘆為觀止。
圖片
prompt:夜晚近距離拍攝一位男性沖浪者,他正騎在海浪上,一支紅色照明彈舉過頭頂,表情緊張,臉上有輕微的胡茬。他以動(dòng)感姿勢(shì)站在沖浪板上,紅光照亮了翻騰的海浪,照明彈后面拖著火花和煙霧。背景是星空,畫面風(fēng)格逼真,色彩鮮艷,動(dòng)態(tài)感十足。
對(duì)比小編用GPT-4o生成的同一圖像,Gemini給的圖更加真實(shí),且動(dòng)作也符合邏輯。
圖片
Gemini生成的女性肖像同樣表現(xiàn)優(yōu)越,給定的圖片中充滿了細(xì)節(jié),皮膚的機(jī)理和肌肉都十分清晰,擺脫了之前AI重度磨皮的bug,讓人看起來非常舒適。
圖片
prompt:一位美麗的年輕女子的肖像,她穿著色彩鮮艷的藍(lán)色花卉圖案和服,頭上戴著飾有花朵的華麗發(fā)飾,臉上帶著溫柔的微笑。畫面采用暖色調(diào)照明,整體呈現(xiàn)出傳統(tǒng)的氛圍。
不過,谷歌似乎過于謹(jǐn)慎地進(jìn)行了漫長(zhǎng)的整改。
在經(jīng)過了FLUX深度偽造級(jí)別的TED照片,以及Grok-2各種生成梗圖的狂轟亂炸以后,谷歌Imagen 3在AI社區(qū)激起的浪花稍顯不足。
2.Deepfake:如何在道德保障下推動(dòng)AI生成圖像的邊界
在收回Gemini的生圖功能之后,谷歌此番動(dòng)作變得更為謹(jǐn)慎。
在生成人物圖像方面,谷歌寄于了更多的限制。包括不再生成逼真的公共人物圖像,以及拒絕暴力色情相關(guān)的請(qǐng)求。
為應(yīng)對(duì)對(duì)深度偽造和錯(cuò)誤信息的擔(dān)憂,谷歌實(shí)施了安全措施,包括SynthID水印技術(shù)。然而,這些措施的有效性尚待觀察,可能會(huì)引發(fā)關(guān)于負(fù)責(zé)任的AI開發(fā)和使用的持續(xù)爭(zhēng)論。
然而,谷歌的擔(dān)憂并非空穴來風(fēng),所做的種種限制也絕非多此一舉。
近期,韓國(guó)就爆出了一起利用AI深度偽造(Deepfake)的社會(huì)事件,被看作是采用新犯罪手段的“N號(hào)房”卷土重來。
不法分子們使用AI技術(shù),將個(gè)人的聲音、面部表情及身體動(dòng)作拼接合成虛假內(nèi)容并進(jìn)行傳播。韓國(guó)網(wǎng)民在通訊軟件“電報(bào)”(Telegram)上發(fā)現(xiàn)大量聊天群,其中有成員創(chuàng)建和分享露骨的性“深度偽造”圖像,對(duì)象甚至涉及未成年女孩。
據(jù)外媒報(bào)道,在付費(fèi)Deepfake電報(bào)頻道中,男性訂閱用戶提供女性照片,交錢后由頻道制作成色情圖片。目前全國(guó)涉及深度偽造犯罪的人數(shù)可能達(dá)到22萬(wàn),眾多女性因此陷入不安和恐懼之中。
為了反擊,韓國(guó)警方開始研究Deepfake的檢測(cè)技術(shù)。據(jù)警方透露,如果在相關(guān)軟件上傳疑似人工智能深偽的視頻,大約5至10分鐘就能辨別真?zhèn)?。警方表示,與以西方人為主的信息構(gòu)成的現(xiàn)有探測(cè)軟件不同,該軟件學(xué)習(xí)了5400人的520萬(wàn)條個(gè)人信息,其中包括100萬(wàn)條韓國(guó)人的信息。但是該軟件的探測(cè)率約為80%,尚未達(dá)到100%。因此,比起證據(jù)資料,警方計(jì)劃將其作為設(shè)定調(diào)查方向的信息。
但是,值得深思的是,一旦受害者被制作了換臉的色情圖像,當(dāng)那些備有用心之人傳播著內(nèi)容并為此洋洋得意時(shí),傷害就已經(jīng)實(shí)際的產(chǎn)生了。
如果不能從源頭遏制這種犯罪,再?gòu)?qiáng)大的檢測(cè)技術(shù)也只能在事后進(jìn)行彌補(bǔ)。更何況,互聯(lián)網(wǎng)往往都是謠言的聲浪高過澄清,沒有真正有效的武器讓不安中的女性保護(hù)自己免受AI換臉的毒害。
3.AI巨頭的較量:谷歌在擁擠市場(chǎng)中的戰(zhàn)略舉動(dòng)
雖然AI生圖技術(shù)存在著相當(dāng)?shù)娘L(fēng)險(xiǎn),但谷歌也無法放棄這方面的開發(fā)。
在過去一年中,包括OpenAI、微軟、Meta、Anthropic和Hugging Face在內(nèi)的公司都推出了可定制的AI chatbot,整個(gè)行業(yè)正向個(gè)性化AI體驗(yàn)轉(zhuǎn)變。
從Sora在年初的炸場(chǎng),到FLUX給AI社區(qū)帶來的億些震撼,都表明擁抱多模態(tài)是一個(gè)不可撼動(dòng)的大趨勢(shì)。
Gems和Imagen 3的推出似乎是谷歌試圖趕上甚至超越其競(jìng)爭(zhēng)對(duì)手的努力。
盡管谷歌長(zhǎng)期以來一直是AI研究的先驅(qū),transformer的架構(gòu)最早就誕生于谷歌。然而,在ChatGPT爆發(fā)之后,谷歌在面向消費(fèi)者的AI產(chǎn)品推向市場(chǎng)方面有時(shí)有所滯后。
最近,谷歌推出自己的Pixel 9系列時(shí),所搭載的AI功能讓人小小的驚艷了一把。
這表明,隨著AI技術(shù)的不斷成熟,主要參與者正在爭(zhēng)相成為最用戶友好、最強(qiáng)大且道德責(zé)任感最強(qiáng)的平臺(tái)。這樣的內(nèi)卷,倒是可以多來一些。
參考鏈接:
1.https://venturebeat.com/ai/googles-gemini-ai-gets-major-upgrade-with-gems-assistants-and-imagen-3/
本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:伊風(fēng)
