自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="2g3ih"></cite>

<style id="2g3ih"></style>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

互聯(lián)網(wǎng)60%的句子由AI生成？谷歌放大招開源SynthID Text，火眼金睛鑒別AI，還能為AI生成的多媒體內容添加隱形水印！

原創(chuàng) 精選

2024-10-29 17:23:57

如果文本水印技術被廣泛采用，它可以幫助應對日益流行但常常錯誤token的“AI 檢測器”問題，這些檢測器會錯誤地將以較為通用的語氣撰寫的文章或論文token為 AI 生成的。然而，問題在于，這些技術是否會被廣泛采用，以及是否有某一組織的標準或技術會勝出。

出品 | 51CTO技術棧（微信號：blog51cto）

谷歌正在推出其 SynthID Text 技術，讓開發(fā)者能夠對生成式 AI 模型生成的文本進行水印token和檢測，并且該技術現(xiàn)在已經(jīng)全面開放。

圖片

SynthID Text 可以通過 AI 平臺 Hugging Face 和谷歌更新后的負責任生成式 AI 工具包下載。

https://huggingface.co/spaces/google/synthid-text

谷歌的這項成果已經(jīng)被nature接收了！在這篇論文中，谷歌詳細揭秘了水印的工作原理。

圖片

https://www.nature.com/articles/s41586-024-08025-4

那么，SynthID Text 究竟是如何工作的呢？

一、SynthID的AI查重：哪個“token”最可能出自AI之手

假設給出一個類似“你最喜歡的水果是什么？”的問題，文本生成模型會預測哪個“token”最有可能跟在另一個token之后——逐個token生成。token可以是單個字符或單詞，它們是生成模型用來處理信息的基本構件。

圖片

以 "我最喜歡的熱帶水果是____"為例。LLM 可能會從 "芒果"、"荔枝"、"木瓜 "或 "榴蓮 "等標記詞開始完成句子，并為每個標記詞分配一個概率分數(shù)。當有一系列不同的標記可供選擇時，SynthID 可以在不影響輸出質量、準確性和創(chuàng)造性的情況下，調整每個預測標記的概率分數(shù)。

谷歌表示，SynthID Text 通過“調節(jié)生成token的可能性”在這種token分布中插入了額外信息。

圖片

上圖：LLM 文本生成通常是通過從左到右生成文本的方式，反復從 LLM 分布中進行采樣。下圖：生成式水印方案通常由三個組成部分構成，如藍色框中所示：隨機種子生成器、采樣算法和評分函數(shù)。這些組件可以用于提供一種文本生成方法和水印檢測方法。在 SynthID-Text 生成式水印方案中，我們使用的是錦標賽采樣算法。

“模型的詞匯選擇的最終分數(shù)模式與調整后的概率分數(shù)結合，被視為水印，”該公司在博客文章中寫道?！按朔謹?shù)模式與水印和非水印文本的預期分數(shù)模式進行比較，從而幫助 SynthID 檢測文本是否由 AI 工具生成，或可能來自其他來源?！?/p>

谷歌聲稱，自今年春季以來，SynthID Text 已與其 Gemini 模型集成，并且不會影響文本生成的質量、準確性或速度，即使在文本被裁剪、改寫或修改后依然有效。

這種技術可用于少至三句話的內容。隨著文本長度的增加，SynthID 的穩(wěn)健性和準確性也會提高。

二、SynthID的多模態(tài)進展：音頻、視頻也有水印

谷歌表示，使用谷歌模型生成的AI音頻、視頻，也已經(jīng)“自帶水印”。

1.音頻

在音頻方面，SynthID 會把 Lyria 模型生成的音頻加上水印。

SynthID的技術是，先將音頻波（聲音的一維表現(xiàn)形式）轉換為頻譜圖。

計算出頻譜圖后，SynthID會將數(shù)字水印加入其中。最后，將頻譜圖轉換回波形。在這一轉換步驟中，SynthID 利用音頻特性確保人耳聽不到水印，從而不會影響聽覺體驗。水印對許多常見的修改（如添加噪音、MP3 壓縮或加快和減慢音軌）都很穩(wěn)健。

SynthID 還能掃描音軌，檢測不同點是否存在水印，以幫助確定其中的部分是否由 Lyria 生成。

2.視頻

SynthID 將人眼無法察覺的數(shù)字水印直接添加到AI圖像和視頻中。

而且，即使經(jīng)過各種技術操作，比如裁剪、添加濾鏡、改變顏色、改變幀頻和使用各種有損壓縮等，也無法擺脫這個水印。

圖片

三、寫在最后

不過，谷歌承認其水印方法存在局限性。

例如，SynthID Text 在處理短文本、改寫或從其他語言翻譯的文本時表現(xiàn)不佳，或者在處理回答事實性問題時效果較差。“在回答事實性提示時，調整token分布的機會較少，且不會影響事實準確性。”這包括像“法國的首都是哪里？”之類的問題，或者像“背誦威廉·華茲華斯的詩”這樣幾乎沒有變化空間的請求，此類輸出很難被識別。

谷歌并不是唯一一家致力于 AI 文本水印技術的公司。OpenAI 多年來一直在研究水印方法，但由于技術和商業(yè)方面的考慮，推遲了發(fā)布。

如果文本水印技術被廣泛采用，它可以幫助應對日益流行但常常錯誤token的“AI 檢測器”問題，這些檢測器會錯誤地將以較為通用的語氣撰寫的文章或論文token為 AI 生成的。然而，問題在于，這些技術是否會被廣泛采用，以及是否有某一組織的標準或技術會勝出。

未來可能會有法律機制迫使開發(fā)者采用這些技術。中國已經(jīng)引入了對 AI 生成內容強制加水印的規(guī)定，加利福尼亞州也正計劃采取類似措施。

形勢十分緊迫。根據(jù)歐盟執(zhí)法機構的一份報告，到 2026 年，90% 的在線內容可能會是由 AI 合成生成的，這將帶來關于虛假信息、宣傳、欺詐和欺騙的新執(zhí)法挑戰(zhàn)。據(jù) AWS 研究顯示，由于 AI 翻譯工具的廣泛使用，當前網(wǎng)絡上約 60% 的句子可能已經(jīng)是 AI 生成的。

參考鏈接：

1.https://techcrunch.com/2024/10/23/google-releases-tech-to-watermark-ai-generated-text/

2.https://deepmind.google/technologies/synthid/

想了解更多AIGC的內容，請訪問：

51CTO AI.x社區(qū)

http://scjtxx.cn/aigc/

責任編輯：武曉燕來源： 51CTO技術棧

互聯(lián)網(wǎng)AI 水印

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<style id="vljb9"></style>