當(dāng)前位置：首頁 > 休閑 > AI一本正經(jīng)地胡說八道有種辦法可以識破它

AI一本正經(jīng)地胡說八道有種辦法可以識破它

發(fā)表于 2024-12-29 14:17:47 來源：下愚不移網(wǎng)

近年來，本正生成式人工智能在文本、經(jīng)地圖像、胡說音樂等領(lǐng)域大放異彩。種辦然而，識破隨著生成式人工智能變得越來越強(qiáng)大，本正人們越來越難以鑒別AI生成的經(jīng)地內(nèi)容。

近日，胡說Google DeepMind 研究團(tuán)隊在《自然》（Nature）上發(fā)表的種辦封面文章提供了一種文本水印方案，可以提高 AI 生成文本的識破檢測精度。

AI 生成內(nèi)容檢測的本正必要性

在文本、圖像和音樂中，經(jīng)地AI 生成的胡說文本是最難以檢測的。因為現(xiàn)有的種辦圖像和音樂生成技術(shù)尚未像文本生成技術(shù)一樣發(fā)達(dá)，AI 生成的識破圖像和音樂往往有某些非自然的視覺或聽覺特征。AI 生成的內(nèi)容在整體上效果較好，但具體到細(xì)節(jié)就顯得不夠自然。在圖像和音樂中，也可以人工添加人類難以發(fā)現(xiàn)的水印，在后期檢測中通過水印篩選出AI生成的作品。

然而在文本中難以直接添加人類不可見的水印，這是因為文本與圖像和音樂不同，每一個文字都是完全可見的。同時，可用于訓(xùn)練 AI 的文本數(shù)據(jù)也遠(yuǎn)多于圖像和音樂。在龐大的、基于人類寫作的語料庫的訓(xùn)練之下，AI 已經(jīng)非常擅長模擬人類的表達(dá)方式和語言習(xí)慣，甚至能夠調(diào)整文本的風(fēng)格和語氣，這使得 AI 生成的文本難以直接檢測。

盡管 AI 生成的文本與人類創(chuàng)作的文本難以分辨，但 AI 生成的內(nèi)容可能帶有事實性的錯誤，并不能保證可靠性。無法辨別來源的內(nèi)容可能會導(dǎo)致虛假信息的傳播，也帶來了學(xué)術(shù)作弊、版權(quán)爭議等種種問題。

比如，在“杭州取消機(jī)動車依尾號限行”假新聞事件中，網(wǎng)友用 AI 技術(shù)生成的“假新聞”行文嚴(yán)謹(jǐn)、語氣措辭得當(dāng)，也基本符合官方通報的格式，導(dǎo)致了錯誤信息大規(guī)模傳播。美國科技新聞網(wǎng)站 CNET 在三個月之內(nèi)上線了 70 多篇用 AI 技術(shù)生成的新聞報道，卻被發(fā)現(xiàn)其中存在大量基礎(chǔ)性錯誤，包括計算錯誤、金融概念誤解等，不得不暫時叫停AI項目重新審核。

為了避免 AI 技術(shù)的濫用，我們需要一種方法辨別文本是否由 AI 生成。

主流檢測方法：事前與事后檢測

檢測 AI 生成的文本是一個分類問題，我們的主要目標(biāo)是區(qū)分一個文本片段是由 AI 生成的還是由人類創(chuàng)作的。通常一個文本檢測器對于一個給定的文本片段會給出一個評分，當(dāng)這個評分超過閾值時，這個片段被認(rèn)為是 AI 生成的，反之則是人類創(chuàng)作的。

文本檢測框架（圖片來源：根據(jù)參考文獻(xiàn) [1] 翻譯）

現(xiàn)有的主流檢測方法可以分為兩大類：事前檢測和事后檢測。事前檢測可以進(jìn)一步分為基于水印的檢測和基于檢索的檢測。事后檢測可以分為基于零樣本學(xué)習(xí)的檢測和基于訓(xùn)練的檢測。

主流檢測方法分類（圖片來源：根據(jù)參考文獻(xiàn) [1] 翻譯）

1、事前檢測

基于水印的檢測是指在 AI 生成的文本中隱藏某些信息以便后續(xù)檢測。但由于文本的離散性，在文本中添加水印比在圖像和音樂中添加水印困難很多。常用的方法是讓 AI 生成的文本使用特定的語言風(fēng)格或者偏向性地使用某些特定的詞匯，但這樣可能會降低 AI 生成文本的質(zhì)量。

基于檢索的方法是指 AI 服務(wù)的提供者將用戶通過 AI 生成的文本保存在數(shù)據(jù)庫中。當(dāng)需要檢測目標(biāo)文本是否由 AI 生成時，將目標(biāo)文本與數(shù)據(jù)庫中的文本進(jìn)行匹配，如果相似度較高，則很可能是 AI 生成的。但這種方法需要保存用戶數(shù)據(jù)，可能帶來隱私泄露的問題。

2、事后檢測

基于零樣本學(xué)習(xí)的檢測是指不需要進(jìn)行任何的訓(xùn)練，僅根據(jù) AI 生成文本的特點(diǎn)來檢測一段文本是否是 AI 生成的。通常 AI 生成的文本傾向于使用常見的詞匯，句子的長度和結(jié)構(gòu)也更加統(tǒng)一。而人類創(chuàng)作的文本則顯得更加隨心所欲，每一句的水平也參差不齊。

與人類相比，AI 在記憶細(xì)節(jié)上能力較強(qiáng)而在邏輯推理上能力較弱。利用這些特點(diǎn)可以在一定程度上區(qū)分 AI 生成的文本和人類創(chuàng)作的文本?；谟?xùn)練的檢測是指使用人類創(chuàng)作的文本和 AI 生成的文本構(gòu)建一個數(shù)據(jù)集，用這個數(shù)據(jù)集訓(xùn)練一個分類器來識別 AI 生成的文本。

但這需要收集足夠的數(shù)據(jù)用于訓(xùn)練，并且隨著 AI 能力的進(jìn)步，這樣的區(qū)分也變得越來越困難。可以看到，事后檢測比事前檢測要困難許多。為了高精度地篩選出 AI 生成的文本，在事前 AI 生成文本時就添加水印是一個很好的解決方案。

Google DeepMind 的突破：SynthID-Text 水印技術(shù)

Google DeepMind 研究團(tuán)隊提出了一種新的水印生成方案，稱為 SynthID-Text。它基于之前的水印生成組件，但使用了一種新的“錦標(biāo)賽采樣”方法。SynthID-Text 可以非扭曲（保留文本質(zhì)量）或者扭曲（以犧牲文本質(zhì)量為代價提升水印的可檢測性）地添加水印。

在扭曲和非扭曲設(shè)置下，與現(xiàn)有的最佳方法相比，SynthID-Text 都提升了水印的檢出率。

水印生成框架（圖片來源：根據(jù)參考文獻(xiàn) [2] 翻譯）

上圖中展示了大語言模型生成文本的原理以及之前水印生成的框架。大語言模型的文本生成是基于上下文的，它會根據(jù)輸入的文本序列計算下一個詞匯的分布，然后從這個分布中抽樣出下一個詞匯。

一個生成式的水印方案通常包含三個部分：一個隨機(jī)數(shù)生成器、一個采樣算法以及一個評分函數(shù)。水印生成的過程是：首先使用隨機(jī)數(shù)生成器根據(jù)前面的文本以及水印鍵生成一個隨機(jī)數(shù)，然后采樣算法利用這個隨機(jī)數(shù)從詞匯的分布中抽樣出下一個詞匯。

給出一段文本以及一個水印鍵，評分函數(shù)提供一個分?jǐn)?shù)來量化當(dāng)前文本中含有水印的可能性，當(dāng)分?jǐn)?shù)超過一個閾值時就認(rèn)為這段文本中含有水印。

錦標(biāo)賽采樣（圖片來源：根據(jù)參考文獻(xiàn) [2] 翻譯）

SynthID-Text 提出了一種新的“錦標(biāo)賽采樣”方法，上圖是錦標(biāo)賽采樣方法的一個例子。當(dāng)向模型輸入“...我最喜歡的熱帶水果是”時，模型計算出下一個詞匯的分布，其中“芒果”的概率是 0.5，“荔枝”的概率是 0.3，“木瓜”的概率是 0.15，“榴蓮”的概率是 0.05。在不加水印的正常生成中，模型會按這個概率直接采樣出下一個詞匯。

在錦標(biāo)賽采樣中，模型先根據(jù)隨機(jī)數(shù)種子生成三個隨機(jī)的水印函數(shù)，然后再從詞匯的分布中采樣出八個詞匯，將這八個詞匯兩兩組合后進(jìn)行競賽，在每一輪競賽中，由一個水印函數(shù)決定每一對組合中的勝出者。經(jīng)過三輪競賽后，最終的勝出者就是模型的輸出結(jié)果：“芒果”。

在錦標(biāo)賽采樣中，詞匯是根據(jù)水印函數(shù)的偏好采樣得出的。因此添加水印的文本會在水印函數(shù)上有更高的評分。在檢測時只需要評估每個詞匯在對應(yīng)的水印函數(shù)下的評分，再將評分加和就可以得到這段文本包含水印的可能性。

水印的添加是通過改變采樣方法實現(xiàn)的，它會改變模型輸出下一個詞匯的分布，這看起來不可避免地會影響生成文本的質(zhì)量。

然而，由于采樣方法中使用了隨機(jī)數(shù)種子，盡管在某一隨機(jī)數(shù)種子下詞匯的分布會被改變，但在對所有隨機(jī)數(shù)種子進(jìn)行平均后可以得到和原始分布相同的結(jié)果。

SynthID-Text 可以在適當(dāng)?shù)呐渲孟卤苊庥绊懺~匯的分布從而保證文本的質(zhì)量，也可以以損失一部分質(zhì)量為代價提高水印的檢出概率。

SynthID-Text 方法在 Google DeepMind 推出的 Gemini 人工智能模型上經(jīng)過了兩千萬次用戶測試。測試結(jié)果表明 SynthID-Text 在添加水印的同時并不會降低文本的質(zhì)量。同時，SynthID-Text 不會產(chǎn)生太多的時間和計算開銷，可以被大規(guī)模地應(yīng)用于生產(chǎn)實踐之中。

結(jié)語

事后檢測文本是否由 AI 生成是非常困難的。隨著 AI 能力的增強(qiáng)，事后檢測會變得越來越困難，檢測和反檢測將會是無止境的技術(shù)競賽。水印方法提供了一種可能的解決方案，但這需要大語言模型的提供者在生成時就預(yù)先加入水印。如果用戶使用的模型沒有主動加入水印，就難以在事后進(jìn)行檢測。

此外，用戶還可以使用開源模型，或者對添加了水印的文本進(jìn)行二次編輯來逃脫檢測。這些問題都有待進(jìn)一步解決。

未來，隨著生成式人工智能的普及，如何檢測 AI 生成的內(nèi)容會變得越來越重要。SynthID-Text 證明了水印技術(shù)在文本生成中大規(guī)模應(yīng)用的可能性，但水印技術(shù)面臨的困難也說明檢測并不只是一個技術(shù)問題。

解決這個問題還需要各方共同努力，形成相關(guān)的行業(yè)標(biāo)準(zhǔn)以及法律法規(guī)，從而推動AI走在為人類服務(wù)的正軌之上。

喜歡85 討厭32

隨機(jī)為您推薦

熱門文章

[流言板]行云流水！小皮蓬助攻肯納德命中三分，灰熊8
[流言板]盧尼：今晚我們的失誤太多，防守影響了我們的進(jìn)攻
舉重世錦賽：中國小將趙金紅破兩項世界紀(jì)錄奪三冠
默森：切爾西5.8%的奪冠概率有些荒謬，他們是有力的競爭者
[流言板]不裝了！雄鹿本賽季前十場2勝8負(fù)，隨后十場取得9勝1負(fù)
[流言板]狀態(tài)火熱！阿德巴約第3節(jié)4投3中，砍下12分6籃板
[流言板]1982年的今天，爵士單場39罰全中創(chuàng)歷史記錄
迪馬：達(dá)尼洛遭遇腳踝問題&暫未隨隊出征，周日檢查后再做決定
[流言板]霍勒迪：第四節(jié)的塔特姆不可阻擋，同時他也信任隊友

文章排行

亚洲嫩模在线观看,日韩视频特黄色大片,乱色中文视频在线,动漫免费观看

AI一本正經(jīng)地胡說八道 有種辦法可以識破它

AI一本正經(jīng)地胡說八道有種辦法可以識破它