全球熱頭條丨復(fù)旦再推AI文本檢測工具“諦聽” 識別ChatGPT成功率達(dá)80%

2023-03-17 18:05:13 來源：第一財經(jīng)

GPT-4讓AI更加具有像人一樣的能力，AI生成的文本的流暢度也令人驚嘆，越來越難以辨識。在這一背景下，AI檢測文本工具可以通過對生成文本進(jìn)行追蹤和檢測，來識別文本是否由AI生成，這也成為防止大型AI語言模型用于作弊等行為的利器。

(資料圖)

日前，復(fù)旦大學(xué)自然語言處理實驗室推出了一款用于AI生成文本檢測的測試軟件“諦聽”（英文：Sniffer），基于黑盒假設(shè)，無需大規(guī)模監(jiān)督訓(xùn)練，就能檢測AI生成的文本。據(jù)該軟件的英文版本介紹，對于ChatGPT生成文本的檢測率達(dá)到80%左右。

實驗室負(fù)責(zé)人邱錫鵬教授3月16日晚間在微信朋友圈上表示：“后續(xù)將會在MOSS語言模型開源后，將Sniffer與MOSS進(jìn)行聯(lián)動，構(gòu)成一對矛與盾，相互提升，繼續(xù)探索大模型的新技術(shù)。”

上個月，邱錫鵬告訴第一財經(jīng)記者，如果優(yōu)化順利，MOSS將于3月底開源。團(tuán)隊表示，未來“諦聽”軟件工具還將支持GPT-4等更多大模型等檢測，并在檢測性能提升后整理公開模型。

不過團(tuán)隊坦言，由于“諦聽”的模型是建立在“黑盒假設(shè)”下，因此對于輸入文本的來源模型并不知曉，而且與監(jiān)督訓(xùn)練的分類器相比，將僅使用少部分?jǐn)?shù)據(jù)進(jìn)行訓(xùn)練。

值得注意的是，測試集的檢測結(jié)果顯示，該模型中文檢測的準(zhǔn)確率低于英文，因此中文檢測結(jié)果還需要進(jìn)一步提升。

根據(jù)“諦聽”的英文版介紹，在保留的測試集上檢測結(jié)果顯示，識別ChatGPT生成文本的成功率在80%左右，識別人類書寫文本或GPT-2生成文本的成功率高于90%；非常短的文本（50個單詞或更少）很難被檢測到。此外，英文人工編寫的示例文本來自維基百科。

“諦聽”英文檢測結(jié)果分為四類：來自人類；來自人類、但可能有大模型如GPT-3輔助；來自GPT-3模型；來自GPT-2模型。

“諦聽”中文版的檢測結(jié)果分為三類：一是“文本是人寫的”、二是“文本是人寫的，但是也很可能包含AI參與”、三是“文本是出自于AI模型的”。

3月17日，邱錫鵬對第一財經(jīng)記者表示：“對ChatGPT級別的中文檢測準(zhǔn)確率目前只有約40%，不過對于小模型（3B左右的開源GPT-2模型）生成的準(zhǔn)確率可以達(dá)到90%左右。”

他解釋稱，中文檢測的準(zhǔn)確率低于英文有幾個原因。“首先是英文采用的wikipedia數(shù)據(jù)集進(jìn)行特征提取，因此覆蓋面更廣，中文選擇的數(shù)據(jù)質(zhì)量差一些，這也是我們發(fā)布beta測試并且正在改進(jìn)的地方；第二個是中文大模型的tokenizer（分詞器）差異會大一些。”邱錫鵬說道。

他還表示，關(guān)于生成文本檢測，國外有一些已經(jīng)發(fā)布的產(chǎn)品，對比下來，針對GPT-2級別的模型，準(zhǔn)確率比較高，針對GPT-3級別的模型，檢測結(jié)果還比較差。

“一方面是這些模型是黑盒，我們的掌握信息有限，另一方面是這些模型生成質(zhì)量很高，多樣性也很好，尤其是GPT-4出現(xiàn)以后，相比于GPT-3.5，檢測難度進(jìn)一步增加了。”邱錫鵬對第一財經(jīng)記者表示，“總而言之，在大模型時代，文本檢測的機(jī)器評測準(zhǔn)確率仍然較低，還需要進(jìn)一步的研究。”

目前的AI文本檢測方式大致可分為兩類：黑盒假設(shè)和白盒假設(shè)。所謂的“黑盒假設(shè)”對大型語言模型通常只有API級別的訪問權(quán)限。因此，這類方法依靠于收集人類和機(jī)器的文本數(shù)據(jù)樣本來訓(xùn)練分類模型；“白盒假設(shè)”擁有對大型語言模型的所有訪問權(quán)限，并且可以通過控制模型的生成行為或者在生成文本中加入水?。╳atermark）來對生成文本進(jìn)行追蹤和檢測。

在實踐中，黑盒檢測器通常由第三方構(gòu)建，例如較為著名的GPTZero，而白盒檢測器通常由大型語言模型開發(fā)人員構(gòu)建。不過由于“黑盒假設(shè)”在數(shù)據(jù)收集的過程中很容易引入偏見（biases），這些偏見常常會被黑盒分類器作為分類的主要特征。而隨著大型語言模型能力的提升，大型語言模型生成的文本和人類的差距越來越小，這會導(dǎo)致黑盒模型的檢測準(zhǔn)確性越來越低

此外，對于黑盒檢測，用戶可以微調(diào)他們的模型，改變模型輸出的風(fēng)格或者格式，從而導(dǎo)致黑盒檢測無法找到通用的檢測特征。

復(fù)旦大學(xué)的語言模型MOSS自上個月推出以來備受各界關(guān)注。邱錫鵬認(rèn)為，國外開發(fā)者不太可能以中文為主去發(fā)展他們的模型，中國要想開發(fā)一個大型語言模型的基座，用于國內(nèi)的信息處理，就必須建設(shè)一個中文能力非常強的大型語言模型。

除了復(fù)旦大學(xué)之外，包括百度、阿里巴巴在內(nèi)的中國互聯(lián)網(wǎng)巨頭以及初創(chuàng)公司也都在開發(fā)基于AI的大模型技術(shù)。

標(biāo)簽：

天天狠天天天天透在线_欧美日韩中文视频_99re精彩视频_任你躁在线精品视频m3u8_欧美日本一区亚洲欧美一区

全球熱頭條丨復(fù)旦再推AI文本檢測工具“諦聽” 識別ChatGPT成功率達(dá)80%