GPT-4讓AI更加具有像人一樣的能力,AI生成的文本的流暢度也令人驚嘆,越來越難以辨識。在這一背景下,AI檢測文本工具可以通過對生成文本進(jìn)行追蹤和檢測,來識別文本是否由AI生成,這也成為防止大型AI語言模型用于作弊等行為的利器。
(資料圖)
日前,復(fù)旦大學(xué)自然語言處理實驗室推出了一款用于AI生成文本檢測的測試軟件“諦聽”(英文:Sniffer),基于黑盒假設(shè),無需大規(guī)模監(jiān)督訓(xùn)練,就能檢測AI生成的文本。據(jù)該軟件的英文版本介紹,對于ChatGPT生成文本的檢測率達(dá)到80%左右。
實驗室負(fù)責(zé)人邱錫鵬教授3月16日晚間在微信朋友圈上表示:“后續(xù)將會在MOSS語言模型開源后,將Sniffer與MOSS進(jìn)行聯(lián)動,構(gòu)成一對矛與盾,相互提升,繼續(xù)探索大模型的新技術(shù)。”
上個月,邱錫鵬告訴第一財經(jīng)記者,如果優(yōu)化順利,MOSS將于3月底開源。團(tuán)隊表示,未來“諦聽”軟件工具還將支持GPT-4等更多大模型等檢測,并在檢測性能提升后整理公開模型。
不過團(tuán)隊坦言,由于“諦聽”的模型是建立在“黑盒假設(shè)”下,因此對于輸入文本的來源模型并不知曉,而且與監(jiān)督訓(xùn)練的分類器相比 ,將僅使用少部分?jǐn)?shù)據(jù)進(jìn)行訓(xùn)練。
值得注意的是,測試集的檢測結(jié)果顯示,該模型中文檢測的準(zhǔn)確率低于英文,因此中文檢測結(jié)果還需要進(jìn)一步提升。
根據(jù)“諦聽”的英文版介紹,在保留的測試集上檢測結(jié)果顯示,識別ChatGPT生成文本的成功率在80%左右,識別人類書寫文本或GPT-2生成文本的成功率高于90%;非常短的文本(50個單詞或更少)很難被檢測到。此外,英文人工編寫的示例文本來自維基百科。
“諦聽”英文檢測結(jié)果分為四類:來自人類; 來自人類、但可能有大模型如GPT-3輔助;來自GPT-3模型;來自GPT-2模型。
“諦聽”中文版的檢測結(jié)果分為三類:一是“文本是人寫的”、二是“文本是人寫的,但是也很可能包含AI參與”、三是“文本是出自于AI模型的”。
3月17日,邱錫鵬對第一財經(jīng)記者表示:“對ChatGPT級別的中文檢測準(zhǔn)確率目前只有約40%,不過對于小模型(3B左右的開源GPT-2模型)生成的準(zhǔn)確率可以達(dá)到90%左右。”
他解釋稱,中文檢測的準(zhǔn)確率低于英文有幾個原因。“首先是英文采用的wikipedia數(shù)據(jù)集進(jìn)行特征提取,因此覆蓋面更廣,中文選擇的數(shù)據(jù)質(zhì)量差一些,這也是我們發(fā)布beta測試并且正在改進(jìn)的地方;第二個是中文大模型的tokenizer(分詞器)差異會大一些。”邱錫鵬說道。
他還表示,關(guān)于生成文本檢測,國外有一些已經(jīng)發(fā)布的產(chǎn)品,對比下來,針對GPT-2級別的模型,準(zhǔn)確率比較高,針對GPT-3級別的模型,檢測結(jié)果還比較差。
“一方面是這些模型是黑盒,我們的掌握信息有限,另一方面是這些模型生成質(zhì)量很高,多樣性也很好,尤其是GPT-4出現(xiàn)以后,相比于GPT-3.5,檢測難度進(jìn)一步增加了。”邱錫鵬對第一財經(jīng)記者表示,“總而言之,在大模型時代,文本檢測的機(jī)器評測準(zhǔn)確率仍然較低,還需要進(jìn)一步的研究。”
目前的AI文本檢測方式大致可分為兩類:黑盒假設(shè)和白盒假設(shè)。所謂的“黑盒假設(shè)”對大型語言模型通常只有API級別的訪問權(quán)限。因此,這類方法依靠于收集人類和機(jī)器的文本數(shù)據(jù)樣本來訓(xùn)練分類模型;“白盒假設(shè)”擁有對大型語言模型的所有訪問權(quán)限,并且可以通過控制模型的生成行為或者在生成文本中加入水?。╳atermark)來對生成文本進(jìn)行追蹤和檢測。
在實踐中,黑盒檢測器通常由第三方構(gòu)建,例如較為著名的GPTZero,而白盒檢測器通常由大型語言模型開發(fā)人員構(gòu)建。不過由于“黑盒假設(shè)”在數(shù)據(jù)收集的過程中很容易引入偏見(biases),這些偏見常常會被黑盒分類器作為分類的主要特征。而隨著大型語言模型能力的提升,大型語言模型生成的文本和人類的差距越來越小,這會導(dǎo)致黑盒模型的檢測準(zhǔn)確性越來越低
此外,對于黑盒檢測,用戶可以微調(diào)他們的模型,改變模型輸出的風(fēng)格或者格式,從而導(dǎo)致黑盒檢測無法找到通用的檢測特征。
復(fù)旦大學(xué)的語言模型MOSS自上個月推出以來備受各界關(guān)注。邱錫鵬認(rèn)為,國外開發(fā)者不太可能以中文為主去發(fā)展他們的模型,中國要想開發(fā)一個大型語言模型的基座,用于國內(nèi)的信息處理,就必須建設(shè)一個中文能力非常強的大型語言模型。
除了復(fù)旦大學(xué)之外,包括百度、阿里巴巴在內(nèi)的中國互聯(lián)網(wǎng)巨頭以及初創(chuàng)公司也都在開發(fā)基于AI的大模型技術(shù)。
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) m.ulq4xuwux.cn 版權(quán)所有,未經(jīng)書面授權(quán)禁止使用
Copyright©2008-2020 By All Rights Reserved 皖I(lǐng)CP備2022009963號-10
聯(lián)系我們: 39 60 29 14 2@qq.com