朱自清《荷塘月色》AI生成率超60%專家:大眾對(duì)“AI率”有誤解
據(jù)報(bào)道,近日,朱自清經(jīng)典散文《荷塘月色》被某AI檢測(cè)工具判定為AI生成率超60%。
這篇?jiǎng)?chuàng)作于近百年前、全文1361字的文學(xué)名篇,被現(xiàn)代技術(shù)貼上“高AI嫌疑”標(biāo)簽,引發(fā)網(wǎng)友熱議與調(diào)侃。
針對(duì)這一荒誕結(jié)果,西湖大學(xué)文本智能實(shí)驗(yàn)室博士、Fast-DetectGPT研發(fā)者之一鮑光勝明確指出,大眾對(duì)“AI率”存在根本性誤解。

AI率60%并非指文章中60%的文字由AI撰寫,而是指整篇文章有60%的概率由AI整體生成,且工具無法精準(zhǔn)定位單個(gè)字詞的來源。
《荷塘月色》被誤判的核心原因,是經(jīng)典文本早已成為AI大模型的訓(xùn)練素材。
AI檢測(cè)的原理是比對(duì)文本用詞、詞頻分布與模型預(yù)測(cè)的一致性,經(jīng)典名篇的表達(dá)被模型深度熟悉,一致性極高,因此被誤判為AI生成。

不止《荷塘月色》,劉慈欣《流浪地球》片段也曾被檢出超50%的AI率,《滕王閣序》甚至被標(biāo)注100% AI率,這類誤判案例屢見不鮮。
不少網(wǎng)友反饋,同一篇文章在不同平臺(tái)檢測(cè),AI率相差可達(dá)30%,這是因?yàn)楦鞴ぞ咚惴ú煌械膫?cè)重詞頻,有的關(guān)注語法或語義。
同時(shí),檢測(cè)準(zhǔn)確性與文本長(zhǎng)度強(qiáng)相關(guān),100字以下短文本判斷極不可靠,500字左右結(jié)果才具參考性。
此外,市面上還出現(xiàn)“賣AI生成服務(wù)+提供降A(chǔ)I率服務(wù)”的灰色產(chǎn)業(yè)鏈,通過替換高頻詞規(guī)避檢測(cè),本質(zhì)是技術(shù)間的持續(xù)攻防。
專家強(qiáng)調(diào),AI檢測(cè)工具給出的始終是概率,結(jié)果存在出錯(cuò)可能,不能作為評(píng)判原創(chuàng)性的唯一標(biāo)準(zhǔn)。
當(dāng)前不少學(xué)生原創(chuàng)論文被誤判高AI率,陷入“自證清白”的困境。
對(duì)抗誤判的最好方式,是保持獨(dú)特的個(gè)人寫作風(fēng)格 ——AI模仿的是人類寫作共性,極具辨識(shí)度的風(fēng)格很難被模型復(fù)刻。