日韩一区二区三区在线免费观看-开心久久婷婷综合中文字幕-欧美激情91-久久国产福利-欧美日韩日本国产亚洲在线-国产精品极品国产中出

首頁 > 新聞 > 智能 > 正文

今日快看!識別「ChatGPT 造假」,效果超越 OpenAI:北大、華為的 AI 生成檢測器來了

2023-06-02 13:07:01來源:ZAKER科技  

機器之心專欄

機器之心編輯部

AI 造假的成功率很高,前幾天「10 分鐘騙 430 萬」還上了熱搜。在最熱門的大語言模型上,研究人員最近探索了一種識別方法。


(資料圖片)

隨著生成式大模型的不斷進步,它們生成的語料正逐步逼近人類。雖然大模型正在解放無數文書的雙手,它以假亂真的強勁能力也為一些不法分子所利用,造成了一系列社會問題:

來自北大、華為的研究者們提出了一種識別各式 AI 生成語料的可靠文本檢測器。根據長短文本的不同特性,提出了一種基于 PU 學習的多尺度 AI 生成文本檢測器訓練方法。通過對檢測器訓練過程的改進,在同等條件下能取得在長、短 ChatGPT 語料上檢測能力的可觀提升,解決了目前檢測器對于短文本識別精度低的痛點。論文地址:https://arxiv.org/abs/2305.18149

代碼地址 ( MindSpore ) :https://github.com/mindspore-lab/mindone/tree/master/examples/detect_chatgpt

代碼地址 ( PyTorch ) :https://github.com/YuchuanTian/AIGC_text_detector

引言

隨著大語言模型的生成效果越發逼真,各行各業迫切需要一款可靠的 AI 生成文本檢測器。然而,不同行業對檢測語料的要求不同,例如在學術界,普遍需要對大段完整的學術文本進行檢測;在社交平臺上,需要對相對簡短而較為支離破碎的假消息進行檢測。然而,既有檢測器往往無法兼顧各式需求。例如,主流的一些 AI 文本檢測器對較短的語料預測能力普遍較差。

對于不同長度語料的不同檢測效果,作者觀察到較短的 AI 生成文本可能存在著一部分歸屬上的「不確定性」;或者更直白地說,由于一些 AI 生成短句同時也常常被人類使用,因而很難界定 AI 生成的短文本是否來自于人或 AI。這里列舉了幾個人和 AI 分別對同一問題做出回答的例子:

由這些例子可見,很難對 AI 生成的簡短回答進行識別:這類語料與人的區別過小,很難嚴格判斷其真實屬性。因此,將短文本簡單標注為人類 / AI 并按照傳統的二分類問題進行文本檢測是不合適的。

針對這個問題,本研究將人類 / AI 的二分類檢測部分轉化為了一個部分 PU(Positive-Unlabeled)學習問題,即在較短的句子中,人的語言為正類(Positive),機器語言為無標記類(Unlabeled),以此對訓練的損失函數進行了改進。此改進可觀地提升了檢測器在各式語料上的分類效果。

算法細節

在傳統的 PU 學習設定下,一個二分類模型只能根據正訓練樣本和無標記訓練樣本進行學習。一個常用的 PU 學習方法是通過制定 PU loss 來估計負樣本對應的二分類損失:

其中,表示正樣本與正標簽計算的二分類損失;表示將無標記樣本全部假定為負標簽計算的二分類損失;表示將正樣本假定為負標簽計算的二分類損失;表示的是先驗正樣本概率,即正樣本在全部 PU 樣本中的預估占比。在傳統的 PU 學習中,通常將先驗設置為一個固定的超參數。然而在文本檢測的場景中,檢測器需要處理各式長度不同的文本;而對于不同長度的文本而言,其正樣本在所有和該樣本相同長度的 PU 樣本中的預估占比也是不同的。因此,本研究對 PU Loss 進行了改進,提出了長度敏感的多尺度 PU(MPU)loss 損失函數。

具體地,本研究提出了一個抽象的循環模型對較短文本檢測進行建模。傳統的 NLP 模型在處理序列時,通常是一個馬爾可夫鏈的結構,如 RNN、LSTM 等。此類循環模型的這個過程通常可以理解為一個逐漸迭代的過程,即每個 token 輸出的預測,都是由上一個 token 及之前序列的預測結果和該 token 的預測結果經過變換、融合得到的。即以下過程:

為了根據這個抽象的模型進行先驗概率的估計,需要假定該模型的輸出為某個句子為正類(Positive)的置信度,即判定為人說出的樣本的概率。假設每個 token 的貢獻大小為句子 token 長度的反比,是非正(Positive)即無標記(Unlabeled)的,且為無標記的概率遠遠大于為正的概率。因為隨著大模型的詞匯量逐漸逼近人類,絕大部分詞匯會同時出現在 AI 和人類語料中。根據這個簡化后的模型和設定好的正 token 概率,通過求出不同輸入情況下模型輸出置信度的總期望,來得到最終的先驗估計。

通過理論推導和實驗,估計得到先驗概率隨著文本長度的上升而上升,最終逐漸穩定。這種現象也符合預期,因為隨著文本變長,檢測器可以捕捉的信息更多,文本的 「來源不確定性」也逐漸減弱:

之后,對于每個正樣本,根據其樣本長度得到的獨特先驗對 PU loss 進行計算。最后,由于較短文本僅有部分 " 不確定性 "(即較短文本也會含有一些人或者 AI 的文本特征),可以對二分類 loss 和 MPU loss 進行加權相加,作為最終的優化目標:

此外需要注意的是,MPU loss 適配的是長度較為多樣的訓練語料。倘若既有的訓練數據單質化明顯,大部分語料為大段冗長的文本,則無法全面發揮 MPU 方法的功效。為了使得訓練語料的長度更多樣化,本研究還引入了一個在句子層面進行多尺度化的模塊。該模塊隨機遮蓋訓練語料中的部分句子,并對余下句子在保留原有順序的前提下進行重組。經過訓練語料的多尺度化操作,訓練文本得到了長度上的極大豐富,從而充分利用了 PU 學習進行 AI 文本檢測器訓練。

實驗結果

如上表所示,作者先在較短的 AI 生成語料數據集 Tweep-Fake 上檢驗 MPU loss 的效果。該數據集中的語料均為推特上較為短小的語段。作者又在傳統的語言模型微調基礎上將傳統二分類 loss 替換為含有 MPU loss 的優化目標。改進之后的語言模型檢測器效果較為突出,超過了其它基線算法。作者又對 chatGPT 生成文本進行了檢測,經過傳統微調得到的語言模型檢測器在短句上表現較差;經過 MPU 方式在同等條件下訓練得到的檢測器在短句上表現良好,且同時能夠在完整語料上取得可觀的效果提升,F1-score 提升了 1%,超越了 OpenAI 和 DetectGPT 等 SOTA 算法。如上表所示,作者在消融實驗中觀察了每個部分帶來的效果增益。MPU loss 加強了長、短語料的分類效果。作者還對比了傳統 PU 和 Multiscale PU(MPU)。由上表可見 MPU 效果更勝一籌,能更好地適配 AI 多尺度文本檢測的任務。

總結

作者通過提出基于多尺度 PU 學習的方案,解決了文本檢測器對于短句識別的難題,隨著未來 AIGC 生成模型的泛濫,對于這類內容的檢測將會越來越重要。這項研究在 AI 文本檢測的問題上邁出了堅實的一步,希望未來會有更多類似的研究,把 AIGC 內容進行更好的管控,防止 AI 生成內容的濫用。

THE END

轉載請聯系本公眾號獲得授權

投稿或尋求報道:content@jiqizhixin.com

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀

四季av一区二区三区免费观看| 国产一区二区精品久| 成人黄色av| 天天综合在线观看| 你懂的国产精品| 欧美激情影院| 首页欧美精品中文字幕| 久久久久网站| 五月天久久网站| 欧美一级做a| 日韩一级特黄| 欧美高清一区| 亚洲一区日本| **精品中文字幕一区二区三区| 日本成人在线网站| h片在线观看视频免费| 视频一区视频二区中文字幕| 久久成人综合| 蜜桃av一区二区三区| 日韩成人在线电影| 日本中文字幕一区二区有限公司| 伊人成人在线| 欧美一级久久| 亚洲福利一区| 成人av免费电影网站| 国产精品色婷婷在线观看| 欧美三级不卡| 亚洲午夜一级| 亚洲二区av| 欧美偷窥清纯综合图区| 日韩成人av电影| 亚洲精品福利| 日本在线精品| 国产一级成人av| 99久久精品一区二区成人| avtt综合网| 少妇一区视频| 久久久久久久久国产一区| 国产黄色一区| 欧美成人综合| 一区二区三区无毛| 快she精品国产999| 日韩精品成人在线观看| 午夜影院一区| 亚洲a一区二区三区| 国产精品久久久一区二区| 亚州av乱码久久精品蜜桃| 欧美区亚洲区| 蜜桃视频第一区免费观看| 欧美午夜寂寞| 精品国产乱码久久久久久樱花| 国产一区二区三区四区五区传媒| 国产精品久久久久久久久免费高清 | 国产在视频线精品视频www666| 麻豆精品少妇| 91大神在线观看线路一区| 欧美日韩麻豆| 国产一区二区三区成人欧美日韩在线观看 | 欧美激情视频一区二区三区免费| 黑丝美女一区二区| 日本欧美一区二区在线观看| 欧美激情欧美| 亚洲精品在线国产| 日韩精品看片| 国产欧美在线| 亚洲在线网站| 激情小说一区| 久久视频在线观看| 日本激情一区| 99成人超碰| av在线亚洲一区| 亚洲日本天堂| 欧美最新另类人妖| 亚洲激情77| 国产福利91精品一区二区| 91久久黄色| 国产suv精品一区| 麻豆精品视频在线| 四虎国产精品免费观看| 久久久久亚洲| 久久gogo国模啪啪裸体| 欧美在线高清| 国产精品久久久乱弄| 国产一区二区中文| 日韩av在线播放中文字幕| 乱一区二区av| 特黄毛片在线观看| 亚洲精品123区| 国产美女撒尿一区二区| 亚洲青青一区| 欧美一区二区三区久久精品茉莉花| 久久成人在线| 激情欧美日韩| 欧美综合自拍| 精品伊人久久| 国产一区二区三区精品在线观看 | 日本不卡在线视频| 天堂资源在线| 蜜臀av亚洲一区中文字幕| 99久久婷婷国产综合精品电影√| 亚洲综合福利| 精品一区二区三区四区五区 | 视频精品国内| 日本乱码一区二区三区不卡| 乱亲女h秽乱长久久久| 久久综合色占| 亚洲综合激情| 亚洲成人国产| 亚洲欧洲国产精品一区| 国产欧美亚洲精品a| 日韩国产欧美在线视频| 成人国产一区二区三区精品麻豆| 欧美gay男男猛男无套| 自拍偷拍欧美专区| 久久久精品网| 精品淫伦v久久水蜜桃| 亚洲视频一起| 在线视频亚洲欧美中文| 午夜视频一区二区在线观看| 久久综合影院| 国产中文精品久高清在线不| 97久久精品一区二区三区的观看方式| 国产日韩免费| 久久精品国产一区二区| 欧美日韩国产高清| 国产综合视频| 久久视频一区| 免费一级片91| 不卡av一区二区| 91亚洲精品视频在线观看| 亚洲制服一区| 久久精品免视看国产成人| 偷拍亚洲色图| 精品视频在线观看免费观看| 日本午夜精品| 日韩电影在线免费看| 日韩欧美在线精品| 亚洲动漫在线观看| 日韩成人一级大片| 日韩欧美黄色| 一区二区在线视频观看| 国产66精品| 欧美va亚洲va日韩∨a综合色| 欧美成人日韩| 伊人成年综合电影网| 日韩精品一二三四| 都市激情亚洲综合| 欧美激情不卡| 91成人在线网站| 日韩免费高清视频网站| 成人自拍在线| 99久久99热这里只有精品| 欧美老女人另类| 老司机精品福利视频| 人在线成免费视频| 美女久久久久久| 亚洲最新色图| 日韩一区网站| 国产99精品| 首页欧美精品中文字幕| 日韩欧美午夜| 日韩精品亚洲专区| 亚洲传媒在线| 久久久精品久久久久久96 | 蜜桃一区二区三区在线| 黄色亚洲网站| 美女视频第一区二区三区免费观看网站| 麻豆免费精品视频| 日韩经典中文字幕一区| 欧美三级午夜理伦三级中文幕| 99久精品视频在线观看视频| 亚洲综合国产| 四虎地址8848精品| 欧美猛男做受videos| 精品国产一区二区三区不卡蜜臂 | 日韩精品成人一区二区在线| 国产最新精品| 久久神马影院| 亚洲精品mv| 亚洲午夜精品一区二区国产| 国产调教精品| 噜噜噜久久亚洲精品国产品小说| 欧美中文字幕精在线不卡| 成人亚洲精品| 久久人人99| 妞干网免费在线视频| 亚洲综合小说| 99久久激情| 男人的天堂免费在线视频| 国产区精品区| 久久国产欧美| 日本乱码一区二区三区不卡| 亚洲青青一区| 亚洲高清毛片| 亚洲一级少妇| 午夜久久av| 日韩中文欧美在线| 久久伊人亚洲| 99国产精品一区二区| 日韩系列欧美系列|