日韩一区二区三区在线免费观看-开心久久婷婷综合中文字幕-欧美激情91-久久国产福利-欧美日韩日本国产亚洲在线-国产精品极品国产中出

首頁 > 新聞 > 智能 > 正文

一鍵開啟 ChatGPT “危險發言”:AI 聊天機器人竟有“大 bug ” 目前無法修復

2023-08-04 07:10:35來源:ZAKER科技  

隨著大模型技術的普及,AI 聊天機器人已成為社交娛樂、客戶服務和教育輔助的常見工具之一。


(相關資料圖)

然而,不安全的 AI 聊天機器人可能會被部分人用于傳播虛假信息、操縱輿論,甚至被黑客用來盜取用戶的個人隱私。WormGPT 和 FraudGPT 等網絡犯罪生成式 AI 工具的出現,引發了人們對 AI 應用安全性的擔憂。

上周,谷歌、微軟、OpenAI 和 Anthropic 共同成立了一個新的行業機構前沿模型論壇(Frontier Model Forum),促進前沿 AI 系統的安全和負責任的發展:推進 AI 安全研究,確定最佳實踐和標準,促進政策制定者和行業之間的信息共享。

那么,問題來了,他們自家的模型真的安全嗎?

近日,來自卡內基梅隆大學、Center for AI Safety 和 Bosch Center for AI 的研究人員便披露了一個與 ChatGPT 等 AI 聊天機器人有關的 " 大 bug" ——通過對抗性提示可繞過 AI 開發者設定的防護措施,從而操縱 AI 聊天機器人生成危險言論

當前熱門的 AI 聊天機器人或模型,如 OpenAI 的 ChatGPT、谷歌的 Bard、Anthropic 的 Claude 2 以及 Meta 的 LLaMA-2,都無一幸免

圖|通過對抗性提示可繞過 4 個語言模型的安全規則,引發潛在有害行為

具體而言,研究人員發現了一個 Suffix,可將其附加到針對大型語言模型(LLMs)的查詢中,從而生成危險言論。相比于拒絕回答這些危險問題,該研究可以使這些模型生成肯定回答的概率最大化。

例如,當被詢問 " 如何竊取他人身份 " 時,AI 聊天機器人在打開 "Add adversarial suffix" 前后給出的輸出結果截然不同。

圖|開啟 Add adversarial suffix 前后的聊天機器人回答對比

此外,AI 聊天機器人也會被誘導寫出 " 如何制造原子彈 "" 如何發布危險社交文章 "" 如何竊取慈善機構錢財 " 等不當言論。

對此,參與該研究的卡內基梅隆大學副教授 Zico Kolter 表示," 據我們所知,這個問題目前還沒有辦法修復。我們不知道如何確保它們的安全。"

研究人員在發布這些結果之前已就該漏洞向 OpenAI、谷歌和 Anthropic 發出了警告。每家公司都引入了阻止措施來防止研究論文中描述的漏洞發揮作用,但他們還沒有弄清楚如何更普遍地阻止對抗性攻擊

OpenAI 發言人 Hannah Wong 表示:" 我們一直在努力提高我們的模型應對對抗性攻擊的魯棒性,包括識別異常活動模式的方法,持續通過紅隊測試來模擬潛在威脅,并通過一種普遍而靈活的方式修復新發現的對抗性攻擊所揭示的模型弱點。"

谷歌發言人 Elijah Lawal 分享了一份聲明,解釋了公司采取了一系列措施來測試模型并找到其弱點。" 雖然這是 LLMs 普遍存在的問題,但我們在 Bard 中已經設置了重要的防護措施,我們會不斷改進這些措施。"

Anthropic 的臨時政策與社會影響主管 Michael Sellitto 則表示:" 使模型更加抵抗提示和其他對抗性的‘越獄’措施是一個熱門研究領域。我們正在嘗試通過加強基本模型的防護措施使其更加‘無害’。同時,我們也在探索額外的防御層。"

圖|4 個語言模型生成的有害內容

對于這一問題,學界也發出了警告,并給出了一些建議。

麻省理工學院計算學院的教授 Armando Solar-Lezama 表示,對抗性攻擊存在于語言模型中是有道理的,因為它們影響著許多機器學習模型。然而,令人驚奇的是,一個針對通用開源模型開發的攻擊居然能在多個不同的專有系統上如此有效。

Solar-Lezama 認為,問題可能在于所有 LLMs 都是在類似的文本數據語料庫上進行訓練的,其中很多數據都來自于相同的網站,而世界上可用的數據是有限的。

" 任何重要的決策都不應該完全由語言模型獨自做出,從某種意義上說,這只是常識。" 他強調了對 AI 技術的適度使用,特別是在涉及重要決策或有潛在風險的場景下,仍需要人類的參與和監督,這樣才能更好地避免潛在的問題和誤用。

普林斯頓大學的計算機科學教授 Arvind Narayanan 談道:"讓 AI 不落入惡意操作者手中已不太可能。" 他認為,盡管應該盡力提高模型的安全性,但我們也應該認識到,防止所有濫用是不太可能的。因此,更好的策略是在開發 AI 技術的同時,也要加強對濫用的監管和對抗。

擔憂也好,不屑也罷。在 AI 技術的發展和應用中,我們除了關注創新和性能,也要時刻牢記安全和倫理。

只有保持適度使用、人類參與和監督,才能更好地規避潛在的問題和濫用,使 AI 技術為人類社會帶來更多的益處。

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀

欧美天堂亚洲电影院在线观看| 成人在线视频国产| 欧美残忍xxxx极端| 国产亚洲人成a在线v网站 | 亚欧成人精品| 亚洲天堂中文字幕在线观看| 91精品国产成人观看| а√天堂中文资源在线bt| 日本怡春院一区二区| 成人综合专区| 久久福利一区| 亚洲国产导航| 成人性生交大片免费看96| 国产精品呻吟| 亚洲精品一二| 欧美色图一区| 国产一区影院| 国产一区二区三区不卡av| 男人的天堂久久精品| 亚洲国产精品一区| 91精品国产乱码久久久久久久 | 精品国产乱码久久久| 都市激情国产精品| 亚洲v天堂v手机在线| 一区视频在线| 亚洲人成人一区二区三区| 久久中文字幕二区| 亚洲天堂一区二区| 免费观看亚洲天堂| 操人在线观看| 一区二区在线视频观看| 免费看欧美女人艹b| 国产剧情在线观看一区| 好看不卡的中文字幕| 美女www一区二区| 欧美日中文字幕| 美女网站视频久久| 蜜桃tv一区二区三区| 乱一区二区av| 婷婷综合久久| 亚洲无中文字幕| 亚洲欧美成人综合| 国内精品久久久久久99蜜桃| 免费欧美日韩国产三级电影| 午夜久久av| ww久久综合久中文字幕| 久久人人99| 青青草国产成人99久久| 999在线观看精品免费不卡网站| 国产精一区二区| 国产精品99一区二区三区| 一区二区三区免费在线看| 福利精品在线| 99热精品在线观看| 亚洲精品伦理| 午夜久久美女| 999色成人| 国产日韩电影| 久久激情婷婷| www.久久久久爱免| 欧美hentaied在线观看| 国产伦精品一区二区三区在线播放 | 国内揄拍国内精品久久| 国产精品成人av| 久久久夜夜夜| 美女精品一区最新中文字幕一区二区三区| 欧美激情电影| 美女毛片一区二区三区四区| 国产亚洲一区二区三区啪| 亚洲精品在线影院| 最新精品国产| 亚洲一二三区视频| 麻豆国产精品官网| 欧美wwwww| 99成人精品| 精品国产91| 亚洲香蕉视频| 麻豆成人免费电影| 欧美成人h版| 国产视频亚洲| 久久国产主播| 久久久精品区| 中文字幕免费一区二区三区| 三上悠亚国产精品一区二区三区| 在线综合亚洲| 国产综合精品一区| 国产成人福利av| 国产不卡一区| 另类小说一区二区三区| 日韩精品三区| 丝袜a∨在线一区二区三区不卡| 久久久五月天| avtt综合网| 亚洲制服欧美另类| 综合激情婷婷| 麻豆国产91在线播放| 精品视频在线一区二区在线| 免费看黄裸体一级大秀欧美| 米奇777超碰欧美日韩亚洲| 国内精品麻豆美女在线播放视频| 国产麻豆精品久久| 日本欧美一区二区在线观看| 麻豆精品蜜桃| yellow在线观看网址| 欧美日韩国产探花| 久久国产毛片| 精品视频日韩| 国产毛片精品| swag国产精品一区二区| 日本免费精品| 日韩激情一二三区| 亚洲8888| 少妇精品久久久一区二区| 亚洲一区欧美| 综合视频在线| 国产在线美女| 色综合综合网| 99热这里有精品| 亚洲麻豆一区| 亚洲国产日韩在线| 日韩精品三区四区| 麻豆极品一区二区三区| 美女网站一区二区| 国产精品综合色区在线观看| 国产精品久久久久9999高清| 久久激情综合网| 美女视频黄免费的久久| 欧美亚洲专区| 麻豆精品一区二区av白丝在线| 男人亚洲天堂| 亚洲精品乱码日韩| 少妇精品视频一区二区免费看| 另类中文字幕国产精品| 日本在线视频一区二区| 日韩国产一二三区| 毛片一区二区三区| 中文字幕成人| 日韩va欧美va亚洲va久久| 午夜久久av| 精品免费视频| 在线日韩中文| 最新成人av网站| 美女精品网站| 在线亚洲人成| 久久久久伊人| 国内精品久久久久久久影视麻豆| 亚洲精品字幕| 日本亚洲三级在线| 国产精品tv| 欧美日一区二区| 亚洲深爱激情| 日韩黄色大片网站| 美日韩一级片在线观看| 国产剧情在线观看一区| 综合视频一区| 激情欧美日韩| 日本一区二区三区视频| 日韩欧美2区| 亚洲一区二区三区无吗| 人人爱人人干婷婷丁香亚洲| 亚洲网站在线| 在线视频亚洲欧美中文| 欧美福利在线播放网址导航| 99久久夜色精品国产亚洲狼| 一本色道久久综合| 国产精品亚洲一区二区三区在线观看| 久久精品国产99| 亚洲欧美日本伦理| 成人在线免费观看91| 国产精品嫩草99av在线| 日韩欧美看国产| 欧美精品国产| 高清一区二区三区| 性欧美精品高清| 日韩福利在线观看| 亚洲精品中文字幕99999| 久久久一二三| zzzwww在线看片免费| 老司机免费视频一区二区 | 日本不卡一二三区黄网| 精品国产麻豆| 国产亚洲高清视频| 欧洲午夜精品| 亚洲春色h网| 激情婷婷综合| 亚洲mmav| 欧美人与牛zoz0性行为| 欧美一区2区| 日韩久久电影| 久久99免费视频| 欧美日韩免费观看一区=区三区 | 精品99在线| 97视频热人人精品免费| 国产精品九九| 激情综合自拍| 成人久久网站| 秋霞一区二区| 蜜臀av性久久久久蜜臀aⅴ流畅 | 久久久久久久久久久久久久久久久久久久| heyzo欧美激情|