我在 AI 訓(xùn)練庫里,找到 200 多張周杰倫的照片
我的一些網(wǎng)站正在被你的用戶攻擊,你不能不經(jīng)同意就抓取我的照片信息。
(資料圖)
你要是不想讓人看你發(fā)網(wǎng)上的照片,你就把它刪除啊。
這段對話來自圖片抓取工具 Img2dataset 的 GitHub 頁面,爭論的雙方,是被抓取圖片的網(wǎng)站站長 Eden,和抓取工具的開發(fā)者 Romain。
▲雙方發(fā)言的贊踩數(shù),似乎能看到大眾的偏向
發(fā)布上網(wǎng) = 默認(rèn)同意 AI 訓(xùn)練
不論是 Open AI 的 DALL-E、Google 的 Imagen,還是開源的 Stable Diffusion,任何由文字生成圖片的通用大模型,都需要經(jīng)過大量的數(shù)據(jù)訓(xùn)練,網(wǎng)絡(luò)是訓(xùn)練信息的最佳來源。
Eden 建立了一個名為 OpenBenches 的網(wǎng)站,邀請用戶上傳世界各地的紀(jì)念長椅圖片和位置。截至今日,OpenBenches 已經(jīng)收集了超過兩萬七千張長椅,托管了 250GB 的照片。
一日,Eden 收到了服務(wù)器報警,說網(wǎng)站正在受到持續(xù)攻擊,來源正是上文中提到的 Img2dataset。原因很簡單,有人把 Eden 網(wǎng)站里的長椅圖片用于了 AI 訓(xùn)練。因為網(wǎng)站流量的激增,導(dǎo)致 Eden 不僅支付了額外費用,還花費了不少時間去阻止抓取工具的濫用。
當(dāng)然,Img2dataset 的抓取并不是無法禁止的,只需為網(wǎng)站加入「X-Robots-Tag: NoAI」的標(biāo)頭,就可以避免被 Img2dataset 抓取,如果你沒有加,則默認(rèn)你同意自己的網(wǎng)站數(shù)據(jù)可以被用于 AI 訓(xùn)練。這就出現(xiàn)了爭論的關(guān)鍵:作為所有者,我應(yīng)該選擇加入,而不是選擇退出。
▲「你剝奪了人們的同意權(quán)」
聽起來似乎有一點繞,舉一個不太恰當(dāng)?shù)睦樱以谑謾C(jī)上下載了一款新 app,在沒有打開前,它就已經(jīng)獲取了所有權(quán)限,并根據(jù)信息推送了廣告通知,當(dāng)我質(zhì)問開發(fā)者時,卻得到了「你要是不想看廣告,就不要用手機(jī)啊」的回復(fù)。
怎么樣,你開始生氣了嗎?
公司能收費,個人沒辦法
今年 2 月,Twitter 宣布不再支持免費 API 訪問,如果你想訪問 Twitter 的數(shù)據(jù),需要每月支付 4.2 萬到 21 萬美元不等的費用,金額越高,研究人員或企業(yè)獲得的推文數(shù)量就越多。
因此,微軟則宣布數(shù)字營銷中心(DMC)隨后表示不再支持 Twitter,這將導(dǎo)致用戶不能再通過微軟的免費社交媒體管理服務(wù)創(chuàng)建、管理他們的推文。
Twitter CEO 馬斯克也一點都不含糊:微軟在用 Twitter 的數(shù)據(jù)進(jìn)行非法訓(xùn)練,接下來是訴訟時間。
知名社交媒體 Reddit 擁有龐大的用戶群體和活躍的社交板塊,同時不少板塊的內(nèi)容也相當(dāng)專業(yè)權(quán)威,這讓它成為了一個非常好的 AI 學(xué)習(xí)資料庫。Google Bard 和 ChatGPT 都曾引用 Reddit 的數(shù)據(jù)做其訓(xùn)練的信息來源之一。
▲兩者的語義學(xué)習(xí)文檔中都出現(xiàn)過 Reddit 的身影
「Reddit 的數(shù)據(jù)語料庫非常有價值,我不能免費將這些價值提供給世界級大公司。」Reddit 創(chuàng)始人 Steve 在采訪中表示。
上周二,Reddit 追隨 Twitter 的腳步,開始向大公司收取 API 訪問費用。
你構(gòu)建未來與我競爭的工具,而我還要把數(shù)據(jù)免費提供給你,怎么想都不合理。
對大公司來說,改變 API 的開放策略尚是一件需要進(jìn)行多方權(quán)衡的反擊方法,而像 Eden 這樣的個人網(wǎng)站運營者或者普通網(wǎng)友,面對 AI 默認(rèn)同意的照片訓(xùn)練,并沒有太好的應(yīng)對方法。音樂家 Holly Herndon 創(chuàng)建了一個名為「Have I Been Trained」的網(wǎng)站,收集了 5 億張用于 AI 藝術(shù)模型訓(xùn)練的圖片,旨在幫助藝術(shù)家了解他們的作品是否包含在 AI 模型訓(xùn)練的數(shù)據(jù)集中。
我嘗試在網(wǎng)站中搜索了「Jay Chou」,不知這些被用來進(jìn)行 AI 訓(xùn)練的周杰倫照片,有沒有經(jīng)過周董本人的同意。
▲網(wǎng)站:https://haveibeentrained.com/
那么,我可以不讓 AI 識別我的照片嗎?當(dāng)然可以,那就是 Img2dataset 開發(fā)者提供的方法了:拒絕 AI 識別的最佳方法,就是刪除它——不想讓我用?那你就別上傳。
人工智能正在以驚人的速度發(fā)展,AI 工具方便了我們的工作生活,但我們似乎還沒有想好,該如何應(yīng)對為人工智能提供動力的數(shù)據(jù)源。
請給我們「同意」的權(quán)利
在「長椅」網(wǎng)站所有者 Eden 與圖片采集工具開發(fā)者 Rom 的爭論中,后者提到一個觀點:被 Google 搜索是搜,被我搜索也是搜,為什么你愿意讓 Google 收錄你的網(wǎng)站,不允許我搜索呢?
這看起來似乎有些道理,但 Google 搜索中心為開發(fā)者提供了一個非常全面的防請求機(jī)制:robots.txt。使用這個文件,就可以避免網(wǎng)站收到過多的請求,它并不是一種阻止 Google 抓取某個網(wǎng)頁的機(jī)制,而是為了更加合理的分配流量。
有網(wǎng)友指出,Img2dataset 主動忽略了 robots.txt,這個做法顯然是惡意的。而且,相比全球最大的搜索引擎 Google,Img2dataset 這樣的小工具數(shù)量更多、迭代更快,今天禁止了這個,明天就會冒出那個。「難道每出現(xiàn)一個新工具,我就要選擇一次拒絕?」Eden 提出的疑問,也是我們每個人可能會遇到的事。
或許是為了利益,或許是尋求方便,不管是故意的還是不小心,「默認(rèn)同意」似乎成為了 AI 高速發(fā)展的秘密武器。但我始終認(rèn)為,同意是道德的基石,AI 發(fā)展的同時,也需要更加合理的數(shù)據(jù)集采集方式。
在爭辯的最后,Rom 依然堅持自己的觀點:很遺憾,你們中的一些人還是不理解 AI 的潛力,作為創(chuàng)作者,你們有更多機(jī)會從中受益,卻與此斗爭,這令人感到悲哀。
AI 在飛速發(fā)展,而要走的路還是很長。點擊「在看」是對我們最大的鼓勵
責(zé)任編輯:hnmd003
相關(guān)閱讀
-
我在 AI 訓(xùn)練庫里,找到 200 多張周杰倫的照片
我的一些網(wǎng)站正在被你的用戶攻擊,你不能不經(jīng)同意就抓取我的照片信息。EdenRomain你要是不想讓人看你發(fā)網(wǎng)上
2023-04-29 -
全球熱點評!體驗過 8 款華碩春季新品 我對今年的輕薄本有了一些思考
經(jīng)過這個春天,我已經(jīng)變成華碩的形狀了。作為一名PC編輯,從三月到五月初,我測試了華碩春季幾乎所有的輕薄
2023-04-29 -
百度文庫內(nèi)測“ AI 文檔助手”:接入“文心一言”,創(chuàng)作文檔僅需 15 秒 世界熱訊
品玩4月28日訊,據(jù)IT之家從百度官方獲悉,近日,百度文庫開啟AI文檔助手功能內(nèi)測。據(jù)了解,該功能已內(nèi)測接
2023-04-29 -
每日信息:華為新專利:可對自動駕駛車輛系統(tǒng)提供安全警示
品玩4月28日訊,據(jù)IT之家報道,華為技術(shù)有限公司一種自動駕駛車輛駕駛安全度量化系統(tǒng)專利于近期獲得授權(quán),
2023-04-29 -
喜迎四周年!《明日方舟》手機(jī)交通卡專屬卡面來了
【手機(jī)中國新聞】4月29日,手機(jī)中國了解到,值此四周年之際,《明日方舟》聯(lián)合上海交通卡、北京市政交通一
2023-04-29
相關(guān)閱讀
-
我在 AI 訓(xùn)練庫里,找到 200 多張周杰倫的照片
我的一些網(wǎng)站正在被你的用戶攻擊,你不能不經(jīng)同意就抓取我的照片信息。EdenRomain你要是不想讓人看你發(fā)網(wǎng)上
-
中國跑車,不都是笑話
最近看到友媒發(fā)表高論《中國超跑,都是笑話》,不禁驚詫,每個字都讓我驚詫。中國什么時候有超跑了?什么時
-
海爾確定不造整車-今亮點
財聯(lián)社4月29日電,針對市場上海爾造車的傳聞,海爾方面回應(yīng)稱,海爾非常明確不造整車,將從生態(tài)的角度切入
-
即時:假期出游or宅家追劇?有華為折疊屏手機(jī)家族就夠了!
五一假期即將來臨,你想好怎么度過這5天了嗎?不少朋友選擇出游,也有朋友愿意宅在家中看劇、打游戲。其實
-
太平人壽怎么退保險?多久能到賬啊? 全球動態(tài)
線上退保需要登錄太平人壽官網(wǎng),在“個人中心”-“我的保單”-“保單詳情”中找到相應(yīng)的保單,點擊“申...
-
利安人壽退保怎么退?需要什么資料?
登錄利安人壽官網(wǎng),進(jìn)入“自助服務(wù)-保單查詢”,輸入投保人姓名、證件類型、證件號碼和保單號碼等信息,...
-
理財保險可以退嗎?怎么退?-最資訊
理財保險是可以退保的,但需注意,理財保險的保險期限一般較長,且其中的投資部分需要經(jīng)過時間積累才能實現(xiàn)
-
雙重參保的情況下怎么退保?退保需要多久?
可以根據(jù)自身情況選擇相應(yīng)的退保方式。一般來說,退保方式包括線上和線下兩種方式,其中線上退保比較方便快
-
人壽保險退保流程是什么?可以退多少錢? 世界新視野
首先要填寫退保申請書一般來說,退保申請書應(yīng)該包含被保險人的姓名、身份證號碼、保單號碼、聯(lián)系方式等基本
-
當(dāng)前快播:券商一季度業(yè)績大反攻,西部證券凈利飆增2227%! “優(yōu)等生”東方財富卻跳水
2022年券商行業(yè)“滑鐵盧”已成歷史,新一年的首份答卷,券商們?nèi)〉昧瞬诲e的成績。截至4月28日晚,51家上...
-
全球熱點評!體驗過 8 款華碩春季新品 我對今年的輕薄本有了一些思考
經(jīng)過這個春天,我已經(jīng)變成華碩的形狀了。作為一名PC編輯,從三月到五月初,我測試了華碩春季幾乎所有的輕薄
-
滴滴退市后發(fā)布年報:2022 年營收下降 19%,凈虧損收窄 52% 全球即時看
4月29日,滴滴退市后在其官網(wǎng)發(fā)布年報。2022年滴滴實現(xiàn)營業(yè)收入1408億元,同比下降19%。凈虧損為238億元,
-
猶太人割禮是什么意思_猶太人割禮解釋_每日熱聞
1、猶太人的包皮環(huán)切術(shù)是指男性切除陰莖的全部或部分包皮。根據(jù)猶太教,所有的男孩都應(yīng)該接受割禮。在猶太
-
環(huán)球熱點評!對話許小年:互聯(lián)網(wǎng)的下一波高潮將在工業(yè)領(lǐng)域掀起
伴隨著數(shù)字化進(jìn)程,互聯(lián)網(wǎng)的主戰(zhàn)場,正在從上半場的消費互聯(lián)網(wǎng),向下半場——工業(yè)互聯(lián)網(wǎng)方向發(fā)展。2016...
-
真愛無敵?DR鉆戒一年新增超200家門店,盈利下滑也抵擋不住擴(kuò)張的心
一生只買一枚的鉆戒正加速擴(kuò)張。4月27日晚間,迪阿股份(301177 SZ)披露2022年年報。年報顯示,2022年,迪
-
王一博也帶不動?樂華娛樂藝人管理收入首次下滑,杜華入局直播帶貨 當(dāng)前快報
過于依賴藝人的樂華娛樂正在拓展第二增長曲線。近日,樂華娛樂(2306 HK)披露了上市后的首份年報,2022年
-
天天快資訊:銀行保險理財產(chǎn)品可以退嗎?退保有什么損失?
一般來說,銀行保險理財產(chǎn)品都可以退,但具體的退款規(guī)定和流程會因產(chǎn)品種類、投資金額、購買時間等因素而異
-
居民醫(yī)療保險購買后多久生效?要交多少錢?|獨家焦點
根據(jù)相關(guān)規(guī)定,居民醫(yī)療保險一般在繳費次月生效。也就是說,比如您在2023年5月1日購買了居民醫(yī)療保險,那么
-
環(huán)球微頭條丨醫(yī)用級體溫儀FTA-300發(fā)布:比傳統(tǒng)水銀體溫計更安全
鳳凰網(wǎng)科技訊4月29日消息,全球三大家電消費電子展之一的中國家電及消費電子博覽會(AWE2023)27日上海揭開
-
雷克薩斯為何拒絕國產(chǎn)化?可以,但沒必要!_最新
雷克薩斯為何拒絕國產(chǎn)化?可以,但沒必要!對于豪華品牌來說,實現(xiàn)在華國產(chǎn)化不僅可以降低運輸成本和零部件
-
百度文庫內(nèi)測“ AI 文檔助手”:接入“文心一言”,創(chuàng)作文檔僅需 15 秒 世界熱訊
品玩4月28日訊,據(jù)IT之家從百度官方獲悉,近日,百度文庫開啟AI文檔助手功能內(nèi)測。據(jù)了解,該功能已內(nèi)測接
-
每日信息:華為新專利:可對自動駕駛車輛系統(tǒng)提供安全警示
品玩4月28日訊,據(jù)IT之家報道,華為技術(shù)有限公司一種自動駕駛車輛駕駛安全度量化系統(tǒng)專利于近期獲得授權(quán),
-
喜迎四周年!《明日方舟》手機(jī)交通卡專屬卡面來了
【手機(jī)中國新聞】4月29日,手機(jī)中國了解到,值此四周年之際,《明日方舟》聯(lián)合上海交通卡、北京市政交通一
-
颯特發(fā)布 5G 戶外三防手機(jī),可用于工業(yè)巡檢等工作測溫場景
鈦媒體App4月29日消息,AWE2023期間,紅外企業(yè)颯特宣布啟用新C端消費子公司盈孚睿泰(英文名:infrared)以
-
安客創(chuàng)新 Q1 凈利增長 54%,預(yù)計于下半年逐步推出用戶儲能產(chǎn)品
中國、東南亞及拉丁美洲仍將是未來布局重點。作者:Bonnie編輯:tuya出品:財經(jīng)涂鴉(ID:caijingtuya)公
-
知乎推送李玉剛跳河消息翻車,應(yīng)讓標(biāo)題黨付出沉重代價 天天短訊
評論員王曉娜這兩天,不少網(wǎng)友稱,自己收到了知乎名為李玉剛跳河自盡的前因后果的推文。隨后,李玉剛曬電影
-
每日消息!自己給自己發(fā)騷擾廣告?信息泄露的“黑洞”應(yīng)牢牢補(bǔ)上
4月27日,在微博、小紅書等社交平臺上,大量網(wǎng)友反映當(dāng)天在某購物平臺上收到陌生的聊天招呼,內(nèi)容均為騷擾
-
讓路讓景給外地游客很贊,但千萬別搞強(qiáng)制
五一來臨,為了迎接外地游客,各地紛紛出大招。繼淄博發(fā)出倡議把燒烤讓給外地人,長沙市發(fā)出倡議把長沙讓給
-
寧夏兩節(jié)會品牌入選“中華美食薈”
4月28日記者從自治區(qū)商務(wù)廳獲悉,我區(qū)“浪寧夏·品味道”2023寧夏美食文化節(jié)和中國面食博覽會暨吳忠早茶...
-
空調(diào)行情現(xiàn)復(fù)蘇趨勢!格力、美的爭當(dāng)“空調(diào)王”,押寶多元化_速遞
4月28日晚,美的集團(tuán)(000333 SZ)、格力電器(000651 SZ)先后發(fā)布2022年年報。2022年,格力電器營收1889
精彩推薦
- 西藏:多措并舉促高原經(jīng)濟(jì)跑出“新速度”
- 環(huán)球播報:“植”此青綠 賡續(xù)美麗拉薩新畫卷
- 環(huán)球最新:第五屆雙品網(wǎng)購節(jié)暨第二屆西...
- 全球聚焦:傳承脈瀉療法的索縣藏醫(yī)院,...
- 世界信息:“五一”假期,三場消費促進(jìn)活...
- 西藏將借助大數(shù)據(jù)實現(xiàn)疫苗接種精準(zhǔn)化
- 今日訊!“五一”假期 青藏集團(tuán)公司預(yù)...
- 世界觀察:西藏山南市大力推進(jìn)澤當(dāng)中心...
- “無腿勇士”陳州走進(jìn)拉薩中學(xué)做勵志講...
- 扎西尼瑪:西藏高海拔帶電作業(yè)第一人_當(dāng)...
閱讀排行
精彩推送
- 當(dāng)前消息!對話北汽集團(tuán)副總經(jīng)理...
- 【世界報資訊】未能實現(xiàn)銷售目標(biāo)...
- 在華停產(chǎn)、承認(rèn)落后、銷量下滑,...
- 熱議:奇駿還能進(jìn)入主流嗎?
- 集度與小米,誰先撐不住?
- 春雪邂逅春坤山_環(huán)球熱推薦
- 全球通訊!PC 行業(yè)生力軍開拓市...
- 全球消息!更加流暢!小米 13、...
- “五一”來賽罕區(qū),讓你暢吃、暢...
- 颯特發(fā)布 5G 戶外三防手機(jī),可...
- 西藏:多措并舉促高原經(jīng)濟(jì)跑出“...
- 騰騰夜經(jīng)濟(jì),奉化百年老街重燃繁...
- “五一”線下演出一票難求:黃牛...
- 不鼓勵生孩子了?馬斯克大砍推特...
- ES6新車未上,ES7老車主已受傷,...
- 青山區(qū):首屆農(nóng)副產(chǎn)品展銷會陪你...
- 致敬勞動者|岳瑞存: 新能源行...
- 全球新資訊:春雪邂逅春坤山
- 包頭機(jī)場將迎客流高峰
- 世界簡訊:市市場監(jiān)管局發(fā)布消費提示
- 上汽大眾凌渡L獲得中國汽車健康...
- 日產(chǎn)ARIYA艾睿雅榮獲Green NCAP...
- 環(huán)球熱文:1799 元起 小米電視...
- 米哈游《崩壞:星穹鐵道》上線騰...
- ChatGPT 標(biāo)注指南來了!數(shù)據(jù)是關(guān)鍵
- 環(huán)球簡訊:西方制裁不管用!俄油...
- 焦點快報!AI哨所|意大利解禁Cha...
- 今年 Q1 國內(nèi)手機(jī)出貨量持續(xù)下...
- 全球最資訊丨颯特發(fā)布消費品戰(zhàn)略...
- 速遞!什么是中級職稱評審_什么...



