Transformer 六周年:在它之前世界平淡,在它之后世界地覆天翻
一直以來(lái),人工智能領(lǐng)域的學(xué)者和工程師們都試圖讓機(jī)器學(xué)習(xí)人類(lèi)的語(yǔ)言和說(shuō)話(huà)方式,但進(jìn)展始終不大。
因?yàn)槿祟?lèi)的語(yǔ)言太復(fù)雜,太多樣,而組成它背后的機(jī)制,往往又充滿(mǎn)著不可名狀的規(guī)律。
過(guò)去人們?cè)谧匀徽Z(yǔ)言處理中多采用 RNN 循環(huán)神經(jīng)網(wǎng)絡(luò),它十分類(lèi)似于人類(lèi)邏輯上對(duì)語(yǔ)言的理解——強(qiáng)調(diào)上下文順序、前后文邏輯關(guān)系。
【資料圖】
但是這種順序方式讓 RNN 無(wú)法實(shí)現(xiàn)并行計(jì)算,也就是說(shuō),它的速度十分緩慢,而規(guī)模也很難擴(kuò)大。
直到 2017 年 6 月 12 日,一篇名為 Attention is All You Need 的論文被提交到預(yù)印論文平臺(tái) arXiv 上。
一切從此改變。
Transformer 的提出直接導(dǎo)致導(dǎo)致了現(xiàn)在生成式 AI 風(fēng)暴。機(jī)器好像在一瞬間就學(xué)會(huì)了如何與人類(lèi)自如交流。
在 Transformer 提出前,人們討論的是如何讓智能音箱聽(tīng)懂你的提問(wèn),而 Transformer 之后,人們討論的重點(diǎn)變成了該如何防范 AGI 通用智能對(duì)人類(lèi)造成的危險(xiǎn)。
Attention is All You Need 這篇論文的重要性可見(jiàn)一斑,剛剛過(guò)去的 12 號(hào)正是它六周歲生日。
Transformer 這個(gè)名字據(jù)說(shuō)來(lái)自論文聯(lián)合作者之一的 Llion Jones,原因無(wú)它,因?yàn)?attention (注意力)這個(gè)詞聽(tīng)上去實(shí)在是有點(diǎn)不酷。
Llion Jones 也是目前八個(gè)論文聯(lián)合作者中唯一一個(gè)還在谷歌上班的人。剩下的七個(gè)人都紛紛離職創(chuàng)業(yè)。最有名的大概是 Character AI,創(chuàng)始人是論文作者之一的 Noam Shazeer,他之前在谷歌工作了 20 年,負(fù)責(zé)構(gòu)建了 LaMDA。
那么 Transformer 究竟有什么點(diǎn)石成金的魔力呢?我們盡量用通俗易懂的話(huà)來(lái)解釋。
Transformer 徹底拋棄了前面提到的 RNN 循環(huán)神經(jīng)網(wǎng)絡(luò)這套邏輯,它完全由自注意力機(jī)制組成。
大家都有過(guò)這樣的經(jīng)驗(yàn),打亂個(gè)一子句中字詞序順的多很時(shí)候不并響影對(duì)你句子的解理。比如上面這句。
這是因?yàn)槿四X在處理信息時(shí)會(huì)區(qū)分權(quán)重,也就是說(shuō),我們的注意力總是被最重要的東西吸引走,次要的細(xì)節(jié)則被忽略。
Transformer 模仿了這一點(diǎn),它能夠自動(dòng)學(xué)習(xí)輸入的序列中不同位置之間的依賴(lài)關(guān)系并計(jì)算其相關(guān)性(而不是對(duì)整個(gè)輸入進(jìn)行編碼)。這讓針對(duì)序列的建模變得更加容易和精準(zhǔn)。
在深度學(xué)習(xí)中引入這種機(jī)制,產(chǎn)生了兩個(gè)明顯好處。
一方面,并行計(jì)算得以實(shí)現(xiàn),基于 Transformer 架構(gòu)的模型可以更好地利用 GPU 進(jìn)行加速。由此,Transformer 為預(yù)訓(xùn)練模型的興起奠定了基礎(chǔ),隨著模型的規(guī)模越來(lái)越大,神經(jīng)網(wǎng)絡(luò)開(kāi)始出現(xiàn)所謂 " 智能涌現(xiàn) ",這正是人們認(rèn)為像 GPT 這樣的大模型打開(kāi)了 AGI 通用人工智能大門(mén)的原因。
另一方面,盡管最開(kāi)始 Transformer 的提出是被用來(lái)解決自然語(yǔ)言,更準(zhǔn)確地說(shuō),機(jī)器翻譯問(wèn)題,但很快人們就發(fā)現(xiàn),這種注意力機(jī)制可以推廣到更多領(lǐng)域——比如語(yǔ)音識(shí)別和計(jì)算機(jī)視覺(jué)。基于 Transformer 的深度學(xué)習(xí)方法實(shí)際上適用于任何序列——無(wú)論是語(yǔ)言還是圖像,在機(jī)器眼中它們不過(guò)是一個(gè)個(gè)帶規(guī)律的向量。
在這兩種優(yōu)點(diǎn)的共同作用下,人工智能領(lǐng)域迎來(lái)了前所未有的爆發(fā),后面的故事我們都知道了。
下面是關(guān)于 Transformer 的幾個(gè) fun facts。前面三個(gè)來(lái)自英偉達(dá) AI 科學(xué)家 Jim Fan 慶祝 Transformer 架構(gòu)被提出六周年的推文。1、注意力機(jī)制不是 Transformer 提出的。
注意力機(jī)制是深度學(xué)習(xí)三巨頭之一的 Yoshua Bengio 于 2014 年提出的。這篇名為 Neural Machine Translation by Jointly Learning to Align and Translate 的論文中首次提出了注意力機(jī)制。堪稱(chēng)自然語(yǔ)言處理里程碑級(jí)的論文。在那之后許多人都投身于對(duì)注意力機(jī)制的研究,但直到 Transformer 論文的出現(xiàn)大家才明白——相對(duì)別的因素而言,只有注意力機(jī)制本身才是重要的。
2、Transformer 和注意力機(jī)制最初都只為了解決機(jī)器翻譯問(wèn)題。
未來(lái)人們回溯 AGI 的起源,說(shuō)不定要從谷歌翻譯開(kāi)始。盡管注意力機(jī)制幾乎可以用在深度學(xué)習(xí)的所有領(lǐng)域,但一開(kāi)始不管是 Yoshua Bengio 的論文還是 Transformer 架構(gòu),都單純是為了提高機(jī)器翻譯的效果。
3、Transformer 一開(kāi)始并未引人注意,至少對(duì) NeurIPS 來(lái)說(shuō)如此。
NeurIPS 2017 上一共有 600 多篇論文被接受,Transformer 是其中之一,但也僅此而已了。諷刺的是當(dāng)年 NeurIPS 上的三篇最佳論文聯(lián)合起來(lái)的引用次數(shù)只有五百多次。
4、OpenAI 在 Transformer 發(fā)布的第二天就 all in 。
雖然很多人一開(kāi)始并沒(méi)有意識(shí)到 Transformer 的威力,但這其中顯然不包括 OpenAI。他們?cè)?Transformer 甫一發(fā)布就迅速意識(shí)到了這意味著什么,并迅速?zèng)Q定完全投入其中。
實(shí)際上,GPT 中的 T 正是 Transformer。
5、Transformer 幾乎立刻取代了 LSTM 的地位。
在 Transformer 提出之前,自然語(yǔ)言處理使用廣泛的是名叫長(zhǎng)短期記憶網(wǎng)絡(luò) LSTM 的序列生成模型,它的一大缺陷是對(duì)輸入內(nèi)容的先后順序敏感,因此無(wú)法大規(guī)模使用并行網(wǎng)絡(luò)計(jì)算。
然而在 Transformer 被提出之前,許多人都認(rèn)為 LSTM 將在很長(zhǎng)一段時(shí)間內(nèi)容主導(dǎo) NLP 的發(fā)展。
責(zé)任編輯:hnmd003
相關(guān)閱讀
-
Transformer 六周年:在它之前世界平淡,在它之后世界地覆天翻
理解了人類(lèi)的語(yǔ)言,就理解了世界。一直以來(lái),人工智能領(lǐng)域的學(xué)者和工程
2023-06-13 -
索尼發(fā)布 FX6 和 CineAltaV 2 固件升級(jí)預(yù)告|全球信息
2023年6月9日,索尼(中國(guó))有限公司發(fā)布關(guān)于兩款電影攝影機(jī)產(chǎn)品固件升
2023-06-13 -
英偉達(dá)、甲骨文聯(lián)手投資的 AI 獨(dú)角獸,能否戰(zhàn)勝 OpenAI?-全球聚焦
白宮、歐盟、中國(guó)、日本,這不是某國(guó)政要的出訪(fǎng)行程,而是近期大熱公司
2023-06-13 -
手機(jī)廠商對(duì)擂護(hù)眼屏:玩手機(jī)真的能不傷眼睛嗎?
作者|孫鵬越編輯|大風(fēng)近日,榮耀發(fā)布新一代數(shù)字旗艦榮耀90系列,將手
2023-06-13 -
對(duì)標(biāo)谷歌 MusicLM!Meta 發(fā)布開(kāi)源音樂(lè)模型 MusicGen
財(cái)聯(lián)社6月13日訊(編輯夏軍雄)隨著聊天機(jī)器人ChatGPT的興起,人們開(kāi)始
2023-06-13
相關(guān)閱讀
-
Transformer 六周年:在它之前世界平淡,在它之后世界地覆天翻
理解了人類(lèi)的語(yǔ)言,就理解了世界。一直以來(lái),人工智能領(lǐng)域的學(xué)者和工程
-
索尼發(fā)布 FX6 和 CineAltaV 2 固件升級(jí)預(yù)告|全球信息
2023年6月9日,索尼(中國(guó))有限公司發(fā)布關(guān)于兩款電影攝影機(jī)產(chǎn)品固件升
-
英偉達(dá)、甲骨文聯(lián)手投資的 AI 獨(dú)角獸,能否戰(zhàn)勝 OpenAI?-全球聚焦
白宮、歐盟、中國(guó)、日本,這不是某國(guó)政要的出訪(fǎng)行程,而是近期大熱公司
-
環(huán)球視訊!利安人壽鑫享人生年金保險(xiǎn)怎么樣?有什么保障?
還是不錯(cuò)的。鑫享人生保險(xiǎn)計(jì)劃在猶豫期10天結(jié)束后即可領(lǐng)取生存金,給付
-
【熱聞】央行年內(nèi)首次降息!市場(chǎng)早有預(yù)期,穩(wěn)增長(zhǎng)政策加碼
圖片來(lái)源:圖蟲(chóng)創(chuàng)意10個(gè)月按兵不動(dòng)后,央行宣布7天逆回購(gòu)利率下降10個(gè)
-
天天熱推薦:國(guó)華真愛(ài)養(yǎng)老年金保險(xiǎn)(萬(wàn)能型)可靠嗎?特點(diǎn)有哪些?
可靠。作為國(guó)內(nèi)知名的金融保險(xiǎn)公司,國(guó)華人壽在行業(yè)內(nèi)具有非常高的聲譽(yù)
-
年金保險(xiǎn)按照給付方式可分為哪幾種?年金保險(xiǎn)有什么功能?_全球新資訊
可以分為定期生存年金、終身年金和兩全年金。定期生存年金保障期限固定
-
天天速訊:國(guó)壽鑫裕尊享年金保險(xiǎn)是哪個(gè)保險(xiǎn)公司的?提供什么保障?
國(guó)壽鑫裕尊享年金保險(xiǎn)是由中國(guó)人壽保險(xiǎn)股份有限公司推出的一款養(yǎng)老保險(xiǎn)
-
人壽百萬(wàn)醫(yī)療價(jià)格表怎么查詢(xún)?都保什么病?
1、直接在保險(xiǎn)公司官方網(wǎng)站查詢(xún),可以在官方網(wǎng)站找到關(guān)于產(chǎn)品價(jià)格的信
-
手機(jī)廠商對(duì)擂護(hù)眼屏:玩手機(jī)真的能不傷眼睛嗎?
作者|孫鵬越編輯|大風(fēng)近日,榮耀發(fā)布新一代數(shù)字旗艦榮耀90系列,將手
-
每日看點(diǎn)!半次元停服了,我的快樂(lè)老家沒(méi)有了
題圖 半次元中國(guó)二次元社區(qū)建立不易守卻更難6月12日晚,一則停服公告,
-
對(duì)標(biāo)谷歌 MusicLM!Meta 發(fā)布開(kāi)源音樂(lè)模型 MusicGen
財(cái)聯(lián)社6月13日訊(編輯夏軍雄)隨著聊天機(jī)器人ChatGPT的興起,人們開(kāi)始
-
【速看料】拒絕頂級(jí) CMOS,“谷歌手機(jī)”打的是什么算盤(pán)
眾所周知,如今在智能手機(jī)行業(yè)中,頂級(jí)CMOS幾乎是所有品牌都爭(zhēng)相追捧的
-
環(huán)球快看:三星或換用水滴鉸鏈,折疊屏手機(jī)已距離普及不遠(yuǎn)
日前有消息源透露,三星方面或?qū)?huì)在新款折疊屏機(jī)型GalaxyZFold5上換用
-
金田股份: 截至2023年6月9日的股東總戶(hù)數(shù)為55,294-天天要聞
金田股份(601609)06月13日在投資者關(guān)系平臺(tái)上答復(fù)了投資者關(guān)心的問(wèn)題。
-
泰康鑫福年金保險(xiǎn)條款介紹,怎么樣?_觀焦點(diǎn)
泰康鑫福年金險(xiǎn)的保單條款包括投保規(guī)則、保障責(zé)任、免責(zé)條款、保費(fèi)繳納
-
建信人壽尊享金生年金保險(xiǎn)怎么樣?值得購(gòu)買(mǎi)嗎? 前沿資訊
年金領(lǐng)取方式多樣,建信尊享金生年金保險(xiǎn)提供了“三金”領(lǐng)取方式,具體
-
陽(yáng)光人壽附加財(cái)富賬戶(hù)年金保險(xiǎn)E款怎么樣?保障什么?
還是非常不錯(cuò)的。該款產(chǎn)品采用分紅累積方式,除了享受基本保險(xiǎn)合同約定
-
天天百事通!華夏財(cái)富寶養(yǎng)老年金保險(xiǎn)(C款)怎么樣?保終身嗎?
還是不錯(cuò)的。華夏財(cái)富寶養(yǎng)老年金保險(xiǎn)C款是一種旨在幫助人們?yōu)橥诵莺蟮?/p>
-
天天微速訊:國(guó)壽鑫享鴻福年金保險(xiǎn)c款提供什么保障?適合什么人買(mǎi)?
國(guó)壽鑫享鴻福年金險(xiǎn)提供了生存保險(xiǎn)金、滿(mǎn)期保險(xiǎn)金和身故保險(xiǎn)金等多種保
-
量子科技強(qiáng)化頂層設(shè)計(jì) 量子計(jì)算機(jī)有望成為AI算力“神藥”?丨行業(yè)風(fēng)口
近日,科技部部長(zhǎng)王志剛赴合肥調(diào)研量子科技發(fā)展情況,對(duì)加強(qiáng)國(guó)家量子科
-
雙碳落向“實(shí)”處 “綠色”引領(lǐng)高質(zhì)量發(fā)展
能源技術(shù)及其關(guān)聯(lián)產(chǎn)業(yè)表現(xiàn)出旺盛的生命力,有望成為帶動(dòng)產(chǎn)業(yè)升級(jí)的新增
-
微信鍵盤(pán)全平臺(tái)體驗(yàn):最適合微信的輸入法,但不適合所有人|每日時(shí)訊
輸入「愛(ài)你」,按下「3」,選擇發(fā)送表情包。輸入「1 」,換行,就會(huì)出
-
三星 S24 Ultra 相機(jī)規(guī)格曝光 2 億主攝不變 長(zhǎng)焦鏡頭微調(diào)
【手機(jī)中國(guó)新聞】近期,三星S24Ultra新一代旗艦機(jī)的消息不斷在網(wǎng)上傳來(lái)
-
小米 Civi 3 頂配版正式開(kāi)售,1TB 存儲(chǔ)僅 2999 元
作為小米旗下面向年輕消費(fèi)群體打造的產(chǎn)品序列,在機(jī)身顏值與影像能力上
-
ChatGPT 或提供更多功能,如定義人設(shè)和長(zhǎng)文分析_世界今亮點(diǎn)
日前,一位名為kocham_psy的Reddit用戶(hù)透漏,已在ChatGPT的源代碼中發(fā)
-
華為 nova 系列或迎來(lái)折疊屏機(jī)型,價(jià)格將更親民 世界焦點(diǎn)
此前,華為方面就已憑借著旗下諸如PocketS、MateXs2、P50Pocket等折疊
-
央行意外調(diào)降 OMO 利率 10bp,債市全線(xiàn)走強(qiáng),現(xiàn)券長(zhǎng)端收益率下行近 5bp 天天信息
財(cái)聯(lián)社6月13日訊(編輯劉海)央行意外調(diào)降7天OMO利率10bp,債市全線(xiàn)走
-
奈雪的茶被傳 7 月開(kāi)放加盟:公司回應(yīng)暫未收到消息,新茶飲規(guī)模戰(zhàn)激烈_世界播報(bào)
本文來(lái)源:時(shí)代周報(bào)作者:涂夢(mèng)瑩新茶飲市場(chǎng)再次卷進(jìn)規(guī)模戰(zhàn)?近日,據(jù)市
-
曾經(jīng)千億 PE 巨頭九鼎帝國(guó)崩塌,前腳分配 7.5 億股息,后腳美元債展期,債權(quán)人當(dāng)了冤大頭?-天天播資訊
財(cái)聯(lián)社6月13日訊(實(shí)習(xí)編輯葛宇)曾經(jīng)的PE巨頭、號(hào)稱(chēng)業(yè)界戰(zhàn)斗機(jī)的九鼎
精彩推薦
- 每日熱聞!@考生 2023年西藏小升初考試...
- 焦點(diǎn)熱訊:十大景點(diǎn)不容錯(cuò)過(guò) 邀您開(kāi)啟“...
- 西藏山南空港新區(qū)污水處理廠及配套管網(wǎng)...
- 國(guó)道之行 從雪山奔向大海|今日玉麥,...
- “口腔診療套餐”送到西藏阿里戍邊民警...
- 當(dāng)前速看:用扎念琴奏響文化傳承之聲
- 世界觀焦點(diǎn):西藏林芝開(kāi)展水域地毯式排查
- 聚焦:國(guó)網(wǎng)拉薩供電公司圓滿(mǎn)完成2023年...
- 拉薩推動(dòng)數(shù)字教育資源規(guī)模化 世界熱頭條
- 【全球新要聞】文化和自然遺產(chǎn)日 | 羅...
閱讀排行
精彩推送
- 炒停售沖刺 630,有保險(xiǎn)代理人...
- 福建千億資產(chǎn)國(guó)企入主 4 年,...
- 中國(guó)首次!這項(xiàng)世界頂級(jí)大會(huì)將在...
- 退市!大股東增持也救不了*ST海...
- 開(kāi)店十五年首獲融資,茶百道會(huì)成...
- 子公司總經(jīng)理用公款存錢(qián),實(shí)控人...
- 時(shí)代IPO快訊:燕之屋首次遞表港...
- 穩(wěn)利來(lái)5號(hào)年金保險(xiǎn)a款好嗎?保障...
- 金彩一生終身年金保險(xiǎn)介紹,好嗎...
- 續(xù)保終身的百萬(wàn)醫(yī)療險(xiǎn)有哪些?能...
- 銀行推薦增額壽險(xiǎn)可靠嗎?有風(fēng)險(xiǎn)...
- 買(mǎi)了重疾險(xiǎn)可以退嗎?能退多少錢(qián)?
- 福特被曝在華大裁員 世界看點(diǎn)
- 環(huán)球報(bào)道:股東分配利潤(rùn)要交什么...
- 百度盤(pán)前漲近5% 蘇寧易購(gòu)百萬(wàn)款...
- 茅臺(tái)擬斥資參與設(shè)立產(chǎn)業(yè)發(fā)展基金...
- 最新快訊!五菱旗下宏光MINIEV家...
- 播報(bào):貴州茅臺(tái)股東大會(huì)舉行 超...
- 搜索造假?微軟瀏覽器中搜索 Ch...
- 舒適不暈系統(tǒng)強(qiáng):試用蘋(píng)果 Visi...
- 存儲(chǔ)芯片反轉(zhuǎn)信號(hào)涌現(xiàn) 機(jī)構(gòu)看好...
- 各大品牌為何扎堆換 logo?帶你...
- SpaceX 實(shí)現(xiàn)第 200 次火箭發(fā)...
- AMD 明天放大招!多位選手跑步...
- 緊急通知!國(guó)家游泳中心“水立方...
- 厄爾尼諾事件標(biāo)志我國(guó)降水“南澇...
- 主任帶著科室醫(yī)生一起吃回扣,9...
- 江南布衣“布盡其用”項(xiàng)目成果亮...
- 焦點(diǎn)資訊:太原周大福黃金價(jià)格今...
- 觀察:梅西淘寶直播首秀的主播,...


