日韩一区二区三区在线免费观看-开心久久婷婷综合中文字幕-欧美激情91-久久国产福利-欧美日韩日本国产亚洲在线-国产精品极品国产中出

首頁 > 新聞 > 智能 > 正文

基于 Transformer 的大模型是如何運行的?Meta 從全局和上下文學習揭秘|世界看熱訊

2023-06-22 14:23:08來源:ZAKER科技  

機器之心報道

編輯:馬梓文

本文旨在更好地理解基于 Transformer 的大型語言模型(LLM)的內部機制,以提高它們的可靠性和可解釋性。


(相關資料圖)

隨著大型語言模型(LLM)在使用和部署方面的不斷增加,打開黑箱并了解它們的內部工作原理變得越來越重要。更好地理解這些模型是如何做出決策的,這對改進模型和減輕其故障(如幻覺或推理錯誤)至關重要。

眾所周知,最近 LLM 成功的一個重要因素是它們能夠從上下文中學習和推理。LLM 對這些上下文的學習能力通常歸功于 Transformer 架構,特別是自注意力塊的使用,其能夠仔細選擇輸入序列,進而推理出可信的下一個 token。此外,預測可能需要全局知識,如語法規則或一般事實,這些可能不會出現在上下文中,需要存儲在模型中。

我們不禁會疑問,為什么基于 Transformer 的模型非常擅長使用它們的上下文來預測新的 token,這種能力是如何在訓練中產生的?帶著這些問題,來自 Meta AI 的研究者進行了深入的研究。他們通過研究合成設置下 Transformer 的學習機制,揭示了其全局和上下文學習的平衡,并將權重矩陣解釋為聯想記憶,為理解和優化 Transformer 提供了基礎。

論文地址:https://arxiv.org/pdf/2306.00802.pdf

首先要了解的是在訓練過程中 Transformer 是如何發現這些能力的。為此,該研究引入了一個合成數據集,該數據集由二元語言模型生成的序列組成。然后,模型需要依靠上下文學習來對特定的二元序列進行良好的預測,而全局二元可以根據當前 token 的全局統計數據進行猜測。雖然單層的 Transformer 無法可靠地預測上下文二元,但該研究發現通過開發感應頭(induction head)機制的雙層 Transformer 取得了成功,即擁有兩個注意力頭的 circuit,其允許 Transformer 從上下文 [ , a, b,, a ] 中預測 b,并且在 Transformer 語言模型中似乎無處不在。這種感應頭(induction head)機制在 Transformer 語言模型中是普遍存在的,并且取得了成功。

更進一步的,為了更好的了解上下文機制是怎樣出現在訓練過程中的,該研究在隨機初始化時凍結了一些層(包括嵌入和值矩陣)來進一步簡化模型架構。這樣一來研究重點轉移到注意力和前饋機制,同時避免了學習表征的困難。與此同時,這種簡化還為單個權重矩陣引入了一個自然模型作為聯想記憶。自然模型可以通過它們的外積存儲輸入 - 輸出或鍵 - 值對嵌入。隨機高維嵌入由于其接近正交性而特別適合這種觀點。

總結而言,該研究的貢獻可概括為:

本文引入了一種新的合成設置來研究全局和上下文學習:序列遵循二元語言模型,其中一些二元在序列中變化,而另一些不會。

本文將 Transformer 的權重矩陣視為學習存儲特定嵌入對的聯想記憶,并以此為任務推導出一個簡化但更可解釋的模型。

本文對訓練動態進行了細致的實證研究:首先學習全局二元,然后以自上而下的方式學習適當的記憶,形成感應頭。

本文給出了訓練動力學的理論見解,展示了如何通過在噪聲輸入中找到信號,在種群損失上進行一些自上而下的梯度步驟來恢復所需的聯想記憶。

方法介紹

接著該研究介紹了合成數據設置,這樣能夠仔細研究感應頭機制在訓練過程中的發展以及 Transformer 如何學習利用上下文信息的。

雙元數據模型:模型序列由一個通用的雙元語言模型(即馬爾可夫鏈)組成,每個序列的生成方式如下:

下圖 2 可視化了測試序列上的注意力圖,這表明該模型已經學習了感應頭機制。接著該研究介紹了 Transformer 聯想記憶觀點:因為幾乎正交的嵌入,權重矩陣表現為聯想記憶,將成對的嵌入存儲為其外積的加權和。研究引入了一個具有固定隨機嵌入的簡化 Transformer 模型,將用這種想法產生對學習動力學的精確理解。

此外,該研究提出了一個有用的觀點,將 Transformer 中的模型權重視為高維嵌入向量的聯想記憶。感應頭機制可以通過以下外積矩陣作為記憶來獲得,而其他所有權重則固定為隨機初始化狀態:

實驗

圖 3 研究了在迭代 300 次之前凍結不同層對訓練動態的影響。

全局 vs 上下文學習。從圖 4(左 / 右)可以看出,當聯合訓練所有層時,全局二元統計的學習速度往往比感應頭更快,這可以從早期迭代中的 loss 和 KL 的快速下降中看出。

此外,從圖 4(左)中看到,數據分布的變化會對上下文機制的學習速度產生重大影響。該研究觀察到以下情況可能會使上下文學習減慢: ( i ) 較少數量的觸發器 K, ( ii ) 僅使用少有的固定觸發器,以及 ( iii ) 使用隨機觸發器而不是固定觸發器。

該研究還在圖 4(中間)中顯示,在訓練時將輸出 token 分布更改為二元分布會降低準確率,這表明,使用更多樣化的訓練分布可以產生具有更好泛化準確率的模型,并且只需少量的額外訓練成本。

更多研究內容,請參考原論文。

THE END

轉載請聯系本公眾號獲得授權

投稿或尋求報道:content@jiqizhixin.com

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀

国产亚洲精aa在线看| 人人精品久久| 亚洲一级高清| 石原莉奈在线亚洲二区| 97欧美成人| 日韩va亚洲va欧美va久久| 五月精品视频| 黄色成人在线视频| 欧美人妖在线| 黑人操亚洲人| 男人亚洲天堂| 国产一级成人av| 国产乱码午夜在线视频| 亚洲精选91| 久久精品不卡| 亚洲二区av| 亚洲无线观看| 鲁大师成人一区二区三区| 久久精品一区| 精品理论电影在线| 黑人巨大精品| 欧美激情偷拍自拍| 免费成人小视频| 在线高清欧美| 自拍日韩欧美| 日日夜夜一区二区| 国产免费拔擦拔擦8x在线播放| 久久国产精品免费精品3p | 亚洲欧美成人vr| 一本色道久久综合亚洲精品不卡| 久久精品国产免费看久久精品| 日韩精品免费一区二区三区| 欧美a级在线观看| 嗯用力啊快一点好舒服小柔久久| 日韩成人综合| 日本电影一区二区| 欧美在线一级| 久久久久久黄| 日韩精品电影在线观看| 91九色精品| 你懂的国产精品| 亚洲女人av| 国产一区二区三区四区五区 | 亚洲成人va| 九九热播视频在线精品6| 亚洲成a人片777777久久| 99热在线成人| 亚洲精品少妇| 蜜臀久久99精品久久久久宅男| 国产专区精品| 一本大道色婷婷在线| 欧美在线导航| 国产欧美日韩精品一区二区三区 | 日韩大片在线| 日本少妇一区| 欧美日韩激情在线一区二区三区| 免费观看日韩av| 亚洲日本中文| 水蜜桃久久夜色精品一区的特点| 国产欧美大片| 亚洲天堂资源| 精品精品国产三级a∨在线| 精品女同一区二区三区在线观看| 免费观看不卡av| 成人黄色91| 亚洲国产成人二区| 欧美成人一区在线观看| 亚洲破处大片| 午夜欧美激情| 一本一本久久a久久综合精品| 高清久久精品| 日韩pacopacomama| 午夜精品一区二区三区国产| 日日噜噜夜夜狠狠视频欧美人| 伊人春色之综合网| 欧洲精品99毛片免费高清观看| 色资源二区在线视频| 欧美综合在线视频观看 | 日韩美女毛片| 成人午夜一级| 蜜桃视频在线观看一区| 国产综合网站| 色综合.com| 男人操女人的视频在线观看欧美 | 色97色成人| 精品福利在线| 欧美激情自拍| 黄色亚洲精品| 99热这里只有精品首页| 麻豆精品在线视频| 欧美羞羞视频| 视频一区视频二区在线观看| 久久三级福利| 日本在线视频一区二区三区| 欧美日本不卡高清| 亚洲精品大片| 亚洲黄色中文字幕| 午夜一区二区三区不卡视频| 国产99精品| 99国产精品免费网站| 国产精品三级| 亚洲三级视频| 黑人一区二区三区| 日韩伦理视频| 蜜桃av一区二区| 日韩视频免费| 在线精品小视频| 日韩精品看片| 久久激情av| 国产精东传媒成人av电影| 亚洲素人在线| 国产探花在线精品| 国内综合精品午夜久久资源| 亚洲视频二区| 欧美成人xxxx| 成人精品高清在线视频| 日韩国产一区二区| 日本黄色精品| 丝袜a∨在线一区二区三区不卡| 91成人免费| 欧美在线亚洲综合一区| 欧洲在线一区| 日韩精品水蜜桃| 久久一区二区三区电影| 国产精品久久久久久久久久白浆| 一本色道69色精品综合久久| 伊色综合久久之综合久久| 香蕉大人久久国产成人av| 亚洲精品国产精品粉嫩| 精品国产一级| 日本一区二区三区视频在线看| 日韩av三区| 日韩激情综合| 国产精品乱战久久久| 精品久久久久久久久久久下田 | 午夜国产一区二区| 香蕉av一区二区| av成人黄色| 久久性天堂网| 麻豆网站免费在线观看| 国产精品粉嫩| 日韩美女在线| 亚洲日韩成人| 五月天亚洲一区| 国产精品任我爽爆在线播放| 91精品国产调教在线观看| 蜜桃国内精品久久久久软件9| 狠狠色丁香久久综合频道| 爽好多水快深点欧美视频| 中文字幕不卡三区视频| 亚洲成人1区| 亚洲精品韩国| 日本亚洲视频在线| 久久久夜夜夜| 午夜在线播放视频欧美| 日韩专区精品| 麻豆精品蜜桃视频网站| 亚洲精品推荐| 久久久久中文| 香蕉久久久久久久av网站| 男人av在线播放| 亚洲另类黄色| 亚洲不卡视频| 狠狠色丁香久久综合频道| 丁香六月综合| 欧美日一区二区在线观看| 综合伊人久久| 偷偷www综合久久久久久久| 国产精品国内免费一区二区三区| 久久激五月天综合精品| 亚洲精品亚洲人成在线观看| 欧美性感美女一区二区| 国产精品二区不卡| 国产精品久久久免费| 日韩成人免费电影| 亚洲成人三区| 全球中文成人在线| 国产亚洲一卡2卡3卡4卡新区| 99精品电影| 正在播放日韩精品| 中文字幕免费一区二区| 日韩精品一区二区三区免费观影| 男男成人高潮片免费网站| 美女视频黄久久| 亚洲日本va| 日本欧美在线观看| 在线精品一区| 秋霞影视一区二区三区| 国产精品久久观看| 你懂的成人av| 91精品国产一区二区在线观看| 91日韩免费| 国产精品第十页| 开心激情综合| а√天堂中文资源在线bt| 91麻豆精品国产综合久久久| 99热国内精品| 粉嫩91精品久久久久久久99蜜桃| 午夜久久av| 欧美激情偷拍自拍|