日韩一区二区三区在线免费观看-开心久久婷婷综合中文字幕-欧美激情91-久久国产福利-欧美日韩日本国产亚洲在线-国产精品极品国产中出

谷歌下場(chǎng)優(yōu)化擴(kuò)散模型,三星手機(jī)運(yùn)行 Stable Diffusion,12 秒內(nèi)出圖

2023-04-27 14:26:16來(lái)源:ZAKER科技  

機(jī)器之心報(bào)道

編輯:陳萍、小舟


(資料圖片僅供參考)

Speed Is All You Need:谷歌提出針對(duì) Stable Diffusion 一些優(yōu)化建議,生成圖片速度快速提升。

Stable Diffusion 在圖像生成領(lǐng)域的知名度不亞于對(duì)話大模型中的 ChatGPT。其能夠在幾十秒內(nèi)為任何給定的輸入文本創(chuàng)建逼真圖像。由于 Stable Diffusion 的參數(shù)量超過(guò) 10 億,并且由于設(shè)備上的計(jì)算和內(nèi)存資源有限,因而這種模型主要運(yùn)行在云端。

在沒(méi)有精心設(shè)計(jì)和實(shí)施的情況下,在設(shè)備上運(yùn)行這些模型可能會(huì)導(dǎo)致延遲增加,這是由于迭代降噪過(guò)程和內(nèi)存消耗過(guò)多造成的。

如何在設(shè)備端運(yùn)行 Stable Diffusion 引起了大家的研究興趣,此前,有研究者開(kāi)發(fā)了一個(gè)應(yīng)用程序,該應(yīng)用在 iPhone 14 Pro 上使用 Stable Diffusion 生成圖片僅需一分鐘,使用大約 2GiB 的應(yīng)用內(nèi)存。

此前蘋(píng)果也對(duì)此做了一些優(yōu)化,他們?cè)?iPhone、iPad、Mac 等設(shè)備上,半分鐘就能生成一張分辨率 512x512 的圖像。高通緊隨其后,在安卓手機(jī)端運(yùn)行 Stable Diffusion v1.5 ,不到 15 秒生成分辨率 512x512 的圖像。

近日,谷歌發(fā)表的一篇論文中《 Speed Is All You Need: On-Device Acceleration of Large Diffusion Models via GPU-Aware Optimizations 》,他們實(shí)現(xiàn)了在 GPU 驅(qū)動(dòng)的設(shè)備上運(yùn)行 Stable Diffusion 1.4 ,達(dá)到 SOTA 推理延遲性能(在三星 S23 Ultra 上,通過(guò) 20 次迭代生成 512 × 512 的圖像僅需 11.5 秒)。此外,該研究不是只針對(duì)一種設(shè)備;相反,它是一種通用方法,適用于改進(jìn)所有潛在擴(kuò)散模型。

在沒(méi)有數(shù)據(jù)連接或云服務(wù)器的情況下,這項(xiàng)研究為在手機(jī)上本地運(yùn)行生成 AI 開(kāi)辟了許多可能性。Stable Diffusion 去年秋天才發(fā)布,今天已經(jīng)可以塞進(jìn)設(shè)備運(yùn)行,可見(jiàn)這個(gè)領(lǐng)域發(fā)展速度有多快。

論文地址:https://arxiv.org/pdf/2304.11267.pdf

為了達(dá)到這一生成速度,谷歌提出了一些優(yōu)化建議,下面我們看看谷歌是如何優(yōu)化的。

方法介紹

該研究旨在提出優(yōu)化方法來(lái)提高大型擴(kuò)散模型文生圖的速度,其中針對(duì) Stable Diffusion 提出一些優(yōu)化建議,這些優(yōu)化建議也適用于其他大型擴(kuò)散模型。

首先來(lái)看一下 Stable Diffusion 的主要組成部分,包括:文本嵌入器(text embedder)、噪聲生成(noise generation)、去噪神經(jīng)網(wǎng)絡(luò)(denoising neural network)和圖像解碼器(image decoder,如下圖 1 所示。

然后我們具體看一下該研究提出的三種優(yōu)化方法。

專用內(nèi)核:Group Norm 和 GELU

組歸一化(GN)方法的工作原理是將特征圖的通道(channel)劃分為更小的組,并獨(dú)立地對(duì)每個(gè)組進(jìn)行歸一化,從而使 GN 對(duì)批大小的依賴性降低,更適合各種批大小和網(wǎng)絡(luò)架構(gòu)。該研究沒(méi)有按順序執(zhí)行 reshape、取均值、求方差、歸一化這些操作,而是設(shè)計(jì)了一個(gè)獨(dú)特的 GPU shader 形式的內(nèi)核,它可以在一個(gè) GPU 命令中執(zhí)行所有這些操作,而無(wú)需任何中間張量(tensor)。

高斯誤差線性單元(GELU)作為常用的模型激活函數(shù),包含大量數(shù)值計(jì)算,例如乘法、加法和高斯誤差函數(shù)。該研究用一個(gè)專用的 shader 來(lái)整合這些數(shù)值計(jì)算及其伴隨的 split 和乘法操作,使它們能夠在單個(gè) AI 作畫(huà)調(diào)用中執(zhí)行。

提高注意力模塊的效率

Stable Diffusion 中的文本到圖像 transformer 有助于對(duì)條件分布進(jìn)行建模,這對(duì)于文本到圖像生成任務(wù)至關(guān)重要。然而,由于內(nèi)存復(fù)雜性和時(shí)間復(fù)雜度,自 / 交叉注意力機(jī)制在處理長(zhǎng)序列時(shí)遇到了困難。基于此,該研究提出兩種優(yōu)化方法,以緩解計(jì)算瓶頸。

一方面,為了避免在大矩陣上執(zhí)行整個(gè) softmax 計(jì)算,該研究使用一個(gè) GPU shader 來(lái)減少運(yùn)算操作,大大減少了中間張量的內(nèi)存占用和整體延遲,具體方法如下圖 2 所示。

另一方面,該研究采用 FlashAttention [ 7 ] 這種 IO 感知的精確注意力算法,使得高帶寬內(nèi)存(HBM)的訪問(wèn)次數(shù)少于標(biāo)準(zhǔn)注意力機(jī)制,提高了整體效率。

Winograd 卷積

Winograd 卷積將卷積運(yùn)算轉(zhuǎn)換為一系列矩陣乘法。這種方法可以減少許多乘法運(yùn)算,提高計(jì)算效率。但是,這樣一來(lái)也會(huì)增加內(nèi)存消耗和數(shù)字錯(cuò)誤,特別是在使用較大的 tile 時(shí)。

Stable Diffusion 的主干在很大程度上依賴于 3 × 3 卷積層,尤其是在圖像解碼器中,它們占了 90% 。該研究對(duì)這一現(xiàn)象進(jìn)行了深入分析,以探索在 3 × 3 內(nèi)核卷積上使用不同 tile 大小的 Winograd 的潛在好處。研究發(fā)現(xiàn) 4 × 4 的 tile 大小最佳,因?yàn)樗谟?jì)算效率和內(nèi)存利用率之間提供了最佳平衡。

實(shí)驗(yàn)

該研究在各種設(shè)備上進(jìn)行了基準(zhǔn)測(cè)試:三星 S23 Ultra(Adreno 740)和 iPhone 14 Pro Max(A16)。基準(zhǔn)測(cè)試結(jié)果如下表 1 所示:

很明顯,隨著每個(gè)優(yōu)化被激活,延遲逐漸減少(可理解為生成圖像時(shí)間減少)。具體而言,與基線相比:在三星 S23 Ultra 延遲減少 52.2%;iPhone 14 Pro Max 延遲減少 32.9%。此外,該研究還對(duì)三星 S23 Ultra 端到端延遲進(jìn)行評(píng)估,在 20 個(gè)去噪迭代 step 內(nèi),生成 512 × 512 像素圖像,不到 12 秒就達(dá)到 SOTA 結(jié)果。

小型設(shè)備可以運(yùn)行自己的生成式人工智能模型,這對(duì)未來(lái)意味著什么?我們可以期待一波。

關(guān)鍵詞:

責(zé)任編輯:hnmd003

相關(guān)閱讀

相關(guān)閱讀

精彩推送

推薦閱讀

999国产精品| 日韩成人免费av| 欧美自拍一区| 亚洲成人tv| 久草在线成人| 美女国产精品| 免费在线小视频| 在线精品一区二区| 国产视频一区二区在线播放| 亚洲自拍电影| 欧美人体视频| 亚洲女同在线| 亚洲国产天堂| 欧美国产视频| 欧美人与物videos另类xxxxx| 日韩av中文在线观看| 99久久这里只有精品| 久久成人在线| 人人精品久久| 国产色99精品9i| 首页欧美精品中文字幕| 麻豆精品视频在线观看视频| caoporn成人免费视频在线| 免费成人在线观看| 国产精品99久久免费| 欧美在线亚洲| 国产精品久久久免费| 欧美aaaaaaaa牛牛影院| 欧美亚洲日本精品| 日韩有码中文字幕在线| 国产精品日本| 欧美激情aⅴ一区二区三区| 激情另类综合| 裸体一区二区三区| 99国产精品免费视频观看| 蜜桃视频www网站在线观看| 西瓜成人精品人成网站| 首页亚洲欧美制服丝腿| 国产伦精品一区二区三区视频| re久久精品视频| 美女视频黄免费的久久| 国产一区观看| 六月婷婷色综合| 亚洲二区三区不卡| 亚洲美女91| 在线精品小视频| 成人自拍视频| 手机亚洲手机国产手机日韩| 日韩av网址大全| 欲香欲色天天天综合和网| 欧美日韩爱爱| 偷拍亚洲精品| 麻豆免费在线| 国产精品一线| 国产日本精品| 国产农村妇女精品一区二区| 久久综合色占| 92国产精品| 亚洲不卡av不卡一区二区| 日韩国产一区二| 在线亚洲激情| 精品午夜视频| 四虎精品一区二区免费| 国产在线不卡| 成人日韩视频| 麻豆mv在线观看| 久久精品官网| 久久综合另类图片小说| 老司机午夜免费精品视频| 一区二区三区视频免费视频观看网站| 欧美黄色网页| 艳女tv在线观看国产一区| 国产在线一区不卡| 国产日韩另类视频一区| 大型av综合网站| 日本不卡视频在线| 免费在线观看日韩欧美| 久久精品论坛| 国产精品一区二区99| 国产一区二区主播在线| 亚洲国产一成人久久精品| 久久不见久久见国语| 97精品国产综合久久久动漫日韩| 99国产一区| 成人中文视频| 国产精品一区2区3区| 久久久久黄色| 日韩精品一二三| 激情五月综合| 7m精品国产导航在线| 日本美女一区二区| 少妇淫片在线影院| 亚洲免费高清| 精品国产123区| 国产精品一区二区三区av麻| 日本另类视频| 亚洲综合国产| 激情综合在线| 日韩成人18| 国产精品亚洲二区| 日韩综合一区二区| 丝袜诱惑一区二区| 另类亚洲自拍| 羞羞答答成人影院www| 国产成人tv| 亚洲制服欧美另类| 国产精品久久| 国产欧美日韩综合一区在线播放| 91青青国产在线观看精品| 91九色精品| 日本久久成人网| 国产日本亚洲| 亚洲人成777| 日本成人在线电影网| 男人天堂久久| 日韩不卡视频在线观看| 久久久久久久欧美精品 | 精品视频免费| 日韩三区视频| 日韩av中文字幕一区| 精品一区二区三区中文字幕在线 | 欧美激情日韩| 午夜影院日韩| 好吊视频一区二区三区四区| 91精品国产91久久久久久黑人| 亚洲日本va| 欧美三级在线| 91国内精品| 日本少妇精品亚洲第一区| 亚洲盗摄视频| 日本一区二区三区视频在线看| 日韩黄色小视频| 中文字幕一区日韩精品| 日韩精品成人在线观看| 日韩免费一级| 亚洲不卡视频| 第九色区aⅴ天堂久久香| 欧美日韩网站| 成人精品影院| 国产综合婷婷| 99国产精品| 丝袜亚洲另类欧美综合| 免费在线观看成人| 色偷偷色偷偷色偷偷在线视频| 成人av三级| 久久激情五月激情| 亚洲精品色图| 三级精品在线观看| 95精品视频| 日本免费一区二区三区视频| 91麻豆精品国产91久久久久推荐资源| 极品国产人妖chinesets亚洲人妖| 久草精品视频| 日韩视频在线一区二区三区 | 日本不卡123| 亚洲综合五月| 一区二区三区视频播放| 成人久久电影| 亚洲成人三区| 超碰国产一区| 亚洲区第一页| 日产国产欧美视频一区精品| 欧美五码在线| 99热这里只有成人精品国产| 国产不卡人人| 久久国内精品自在自线400部| 国产精品一站二站| 精品一区二区三区的国产在线观看| 欧美国产91| 蜜臂av日日欢夜夜爽一区| 五月天av在线| 日本欧美一区二区三区乱码| 五月国产精品| 免费视频一区三区| 国产黄大片在线观看| 欧美天堂一区二区| 国产麻豆精品| 老牛精品亚洲成av人片| 亚洲欧洲一区| 丁香婷婷久久| 日韩高清二区| 妖精视频成人观看www| 99精品在免费线偷拍| 国产欧美一区二区三区精品观看 | 免费看黄色91| 国产欧美三级| 欧美三级视频| 国产精品日韩| 日本一区中文字幕| 成人在线免费观看91| 天使萌一区二区三区免费观看| 激情久久99| 日韩 欧美一区二区三区| 一区免费视频| 成人在线高清| 日韩av网站免费在线| 99成人在线| 日本不卡视频在线| 色婷婷综合久久久久久| 91综合视频|