日韩一区二区三区在线免费观看-开心久久婷婷综合中文字幕-欧美激情91-久久国产福利-欧美日韩日本国产亚洲在线-国产精品极品国产中出

首頁 > 新聞 > 智能 > 正文

有手就行?把大象 P 轉身只需拖動鼠標,華人一作 DragGAN 爆火_當前觀點

2023-05-20 13:28:17來源:ZAKER科技  

機器之心報道

編輯:蛋醬、小舟


(相關資料圖)

如果甲方想把大象 P 轉身,你只需要拖動 GAN 就好了。

在圖像生成領域,以 Stable Diffusion 為代表的擴散模型已然成為當前占據主導地位的范式。但擴散模型依賴于迭代推理,這是一把雙刃劍,因為迭代方法可以實現具有簡單目標的穩定訓練,但推理過程需要高昂的計算成本。

在 Stable Diffusion 之前,生成對抗網絡(GAN)是圖像生成模型中常用的基礎架構。相比于擴散模型,GAN 通過單個前向傳遞生成圖像,因此本質上是更高效的。但由于訓練過程的不穩定性,擴展 GAN 需要仔細調整網絡架構和訓練因素。因此,GAN 方法很難擴展到非常復雜的數據集上,在實際應用方面,擴散模型比 GAN 方法更易于控制,這是 GAN 式微的原因之一。

當前,GAN 主要是通過手動注釋訓練數據或先驗 3D 模型來保證其可控性,這通常缺乏靈活性、精確性和通用性。然而,一些研究者看重 GAN 在圖像生成上的高效性,做出了許多改進 GAN 的嘗試。

最近,來自馬克斯普朗克計算機科學研究所、MIT CSAIL 和谷歌的研究者們研究了一種控制 GAN 的新方法 DragGAN,能夠讓用戶以交互的方式「拖動」圖像的任何點精確到達目標點。

論文鏈接:https://arxiv.org/abs/2305.10973

項目主頁:https://vcai.mpi-inf.mpg.de/projects/DragGAN/

這種全新的控制方法非常靈活、強大且簡單,有手就行,只需在圖像上「拖動」想改變的位置點(操縱點),就能合成你想要的圖像。

例如,讓獅子「轉頭」并「開口」:

還能輕松讓小貓 wink:再比如,你可以通過拖動操縱點,讓單手插兜的模特把手拿出來、改變站立姿勢、短袖改長袖。看上去就像是同一個模特重新拍攝了新照片:

如果你也接到了「把大象轉個身」的 P 圖需求,不妨試試:

整個圖像變換的過程就主打一個「簡單靈活」,圖像想怎么變就怎么變,因此有網友預言:「PS 似乎要過時了」。也有人覺得,這個方法也可能會成為未來 PS 的一部分。總之,觀感就是一句話:「看到這個,我腦袋都炸了。」當大家都以為 GAN 這個方向從此消沉的時候,總會出現讓我們眼前一亮的作品:這篇神奇的論文,已經入選了 SIGGRAPH 2023。研究者表示,代碼將于六月開源。那么,DragGAN 是如何做到強大又靈活的?我們來看一下該研究的技術方法。

方法概述

該研究提出的 DragGAN 主要由兩個部分組成,包括:

基于特征的運動監督,驅動圖像中的操縱點向目標位置移動;

一種借助判別型 GAN 特征的操縱點跟蹤方法,以控制點的位置。

DragGAN 能夠通過精確控制像素的位置對圖像進行改變,可處理的圖像類型包括動物、汽車、人類、風景等,涵蓋大量物體姿態、形狀、表情和布局,并且用戶的操作方法簡單通用。

GAN 有一個很大的優勢是特征空間具有足夠的判別力,可以實現運動監督(motion supervision)和精確的點跟蹤。具體來說,運動監督是通過優化潛在代碼的移位特征 patch 損失來實現的。每個優化步驟都會導致操縱點更接近目標,然后通過特征空間中的最近鄰搜索來執行點跟蹤。重復此優化過程,直到操縱點達到目標。

DragGAN 還允許用戶有選擇地繪制感興趣的區域以執行特定于區域的編輯。由于 DragGAN 不依賴任何額外的網絡,因此它實現了高效的操作,大多數情況下在單個 RTX 3090 GPU 上只需要幾秒鐘就可以完成圖像處理。這讓 DragGAN 能夠進行實時的交互式編輯,用戶可以對圖像進行多次變換更改,直到獲得所需輸出。

如下圖所示,DragGAN 可以有效地將用戶定義的操縱點移動到目標點,在許多目標類別中實現不同的操縱效果。與傳統的形變方法不同的是,本文的變形是在 GAN 學習的圖像流形上進行的,它傾向于遵從底層的目標結構,而不是簡單地應用扭曲。例如,該方法可以生成原本看不見的內容,如獅子嘴里的牙齒,并且可以按照物體的剛性進行變形,如馬腿的彎曲。研究者還開發了一個 GUI,供用戶通過簡單地點擊圖像來交互地進行操作。

此外,通過與 GAN 反轉技術相結合,本文方法還可以作為一個用于真實圖像編輯的工具。

一個非常實用的用途是,即使合影中某些同學的表情管理不過關,你也可以為 Ta 換上自信的笑容:

順便提一句,這張照片正是本篇論文的一作潘新鋼,2021 年在香港中文大學多媒體實驗室獲得博士學位,師從湯曉鷗教授。目前是馬克斯普朗克信息學研究所博士后,并將從 2023 年 6 月開始擔任南洋理工大學計算機科學與工程學院 MMLab 的任助理教授。

這項工作旨在為 GAN 開發一種交互式的圖像操作方法,用戶只需要點擊圖像來定義一些對(操縱點,目標點),并驅動操縱點到達其對應的目標點。

這項研究基于 StyleGAN2,基本架構如下:

在 StyleGAN2 架構中,一個 512 維的潛在代碼∈ N(0,)通過一個映射網絡被映射到一個中間潛在代碼∈ R 512 中。的空間通常被稱為 W。然后,被送到生成器,產生輸出圖像 I = ( ) 。在這個過程中,被復制了幾次,并被送到發生器的不同層,以控制不同的屬性水平。另外,也可以對不同層使用不同的,在這種情況下,輸入將是,其中是層數。這種不太受約束的 W^+ 空間被證明是更有表現力的。由于生成器學習了從低維潛在空間到高維圖像空間的映射,它可以被看作是對圖像流形的建模。

實驗

為了展示 DragGAN 在圖像處理方面的強大能力,該研究展開了定性實驗、定量實驗和消融實驗。實驗結果表明 DragGAN 在圖像處理和點跟蹤任務中均優于已有方法。

定性評估

圖 4 是本文方法和 UserControllableLT 之間的定性比較,展示了幾個不同物體類別和用戶輸入的圖像操縱結果。本文方法能夠準確地移動操縱點以到達目標點,實現了多樣化和自然的操縱效果,如改變動物的姿勢、汽車形狀和景觀布局。相比之下,UserControllableLT 不能忠實地將操縱點移動到目標點上,往往會導致圖像中出現不想要的變化。

如圖 10 所示,它也不能像本文方法那樣保持未遮蓋區域固定不變圖 6 提供了與 PIPs 和 RAFT 之間的比較,本文方法準確地跟蹤了獅子鼻子上方的操縱點,從而成功地將它拖到了目標位置。真實圖像編輯。使用 GAN inversion 技術,將真實圖像嵌入 StyleGAN 的潛空間,本文方法也可以用來操作真實圖像。

圖 5 顯示了一個例子,將 PTI inversion 應用于真實圖像,然后進行一系列的操作來編輯圖像中人臉的姿勢、頭發、形狀和表情:

圖 13 展示了更多的真實圖像編輯案例:定量評估

研究者在兩種設置中下對該方法進行了定量評估,包括人臉標記點操作和成對圖像重建。

人臉標記點操作。如表 1 所示,在不同的點數下,本文方法明顯優于 UserControllableLT。特別是,本文方法保留了更好的圖像質量,正如表中的 FID 得分所示。

這種對比在圖 7 中可以明顯看出來,本文方法打開了嘴巴并調整下巴的形狀以匹配目標臉,而 UserControllableLT 未能做到這一點。成對圖像重建。如表 2 所示,本文方法在不同的目標類別中優于所有基線。消融實驗

研究者研究了在運動監督和點跟蹤中使用某種特征的效果,并報告了使用不同特征的人臉標記點操作的性能(MD)。如表 3 所示,在運動監督和點跟蹤中,StyleGAN 的第 6 個 block 之后的特征圖表現最好,顯示了分辨率和辨別力之間的最佳平衡。

表 4 中提供了 _1 的效果。可以看出,性能對 _1 的選擇不是很敏感,而 _1=3 的性能略好。討論

掩碼的影響。本文方法允許用戶輸入一個表示可移動區域的二進制掩碼,圖 8 展示了它的效果:

Out-of-distribution 操作。從圖 9 可以看出,本文的方法具有一定的 out-of-distribution 能力,可以創造出訓練圖像分布之外的圖像,例如一個極度張開的嘴和一個大的車輪。研究者同樣指出了本文方法現存的局限性:盡管有一些推斷能力,其編輯質量仍然受到訓練數據多樣性的影響。如圖 14(a)所示,創建一個偏離訓練分布的人體姿勢會導致偽影。此外,如圖 14(b)和(c)所示,無紋理區域的操縱點有時會在追蹤中出現更多的漂移。因此,研究者建議盡可能挑選紋理豐富的操縱點。AI+EDA:引領芯片設計新未來

5 月 23 日 19:00-21:00,機器之心聯合新思科技與微軟帶來線上分享,來自新思科技資深產品經理莊定錚與微軟全球黑帶 - 數據與人工智能資深技術專家陳景忠將就 AI+EDA 這一行業熱議話題展開討論。

識別海報二維碼,預約直播。

THE END

轉載請聯系本公眾號獲得授權

投稿或尋求報道:content@jiqizhixin.com

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀

第四色在线一区二区| 夜夜精品视频| 久久国产88| 亚洲精品456| 日韩国产欧美视频| 国产一区 二区| 手机在线观看av| 蜜臀久久99精品久久久画质超高清 | 青草综合视频| 国产精品呻吟| 亚洲成人最新网站| 日本午夜精品| 日本中文字幕在线一区| 不卡一区视频| 中文字幕一区二区av| 日韩国产在线一| 影音先锋中文字幕一区二区| 国产精品蜜月aⅴ在线| 欧洲美女日日| 1024精品久久久久久久久| 91精品国产自产在线观看永久∴| 亚洲桃色综合影院| 素人一区二区三区| 国产69精品久久| 日韩精选视频| 福利一区二区免费视频| 国产精品一页| 日本午夜一区二区| 麻豆中文一区二区| 国产私拍福利精品视频二区| av成人在线播放| 成人黄色毛片| 一区二区三区成人精品| 欧美aa在线观看| 国产一区二区色噜噜| 成人国产精选| 亚洲国产午夜| 97精品一区| 日韩欧美综合| 精品成人免费一区二区在线播放| 高潮在线视频| 久久精品超碰| 亚洲网站三级| 在线观看视频一区二区三区| 精品国产精品国产偷麻豆| 亚洲欧美日韩高清在线| 人人狠狠综合久久亚洲| 免费成人在线电影| 日本在线不卡视频| 亚洲亚洲免费| 六月丁香久久丫| 99国产精品自拍| 日韩国产一区| 日韩国产欧美在线播放| 国内精品美女在线观看| 国产亚洲一区二区三区不卡| 国产福利一区二区精品秒拍| 黑人操亚洲人| 蜜臀av一区二区三区| 激情视频网站在线播放色 | 亚洲18在线| 在线高清欧美| 秋霞欧美视频| 成人三级视频| 免费高清不卡av| 久久精品午夜| 伊人久久综合网另类网站| 日本一区二区乱| 久久麻豆精品| 午夜一级在线看亚洲| 成人亚洲一区| 综合久久一区| 久久一本综合| 天天揉久久久久亚洲精品| 精品一区在线| av影院在线免费观看| 国产一区二区三区的电影| 日韩深夜福利| 国产一区二区三区自拍| 日本三级一区| 国产视频网站一区二区三区| 欧美成年网站| 首页国产欧美久久| 麻豆极品一区二区三区| 一区二区在线视频观看| 日韩中文字幕亚洲一区二区va在线| 欧美成人家庭影院| 麻豆久久一区| 欧美韩国日本在线观看| 中文av一区| 红桃视频亚洲| 日本vs亚洲vs韩国一区三区| 日韩精品水蜜桃| 精品亚洲美女网站| 亚洲ab电影| 蜜桃一区二区三区在线观看| 亚洲免费资源| 美女视频一区免费观看| 久久悠悠精品综合网| 欧美日韩国产在线观看网站 | 亚洲毛片免费看| 麻豆成人在线| 国产精品羞羞答答在线观看| 伊人久久亚洲热| 欧美日韩亚洲一区三区 | 97久久亚洲| 日韩极品一区| 国语一区二区三区| 免费看男女www网站入口在线| 国产乱人伦丫前精品视频| 香蕉成人av| 精品精品久久| 日韩一级特黄| 欧美亚洲国产日韩| 国产精品久久久亚洲一区| 久久黄色影视| 美腿丝袜亚洲一区| 欧美精品自拍| 欧美欧美在线| 在线天堂中文资源最新版| 99精品在免费线中文字幕网站一区| 四季av一区二区凹凸精品| 中文无码日韩欧| 99久久伊人| 欧美另类综合| 国产精品嫩草影院在线看| 蜜桃视频一区二区三区在线观看| 日韩电影免费在线看| 欧美香蕉视频| 欧美福利专区| 国产成人高清| 美女色狠狠久久| 午夜久久美女| 日韩av一区二| 美女性感视频久久| 午夜在线视频一区二区区别| 精品国产亚洲一区二区三区大结局| 日韩激情免费| 日韩视频一区二区三区在线播放免费观看| 最新亚洲精品| 开心久久婷婷综合中文字幕| 午夜久久黄色| 999在线精品| 亚洲三级毛片| 日韩伦理一区| 在线亚洲一区| 精品久久网站| 亚洲动漫精品| 久久精品国产99久久6| 水野朝阳av一区二区三区| 久久男女视频| 国产va免费精品观看精品视频| 亚洲欧洲美洲av| 伊人久久亚洲影院| 黄色成人美女网站| 999色成人| 国产精品亚洲欧美| 91影院成人| 国产亚洲精品bv在线观看| 欧洲亚洲成人| 先锋影音国产精品| 在线精品一区二区| 国产私拍福利精品视频二区| 免费在线观看日韩欧美| 99国产精品| 亚洲欧美视频| 国产精品一区二区中文字幕| 国产一区二区三区日韩精品| 久久精品国产精品亚洲综合| 日韩精品电影| 国产精品久久久久久久免费观看| 国产精品99免费看| 精品久久久久久久久久久下田 | 日韩中文首页| 午夜宅男久久久| 999精品色在线播放| 日本免费一区二区三区视频| 亚洲一区二区| 捆绑调教一区二区三区| 日本在线中文字幕一区二区三区| 欧美wwwww| 人人超碰91尤物精品国产| 午夜久久美女| 不卡视频在线| 国产一区日韩欧美| 国产亚洲精品美女久久| 亚洲涩涩av| 亚洲免费专区| 国产欧美日韩在线观看视频| 国产精品啊v在线| 美女国产一区二区三区| 成人国产综合| 不卡亚洲精品| 另类中文字幕国产精品| 国产精品亚洲一区二区三区在线观看| 天堂va蜜桃一区二区三区| 国产毛片久久| 国产在线观看91一区二区三区 | 丁香婷婷久久| 欧美一区久久|