欧美亚洲中文,在线国自产视频,欧洲一区在线观看视频,亚洲综合中文字幕在线观看

<dfn id="rfwes"></dfn>

<object id="rfwes"></object>

<option id="r3hys"></option>

<strike id="r3hys"></strike>

<acronym id="r3hys"></acronym>

<mark id="r3hys"><thead id="r3hys"><input id="r3hys"></input></thead></mark>

當前位置：站長資訊網 > 新聞資訊 > 正文

英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

2021-12-13 分類：新聞資訊閱讀(1009) 評論(0)

　　繼 GauGAN2 之后，英偉達推出了一個 GAN 的“超級縫合體”——PoE GAN。PoE GAN 可以接受多種模態(tài)的輸入，文字描述、圖像分割、草圖、風格都可以轉化為圖片。

英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

　　而且它可以同時接受以上幾種輸入模態(tài)的任意兩種組合，這便是 PoE 的含義。

英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

　　所謂 PoE 是 Hinton 在 2002 年提出的“專家乘積”(product of experts)概念，每個專家(單獨模型)被定義為輸入空間上的一個概率模型。

　　而每種單獨的輸入模態(tài)都是合成圖像必須滿足的約束條件，因此滿足所有約束的一組圖像是滿足每個約束集合的交集。

英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

　　假設每種約束的聯合條件概率分布都服從高斯分布，就用單條件概率分布的乘積來表述交集的分布。

英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

　　在此條件下，為了使乘積分布在一個區(qū)域具有高密度，每個單獨的分布需要在該區(qū)域具有高密度，從而滿足每個約束。而 PoE GAN 的重點是如何將每種輸入混合在一起。

　　PoE GAN 的設計

　　PoE GAN 的生成器使用全局 PoE-Net 將不同類型輸入的變化混合起來。

　　我們將每個模態(tài)輸入編碼為特征向量，然后使用 PoE 匯總到全局 PoE-Net 中。解碼器不僅使用全局 PoE-Net 的輸出，還直接連接分割和草圖編碼器，以此來輸出圖像。

英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

　　全局 PoE-Net 的結構如下，這里使用一個潛在的特征矢量 z0 作為樣本使用 PoE，然后由 MLP 處理以輸出特征向量 w。

英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

　　在鑒別器部分，作者提出了一種多模態(tài)投影鑒別器，將投影鑒別器推廣到處理多個條件輸入。與計算圖像嵌入和條件嵌入之間單個內積的標準投影鑒別器不同，這里要計算每個輸入模態(tài)的內積，并將其相加以獲得最終損失。

英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

　　隨意變換輸入的 GAN

　　PoE 可以在單模態(tài)輸入、多模態(tài)輸入甚至無輸入時生成圖片。

　　當使用單個輸入模態(tài)進行測試時，PoE-GAN 的表現優(yōu)于之前專門為該模態(tài)設計的 SOTA 方法。

　　例如在分割輸入模態(tài)中，PoE-GAN 優(yōu)于此前的 SPADE 和 OASIS。

英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

　　在文本輸入模態(tài)中，PoE-GAN 優(yōu)于文本到圖像模型 DF-GAN、DM-GAN+CL。

英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

　　當以模式的任意子集為條件時，PoE-GAN 可以生成不同的輸出圖像。下面展示了 PoE-GAN 的隨機樣本，條件是兩種模式(文本 + 分割、文本 + 草圖、分割 + 草圖)在景觀圖像數據集上。

英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

　　PoE-GAN 甚至還能沒有輸入，此時 PoE-GAN 就會成為一個無條件的生成模型。以下是 PoE-GAN 無條件生成的樣本。

英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

　　團隊介紹

　　論文通訊作者是英偉達著名工程師劉洺堉，他的研究重點是深度生成模型及其應用。英偉達 Canvas 和 GauGAN 等有趣的產品均出自他手。

英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

　　論文一作是黃勛，北京航空航天大學本科畢業(yè)，康奈爾大學博士，現在在英偉達工作。

英偉達推出“超級縫合體”PoE GAN，輸入文字草圖語義圖都能生成逼真照片

　　論文地址：

　　https://arxiv.org/abs/2112.05130

　　PoE：

　　https://www.cs.toronto.edu/~hinton/absps/icann-99.pdf

　　投影鑒別器：

　　https://arxiv.org/abs/1802.05637

特別提醒：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其原創(chuàng)性以及文中陳述文字和內容未經本站證實，對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾，并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

贊(0)

標簽：Canvas word 互聯網+

相關推薦

網站地圖滬ICP備18035694號-2

滬公網安備31011702889846號