「AI新青年講座」將邀請世界頂尖AI研究機構和大學的科研新青年,主講他們在計算機視覺、機器學習等人工智能領域的最新重要研究成果。
AI新青年是加速人工智能前沿研究的新生力量。AI新青年的視頻講解和直播答疑,將可以幫助大家增進對人工智能前沿研究的理解,相應領域的專業(yè)知識也能夠得以積累加深。同時,通過與AI新青年的直接交流,大家在AI學習和應用AI的過程中遇到的問題,也能夠盡快解決。
有興趣分享學術成果的朋友,可以與智東西公開課教研團隊進行郵件(class@m.loveliyi.com)聯系。
GAN在2D圖像生成上大放異彩,但在3D場景上卻無能為力。有研究者提出了一種3D感知圖像合成模型,可以從多個視圖圖像中學習3D的場景表示,例如體素、NeRF等。其中,基于NeRF的方法引起人們的關注,也產生了許多科研成果。然而現有的方法存在一個關鍵的挑戰(zhàn):無法保證視圖之間的幾何約束,導致無法生成多視圖一致的圖像。
悉尼科技大學ReLER Lab在讀博士張軒夢等人對上述問題進行分析,提出多視角連貫性生成式對抗網絡MVCGAN。利用底層的三維幾何信息,解決視覺之間幾何約束的問題,強制使圖像對的光度一致,來明確視圖之間的對應關系,鼓勵模型推理出正確的3D形狀,并優(yōu)化訓練過程,使生成器不僅可以學習到2D圖像的流形,還能保證底層3D的正確性。
此外,張軒夢博士等還設計了一種兩階段訓練策略,來生成具有精細細節(jié)的高分辨率圖像。數據表明,在CELEBA-HQ、FFHQ和AFHQv2三個數據集上,MVCGAN在3D感知圖像合成上達到了最先進的性能。
7月20日晚6點,「AI新青年講座」第139講邀請到悉尼科技大學ReLER Lab在讀博士張軒夢參與,主講《多視圖統一的3D感知圖像生成網絡MVCGAN》。
講者
張軒夢,悉尼科技大學ReLER Lab在讀博士,師從楊易教授,研究方向為3D視覺,圖像生成和圖像檢索,曾在等學術競賽CVPR AICITY Challenge中取得冠軍和亞軍,并在計算機視覺頂級會議CVPR發(fā)表過論文。
主題
《多視圖統一的3D感知圖像生成網絡MVCGAN》
提綱
1、3D圖像生成的研究背景
2、主流方法的優(yōu)劣勢比較
3、基于幾何約束的3D圖像生成網絡MVCGAN
4、多視圖的聯合優(yōu)化及應用展示
直播信息
直播時間:7月20日18:00
直播地點:智東西公開課知識店鋪
成果
MVCGAN:《Multi-View Consistent Generative Adversarial Networks for 3D-aware Image Synthesis》
論文鏈接:https://arxiv.org/abs/2204.06307.pdf
開源代碼:https://github.com/Xuanmeng-Zhang/MVCGAN