Sensationell: Nvidia präsentiert GauGAN2

23. November 2021 0 Von Horst Buchwald

San Francisco, 23.11.2021

Nvidia hat GauGAN2 vorgestellt, das realistisch aussehende Bilder aus einfachen Phrasen erzeugt. Als Nachfolger des Deep-Learning-Modells GauGAN erzeugt die Mal-KI fotorealistische Szenen auf der Grundlage einer Eingabe von nur wenigen Wörtern und verändert die Bilder, wenn neue Adjektive hinzugefügt werden.

Das erste GauGAN-System von Nvidia, benannt nach dem postimpressionistischen Maler Paul Gauguin, wurde 2019 veröffentlicht, nachdem es auf mehr als 1 Million öffentlicher Flickr-Bilder trainiert wurde. Es wurde verwendet, um die Nvidia-App „Rapid Painting Canvas“ zu entwickeln, die sich jetzt in der Beta-Phase befindet.

GauGAN2, ebenfalls ein GAN-basiertes System, wurde mit 10 Millionen Bildern trainiert. Es kombiniert „Segmentation Mapping, Inpainting und Text-zu-Bild-Generierung in einem einzigen Modell“.

Der Benutzer gibt einen kurzen Satz ein, z. B. „schneebedeckte Bergkette“, und das System generiert das Bild. Der Benutzer kann dann die Segmentierungskarte erstellen, die die Lage der Objekte umreißt, und die Szene anhand seiner eigenen groben Skizzen optimieren.

Im Vergleich zu anderen Modellen, die dem neuesten Stand der Technik entsprechen, erzeugt das neuronale Netzwerk von GauGAN2 „eine größere Vielfalt und eine höhere Qualität von Bildern“, heißt es in einem Blogbeitrag des Unternehmens.

GauGAN2 ist ab sofort auf Nvidias AI Demos Website verfügbar:

https://www.nvidia.com/en-us/research/ai-demos/

KategorieHeader