OpenAI : Wie Worte in Kunstwerke verwandelt werden

11. April 2022 0 Von Horst Buchwald

OpenAI : Wie Worte in Kunstwerke verwandelt werden

San Francisco, 11.4.2022

OpenAI hat eine neue Version von DALL-E vorgestellt, seinem KI-Modell, das fotorealistische Bilder auf der Grundlage von Textbeschreibungen erzeugt. Der Text-Bild-Generator der zweiten Generation verwandelt Worte in Kunstwerke.

Bei DALL-E handet es sich um ein Portmanteau aus Salvador Dalí und WALL-E. Es wurde erstmals im Januar 2021 vorgestellt. Das neuronale Netzwerk generiert fotorealistische Bilder auf der Grundlage einfacher schriftlicher Beschreibungen.

OpenAI-Mitarbeiter Aris Konstantinidis nutzte das Tool beispielsweise, um Bilder von Bandana-tragenden Pandas zu erzeugen, die in der Wüste Motorrad fahren.

DALL-E 2 ist schneller und erzeugt Bilder mit höherer Auflösung als sein Vorgänger. Die neueste Version ist zwar nicht für die Öffentlichkeit freigegeben, aber Forscher können sich für eine Vorschau anmelden.

OpenAI plant, sie zu einem späteren Zeitpunkt über eine API für Drittentwickler freizugeben. Dies könnte insbesondere für Grafikdesigner und App-Entwickler nützlich sein.

Wer ist OpenAI?

Das in San Francisco ansässige KI-Forschungslabor wurde Ende 2015 gegründet, um sichere und hilfreiche KI-Projekte für die Öffentlichkeit durchzuführen.

Die ursprünglichen Gründer waren Sam Altman, Elon Musk, Greg Brockman, Ilya Sutskever, Wojciech Zaremba und John Schulman, die zum Start zusammen mehr als 1 Milliarde US-Dollar für das Unternehmen bereitstellten. Musk trat später aus dem Vorstand zurück, unter anderem um Interessenkonflikte mit Tesla zu vermeiden. 2019 wurde das gemeinnützige Labor in ein gewinnorientiertes Unternehmen umgewandelt und ein Investitionspaket in Höhe von 1 Mrd. USD von Microsoft angekündigt. 2020 veröffentlichte OpenAI sein beliebtes Sprachmodell GPT-3, das die Grundlage für Anwendungen bildet, die Code und Texte für Websites, Werbung und soziale Medien generieren. DALL-E 2 basiert auf OpenAIs Bilderkennungs-/Computer-Vision-System CLIP, das wiederum auf GPT-3 basiert.