researchsimonw · 25. April 2026

ChatGPT Images 2.0 fügt eigenständig Text zu komplexen Bildprompts hinzu

Bei einem Test mit einem komplexen Bildprompt (Pferd reitet auf Astronaut, der auf fahrradfahrendem Pelikan sitzt) fügte ChatGPT Images 2.0 eigenständig ein Straßenschild mit der Aufschrift 'WHY ARE YOU LIKE THIS' hinzu. Dies zeigt unerwartetes emergentes Verhalten bei der Bildgenerierung.

Einordnung

Dieses Beispiel zeigt interessantes emergentes Verhalten von Text-zu-Bild-Modellen. Das Modell interpretierte die chaotische Szene nicht nur visuell, sondern fügte eigenständig einen kommentierenden Text hinzu, der die Absurdität der Situation reflektiert. Dies deutet auf eine Art 'Meta-Bewusstsein' des Modells für den surrealen Charakter des generierten Inhalts hin. Solche unvorhergesagten Ausgaben werfen wichtige Fragen zur Vorhersagbarkeit und Kontrolle von KI-Systemen auf. Während das Ergebnis hier humorvoll ist, zeigt es auch, dass moderne Bildgenerierungsmodelle über die reine Umsetzung von Prompts hinausgehen und eigene interpretative Elemente hinzufügen können.

Quelle: simonw↗