AI News
model-releasesimonw ·

OpenAI veröffentlicht ChatGPT Images 2.0 - Test mit Waschbär und Funkgerät

OpenAI hat ChatGPT Images 2.0 veröffentlicht, ihr neues Bildgenerierungsmodell. Simon Willison testete das neue Modell gegen die Vorgängerversion und Googles Nano Banana mit einem 'Wo ist Waldo'-Style Prompt nach einem Waschbären mit Funkgerät. Die Ergebnisse zeigen deutliche Unterschiede in der Bildqualität und Promptverständnis.

Einordnung

Die Veröffentlichung von ChatGPT Images 2.0 markiert einen wichtigen Schritt in OpenAIs Bildgenerierung. Sam Altman behauptete, der Sprung von gpt-image-1 zu gpt-image-2 entspreche dem Sprung von GPT-3 zu GPT-5. Willisons praktischer Test zeigt interessante Unterschiede zwischen den Modellen: Während gpt-image-1 den Waschbären nicht erkennbar platzierte, lieferte Googles Nano Banana 2 ein offensichtliches Ergebnis mit dem Waschbären prominent in einem 'Amateur Radio Club'-Stand. Dieser Test verdeutlicht die Herausforderungen bei der Bewertung von Bildgenerierungsmodellen, besonders bei komplexen Szenen mit versteckten Objekten. Die Tatsache, dass selbst Claude Opus 4.7 Schwierigkeiten hatte, den Waschbären im ersten Bild zu finden, zeigt sowohl die Komplexität der generierten Bilder als auch die Grenzen aktueller Vision-Modelle bei der Objekterkennung in dichten Szenen.
Quelle: simonw