GPT Image 2 Prompt-Leitfaden: Tipps, Vorlagen & virale Beispiele (2026)

VideoToPrompton 2 months ago10 min read

OpenAI hat GPT Image 2 (Modell-ID gpt-image-2, vermarktet als ChatGPT Images 2.0) am 21. April 2026 veröffentlicht – und es eroberte innerhalb von zwölf Stunden den ersten Platz in der Image Arena mit einem Vorsprung von +242 Punkten, dem größten Vorsprung, der jemals auf dieser Bestenliste verzeichnet wurde. Wenn Sie Prompts für KI-Bildgeneratoren schreiben, ist dies das Modell, das Sie in diesem Quartal lernen müssen.

Dies ist ein praktischer GPT Image 2 Prompt-Leitfaden, der aus drei Quellen erstellt wurde: OpenAIs eigenem Kochbuch, den gpt-image-2-Prompt-Beispielen, die in der ersten Woche auf X viral gingen, und Side-by-Side-Tests gegen frühere Modelle wie GPT Image 1.5 und DALL-E 3. Am Ende werden Sie eine wiederverwendbare GPT Image 2 Prompt-Struktur, zehn Copy-Paste-Vorlagen und ein klares Verständnis der Textwiedergabe- und Bearbeitungsmuster haben, die dieses Modell anders machen.

Was ist GPT Image 2 (ChatGPT Images 2.0)?

GPT Image 2 ist OpenAIs erstes Bildmodell mit nativer Denkfähigkeit, die in die Architektur integriert ist – es kann das Web durchsuchen, eine Anfrage durchdenken und bis zu acht konsistente Variationen aus einem einzigen Prompt generieren. Wichtige Spezifikationen, die die Art und Weise, wie Sie Prompts schreiben, verändern:

Auflösung: bis zu 4K (4096×4096), wobei der 2K-Bereich (2560×1440) der Sweet Spot für Zuverlässigkeit ist
Textwiedergabe: ~99% Zeichengenauigkeit über Latein, CJK, Hindi und Bengali hinweg – das herausragende Merkmal von gpt-image-2
Multi-Bild-Eingabe: Füttern Sie mehrere Referenzbilder ein, und gpt-image-2 wird über deren Kombination nachdenken
Backbone: GPT-5.4, ersetzt sowohl DALL-E 3 als auch GPT Image 1.5

Was das in der Praxis bedeutet: GPT Image 2 belohnt spezifische, strukturierte, mehrteilige Prompts auf eine Weise, wie es die meisten älteren Modelle nicht tun. Vage Prompts erzeugen vage Ergebnisse. Lange, dichte, gut organisierte Prompts erzeugen überraschend genaue Ergebnisse.

Die GPT Image 2 Prompt-Struktur, die funktioniert

Das offizielle OpenAI-Kochbuch empfiehlt eine Prompt-Struktur für gpt-image-2, und jeder virale GPT Image 2 Prompt, den ich reverse-engineered habe, folgt ihr:

Scene → Subject → Important details → Use case → Constraints

Schreiben Sie Ihren gpt-image-2-Prompt in dieser Reihenfolge. Verwenden Sie Zeilenumbrüche oder beschriftete Segmente anstelle eines langen Absatzes – der Reasoning-Schritt von gpt-image-2 parst strukturierte Prompts zuverlässiger als Aneinanderreihungen von kommagetrennten Keywords.

Schwacher gpt-image-2-Prompt:

A girl in Tokyo at night.

Starker gpt-image-2-Prompt (Scene → Subject → Details → Use case → Constraints):

Scene: a narrow Shinjuku alley at 11pm, light rain on wet pavement reflecting neon signage in red and cyan.

Subject: a 22-year-old Japanese woman in a oversized beige trench coat, holding a clear umbrella, looking slightly off-camera.

Details: shot on 35mm film with mild grain, shallow depth of field at f/1.8, subject in focus and background bokeh, soft fill from a paper lantern off-screen left.

Use case: editorial street photography portrait, magazine cover potential.

Constraints: photorealistic only, no anime stylization, no logos or readable signage, no extra people in frame.

Der zweite Prompt ist nicht länger, nur um länger zu sein. Jedes Segment gibt gpt-image-2 eine andere Art von Einschränkung: Scene legt Ort und Beleuchtung fest, Subject legt die Identität fest, Details legen Kamera und Look fest, Use case bestimmt das Polishing-Level, Constraints eliminieren Fehlermodi.

Textwiedergabe: Das Killer-Feature von GPT Image 2

GPT Image 2 ist das erste große Bildmodell, bei dem Sie echten, mehrzeiligen, mehrsprachigen Text in ein Bild einfügen und dem Ergebnis vertrauen können. Um die von OpenAI versprochene Genauigkeit von ~99% zu erreichen, befolgen Sie vier Regeln.

1. Setzen Sie den wörtlichen Text in Anführungszeichen. Dies signalisiert gpt-image-2, dass die Zeichenfolge wörtlich wiedergegeben werden soll:

Headline reads: "Summer 2026 Capsule Collection"

2. Beschreiben Sie die Typografie detailliert. Sagen Sie nicht einfach "eine saubere Schriftart". Teilen Sie gpt-image-2 das Gewicht, die Farbe, die Ausrichtung und die Position mit:

Bold sans-serif, white, centered in the bottom third, ~80px equivalent, generous letter spacing.

3. Fügen Sie eine Verbatim-Schutzanweisung für kritischen Text hinzu. Wenn Genauigkeit wichtig ist – Markennamen, Daten, Preise – fügen Sie hinzu:

Render verbatim. No extra characters, no substitutions, no creative reinterpretation.

4. Erhöhen Sie die Qualität. Verwenden Sie quality: medium oder high für Prompts mit kleinem Text, Multi-Font-Layouts oder dichten Informationspanels. low-Qualität sieht auf großen Postern gut aus, versagt aber bei Text in Untertitelgröße.

Virales X-Beispiel von @BubbleBrain (22. April): ein 35mm-Porträt-Prompt im japanischen Stil, der explizit "Analog 35mm film photography, soft airy Japanese-style aesthetic, gentle diffused natural window light, slight overexposure, pastel tones, low contrast" spezifizierte. Hier war keine Textwiedergabe involviert, aber dieselbe Logik von Dichte und Spezifität gilt – gpt-image-2 erfüllte jede Klausel präzise, weil jede konkret war.

Das Change / Preserve Bearbeitungsmuster

Die Bearbeitung mit gpt-image-2 ist der Punkt, an dem die meisten Menschen Stunden verlieren. Das Muster, das konsistent funktioniert – und sowohl vom OpenAI-Kochbuch als auch von jedem awesome-gpt-image-2-GitHub-Repo empfohlen wird – hat drei Blöcke:

Change: [exactly what should change]
Preserve: [face, identity, pose, lighting, framing, background, geometry, text, layout]
Constraints: [no extra objects, no redesign, no logo drift, no watermark]

Der Trick ist die Preserve-Zeile. gpt-image-2 wird bei allem, was Sie nicht explizit sperren, stillschweigend abweichen. Wenn Sie möchten, dass das Gesicht gleich bleibt, schreiben Sie "face" in Preserve. Wenn Sie möchten, dass die Beleuchtung bleibt, schreiben Sie "lighting". Wenn Sie den Originaltext unberührt lassen möchten, während Sie einen Hintergrund austauschen, schreiben Sie "all on-image text verbatim" in Preserve.

Iterieren Sie eine Änderung nach der anderen. Lange Bearbeitungs-Prompts, die versuchen, fünf Dinge gleichzeitig zu ändern, führen zu Abweichungen bei allen fünf. Kurze Bearbeitungs-Prompts mit einer Change-Klausel und einer langen Preserve-Liste erzeugen das gewünschte Ergebnis.

Multi-Bild-Eingabe: Reasoning über Referenzen hinweg

Eine der Dinge, die gpt-image-2 kann und frühere Modelle nicht konnten, ist das Reasoning über mehrere Referenzbilder hinweg. Die Regel: Referenzieren Sie jedes Bild nach Index und beschreiben Sie, wie sie interagieren.

Image 1: product shot of a glass perfume bottle on white seamless. Image 2: editorial style reference, golden hour light through a window. Image 3: pose reference, hand holding the bottle from above.

Apply Image 2's lighting and color grade to Image 1. Use Image 3's hand pose. Final aspect ratio 4:5.

@icreatelife (Kris Kashtanova) nutzte dieselbe Logik für eines der meistgeteilten GPT Image 2 Tutorials der Startwoche – die Generierung eines äquirektangulären 360°-Panoramas mit dem Prompt "make equirectangular panorama of [PLACE]" und dessen Rückführung als Referenz für einen 3D-Viewer-Build. Dieselbe Multi-Image-Grammatik handhabt Compositing, Stilübertragung und Posenübertragung.

5 virale GPT Image 2 Prompts, entschlüsselt

Hier sind fünf GPT Image 2 Prompts, die in der ersten Veröffentlichungswoche auf X viral gingen, jeweils kommentiert mit dem, was sie erfolgreich machte.

1. Times Square Realismus — viral, weil gpt-image-2 über 150 Fußgänger, gelbe Taxis, nassen Gehweg, spiegelnde Glanzlichter und alle Beschilderungen korrekt geschrieben wiedergab. Der Prompt war eine dichte Scene → Subject → Details-Durchführung mit explizitem "all signage text remains accurate, no garbled letters" in Constraints.

2. @hasantoxrs Lovart Workflow — ein Prompt, 30 Kampagnen-Assets, bearbeitbare Textebenen. Der Trick: Er übergab gpt-image-2 ein Brand Briefing innerhalb des Prompts anstatt einer einzelnen Bildbeschreibung und bat um ein System von Assets in einem Zug. Der Reasoning-Modus von gpt-image-2 übernahm den Multi-Asset-Planungsschritt.

3. @junwatus Design-Mockup — ein One-Shot-UI-Mockup einer mobilen E-Commerce-Homepage. Der Prompt spezifizierte die Statusleiste, obere Tabs, Hero Card, Produktgitter und untere Navigation als explizite Elemente. gpt-image-2 erzeugte ein pixelgenaues Mockup, das Designer für einen echten Screenshot hielten.

4. "A massive pile of rice, and on one single grain there is tiny text that reads 'wOw'" — Mikro-Detail-Flex. Zwei Erkenntnisse: (1) gpt-image-2 kann lesbaren Text in einem Bereich von vielleicht 3% des Bildes wiedergeben, und (2) kontrastierende Maßstäbe (massiver Haufen vs. einzelnes Korn) erzeugen einprägsame Bilder, die sich gut teilen lassen.

5. @icreatelife's äquirektanguläres Panorama — "make equirectangular panorama of [PLACE]". Kurzer Prompt, aber er nutzt ein spezifisches Format, das gpt-image-2 ohne weitere Erklärung verstand. Dann speiste er das Ergebnis in einen Codex-Prompt für einen mausgesteuerten 3D-Viewer ein. Zweistufige Workflows wie dieser werden von frühen gpt-image-2-Power-Usern entwickelt.

10 Copy-Paste GPT Image 2 Prompt-Vorlagen

Nutzen Sie diese als Ausgangspunkte und füllen Sie die Felder in Klammern aus. Jede Vorlage folgt der Scene → Subject → Details → Constraints-Struktur.

1. Editoriales Porträt

Scene: [location, time of day, light source]. Subject: [age/look], wearing [outfit], [pose]. Details: shot on 35mm, shallow depth of field, soft natural light. Constraints: photorealistic, no extra people, no readable text.

2. Poster mit Überschrift

A [style] poster, [aspect ratio]. Headline reads: "[exact text]" in [font weight + color], centered. Body: [layout description]. Render text verbatim, no substitutions.

3. UI-Mockup

A pixel-perfect [device] screenshot of a [product type] app. Top: [status bar + nav]. Middle: [hero + content]. Bottom: [tab bar]. Style: [iOS / Material / minimal]. Constraints: realistic UI, no Lorem Ipsum, all text in English.

4. Infografik

An infographic titled "[exact title]" explaining [topic]. Layout: [columns / flow]. Style: [flat / 3D / hand-drawn]. Use icons for [list items]. All text rendered verbatim.

5. Produktfoto

Studio product shot of [product] on [background], [lighting setup], [angle]. Reflections, shadows, and material accuracy are critical. No text, no logos.

6. Charakterbogen

Character sheet of [character description]. Three poses: front, three-quarter, side. Same outfit, same lighting across all three. Reference style: [studio]. Constraints: identical face across panels.

7. Social-Media-Werbemittel

A [aspect ratio] social ad for [brand/product]. Headline: "[text]". Subtext: "[text]". CTA button: "[text]". Background: [scene]. Style: [tone]. Render all text verbatim.

8. Game-Screenshot

A first-person [game style] screenshot of [scene]. HUD elements: [list]. Lighting: [description]. Resolution: 4K. Constraints: no real-world logos, no watermark.

9. Storyboard-Panel

Storyboard panel #[N] for [scene]. Shot type: [wide / medium / close]. Camera: [angle]. Subject: [action]. Style: [grayscale sketch / color]. Caption beneath: "[scene description]".

10. Change / Preserve

[Attached image]. Change: [exactly what changes]. Preserve: face, identity, pose, lighting, framing, background, all on-image text verbatim. Constraints: no extra objects, no redesign, no logo drift.

Häufige GPT Image 2 Prompt-Fehler

Constraints vergessen. Das Modell weicht mehr ab, als man erwartet. Wenn Sie nicht "no extra people" sagen, erhalten Sie oft zusätzliche Personen.
Einen Prompt mit fünf Bearbeitungen überladen. Iterationen mit einer einzigen Änderung sind besser als ein heroischer Mega-Prompt.
Verbatim-Schutzanweisungen für Text vergessen. "Summer" kann zu "Sumer" werden, wenn Sie es nicht sperren.
Vager Stil. "Cinematic" bedeutet für gpt-image-2 allein nichts. "Anamorphic 2.39:1, teal and orange grade, soft halation on highlights" hingegen schon.
Ein Seitenverhältnis in Worten, aber nicht im size-Parameter anfordern. Übergeben Sie es als size (z.B. 1024×1536) – Worte allein fixieren die Leinwand nicht immer.

GPT Image 2 ist das erste OpenAI-Bildmodell, bei dem Prompt Engineering die Ausgabe maßgeblich verändert. Die Scene → Subject → Details → Constraints-Struktur, die Verbatim-Textmuster und das Change / Preserve-Bearbeitungsformat sind die drei Dinge, die man zuerst beherrschen sollte. Alles andere ist Variation.

Möchten Sie die Struktur nicht jedes Mal von Hand schreiben? Probieren Sie unseren GPT Image 2 Prompt-Generator aus – geben Sie eine einzeilige Idee ein und erhalten Sie einen strukturierten gpt-image-2-Prompt zurück, bereit zum Einfügen in ChatGPT oder die OpenAI API.

YouTube Shorts KI-Monetarisierung: Echte Umsatzzahlen und Methoden

Praktischer Guide zur YouTube Shorts KI-Monetarisierung. Echte Umsatzdaten, bewaehrte Workflows und Methoden, mit denen Creator 10.000-60.000 $/Monat verdienen.

Warum KI-Faceless-Kanaele 2026 scheitern (und wie du es behebst)

Die meisten KI-Faceless-YouTube-Kanaele scheitern nicht am Algorithmus, sondern an faulem Content und Nachahmung. Die ehrliche Analyse und Loesungsansaetze.

Veo 3.1 Test: Googles FAST-Modus, Prompt-Tipps und ehrliche Grenzen

Ein praxisnaher Veo 3.1 Test mit dem neuen FAST-Modus, Prompt-Schreibtipps, Generierungslimits und Vergleich mit Kling und Sora fuer KI-Videoerstellung.