Best Practices für die Erstellung benutzerdefinierter Modelle

Zuletzt aktualisiert am 2. November 2025

Erfahre mehr über die Best Practices zur effektiven Vorbereitung und Erstellung selbstdefinierter Modelle.

Wähle einen überzeugenden Anwendungsfall aus

Anwendungsfall

Gut

Zu vermeiden

Lifestyle-Fotografie

  • Klare, fokussierte Personen
  • Natürliches Licht und authentische Ausdrücke
  • Verschiedene Posen und Kompositionen
  • Einfache oder sanft verschwommene Hintergründe
  • Unscharfe oder verpixelte Bilder
  • Grelle Filter oder extreme Farbbearbeitung
  • Überfüllte Szenen oder ablenkende Hintergründe
  • Gruppenaufnahmen, bei denen Gesichter zu klein sind, um sie deutlich zu erkennen

Fotoshooting einer Person

  • Scharfe, gut beleuchtete Nahaufnahmen und Aufnahmen aus mittlerer Entfernung
  • Vielfalt an Posen, Ausdrücken und Outfits
  • Gleichmäßige Beleuchtung und Umgebung
  • Saubere oder sanft verschwommene Hintergründe
  • Zu kleine oder teilweise verdeckte Gesichter
  • Starke Schatten oder grelles Licht
  • Zu viele ähnliche Aufnahmen
  • Unscharfe oder qualitativ minderwertige Bilder

Stillleben-Fotografie

  • Lineare, ausgewogene Beleuchtung und Schatten
  • Einheitlicher Stil und Farbpalette
  • Vielfalt an Kompositionen und Arrangements
  • Scharfer Fokus auf Hauptmotive
  • Qualitativ minderwertige oder unscharfe Bilder
  • Produktaufnahmen mit Logos oder Verpackungen
  • Ablenkende Requisiten oder Hintergründe
  • Irrelevante oder themenfremde Motive

Illustrierte Figur

  • Präzise Anatomie und Proportionen
  • Einheitlicher Stil und einheitliche Rendering-Qualität
  • Vielfalt an Posen und Ausdrücken
  • Klare Details ohne visuelle Überladung
  • Qualitativ minderwertige oder unvollständige Illustrationen
  • Uneinheitliche Stile oder uneinheitliches Rendering
  • Begrenzte Vielfalt an Posen oder Perspektiven
  • Ablenkende Hintergründe oder nicht zusammenhängende Elemente

Ikonografie

  • Klarer, einheitlicher Symbolstil
  • Designs mit mittlerer bis hoher Komplexität
  • Einheitliche Beleuchtung und Farbpalette
  • Klare, objektfokussierte Kompositionen
  • Qualitativ minderwertige oder unscharfe Symbole
  • Irrelevante oder themenfremde Konzepte
  • Uneinheitliche Stile oder Rendering-Methoden
  • Zu spezifische Farben und Designelemente

Markenillustrationen

  • Präzise Anatomie und Proportionen
  • Einheitlicher Stil und einheitliche Rendering-Qualität
  • Vielfalt an Posen und Ausdrücken
  • Klare Details ohne visuelle Überladung
  • Minderwertige oder unvollständige Illustrationen
  • Uneinheitliche Stile oder uneinheitliches Rendering
  • Begrenzte Vielfalt bei Posen oder Perspektiven
  • Ablenkende Hintergründe oder irrelevante Elemente

3D-Grafiken

  • Einheitliche Perspektive und Proportionen
  • Einheitlicher Stil, Beleuchtung und Rendering-Qualität
  • Vielfalt an Kompositionen und Blickwinkeln
  • Klare, aufgeräumte Designs
  • Qualitativ minderwertige oder unvollständige Renderings
  • Uneinheitliche Stile oder Perspektiven
  • Begrenzte Vielfalt an Blickwinkeln oder Kompositionen
  • Ablenkende Elemente oder irrelevante Objekte

Neue Illustrationen zur Markenaussage

  • Durchgängig starker, einheitlicher Markenstil
  • Klare Kompositionen mit Raum zum Atmen
  • Ausdrucksstarke, markenspezifische Figuren und Szenen
  • Sauberes Rendering mit ausgewogener Beleuchtung
  • Vermischte Stile oder uneinheitliche Perspektiven
  • Überfüllte Szenen ohne klaren Fokus
  • Nicht markengebundene Requisiten oder irrelevante Grafiken
  • Unvollständige oder minderwertige Illustrationen

Neue Konzepte

  • Visuell unverwechselbare und gut umgesetzte Konzepte
  • Einheitliche Struktur, Beleuchtung und Details
  • Starke Form und klare Silhouette
  • Hochwertige Bilder mit sauberem Rendering
  • Wiederholte Formen oder kleine Variationen
  • Ablenkende Hintergründe oder Details
  • Unvollständige oder minderwertige Renderings
  • Vermischte Rendering-Stile oder -Effekte

Verwende qualitativ hochwertige Bilder

  • Verwende JPG- oder PNG-Dateien.
  • Wähle mindestens 10 – 30 hochwertige Bilder aus, welche die markenspezifischen Stile und Konzepte bzw. Motive präsentieren, die du erreichen möchtest.
  • Erfasse einen abwechslungsreichen Satz von Bildern, die den Stil oder das Motiv repräsentieren.
  • Achte darauf, dass die einzelnen Bilddateien höchstens 50 MB groß sind.
  • Stelle sicher, dass die Bildauflösung höher ist als 1024 x 1024 Pixel und dass das Seitenverhältnis maximal 16:9 im Querformat oder 9:16 im Hochformat beträgt. 
  • Behalte das Seitenverhältnis aus dem Trainings-Datensatz bei. Wenn der Trainings-Satz im Hochformat vorliegt und du quadratische Bilder generierst, treten bei der Generierung Probleme durch Abschneiden auf. 
  • Schneide deine Beispielbilder zu, um dich auf die wichtigsten visuellen Elemente zu konzentrieren. Schließe zum Beispiel Bilder aus, die eine Person oder Figur aus der Ferne mit kleinem Gesicht oder Körper zeigen.
  • Schließe Bilder mit ein, in denen unterschiedliche Blickwinkel und Hintergründe gezeigt werden, und wahre dabei eine einheitliche Ästhetik.
  • Vergewissere dich, dass deine Bilder kein unbeabsichtigtes Muster enthalten, das du nicht möchtest, wie zum Beispiel einen weißen Hintergrund in jedem Bild.
  • Entferne ablenkende Elemente, die nicht vom Modell gelernt werden sollen, wie etwa eine Collage im Hintergrund eines Porträts oder ein Hut bei einer Figur.

Überprüfe Modell-Tags

  • Füge dauerhafte Attribute des Motivs oder Stils hinzu, für das du ein Modell trainierst, wie zum Beispiel braune Haare für eine brünette Figur.
  • Füge keine veränderbaren Attribute in Tags ein, wie etwa Gegenstände, die eine Figur hält.
  • Füge mindestens drei Modell-Tags hinzu.

Prüfe Beschriftungen

  • Verwende Beschriftungen, um die Details zu verbessern und die selbstdefinierten Modelle in Konzepten zu trainieren, die vom Modell generiert werden sollen. 
  • Halte die Bildbeschriftungen kurz und prägnant. Verwende dabei die Sprache, die du auch in Textbeschreibungen mit dem Modell verwenden wirst.
  • Variiere die Satzstruktur bei den Bildbeschriftungen.
  • Ändere die automatischen Beschriftungen nach Bedarf, um das Modell über die Details des Konzepts zu informieren.
  • Das Firefly-Basismodell kennt keine bekannten Personen oder Orte, daher sollten die Beschriftungen Beschreibungen dieser Orte enthalten, um potenzielle Ergebnisse zu verbessern.

Verwenden knapper Textbeschreibungen, die mit deinen Trainings-Daten übereinstimmen

  • Verwende in deinen Prompts ähnliche Wörter und Phrasen, die du in Bildunterschriften verwendet hast.
  • Durch die Verwendung von Konzepten, die zu dem passen, womit du das selbstdefinierte Modell trainiert hast, bleibt dessen Identität besser erhalten als durch die Verwendung von Konzepten, die nichts damit zu tun haben (d.h. die Anfrage nach einer schwarz-weißen Rakete von einem Modell, das auf farbenfrohe Lifestyle-Fotografie trainiert wurde).

Verwenden erweiterter Stilmöglichkeiten zur weiteren Verfeinerung deines Bildes

  • Der Schieberegler Visuelle Intensität ist standardmäßig auf den niedrigsten Wert eingestellt, um Identität optimal zu wahren. Für kreative Anwendungsfälle wie Stil-Referenzen kann eine Erhöhung der visuellen Intensität jedoch zu lebendigeren Ergebnissen führen.  
  • Wenn du Kompositionsreferenzen für Motive verwendest, suche dafür Bilder mit weißem Hintergrund oder Skizzen aus, in denen das Motiv in der gewünschten Pose dargestellt wird.