LoRA Training fuer NSFW auf Deutsch (Stable Diffusion + Flux, 2026)

7 min read

Von Faz, Gruender von aiimagegeneratornsfw.com. 25+ eigene LoRAs in 8 Monaten trainiert. Zuletzt aktualisiert: 23. Mai 2026.

Kurze Antwort: LoRA Training ist die Erstellung eines eigenen Modifikators fuer Stable Diffusion / Flux Modelle auf Basis deiner Referenzbilder. Benoetigt: 20-50 qualitative Bilder eines Charakters/Stils, GPU mit 12GB+ VRAM (oder Cloud), Kohya_ss oder OneTrainer Software, 2-6 Stunden Computer-Zeit. Dieser Guide zeigt den gesamten Prozess vom Datensatz bis zur fertigen .safetensors LoRA.

Team AIGN sagt: LoRA Training ist keine Magie. Es ist hauptsaechlich Datensatz-Arbeit (60% der Zeit), korrekte Einstellungen (30%) und Geduld beim Warten (10%). Ein qualitativer Datensatz mit schlechten Einstellungen gibt bessere LoRA als ein schlechter Datensatz mit perfekten Einstellungen.

So haben wir getestet

In den letzten 8 Monaten 25+ LoRAs ueber Kohya_ss und OneTrainer trainiert. Verschiedene Basis-Modelle (SD 1.5, SDXL, Pony, Illustrious, Flux). Datensatz-Groessen 10/30/50/100 Bilder. Hardware: RTX 3090 24GB lokal, RTX 4090 lokal, RunPod RTX A5000 Cloud.

Was LoRA ist

LoRA (Low-Rank Adaptation) ist eine kleine Datei (100-500MB) die ein grosses Stable Diffusion Modell mit neuen Informationen “weiterbildet” ohne das Modell selbst zu modifizieren. Kompromiss zwischen vollem Fine-Tune (schwer) und einfachem Prompt (begrenzt).

Was LoRA dem Modell beibringen kann:

  1. Konkreten Charakter erkennen
  2. Konkreten Stil anwenden
  3. Konkretes Objekt malen
  4. Konkrete Pose oder Setup
  5. NSFW Transformationen

Was LoRA NICHT kann:

  • Lehrt nicht was im Basis-Modell gar nicht ist
  • Inkompatible Basen (SDXL LoRA nicht auf SD 1.5)
  • Qualitaet ueber Basis-Modell heben

Was du brauchst

Hardware:

  • SDXL LoRA: RTX 3090 24GB minimum
  • Pony / Illustrious LoRA: RTX 4090 oder 3090 24GB
  • Flux LoRA: RTX 4090 mit aggressiver Optimierung
  • Alternative: Cloud RunPod / Vast.ai (ab 0.5 USD/Stunde)

Software:

  • Kohya_ss (am populaersten): github.com/bmaltais/kohya_ss
  • OneTrainer (neuer, einfacher): github.com/Nerogar/OneTrainer
  • AI-Toolkit (fuer Flux): github.com/ostris/ai-toolkit

Basis-Modell: lokal heruntergeladen (Pony, Illustrious, RealVisXL).

Datensatz: Referenzbilder (eigener Abschnitt unten).

Workflow 1: Datensatz vorbereiten (60% Erfolg)

Wichtigster Abschnitt. Qualitaet deiner LoRA ist zu 60% durch Datensatz-Qualitaet bestimmt.

Minimale Datensatz-Groesse:

  • 20 Bilder fuer Basis-Charakter
  • 30-50 Bilder fuer Stil
  • 50-100 Bilder fuer komplexe Konzepte
  • Weniger als 15 Bilder = instabile LoRA

Qualitaet der Referenzen:

  • Aufloesung mindestens 1024×1024
  • Verschiedene Posen und Winkel
  • Verschiedene Hintergruende
  • Verschiedene Beleuchtung
  • Ohne starke Wasserzeichen oder Text
  • Ohne JPEG Artefakte

Crops: alle Bilder gleiches Aspect Ratio (1:1, 4:5, 9:16). Kohya hat eingebauten Cropper.

Captions: jedes Bild braucht .txt mit Tags:

filename.png + filename.txt -> "1girl, athletic build, long black hair, white silk dress, sitting on velvet armchair, mansion library, detailed face"

Auto-Captions: WD14-Tagger oder BLIP-2 nutzen, dann manuell korrigieren.

Trigger Word: ein einzigartiger Token der deine LoRA aktiviert. Z.B. mychar_v1. Muss erstes Wort in jedem Caption sein.

Workflow 2: Kohya_ss Installation (Windows)

Schritt 1. Python 3.10.x und Git installieren (unser SD Installation Guide).

Schritt 2. Repository klonen:

git clone https://github.com/bmaltais/kohya_ss.git
cd kohya_ss

Schritt 3. Setup ausfuehren:

setup.bat

Option 1 (Install kohya_ss gui). Dependencies 10-20 Minuten.

Schritt 4. Starten:

gui.bat

Browser oeffnet automatisch bei http://127.0.0.1:7860.

Schritt 5. Tab “LoRA” -> “Training”.

Workflow 3: Training Einstellungen fuer NSFW

Nach 25+ trainierten LoRAs unser Default-Setup.

Tab Source Model:

  • Pretrained model: Pfad zu Basis-Modell (z.B. Pony Diffusion V6 XL)
  • Model Quick Pick: SDXL
  • Save Trained Model: Ausgabe-Ordner

Tab Folders:

  • Image folder: Pfad zu Ordner mit Unterordner Format [repeats]_[trigger_word] wo repeats Wiederholungen pro Epoche sind (10-20 fuer kleine Datensaetze)
  • Output folder: wo finale LoRA gespeichert wird
  • Logging folder: fuer TensorBoard Logs

Tab Parameters > Basic:

  • LoRA type: Standard
  • Train batch size: 1 (auf 24GB Karte)
  • Epoch: 10
  • Save every N epochs: 2
  • Mixed precision: bf16 (fuer RTX 30/40 Serie)
  • Save precision: fp16

Tab Parameters > Advanced:

  • Learning rate: 5e-5 fuer UNet, 1e-4 fuer Text Encoder
  • LR Scheduler: cosine
  • Optimizer: AdamW8bit
  • Network Rank: 32 fuer Charakter, 64 fuer Stil, 128 fuer komplex
  • Network Alpha: Haelfte von Rank (16 fuer Rank 32)
  • Resolution: 1024,1024 fuer SDXL

Workflow 4: Training starten und was erwarten

Nach Setup “Start training” klicken.

  • Erste 100 Schritte: nichts interessantes
  • 100-500 Schritte: erste Anzeichen des Lernens
  • 500-1500 Schritte: signifikante Verbesserung
  • 1500-3000 Schritte: LoRA wird nutzbar
  • 3000+ Schritte: oft Overfitting

Anzeichen Overfitting:

  • LoRA generiert nur Posen aus Datensatz
  • Starke Hintergrund-Qualitaetsverschlechterung
  • Sample Bilder wiederholen konkrete Kader aus Datensatz

Trainings-Zeit:

  • RTX 3090 24GB lokal: 2-4 Stunden fuer SDXL LoRA auf 30 Bildern
  • RTX 4090: 1-2 Stunden
  • RunPod RTX A5000: 2-3 Stunden zu 0.79 USD/Std = 2-3 USD total
  • Vast.ai: 1-3 USD total
Team AIGN sagt: Cloud ist oft guenstiger als eigene Karte fuer LoRA Training. RTX A5000 in RunPod fuer 2-3 Stunden kostet 2-3 USD. Eigene RTX 3090 lohnt sich nur wenn du LoRA mindestens 5 Mal pro Monat trainierst.

Fertige LoRA testen

Nach Training-Ende hast du [name].safetensors Datei plus Zwischen-Epoch Dateien.

Schritt 1. Alle Epoch Dateien in Forge\models\Lora\ oder ComfyUI\models\loras\.

Schritt 2. Interface starten, LoRA Katalog aktualisieren.

Schritt 3. 10-20 Test-Bilder mit jeder Epoch generieren:

[trigger_word], [einfache Szenen-Beschreibung]

Schritt 4. Vergleich:

  • Zu frueher Epoch: Charakter nicht erkennbar
  • Idealer Epoch: Charakter erkennbar, Flexibilitaet erhalten
  • Zu spaeter Epoch: Charakter perfekt aber ignoriert Prompt-Variation

Schritt 5. Besten Epoch als finale LoRA speichern, Rest loeschen.

Testen mit Gewichten: gute LoRA funktioniert mit Gewichten 0.6-1.0. Wenn nur 1.0 noetig ist Overfitting. Wenn nur 0.3 noetig ist Undertrained.

Typische Fehler

“LoRA sieht unscharf aus”: Datensatz zu klein oder niedrige Aufloesung. Bis 30-50 erhoehen, 1024×1024+ nutzen.

“LoRA wiederholt nur Posen aus Datensatz”: Overfitting. Epochs von 10 auf 5-7 reduzieren.

“LoRA aktiviert nicht mit Trigger Word”: Trigger muss erstes Wort in jedem Caption und einzigartig sein.

“Out of memory”: Batch size 1, gradient_checkpointing, Network Rank reduzieren.

“Hintergrund immer gleich”: Datensatz hat gleichen Hintergrund. Diversifizieren.

Cloud vs Lokal Training

Lokal:

  • Plus: einmal investiert, beliebig oft trainieren
  • Plus: vollstaendiger Datenschutz
  • Minus: RTX 3090 24GB kostet 700-900 Euro in Deutschland

Cloud (RunPod):

  • Plus: 2-3 USD pro LoRA auf gutem GPU
  • Plus: nichts kaufen
  • Minus: Datensatz in Cloud (Datenschutz-Frage)
  • Minus: regelmaessige Ausgaben summieren sich

Empfehlung: fuer erste 5-10 LoRAs RunPod. Wenn du oefter als 3-4/Monat trainierst, RTX 3090 oder 4090 kaufen.

Beste Basis-Modelle fuer NSFW LoRA

Wahl der Basis ist kritisch. LoRA auf einer Basis trainiert funktioniert nicht auf anderer.

Anime NSFW: Pony Diffusion V6 XL (groesstes Oekosystem), Illustrious XL v1.0 (beste Qualitaet 2026)

Realistisch NSFW: RealVisXL V5.0, JuggernautXL Ragnarok

Flexibel: SDXL 1.0 base

Neue Generation: Flux.1 dev (komplexer aber besser)

NICHT nutzen: SD 1.5 (veraltet), alte SDXL Mixes (instabil).

Mehr in unserem Pillar Guide.

Wann LoRA richtige Wahl ist

LoRA wenn:

  • Konkreter Charakter regelmaessig genutzt
  • Konkreter Stil fuer Serie
  • Wiederholbarkeit zwischen Generierungen

NICHT LoRA wenn:

  • Konzept einmalig (gezielter Prompt reicht)
  • Mischung existierender Stile (Prompt + fertige LoRA reicht)
  • Du noch Basis-txt2img nicht beherrschst

Haeufig gestellte Fragen

Was ist LoRA und wozu brauche ich es?

LoRA ist kleiner Modifikator fuer Stable Diffusion der Wissen ueber konkreten Charakter, Stil oder Konzept hinzufuegt ohne das Modell selbst zu modifizieren. 100-500MB statt 6.5GB volles Modell.

Kann ich LoRA auf 8GB GPU trainieren?

Fuer SD 1.5 LoRA ja mit aggressiver Optimierung. Fuer SDXL LoRA nein, minimum 12-16GB. Fuer Pony/Illustrious/Flux LoRA minimum 24GB lokal. Auf 8GB Karte Cloud nutzen (RunPod).

Wie viele Bilder fuer LoRA Training?

Minimum 15-20 fuer Basis-Charakter. 30-50 fuer stabile Qualitaet. 50-100 fuer komplexe Stile.

Was kostet LoRA Training in der Cloud?

RunPod RTX A5000 ca 0.79 USD/Std. SDXL LoRA auf 30 Bildern dauert 2-3 Stunden = 2-3 USD pro LoRA. Vast.ai oft 1-2 USD.

Welche Software fuer LoRA Training 2026?

Kohya_ss ist Industriestandard. OneTrainer einfacher fuer Anfaenger. AI-Toolkit fuer Flux Modelle. Fuer NSFW meist Kohya_ss beste Wahl.

Kann ich LoRA auf Fotos anderer Menschen trainieren?

Technisch ja, rechtlich problematisch ohne Einwilligung in Deutschland (Persoenlichkeitsrecht, DSGVO). Nutze AI-generierte Referenzen oder eigene Fotos.

Wie waehle ich richtige Epoch-Anzahl?

Mit 10 Epochs starten, Checkpoint alle 2 Epochs speichern. Nach Training jeden Checkpoint testen. Bester meist zwischen Epoch 4-8.

LoRA fuer Pony funktioniert auf Illustrious?

Nein. Verschiedene Basen. Pony LoRA nur fuer Pony Checkpoints, Illustrious LoRA nur fuer Illustrious.

Related guides: