Автор Faz, основатель aiimagegeneratornsfw.com. Обучено 25+ собственных LoRA через Kohya_ss и OneTrainer за 8 месяцев. Последнее обновление: 23 мая 2026.
Краткий ответ: Обучение LoRA это создание своего модификатора для Stable Diffusion / Flux моделей на основе ваших референсных изображений. Нужно: 20-50 качественных картинок одного персонажа/стиля, GPU с 12GB+ VRAM (или облако), Kohya_ss или OneTrainer софт, 2-6 часов компьютерного времени. Этот гайд показывает весь процесс от датасета до готовой .safetensors LoRA для NSFW.
Как мы тестировали обучение LoRA для этого гайда
За последние 8 месяцев мы обучили 25+ LoRA через Kohya_ss и OneTrainer на разных базовых моделях (SD 1.5, SDXL, Pony, Illustrious, Flux). Тестировали разные размеры датасета (10 / 30 / 50 / 100 картинок), разные конфигурации обучения, разные железки (RTX 3090 24GB локально, RTX 4090 локально, RunPod RTX A5000 в облаке).
Финальная LoRA проверялась на 50+ генерациях с разными промптами для оценки реальной usability.
Что такое LoRA на самом деле
LoRA (Low-Rank Adaptation) это маленький файл (100-500MB) который “доучивает” большую модель Stable Diffusion новой информации без модификации самой модели. Это компромисс между полным fine-tune (медленно, тяжело) и простым промптом (быстро, ограниченно).
Что LoRA может научить модель:
- Узнавать конкретного персонажа. Загружаете 30 фото одного человека, LoRA научит SD генерировать его в любых сценах.
- Применять конкретный стиль. Загружаете 50 картин художника, LoRA генерирует в его стиле.
- Делать конкретный объект. Загружаете 20 фото машины модели X, LoRA рисует её.
- Делать конкретную позу или сетап. Загружаете 30 фото в позе X, LoRA воспроизводит позу с разными персонажами.
- Делать NSFW трансформации. Загружаете 50 nude фото в определённом стиле, LoRA генерирует подобное.
Что LoRA НЕ может:
- Научить модель тому что в базовой модели нет совсем. SD 1.5 не знает что такое FLUX style.
- Работать на несовместимых базах. SDXL LoRA не работает на SD 1.5 и наоборот.
- Дать вам качество выше базовой модели. Если SDXL плохо рисует руки, LoRA это не исправит.
Что вам нужно перед началом
Железо:
- Минимум для SDXL LoRA: RTX 3090 24GB (можно RTX 4080 16GB но впритык)
- Минимум для Pony / Illustrious LoRA: RTX 4090 или 3090 24GB
- Минимум для Flux LoRA: RTX 4090 или 3090 с aggressive optimizations
- Альтернатива железу: облако RunPod / Vast.ai (от 0.5 USD в час за нужное GPU)
Софт:
- Kohya_ss (наиболее популярный):
github.com/bmaltais/kohya_ss - OneTrainer (новее, проще):
github.com/Nerogar/OneTrainer - AI-Toolkit by Ostris (для Flux):
github.com/ostris/ai-toolkit
Базовую модель на которой будете тренировать LoRA. Должна быть скачана локально. Pony, Illustrious, RealVisXL популярные базы для NSFW LoRA.
Датасет референсных изображений (об этом отдельный большой раздел ниже).
Workflow 1: Подготовка датасета (60% успеха)
Это самый важный раздел. Качество вашей LoRA на 60% определяется качеством датасета.
Минимальный размер датасета:
- 20 картинок для базового персонажа или объекта
- 30-50 картинок для стиля
- 50-100 картинок для сложных концептов (фетиш, сетап)
- Меньше 15 картинок обычно даёт неустойчивую LoRA
Качество референсов:
- Разрешение минимум 1024×1024. Меньше = модель не научится деталям.
- Разнообразие поз и углов. 20 фронтальных фото одного и того же дают LoRA которая умеет только этот ракурс.
- Разнообразие фонов. Иначе LoRA выучит фон вместе с персонажем.
- Разнообразие освещения. Иначе все генерации будут в одном освещении.
- Без сильных watermarks или текста. LoRA выучит их тоже.
- Без JPEG артефактов. Re-export через PNG если возможно.
Кропы: все картинки должны быть одного aspect ratio (1:1, 4:5, 9:16 . Выберите один). Kohya и OneTrainer имеют встроенные cropper, но лучше подготовить вручную для контроля.
Капшены (tags для каждой картинки):
Каждая картинка датасета должна иметь .txt файл с тегами описывающими что на ней. Формат:
filename.png
filename.txt -> "1girl, athletic build, long black hair, white silk dress, sitting on velvet armchair, mansion library, detailed face"
Автокапшены: используйте WD14-tagger или BLIP-2 для автоматических тегов, потом ручная корректировка. В Kohya встроено.
Trigger word: обычно один уникальный токен который “активирует” вашу LoRA. Например mychar_v1 или myart_style. Этот токен должен быть первым в каждом капшене. В промпте при использовании готовой LoRA вы пишете этот токен и LoRA активируется.
Workflow 2: Установка Kohya_ss (Windows)
Kohya_ss это самый популярный софт для обучения LoRA. Установка чуть сложнее чем Forge но не страшно.
Шаг 1. Установите Python 3.10.x и Git (по нашему гайду по Stable Diffusion на русском если ещё не сделали).
Шаг 2. Клонируйте репозиторий:
git clone https://github.com/bmaltais/kohya_ss.git
cd kohya_ss
Шаг 3. Запустите setup script:
setup.bat
Выберите опцию 1 (Install kohya_ss gui). Скачивание зависимостей займёт 10-20 минут.
Шаг 4. Когда установка закончилась, запустите:
gui.bat
В консоли увидите Running on local URL: http://127.0.0.1:7860. Откройте в браузере.
Шаг 5. В UI Kohya перейдите на вкладку “LoRA” -> “Training” для обучения новой LoRA.
Workflow 3: Настройки обучения LoRA для NSFW
Это раздел с конкретными параметрами которые работают. После 25+ обученных LoRA эти настройки наш default.
В Kohya, вкладка Source Model:
- Pretrained model: путь к вашей базовой модели (например Pony Diffusion V6 XL)
- Model Quick Pick: SDXL (если тренируете на SDXL базе)
- Save Trained Model: укажите выходную папку
Вкладка Folders:
- Image folder: путь к папке с подпапкой формата
[repeats]_[trigger_word]где repeats это число повторов в эпохе (обычно 10-20 для маленьких датасетов), trigger_word это ваш уникальный токен - Output folder: куда сохранится финальная LoRA
- Logging folder: для TensorBoard логов
Вкладка Parameters > Basic:
- LoRA type:
Standard - Train batch size: 1 (на 24GB карте), 2 (на 48GB карте)
- Epoch: 10
- Save every N epochs: 2 (сохраняем чекпойнты для выбора лучшего)
- Mixed precision:
bf16(для RTX 30/40 серии) - Save precision:
fp16
Вкладка Parameters > Advanced:
- Learning rate:
5e-5для UNet (стандартное),1e-4для Text Encoder - LR Scheduler:
cosineилиcosine_with_restarts - Optimizer:
AdamW8bit(экономит VRAM) - Network Rank (Dimension): 32 для персонажа, 64 для стиля, 128 для сложных концептов
- Network Alpha: половина от Rank (16 для Rank 32, 32 для Rank 64)
- Resolution: 1024,1024 для SDXL
Вкладка Parameters > Samples:
- Sample every N steps: 100 (генерируем тестовые картинки во время обучения)
- Sample prompts: ваш trigger word + базовый промпт чтобы видеть прогресс
Workflow 4: Запуск обучения и что ожидать
После настройки параметров жмите “Start training”. Что произойдёт:
Первые 100 шагов: ничего интересного. Модель только начинает учиться.
100-500 шагов: в sample генерациях видны первые признаки изучения вашего предмета. Обычно слабые.
500-1500 шагов: заметное улучшение. Sample картинки начинают узнавать вашего персонажа.
1500-3000 шагов: LoRA становится usable. Если результат хороший на 2000 шагах, можете остановиться раньше для избежания overfitting.
3000+ шагов: обычно overfitting. LoRA начинает воспроизводить датасет дословно вместо генерализации.
Признаки overfitting:
- LoRA генерирует только позы из датасета, новые промпты игнорируются
- Сильное снижение качества фонов (модель не “понимает” комбинацию)
- Sample картинки повторяют конкретные кадры датасета
Время обучения:
- RTX 3090 24GB локально: 2-4 часа для SDXL LoRA на 30 картинках
- RTX 4090 локально: 1-2 часа для того же
- RunPod RTX A5000 (24GB): 2-3 часа за 0.79 USD/час = 2-3 USD total
- Vast.ai разные RTX опции: 1-3 USD total
Тестирование готовой LoRA
После окончания обучения у вас будет файл [name].safetensors (300-500MB) плюс несколько промежуточных epoch файлов.
Шаг 1. Скопируйте все epoch файлы в Forge\models\Lora\ или ComfyUI\models\loras\.
Шаг 2. Запустите ваш интерфейс, обновите LoRA каталог.
Шаг 3. Сгенерируйте 10-20 тестовых картинок с каждым epoch файлом используя промпт типа:
[trigger_word], [простое описание сцены, обычно совпадает с одним из ваших капшенов]
Например:
mychar_v1, sitting on chair, library background
Шаг 4. Сравните результаты разных epoch:
- Слишком ранний epoch: персонаж не узнаётся, выглядит размыто
- Идеальный epoch: персонаж узнаётся, гибкость в позах сохранена
- Слишком поздний epoch: персонаж точно воспроизводится, но игнорирует variation в промпте
Шаг 5. Сохраните лучший epoch как финальную LoRA, удалите остальные.
Тестирование с весами: хорошая LoRA должна работать на весах 0.6-1.0. Если требует только 1.0 это overfitting. Если работает только на 0.3 и ниже это undertrained.
Типичные ошибки при обучении LoRA
“LoRA выглядит размыто.” Датасет слишком маленький или низкое разрешение. Добавьте картинок до 30-50 минимум, используйте 1024×1024+ разрешение.
“LoRA воспроизводит только позы из датасета.” Overfitting. Сократите epoch с 10 до 5-7, проверьте каждый сохранённый чекпойнт.
“LoRA не активируется когда я пишу trigger word.” Trigger word должен быть в каждом капшене первым словом и быть уникальным. Не используйте обычные слова как trigger.
“Out of memory во время обучения.” Уменьшите batch size до 1, включите gradient_checkpointing, понизьте Network Rank.
“Background всегда одинаковый.” Датасет имеет одинаковый фон в большинстве картинок. Добавьте картинки с разными фонами или используйте background_blur preprocessing.
“Лицо размывается с другими персонажами.” Capshen каждой картинки должен описывать что НЕ персонаж тоже (фон, одежда, освещение). Так модель учится отделять персонаж от контекста.
Облачное обучение vs локальное
Локальное обучение:
Плюсы:
- Один раз вложился в GPU, обучай сколько хочешь
- Полная приватность датасета
- Удобно для итеративных экспериментов
Минусы:
- RTX 3090 24GB стоит 80-100K рублей в России
- Электричество и шум при долгих обучениях
- Невозможно одновременно использовать GPU для другого
Облачное обучение (RunPod):
Плюсы:
- 2-3 USD за одну LoRA на хорошем GPU
- Не нужно ничего покупать
- Параллельно можете обучать несколько LoRA на разных pod
- Своя машина свободна для другого
Минусы:
- Датасет загружается в облако (приватность вопрос)
- Зависимость от стабильности сервиса
- Регулярные расходы суммируются
Наша рекомендация: для первых 5-10 LoRA используйте RunPod. Поймёте свой workflow, оцените реальную частоту обучения. Если обучаете чаще 3-4 LoRA в месяц, покупайте RTX 3090 или 4090.
Лучшие базовые модели для NSFW LoRA
Выбор базы критичен. LoRA натренированная на одной базе не работает на другой.
Для NSFW аниме:
- Pony Diffusion V6 XL . Самая большая экосистема LoRA, де-факто стандарт
- Illustrious XL v1.0 . Современный конкурент, лучшее качество в 2026
Для реалистичного NSFW:
- RealVisXL V5.0 . Золотой стандарт реалистичности
- JuggernautXL Ragnarok . Более киноподобный стиль
Для гибкости (smaller community LoRA):
- SDXL 1.0 base . Универсальная база, LoRA работают везде где есть SDXL
Для нового поколения:
- Flux.1 dev . Но обучение Flux LoRA сложнее и требует больше VRAM
Не используйте для NSFW LoRA:
- SD 1.5 . Устарела, мало кому будет полезно
- Старые SDXL миксы . Нестабильная база для LoRA
Подробнее про модели в нашем pillar гайде по лучшим NSFW нейросетям.
Когда LoRA это правильный выбор vs альтернативы
Используйте LoRA если:
- Нужен конкретный персонаж который используется регулярно
- Нужен конкретный стиль для серии работ
- Нужна повторяемость концепта между генерациями
НЕ используйте LoRA если:
- Концепт нужен один раз (просто прицельный промпт хватит)
- Концепт это смесь существующих стилей (комбинация промпта + готовых LoRA сработает)
- Вы новичок в Stable Diffusion и ещё не освоили базовый txt2img workflow
Альтернативы LoRA:
- Textual Inversion (embedding) . Маленький файл (40-200KB), но менее мощный чем LoRA
- LyCORIS . Продвинутая LoRA с возможностями DoRA, LoCon, LoHA
- DreamBooth . Полное fine-tune модели (тяжело, не для домашнего использования)
Часто задаваемые вопросы
Что такое LoRA и зачем она нужна?
LoRA это маленький файл-модификатор для Stable Diffusion который добавляет в модель знания о конкретном персонаже, стиле или концепте без модификации самой модели. 100-500MB вместо 6.5GB полной модели.
Можно ли обучить LoRA на 8GB GPU?
Для SD 1.5 LoRA да, с aggressive optimizations. Для SDXL LoRA нет, минимум 12-16GB. Для Pony / Illustrious / Flux LoRA минимум 24GB локально. На 8GB карте используйте облако (RunPod).
Сколько картинок нужно для обучения LoRA?
Минимум 15-20 для базового персонажа. 30-50 для стабильного качества. 50-100 для сложных стилей и фетишей. Меньше 15 даёт плохие результаты, больше 100 редко улучшает.
Сколько стоит обучить LoRA в облаке?
На RunPod RTX A5000 (24GB) около 0.79 USD/час. Обучение SDXL LoRA на 30 картинках занимает 2-3 часа = 2-3 USD за одну LoRA. На Vast.ai можно найти варианты от 1-2 USD за обучение.
Какой софт для обучения LoRA лучший в 2026?
Kohya_ss это стандарт индустрии, самый функциональный. OneTrainer проще и удобнее для новичков. AI-Toolkit by Ostris для Flux моделей. Для NSFW Kohya_ss обычно лучший выбор из-за зрелости и community поддержки.
Можно ли обучить LoRA на чужих фотографиях?
Технически да, юридически и этически зависит от контекста. Обучение на свои фото без проблем. На фото знаменитостей или других людей без согласия проблематично в большинстве юрисдикций включая РФ. Используйте AI-сгенерированные референсы или свои фотографии.
Как выбрать правильное количество эпох?
Стартуйте с 10 эпох и сохраняйте чекпойнт каждые 2 эпохи. После обучения тестируйте каждый чекпойнт. Лучший обычно между эпохами 4-8. После эпохи 10 обычно overfitting.
LoRA для Pony работает на Illustrious?
Нет, не работают. Это разные базы. Pony LoRA только для Pony чекпойнтов, Illustrious LoRA только для Illustrious. Это важная причина почему сообщество держит обе базы локально параллельно.
Related Articles
- RTX 3060 vs 4060 for NSFW AI 2026: Which GPU to Buy
- Civitai на русском 2026: как пользоваться + лучшие NSFW чекпойнты
- Pony Diffusion XL Anleitung auf Deutsch: NSFW Anime Guide (2026)
- Free NSFW AI Prompt Generator 2026: 1000+ Tested Combinations
- Чат с нейросетью-девушкой 18+ 2026: топ-7 AI girlfriend платформ