Stable Diffusion Forge é o fork otimizado do Automatic1111 que virou padrão em 2026 para quem roda Flux, Pony ou Illustrious em GPU média. Este tutorial em português cobre instalação no Windows, otimizações para RTX 3060, configuração de extensões NSFW, e workflow prático para gerar imagens adulto de qualidade local. Tudo testado neste mês.
O Forge é hoje a interface mais amigável para rodar Stable Diffusion local. Mantém a UI clássica do Automatic1111 (que todo mundo já conhece) mas reescreveu a gestão de memória, suportando Flux nativo e usando até 50% menos VRAM em SDXL. Para o brasileiro que tem uma RTX 3060 12GB (a placa custo-benefício rei aqui), o Forge é o caminho mais curto entre baixar e estar gerando imagem NSFW de qualidade. Este tutorial leva você do zero.
Quer ver o resultado antes de baixar 10GB? O gerador grátis no topo do site roda Flux e Pony em GPU dedicada, sem cadastro. Você testa o output esperado antes de bater de cabeça com o setup local.
Por que usar o Forge em 2026
O Forge foi criado por lllyasviel (mesma pessoa que criou o ControlNet) com um objetivo: tornar Stable Diffusion executável em hardware mediano. Em 2024, rodar SDXL numa RTX 3060 era luta. Forge resolveu. Em 2025, Flux chegou e o Forge foi a primeira interface a suportar nativamente. Em 2026, Forge é o que recomendo para 90% dos iniciantes brasileiros: instalação simples, gestão de memória excelente, e mesma interface do A1111 que tem 5 anos de tutoriais na internet.
Comparado ao ComfyUI (que cobrimos em nosso tutorial ComfyUI em português), Forge é menos flexível mas muito mais rápido de aprender. Você abre, seleciona checkpoint, digita prompt, clica Generate. ComfyUI exige montar node graph antes. Para uso casual e batch produtivo, Forge ganha. Para pipelines complexos com 10+ etapas, ComfyUI ganha. A maioria das pessoas começa no Forge.
Atalho: use o gerador grátis no topo para validar prompts antes de rodar local. Mesma engine (Flux), zero setup.
Instalação: Windows 10 e 11 passo a passo
Pré-requisitos: Windows 10 ou 11, GPU NVIDIA com driver 555 ou superior, 25GB livres de disco, internet decente (vai baixar uns 5GB na primeira execução). Passo a passo:
1. Acesse: https://github.com/lllyasviel/stable-diffusion-webui-forge
2. Aba Releases (lado direito do README)
3. Baixe: webui_forge_cuXXX_torchXXX.7z (~2GB, versão mais recente)
4. Extraia com 7-Zip para C:\Forge (sem espaço, sem acento no caminho)
5. Entre na pasta. Rode primeiro: update.bat (pega update mais recente)
6. Depois rode: run.bat (ou webui-user.bat conforme versão)
7. Janela cmd abre, aguarda 5-10 min na primeira execução (baixa torch, etc)
8. Abre automaticamente no navegador: http://127.0.0.1:7860
9. Pronto, Forge está rodando.
Erros comuns: se aparecer Python not found, instale Python 3.10.6 (não 3.11, não 3.12). Se aparecer CUDA not detected, atualize driver NVIDIA. Se demorar mais de 20 minutos travado, feche e reabra; geralmente é fila lenta de pip.
Primeiro uso: gerando sua primeira imagem
Com o Forge aberto no navegador, a interface tem abas no topo: txt2img, img2img, Extras, PNG Info, Checkpoint Merger, Settings, Extensions. Você vai viver na txt2img.

Primeiro, baixe um checkpoint da Civitai (Pony V6 XL ou Illustrious XL para começar). Coloque em Forge/models/Stable-diffusion. Volte ao navegador, clique no botão refresh ao lado do dropdown Stable Diffusion checkpoint (canto superior esquerdo) e selecione o modelo. Veja nosso tutorial Civitai em português para detalhes.
Prompt positivo (caixa grande superior):
score_9, score_8_up, photorealistic, 1woman, brazilian,
tan skin, brown eyes, on the beach, sunset, detailed skin
Prompt negativo (caixa logo abaixo):
score_4, score_5, low quality, blurry, distorted,
bad anatomy, extra fingers, watermark
Configurações na lateral direita: Sampling steps 30, Sampling method DPM++ 2M Karras, Width 832, Height 1216, CFG Scale 6, Seed -1. Clique no botão laranja Generate. Em uma RTX 3060, sai em 5 a 10 segundos. Pronto, primeira imagem NSFW gerada localmente.
Configurações essenciais para RTX 3060
Tabela de configurações otimizadas que uso na 3060 12GB para diferentes modelos:
MODELO | RES. NATIVA | STEPS | CFG | SAMPLER | TEMPO
----------------|---------------|-------|-----|-----------------|------
Pony V6 XL | 832x1216 | 28 | 6 | DPM++ 2M Karras | ~6s
Illustrious XL | 832x1216 | 30 | 5 | DPM++ 2M Karras | ~7s
Flux Schnell | 1024x1024 | 4 | 1 | Euler | ~8s
Flux Dev fp8 | 1024x1024 | 25 | 3.5 | Euler | ~22s
SDXL Base 1.0 | 1024x1024 | 30 | 7 | DPM++ 2M Karras | ~10s
Realistic V6 | 768x1152 | 30 | 6.5 | DPM++ 2M Karras | ~9s
Para a 3060 8GB ou GPUs menores, edite webui-user.bat e adicione na linha COMMANDLINE_ARGS:
set COMMANDLINE_ARGS=--medvram-sdxl --xformers --opt-sdp-attention
Reinicie o Forge. Vai usar uns 6GB de VRAM em vez de 10GB, com pequena perda de velocidade. Sem isso, GPU de 8GB sofre.
Workflow NSFW: extensões essenciais
Três extensões transformam o Forge de bom em produtivo. Instale todas via aba Extensions, sub-aba Install from URL, cole a URL, clique Install, depois aba Installed e clique Apply and restart UI.
1. ADetailer - corrige rosto e mão automaticamente
URL: https://github.com/Bing-su/adetailer
2. Ultimate SD Upscale - upscale de qualidade
URL: https://github.com/Coyote-A/ultimate-upscale-for-automatic1111
3. sd-webui-controlnet - controle de pose, profundidade
URL: já vem embutido no Forge, só ative
Fluxo de trabalho que uso: gera imagem base com Pony V6 e ADetailer ligado (corrige rosto e mão automaticamente em cada saída) → escolho a melhor de um batch de 4 → mando para img2img com denoise 0.3 + Ultimate Upscale 2x → resultado em 1664×2432 limpo. Total: uns 30 segundos por imagem refinada na 3060. Veja nosso guia de como criar pornô com IA para o passo a passo.
Solução de problemas no Forge
CUDA out of memory na 3060 8GB: adicione –medvram-sdxl no COMMANDLINE_ARGS. Reduza resolução para 768×1152. Use modelos fp8 ou GGUF em vez de fp16.

Forge não acha a GPU: verifique driver NVIDIA atualizado (555+). Confirme que o Forge não está rodando em GPU integrada por engano (Painel NVIDIA, configurações 3D, force High Performance para python.exe).
Erro safetensors_rust ao carregar modelo: arquivo corrompido durante download. Baixe de novo. Verifique checksum SHA-256 quando o autor publica.
Extensão quebrou após update: entre na pasta extensions, renomeie a pasta da extensão problemática (tipo adetailer para adetailer.bak). Reinicia. Aí instala a versão nova pelo Install from URL.
Veredito: Forge é a porta de entrada certa
Se você nunca rodou Stable Diffusion e está num PC de gamer brasileiro padrão (RTX 3060 ou similar), comece no Forge. Instalação fácil, 5 anos de tutoriais compatíveis, gestão de memória superior, suporte a Flux nativo. Em 2 horas você está gerando arte adulta de qualidade. Depois que dominar, considere migrar para ComfyUI para pipelines avançados. Mas começar no Forge é o caminho mais curto para resultado em 2026.
Próximos passos: explore o tutorial ComfyUI para escalar, ou nosso guia de treinar LoRA para criar modelos personalizados. Sem GPU ainda? Comece pelo gerador grátis no topo.
Hi-Res Fix, ADetailer e ControlNet no Forge
Três recursos do Forge transformam imagens medianas em produções limpas. Hi-Res Fix gera primeiro em baixa (832×1216) e depois faz upscale 2x re-gerando detalhe, resultado: 1664×2432 com pele e cabelo em altíssima definição. ADetailer detecta rosto e mão automaticamente e re-gera essas áreas com prompt dedicado, eliminando o problema número um de iniciantes (rosto fundido, dedos extras). ControlNet usa imagem de referência (pose, depth map, edge) para forçar composição exata.
Configuração padrão Hi-Res Fix no Forge: ative o checkbox, escolha upscaler 4x-UltraSharp (melhor balanço qualidade-velocidade), denoising strength 0.35, hires steps 15, upscale by 1.5. Resultado dobra o tempo de geração mas a qualidade salta. Em RTX 3060 com Pony, sai imagem 1248×1824 limpa em uns 18 segundos.
O ControlNet do Forge vem integrado e suporta os modelos novos (Flux ControlNet, SDXL ControlNet Union). Baixe os modelos ControlNet de huggingface.co/lllyasviel/sd_control_collection e coloque em models/ControlNet. Para entender melhor o pipeline de prompt + ControlNet, veja nosso guia de prompts NSFW em português.
Forge na nuvem: alternativa para quem não tem GPU
Quem não tem RTX no Brasil (e placa boa custa R$ 2.000 mínimo em 2026) pode rodar Forge na nuvem. Duas alternativas práticas: RunPod (USD 0,40 a hora em GPU RTX 4090) e Google Colab grátis (limitado a 90 min por sessão). No RunPod existe template pronto chamado AUTOMATIC1111/Forge WebUI que sobe em 2 minutos com tudo configurado, basta fazer upload dos seus checkpoints via interface web. Total para 10 horas de geração intensa: USD 4, equivalente a R$ 22 em 2026.

Veja nosso tutorial RunPod em português para o passo a passo de configurar Forge na nuvem. Vale a pena para quem gera bastante mas não quer comprometer R$ 2.000 em GPU agora. Em 6 meses de uso intenso na nuvem, ainda sai mais barato do que comprar placa nova.
Repositórios oficiais e fontes confiáveis
O Forge é open source mantido por github.com/lllyasviel/stable-diffusion-webui-forge. Sempre baixe daqui, nunca de sites espelho desconhecidos. O ecossistema próximo: github.com/AUTOMATIC1111/stable-diffusion-webui (o predecessor), huggingface.co/runwayml (modelo base original), e civitai.com (modelos comunidade).
Para extensões oficiais validadas, navegue na aba Extensions do Forge e clique em Available para ver a lista mantida pela comunidade. Evite instalar extensão de URL aleatória encontrada em fórum, pode conter código malicioso. Sempre cheque o GitHub do autor, número de stars e atividade recente. Para ver as extensões Forge populares em 2026, leia também nosso tutorial ComfyUI (vários custom nodes têm equivalente em extensão Forge).
Forge versus Fooocus, Easy Diffusion, Invoke
Existem outras interfaces. Fooocus é hiper-simplificado, foca em qualidade automática para iniciante absoluto, mas pouco controle. Easy Diffusion é GUI clicada, boa para curioso casual mas sem profundidade. Invoke AI é polido e tem ótimo inpainting, mas é pago para uso profissional. Forge é o ponto doce: complexo o suficiente para fazer tudo, simples o suficiente para começar em uma tarde, gratuito, ativo em desenvolvimento. Em 2026 é a escolha padrão para o brasileiro entrando em Stable Diffusion local.
Para fechar o pipeline e ir além de geração simples, veja nosso guia de treinar LoRA que usa Forge como destino final dos LoRAs treinados. Se você ainda está decidindo qual modelo usar, leia também o tutorial Civitai em português para entender o ecossistema completo de checkpoints e LoRAs comunitários disponíveis em 2026, todos compatíveis com Forge nativamente sem precisar de conversão extra ou extensão paga adicional.
Dica final: junte Forge com nosso guia de prompts NSFW PT-BR e você tem o kit completo para produzir conteúdo adulto de qualidade profissional na sua máquina local, com zero mensalidade recorrente e zero filtro vigiando sua criatividade.
Perguntas Frequentes
Qual a diferença entre Forge e Automatic1111?
Forge é um fork otimizado do Automatic1111 mantido por lllyasviel (criador do ControlNet). Mesmo interface, mesma sintaxe de prompt, mas gestão de memória reescrita. Usa menos VRAM (até 50% menos em SDXL e Flux), roda Flux nativo sem hack, e suporta hardwares mais fracos. Em 2026, Forge virou padrão para quem tem RTX 3060 ou inferior. Automatic1111 ainda existe mas está em desenvolvimento lento. Para iniciante BR com GPU média, Forge é a escolha obvia.
Forge roda em RTX 3060 12GB com Flux?
Roda Flux Schnell em 6 a 12 segundos por imagem 1024×1024. Flux Dev fp16 cabe (com 500MB sobrando), Flux Dev fp8 fica folgado. Pony XL roda em 4 a 6 segundos. Adicionar ControlNet aumenta para 8 a 15 segundos. Hi-Res Fix 2x dobra o tempo. Tudo dentro do esperado para uma 3060. Para placas com 8GB (3060 8GB ou 2060), use o argumento –medvram-sdxl ou rode versões fp8/GGUF dos modelos.
Como instalar Stable Diffusion Forge no Windows?
Baixe o pacote oneclick installer em github.com/lllyasviel/stable-diffusion-webui-forge (aba Releases). Extraia em C:\Forge (sem espaço no caminho). Rode update.bat primeiro (pega versão mais nova). Depois rode webui-user.bat. Na primeira execução baixa as dependências (uns 5GB) e abre o navegador automático em localhost:7860. Total: 25 minutos com internet decente.
Onde colocar modelo, LoRA e VAE no Forge?
Checkpoints em stable-diffusion-webui-forge/models/Stable-diffusion (arquivos .safetensors ou .ckpt). LoRAs em models/Lora. VAEs em models/VAE. Embeddings (textual inversion) em embeddings. ControlNet em models/ControlNet. Estrutura idêntica ao Automatic1111. Sempre clique no botão refresh ao lado do dropdown depois de adicionar arquivo, ou reinicie o Forge.
Forge tem suporte a ControlNet e ADetailer?
Sim, ambos integrados nativamente. ControlNet vem embutido (não precisa instalar extensão como no A1111). ADetailer instala via aba Extensions, URL github.com/Bing-su/adetailer, install, reinicia. Após instalar, ADetailer aparece como dropdown abaixo do prompt na aba txt2img. Bom para refinar rosto e mão automaticamente em batch.
Posso usar Forge sem placa NVIDIA?
Sim, mas com limitações severas. AMD funciona via DirectML (lento, 5x mais devagar que NVIDIA equivalente). Apple Silicon (M1/M2/M3) funciona via MPS, decentemente rápido. CPU only funciona mas demora minutos por imagem (inviável para uso real). Recomendação BR: economize uns R$ 1.800 numa RTX 3060 12GB usada (Mercado Livre 2026), é o melhor custo-benefício mundial para Stable Diffusion.
Como melhorar prompt em PT-BR no Forge?
Forge suporta extensão Prompt Translate que traduz seu prompt PT-BR para inglês antes de gerar. Install via aba Extensions, URL github.com/butaixianran/Stable-Diffusion-Webui-Prompt-Translator. Configure DeepL ou Google Translate como backend. Ainda assim, recomendo aprender estrutura básica em inglês: modelos foram treinados em legenda inglesa e respondem melhor a tokens diretos. Tradução automática às vezes inverte sentido.
Forge atualiza sozinho ou tenho que rodar update?
Não atualiza sozinho por segurança. Você roda update.bat manualmente quando quiser pegar nova versão. Recomendo atualizar a cada 30 dias para pegar melhorias de performance e suporte a modelos novos. Antes de atualizar, faz backup da pasta inteira (especialmente embeddings, configs e extensions instaladas). Tem caso raro de update quebrar extension antiga.



