RunPod Tutorial Português 2026: Stable Diffusion na Nuvem

13 min read

O RunPod é a forma mais barata de rodar Stable Diffusion na nuvem a partir do Brasil em 2026. Custa entre R$ 1,66 e R$ 5,15 por hora dependendo da GPU, paga em dólar via Wise ou Nubank, e roda Flux, SDXL, Pony e ComfyUI sem censura. Este tutorial em português cobre cadastro, escolha de GPU, template, persistent volume e troubleshooting. Em 30 minutos você está gerando imagens NSFW em uma RTX 4090.

Comprar uma RTX 3090 ou 4090 no Brasil custa de R$ 8.000 a R$ 18.000. Some energia (250W por hora ligada), barulho, calor no quarto e o medo de queimar o equipamento. Alugar pela hora no RunPod resolve tudo: você paga só quando usa, troca de GPU em 2 cliques e nunca precisa atualizar driver. Para quem está começando ou gera em lote esporadicamente, é a melhor relação custo benefício em 2026. Este guia testa o fluxo completo do brasileiro, do cadastro ao primeiro batch de imagens.

Quer testar IA sem censura antes de configurar a nuvem? Use nosso gerador grátis no topo do site. Sem login, sem cartão, sem cadastro. Você digita o prompt e a imagem aparece em segundos. Funciona no celular também. É o jeito mais rápido de ver se o resultado vale o trabalho de subir um pod no RunPod.

O que é o RunPod e por que brasileiros usam

O RunPod é uma plataforma de aluguel de GPU por hora. Você liga um pod (uma máquina virtual com GPU), trabalha o que precisar, desliga, e só paga pelas horas usadas. A diferença para AWS ou Google Cloud é o preço: enquanto AWS cobra USD 3 por hora numa V100, RunPod entrega uma RTX 4090 (mais potente) por USD 0,69. Para brasileiro que paga em real, essa diferença é a fronteira entre viável e impagável.

O público brasileiro do RunPod cresceu muito desde meados de 2024. A maioria entra para rodar ComfyUI ou Forge com checkpoints da Civitai que a placa de casa não aguenta. Outros usam para treinar LoRA (precisa de 24GB de VRAM no mínimo). E uma boa parte usa só para gerar batch grande de imagens NSFW que demoraria horas em uma RTX 3060. Veja nosso guia de como treinar LoRA em português se esse for o seu caso.

Como criar a conta no RunPod (passo a passo)

Abra runpod.io e clique em Sign Up. Use Google ou GitHub para acelerar o cadastro. Confirme o e-mail, faça login e você cai no dashboard. Antes de qualquer pod, vá em Billing e adicione um cartão. É aqui que o brasileiro tropeça: cartão internacional comum (Caixa, Itaú, Santander) costuma cair na trava antifraude do RunPod. Use Wise ou Nubank Ultravioleta. Faça uma carga inicial de USD 10 (R$ 52) para testar.

Runpod tutorial portugues: a pod creation panel showing gpu options and pricing tags, dark ui (ilustracao)

Sem GPU em casa e sem paciência para subir um pod? O gerador grátis no topo do site usa Flux NSFW rodando em uma L40S dedicada, sem fila, sem login. Gera no mesmo nível que você tiraria do RunPod, só que sem você precisar configurar nada. Ótimo para testar prompts antes de fechar uma sessão paga.

Sobre o pagamento em dólar: o RunPod cobra em USD e converte na hora pelo câmbio do dia. Com cartão Wise (que mantém saldo em dólar), você não paga IOF de cartão internacional (3,38%) e nem spread bancário, só 1,1% de IOF de operação cambial. Numa conta de USD 50/mês (R$ 260), Wise te economiza uns R$ 8 por mês. Em 12 meses, R$ 100. Vale a pena abrir conta Wise se você vai usar com frequência.

Escolhendo a GPU certa: tabela comparativa

GPUVRAMUSD/horaR$/horaBom para
RTX A450020GB0,321,66SDXL, Pony, Illustrious, Flux Schnell
RTX 309024GB0,442,29Flux Dev fp16, batch grande SDXL
RTX 409024GB0,693,60Flux Dev rápido, treino LoRA leve
L40S48GB0,995,15Flux Dev sem limite, treino LoRA pesado
A100 80GB80GB1,899,83Treino de checkpoint, vídeo, batch enorme

Para 90% dos casos brasileiros, RTX 4090 é o ponto doce. Roda Flux Dev em fp16 sem swap, gera uma imagem 1024×1024 em 5 segundos, e R$ 3,60 por hora cobre uma sessão produtiva inteira. Se o seu workflow é só SDXL ou Pony, a A4500 economiza metade e entrega resultado idêntico. L40S e A100 só fazem sentido se você está treinando modelo ou rodando vídeo (AnimateDiff, Hunyuan Video). Veja o tutorial ComfyUI em português para escolher o workflow certo para sua GPU.

Criando seu primeiro pod com template Stable Diffusion

No dashboard do RunPod, clique em Pods, depois em Deploy. Escolha o filtro Secure Cloud (mais estável que Community Cloud). Selecione a GPU desejada (recomendo RTX 4090 para começar). Em Template, busque por ‘Stable Diffusion’ e escolha o template oficial ‘RunPod Stable Diffusion v2’ ou ‘ashleykleynhans/stable-diffusion-webui’. Esses templates já vêm com Automatic1111 ou Forge instalado, modelo SD 1.5 base baixado e portas configuradas.

Configure disk: 30GB para container disk (sistema), 50GB para volume disk (persistent). Em Expose HTTP Ports, deixe 3001 (Forge) e 8888 (Jupyter) marcados. Clique em Deploy On-Demand. Em 1 a 2 minutos, o pod sobe e aparecem dois botões: Connect to HTTP Service [Port 3001] e Connect to Jupyter Lab. O primeiro abre a interface gráfica do Forge no navegador, o segundo abre o terminal para baixar checkpoints.

Baixando checkpoints e LoRAs da Civitai

Os templates vêm com modelo SD 1.5 vanilla, que é fraco para NSFW. Você vai querer Pony V6 XL, Illustrious ou um checkpoint realista da Civitai. Abra o Jupyter Lab do pod e crie um terminal (File, New, Terminal). Vá para a pasta de modelos do Forge: cd /workspace/stable-diffusion-webui/models/Stable-diffusion. Cole o comando de download abaixo (substitua MODEL_ID pelo ID do modelo na Civitai e TOKEN pela sua API key da Civitai).

Runpod tutorial portugues: terminal window with command lines launching a generator on a dark interface (ilustracao)
# Baixar checkpoint da Civitai com curl
# 1. Pegue seu token em civitai.com/user/account, aba API Keys
# 2. Substitua MODEL_VERSION_ID pelo ID na URL do modelo
# 3. Cole no terminal do Jupyter

curl -L -o pony_v6_xl.safetensors \
  -H "Authorization: Bearer SEU_TOKEN_AQUI" \
  "https://civitai.com/api/download/models/MODEL_VERSION_ID"

# Para LoRAs, mude a pasta:
cd /workspace/stable-diffusion-webui/models/Lora
curl -L -o minha_lora.safetensors \
  -H "Authorization: Bearer SEU_TOKEN_AQUI" \
  "https://civitai.com/api/download/models/OUTRO_VERSION_ID"

# Depois reinicie o Forge para ele ver os novos arquivos
pkill -f "launch.py" && cd /workspace/stable-diffusion-webui && python launch.py --xformers --listen --port 3001 &

Pony V6 XL pesa 6.6GB, Illustrious 6.9GB, Flux Dev 23GB. Em uma conexão razoável de Brasil (300Mbps), o download dura 2 a 5 minutos. Importante: a Civitai exige token autenticado para conteúdo NSFW desde 2024. Cadastre no site da Civitai (criou link no nosso tutorial Civitai em português), gere o token e use no comando acima.

Persistent volume: como não perder tudo entre sessões

O detalhe que separa o brasileiro novato do experiente é o persistent volume. Sem ele, toda vez que você clica em Terminate, perde os modelos baixados, os LoRAs configurados e as imagens geradas. Com ele, tudo fica salvo na pasta /workspace e reaparece quando você sobe um novo pod com o mesmo volume montado. Custa USD 0,10 por GB por mês. Um volume de 50GB sai por USD 5/mês (R$ 26). Em duas sessões de download, ele já se paga.

Como configurar: na hora de criar o pod, na aba Storage, marque ‘Network Volume’ e crie um volume novo de 50GB ou 100GB. Dê um nome (ex: meu-sd-volume). Esse volume agora pertence à sua conta e pode ser montado em qualquer pod futuro. Quando criar o próximo pod, em vez de criar novo, selecione ‘Use Existing Volume’ e escolha o seu. Resultado: 2 minutos para subir um ambiente idêntico ao anterior, sem baixar nada de novo.

Workflow padrão: ligar, gerar, desligar

O fluxo eficiente do brasileiro funciona assim. Você abre o dashboard, sobe o pod (1 minuto), conecta na porta 3001, gera o lote planejado (30 minutos a 2 horas dependendo do tamanho), baixa os outputs via Jupyter ou rsync, e clica em Stop. O pod hiberna sem cobrar GPU (só cobra storage do volume). Quando voltar amanhã, clica em Start no mesmo pod e em 30 segundos volta tudo no estado em que ficou.

Truque importante: nunca clique em Terminate sem antes baixar suas imagens. Terminate apaga o container disk (não o volume) mas perde processos rodando, logs e qualquer arquivo fora da pasta /workspace. Stop apenas pausa: ele continua cobrando volume mas zera o custo da GPU. Use Stop entre sessões do dia, Terminate só quando vai ficar dias sem usar e quiser zerar custo.

Troubleshooting: erros comuns do brasileiro

  • Pagamento recusado: 90% das vezes é cartão brasileiro normal. Troque por Wise ou Nubank Ultravioleta. Se for Wise, tenha pelo menos USD 15 no saldo.
  • Pod ligado mas Forge não abre: espere 2 minutos depois do pod aparecer ‘Running’. O Forge demora a iniciar. Se passou 5 minutos, abra o Jupyter e veja o log com tail -f /workspace/stable-diffusion-webui/runpod.log.
  • CUDA out of memory: sua GPU não tem VRAM suficiente para o modelo. Reduza para 768×768, ative –medvram nas flags do Forge, ou troque a GPU para uma com mais VRAM.
  • Civitai download retorna 401: seu token expirou ou está mal formatado. Gere outro em civitai.com/user/account, copie inteiro, e cole no curl entre aspas duplas.
  • Conexão lenta no Brasil: os datacenters do RunPod ficam nos EUA, Canadá e Europa. Latência tipica de São Paulo é 130 a 180ms, o que torna a interface levemente travada. Não atrapalha a geração (que roda na nuvem), só o cursor do navegador.

Quanto realmente custa por mês (cenário real)

Vamos a um cenário real: brasileiro gerando 200 imagens NSFW por semana em Flux Dev. Cada imagem leva 6 segundos numa RTX 4090. 200 imagens = 1200 segundos = 20 minutos de GPU. Adicione 10 minutos de setup e ajustes por sessão. Total: 30 minutos por semana, ou 2 horas por mês. Custo de GPU: 2 horas × USD 0,69 = USD 1,38 (R$ 7,18). Custo de persistent volume (50GB): USD 5/mês (R$ 26). Total mensal: R$ 33.

Runpod tutorial portugues: browser window showing a remote stable diffusion ui rendering an image (ilustracao)

Compare com comprar uma RTX 3060 12GB (R$ 2.000 usada no Mercado Livre) e rodar local: payback de 60 meses se ela aguentar (e ela não vai aguentar Flux Dev sem swap pesado). Compare com Midjourney Pro: USD 30/mês (R$ 156), com filtro NSFW que bloqueia o que você quer fazer. RunPod sai 5 vezes mais barato e sem filtro. Para uso esporádico, é imbatível.

Veredito: para quem vale a pena

RunPod vale a pena para três perfis de brasileiro. Primeiro: quem gera em lote esporadicamente (200 a 500 imagens por mês) e não quer investir em GPU. Segundo: quem precisa de modelo grande (Flux Dev, treino de LoRA) que sua placa atual não aguenta. Terceiro: quem viaja, usa notebook, ou quer ter Stable Diffusion acessível de qualquer lugar com browser.

Não vale a pena para quem gera dezenas de imagens por hora todo dia (aí compensa comprar GPU), nem para quem mora em região com internet ruim (latência alta atrapalha o fluxo). Para o caso de uso intermediário, RunPod é o equilíbrio certo entre custo, qualidade e ausência de filtro. Combine com o nosso gerador grátis para testes rápidos e use RunPod para batch sério.

Perguntas Frequentes

Quanto custa rodar Stable Diffusion no RunPod em reais?

Hoje 1 USD vale cerca de R$ 5,20. Uma RTX 4090 sai por USD 0,69/hora, ou seja R$ 3,60/hora. Uma A4500 fica em USD 0,32/hora (R$ 1,66). Uma L40S, USD 0,99/hora (R$ 5,15). Para uma sessão de 2 horas gerando algumas centenas de imagens, você gasta entre R$ 3 e R$ 10, dependendo da GPU. Compare com comprar uma RTX 3060 usada no Mercado Livre (R$ 2.000): em RunPod você só paga quando usa, sem energia, sem barulho, sem upgrade.

Como pagar o RunPod no Brasil sem ter cartão internacional?

Use cartão Wise ou Nubank Ultravioleta. O Wise é o mais barato porque cobra IOF de 1,1% (cartão internacional comum cobra IOF de 3,38% mais spread). Você abre uma conta Wise grátis, transfere R$ 50 por PIX, recebe um cartão virtual em dólar e cadastra direto no RunPod. Nubank Ultravioleta também funciona, mas o spread é maior. Cartão de débito Caixa ou Itaú normalmente é recusado pelo RunPod por questão de fraude.

Qual GPU escolher para rodar Flux Dev sem travar?

Flux Dev precisa de 24GB de VRAM para rodar confortável em fp16. Pegue uma RTX 4090 (24GB) ou L40S (48GB) no RunPod. Se quiser economizar, use Flux Schnell em fp8 numa A4500 (20GB) que ainda roda. RTX 3090 (24GB) também serve e custa menos que a 4090 por hora. Evite GPUs abaixo de 16GB para Flux. Para SDXL ou Pony, RTX 3080 (10GB) já é suficiente.

Vale a pena pagar persistent volume no RunPod?

Vale, sim. O persistent volume custa USD 0,10/GB/mês (cerca de R$ 0,52). Um volume de 50GB sai por USD 5/mês (R$ 26) e guarda seus modelos, LoRAs e outputs entre sessões. Sem ele, toda vez que você liga o pod, baixa tudo do zero (Flux Dev sozinho são 23GB de download). Em 3 sessões, o persistent volume já se paga. Configure 50GB se você só roda um modelo, 100GB se acumula vários checkpoints.

RunPod tem suporte em português?

Não. O suporte oficial é só em inglês via Discord e tickets. Mas o Discord da RunPod tem um canal #brasil ativo com uns 300 brasileiros que ajudam uns aos outros. A interface tem tradução automática do navegador que funciona bem. Para tutoriais em português, este guia, nosso post sobre ComfyUI em português e o canal do Sandner Art no YouTube cobrem o essencial.

Posso deixar o pod ligado durante a noite para gerar imagens em lote?

Pode, mas a conta vem cara. 8 horas de RTX 4090 são USD 5,52 (R$ 28,70). Se você gerar 500 imagens nesse tempo, dá R$ 0,06 por imagem, o que é barato. Mas se esquecer o pod ligado sem gerar nada, é dinheiro queimando. Configure auto-stop: vá em Settings do pod e ative ‘Stop on idle’ com timeout de 15 minutos. Assim ele desliga sozinho quando você sai.

RunPod é melhor que Vast.ai ou Paperspace para brasileiro?

Para brasileiro, RunPod ganha. Vast.ai é mais barato (USD 0,40/hora numa 4090 leiloada) mas os pods são instáveis: o dono da máquina pode te derrubar a qualquer hora. Paperspace tem boa interface mas é caro (USD 1,15/hora numa 4090) e a fila grátis é uma piada. RunPod fica no meio: preço justo, pods estáveis, templates prontos para Stable Diffusion. Veja nosso guia de RTX 3060 no Brasil se preferir rodar local.

Como faço backup das imagens geradas antes de desligar o pod?

Três opções. Primeira: baixe via interface web do JupyterLab (lento, manual, mas funciona). Segunda: use rsync para um Google Drive ou Mega via rclone (configura uma vez, sincroniza tudo). Terceira: monte um persistent volume e deixe as imagens lá entre sessões. A pior coisa é desligar o pod sem persistent volume e perder 4 horas de geração. Sempre baixe ou sincronize antes do ‘Terminate’.