#801 #800 Creo que estáis mezclando cosas.
Hay 3 modelos:
Pro. De este no voy a hablar, es el de pago.
Dev. El checkpoint base ocupa 24gb https://huggingface.co/black-forest-labs/FLUX.1-dev Es el más parecido a la versión Pro. Hay versiones que ocupan menos como la del creador de Forge https://huggingface.co/lllyasviel/flux1-dev-bnb-nf4/tree/main pero con menos precisión (NF4).
Schnell (En Alemán "rápido". El checkpoint base también ocupa 24gb https://huggingface.co/black-forest-labs/FLUX.1-schnell. Está pensado para funcionar en 1-4 steps como los Hyper-SDXL etc. También hay versiones que ocupan menos a costa de precisión (NF4) https://huggingface.co/silveroxides/flux1-nf4-weights/tree/main.
Luego de esas versiones también podéis ver la palabra "BNB" , esto quiere decir que lo han optimizado para funcionar en 8 y 4 bits.
La precisión de más a menos preciso va en este orden FP32 -> FP16 -> FP8 ->NF4.
Si alguien quiere entrenar LoRA en Flux:
https://github.com/bghira/SimpleTuner en Linux
https://github.com/ostris/ai-toolkit en Windows
Y ya están en proceso de meterlo en el repo de https://github.com/bmaltais/kohya_ss