Revista Informática

Flux: El Asesino de Midjourney de Código Abierto Del Que Todos Hablan

Publicado el 14 agosto 2024 por Lauratuero @incubaweb

El año 2024 ha visto un incremento notable en el lanzamiento de modelos de inteligencia artificial generativa (GenAI), especialmente de aquellos de código abierto. Entre los lanzamientos más destacados están Stable Audio Open de Stability AI, un modelo para generar datos de audio de alta calidad, y AuraFlow, un modelo de generación de imágenes a partir de texto.

Recientemente, Black Forest Labs, una nueva empresa de inteligencia artificial, ha ingresado al mercado con una financiación de $31 millones en su etapa inicial. Han presentado una familia de modelos GenAI llamada «Flux.1», que incluye tanto opciones de código cerrado como abierto. Estos modelos están diseñados tanto para la investigación académica como para el uso general, promoviendo la innovación y la transparencia.

El más avanzado de estos modelos es el FLUX.1 [pro], una versión de código cerrado que ofrece las capacidades más sofisticadas. Para desarrolladores, existe el FLUX.1 [dev], un modelo de código abierto ligeramente menos potente pero que mantiene un alto nivel de desempeño y eficiencia. Por último, el FLUX.1 [schnell], con licencia Apache 2.0, es el más rápido y está optimizado para el desarrollo local y uso personal.

Tanto los modelos [dev] como [schnell] son compatibles con ComfyUI y utilizan una arquitectura híbrida de transformadores de difusión multimodal y en paralelo, escalada a 12 mil millones de parámetros. Esto, junto con las mejoras en las capas de atención y los embeddings posicionales rotativos, optimiza el rendimiento del modelo y la eficiencia del hardware.

Según los benchmarks compartidos por Black Forest Labs, las variantes [pro] y [dev] del modelo Flux están muy cerca en términos de rendimiento, mientras que la versión [schnell] también ofrece un desempeño competitivo. Comparativas hechas por Decrypt contra otros modelos populares como Stable Diffusion 3 y Midjourney revelan que Flux.1 produce resultados de alta calidad y fieles a las indicaciones recibidas, aunque requiere mayor detalle en los prompts. Esto posiciona a Flux.1 como una opción viable y potentemente competitiva en el mercado de la inteligencia artificial generativa.
vía: It’s Foss News


Volver a la Portada de Logo Paperblog