🖼 Stable Diffusion XL Turbo: Un generador de imágenes en tiempo real a partir de texto

Stable Diffusion XL Turbo
Stable Diffusion XL Turbo en acción. Foto: Stability AI

Stability AI, una empresa líder en el campo de la inteligencia artificial, ha presentado su nuevo modelo de síntesis de imágenes impulsado por IA, llamado Stable Diffusion XL Turbo (SDXL Turbo). Este modelo promete cambiar la forma en que creamos y transformamos imágenes, ya que puede generar imágenes en tiempo real a partir de una descripción escrita, con una eficiencia y una velocidad sin precedentes.

El nuevo producto se basa en una técnica innovadora llamada Adversarial Diffusion Distillation (ADD), que permite al modelo aprender de otros modelos de síntesis de imágenes existentes y mejorar su capacidad para diferenciar entre imágenes reales y generadas. Esto se traduce en una mejora de la calidad de las imágenes producidas, que pueden alcanzar un nivel de detalle similar al de su predecesor, Stable Diffusion, pero en un solo paso, en lugar de los 20-50 pasos requeridos anteriormente.

Stable Diffusion XL Turbo comparte similitudes con las populares Redes Generativas Adversarias (GANs), especialmente en la generación de imágenes en un solo paso. Sin embargo, tiene la ventaja de ser más rápido y eficiente, lo que lo hace ideal para situaciones en las que la velocidad es esencial, como la producción de contenido en tiempo real.

Según Stability AI, el modelo puede generar una imagen de 1024×1024 píxeles en tan solo 4 segundos con 3 pasos, en comparación con los 26.4 segundos requeridos para una imagen de 20 pasos con un nivel de detalle similar. Incluso para imágenes más pequeñas, como las de 512×768 píxeles, el proceso lleva menos de un segundo.

La velocidad de Stable Diffusion XL Turbo se hace más evidente en una tarjeta gráfica Nvidia A100, donde el modelo puede generar una imagen de 512×512 píxeles en tan solo 207 milisegundos, incluyendo la codificación, un paso de eliminación de ruido y la decodificación. Esta velocidad abre la puerta a aplicaciones emocionantes, como filtros de video generativos en tiempo real o la generación de gráficos en videojuegos experimentales.

Sin embargo, el modelo también enfrenta algunos desafíos, como el problema de la coherencia, que se refiere a mantener la misma temática en múltiples cuadros o generaciones de imágenes. Además, está disponible bajo una licencia de investigación no comercial, lo que limita su uso a fines personales y no comerciales. Esta restricción ha generado algunas críticas en la comunidad de Stable Diffusion, pero Stability AI ha expresado su disposición a considerar aplicaciones comerciales y alienta a las partes interesadas a ponerse en contacto para obtener más información.

Stability AI es una empresa que se dedica a desarrollar modelos de IA innovadores, incluido Stable Video Diffusion, que puede animar imágenes estáticas en clips de video cortos. La compañía ofrece una demostración beta de Stable Diffusion XL Turbo en su sitio web, donde los usuarios pueden probar el modelo y ver cómo genera imágenes a partir de sus propias descripciones escritas.

En video, Stable Diffusion XL Turbo en acción

Autor

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *