👀 Microsoft lanza nueva IA para generar imágenes sin la ayuda de OpenAI

Microsoft mai-image-1-01

Microsoft ha dado un paso decisivo en el desarrollo de inteligencia artificial con la presentación de MAI-Image-1, su primer modelo capaz de generar imágenes realistas a partir de texto. Este avance marca un cambio de estrategia dentro de la compañía, que hasta ahora había dependido de tecnologías externas como las de OpenAI para potenciar sus servicios en Copilot.

MAI-Image-1 forma parte de los esfuerzos liderados por Mustafa Suleyman, cofundador de DeepMind, quien asumió la dirección de la nueva división Microsoft AI. Desde su incorporación, la empresa ha priorizado la creación de modelos propios que respondan a las exigencias del mercado actual. El resultado comienza a materializarse con esta herramienta, desarrollada completamente por el equipo interno de Microsoft y posicionada entre las diez mejores según los puntajes de LMArena.

Durante años, Microsoft mantuvo una posición secundaria en la carrera por la inteligencia artificial. Aunque firmó un acuerdo multimillonario con OpenAI para integrar sus modelos en Copilot, no impulsó el desarrollo de alternativas propias que compitieran directamente con GPT o Gemini. Esta situación cambió con la llegada de Suleyman, quien trazó una hoja de ruta centrada en la independencia tecnológica.

MAI-Image-1 representa uno de los primeros frutos de esa estrategia. El modelo fue entrenado con datos seleccionados bajo criterios estrictos y evaluado en tareas que reflejan las necesidades creativas contemporáneas. Microsoft afirma que recibió retroalimentación de profesionales de las industrias creativas, aunque no especifica quiénes participaron ni el alcance de sus aportes.

Según una publicación en el blog oficial de Microsoft AI, MAI-Image-1 se distingue por su capacidad para generar imágenes con alto nivel de realismo. El modelo maneja con precisión aspectos como la iluminación, los reflejos y los detalles visuales complejos. Aunque no alcanza la escala de modelos como Midjourney o GPT-Image-1, supera a estos en velocidad de respuesta. Los usuarios pueden crear contenido e iterar sin largos tiempos de espera.

Uno de los objetivos centrales de MAI-Image-1 es ofrecer valor genuino a los creadores. Los ingenieros de Microsoft dedicaron especial atención a evitar resultados repetitivos o genéricos. Además, la empresa busca garantizar que las imágenes generadas sean seguras y responsables. Para ello, realizará una prueba en LMArena que permitirá recopilar información, corregir errores y perfeccionar el modelo antes de su lanzamiento general.

Cuando esté listo, MAI-Image-1 se integrará en Copilot y Bing Image Creator, reemplazando gradualmente a DALL-E 3 y GPT-4o multimodal, que actualmente generan imágenes en esas plataformas. El despliegue será progresivo, por lo que los usuarios no verán cambios inmediatos.

Este modelo se suma a otros desarrollos recientes del equipo de Suleyman. Hace unas semanas, Microsoft presentó MAI-Voice-1, una inteligencia artificial con capacidades de generación y comprensión de voz que se incorporará a Copilot para mejorar la naturalidad de las interacciones. También anunció MAI-1-Preview, un modelo multimodal que podría convertirse en la base de futuras versiones de Copilot.

Con estos avances, Microsoft refuerza su apuesta por una inteligencia artificial desarrollada internamente, capaz de competir en rendimiento y utilidad con los líderes del sector.

Autor

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *