Google ha anunciado Gemini Omni, un modelo que combina la capacidad de razonamiento de Gemini con la de crear contenido a partir de cualquier entrada. El primer miembro de esta familia es Gemini Omni Flash, ya disponible en la aplicación Gemini, Google Flow y YouTube Shorts.

Edición de vídeo con lenguaje natural
Una de las características más destacadas de Omni es la posibilidad de editar vídeos mediante instrucciones en lenguaje natural. Los usuarios pueden pedirle que cambie escenas, añada personajes o transforme objetos, y el modelo mantiene la coherencia narrativa y física.
- Edición conversacional: cada instrucción se suma a la anterior, garantizando continuidad.
- Transformación de escenas: convierte un vídeo grabado en algo completamente distinto, como un espejo que se vuelve líquido o un objeto que se transforma en otro.
- Revisiones iterativas: permite ajustar ángulos, estilos y detalles sin perder el hilo de la escena original.

Conocimiento y creatividad
Omni no se limita a generar imágenes realistas: razona sobre lo que debería ocurrir a continuación. Combina comprensión intuitiva de la física con conocimientos de historia, ciencia y cultura, lo que lo convierte en un modelo capaz de narrar con sentido.
- Comprensión física: simula gravedad, energía cinética y dinámica de fluidos.
- Narración coherente: conecta lenguaje, imágenes y significado para producir historias consistentes.
- Visualización de ideas complejas: crea vídeos explicativos, como un claymation sobre el plegamiento de proteínas.
Multientrada y cohesión
Omni puede generar contenido a partir de texto, imágenes, audio y vídeo, combinándolos en un resultado cohesionado.
- Convierte referencias en un único producto final.
- Permite aplicar estilos, movimientos o efectos definidos por el usuario.
- Aunque inicialmente solo admite audios de voz, pronto se añadirán otros tipos de entrada.
Avatares digitales y responsabilidad
Google también ha introducido la función Avatar, que permite crear vídeos con tu propia voz y apariencia digital. La compañía asegura que este desarrollo se realiza bajo políticas de IA responsable, incluyendo la marca de agua digital SynthID, que permite verificar si un vídeo fue generado con Gemini Omni.
![]()
Disponibilidad
- Gemini Omni Flash ya está disponible para suscriptores de Google AI Plus, Pro y Ultra.
- También se ofrece gratis en YouTube Shorts y YouTube Create.
- En las próximas semanas llegará a desarrolladores y empresas mediante APIs.
Impacto en la creación audiovisual
El lanzamiento de Gemini Omni marca un hito en la evolución de la inteligencia artificial aplicada al contenido digital. Su capacidad para combinar razonamiento y creatividad abre nuevas posibilidades en:
- Producción audiovisual: desde vídeos explicativos hasta narrativas cinematográficas.
- Educación: creación de material didáctico visual y dinámico.
- Entretenimiento: generación de escenas imposibles de grabar en la vida real.
Con Gemini Omni, Google redefine la creación de contenido digital. La posibilidad de editar y generar vídeos con simples instrucciones en lenguaje natural, sumada a su capacidad de razonar sobre física y cultura, convierte a Omni en una herramienta que promete transformar la producción audiovisual. Desde proyectos educativos hasta narrativas cinematográficas, el modelo abre un abanico de oportunidades para usuarios, creadores y empresas.
