馃寪 Gemini Omni: la nueva frontera de la creaci贸n multimodal

Google ha anunciado Gemini Omni, un modelo que combina la capacidad de razonamiento de Gemini con la de crear contenido a partir de cualquier entrada. El primer miembro de esta familia es Gemini Omni Flash, ya disponible en la aplicaci贸n Gemini, Google Flow y YouTube Shorts.

Qu茅 es Gemini Omni y c贸mo funciona la nueva IA de Google para armar videos con fotos y texto | El Destape

Edici贸n de v铆deo con lenguaje natural

Una de las caracter铆sticas m谩s destacadas de Omni es la posibilidad de editar v铆deos mediante instrucciones en lenguaje natural. Los usuarios pueden pedirle que cambie escenas, a帽ada personajes o transforme objetos, y el modelo mantiene la coherencia narrativa y f铆sica.

  • Edici贸n conversacional: cada instrucci贸n se suma a la anterior, garantizando continuidad.
  • Transformaci贸n de escenas: convierte un v铆deo grabado en algo completamente distinto, como un espejo que se vuelve l铆quido o un objeto que se transforma en otro.
  • Revisiones iterativas: permite ajustar 谩ngulos, estilos y detalles sin perder el hilo de la escena original.

Google Lanza Gemini Omni Flash - Generaci贸n de v铆deo multimodal, edici贸n conversacional y avatares digitales | CineD

Conocimiento y creatividad

Omni no se limita a generar im谩genes realistas: razona sobre lo que deber铆a ocurrir a continuaci贸n. Combina comprensi贸n intuitiva de la f铆sica con conocimientos de historia, ciencia y cultura, lo que lo convierte en un modelo capaz de narrar con sentido.

  • Comprensi贸n f铆sica: simula gravedad, energ铆a cin茅tica y din谩mica de fluidos.
  • Narraci贸n coherente: conecta lenguaje, im谩genes y significado para producir historias consistentes.
  • Visualizaci贸n de ideas complejas: crea v铆deos explicativos, como un claymation sobre el plegamiento de prote铆nas.
Multientrada y cohesi贸n

Omni puede generar contenido a partir de texto, im谩genes, audio y v铆deo, combin谩ndolos en un resultado cohesionado.

  • Convierte referencias en un 煤nico producto final.
  • Permite aplicar estilos, movimientos o efectos definidos por el usuario.
  • Aunque inicialmente solo admite audios de voz, pronto se a帽adir谩n otros tipos de entrada.
Avatares digitales y responsabilidad

Google tambi茅n ha introducido la funci贸n Avatar, que permite crear v铆deos con tu propia voz y apariencia digital. La compa帽铆a asegura que este desarrollo se realiza bajo pol铆ticas de IA responsable, incluyendo la marca de agua digital SynthID, que permite verificar si un v铆deo fue generado con Gemini Omni.

What is Gemini Omni, What Does it Really Do & How It Works

Disponibilidad
  • Gemini Omni Flash ya est谩 disponible para suscriptores de Google AI Plus, Pro y Ultra.
  • Tambi茅n se ofrece gratis en YouTube Shorts y YouTube Create.
  • En las pr贸ximas semanas llegar谩 a desarrolladores y empresas mediante APIs.
Impacto en la creaci贸n audiovisual

El lanzamiento de Gemini Omni marca un hito en la evoluci贸n de la inteligencia artificial aplicada al contenido digital. Su capacidad para combinar razonamiento y creatividad abre nuevas posibilidades en:

  • Producci贸n audiovisual: desde v铆deos explicativos hasta narrativas cinematogr谩ficas.
  • Educaci贸n: creaci贸n de material did谩ctico visual y din谩mico.
  • Entretenimiento: generaci贸n de escenas imposibles de grabar en la vida real.

Con Gemini Omni, Google redefine la creaci贸n de contenido digital. La posibilidad de editar y generar v铆deos con simples instrucciones en lenguaje natural, sumada a su capacidad de razonar sobre f铆sica y cultura, convierte a Omni en una herramienta que promete transformar la producci贸n audiovisual. Desde proyectos educativos hasta narrativas cinematogr谩ficas, el modelo abre un abanico de oportunidades para usuarios, creadores y empresas.

Autor

Deja un comentario

Tu direcci贸n de correo electr贸nico no ser谩 publicada. Los campos obligatorios est谩n marcados con *