Hace un mes me maravillaba con las capacidades de Seedance 2.0 y ahora siento que OMNI de Google lleva las cosas todavía más allá cuando se trata de generación de videos con Inteligencia Artificial.
Esta herramienta permite a los usuarios crear secuencias audiovisuales mediante diferentes métodos, ya sea desde cero o utilizando elementos de referencia aportados por el usuario. Lo que más sorprende, lejos, son las opciones de alteración de clips preexistentes.
Pero vamos por parte. Una de las modalidades de uso de ONMI consiste en la creación de videos a partir de lo que el sistema denomina “ingredientes”. Estos ingredientes son elementos visuales que se entregan al modelo como punto de partida, tales como imágenes de referencia de personajes, logotipos o bocetos.
El sistema utiliza esta información para generar la animación solicitada respetando las características visuales proporcionadas. Dentro de esta modalidad, el modelo es capaz de interpretar y animar guiones gráficos o storyboards completos. Al entregar una secuencia dibujada junto con instrucciones escritas, el generador reproduce las escenas cuadro por cuadro, intentando mantener la coherencia con el diseño del personaje principal especificado en las imágenes adjuntas.
La fluidez de estas secuencias generadas a partir de storyboards es consistente, logrando transiciones estables entre las distintas acciones planteadas. Aunque pueden presentarse imperfecciones menores en la velocidad de ciertos movimientos o en la adición de fotogramas, el resultado general mantiene la estructura dictada por el guion gráfico original.
Sin embargo, el sistema presenta ciertas limitaciones al intentar replicar personajes con diseños muy complejos o poco convencionales. En casos donde se utilizan figuras con múltiples detalles específicos, OMNI logra una aproximación general al estilo y a las indicaciones de cámara, pero no una réplica exacta de las características de los sujetos originales.
Lo mejor de Gemini OMNI
Además de la generación basada en imágenes previas, el modelo permite crear secuencias audiovisuales partiendo únicamente de instrucciones escritas. Utilizando plantillas predefinidas, como el estilo origami, el usuario puede solicitar la aparición e interacción de elementos específicos, obteniendo animaciones sin necesidad de aportar material gráfico inicial.
Y como decía, al principio, otra característica de OMNI -la que más me impresiona- es su capacidad como editor de video. Esta función permite tomar un video real e introducir alteraciones directas mediante texto.
El modelo procesa el archivo original y aplica los cambios solicitados en áreas específicas, manteniendo el resto de los elementos visuales de la grabación en su estado original. Asimismo, permite incorporar elementos animados que interactúan con el entorno y los sujetos del video base.

Mediante esta herramienta de edición, es posible modificar aspectos puntuales de una escena real, como sustituir la vestimenta de una persona por prendas distintas o añadir iluminación particular.
El acceso a estas funciones opera a través de distintos canales. Los usuarios pueden emplear la herramienta desde el plan más barato de Gemini, los cuales permiten un número acotado de generaciones diarias.
La plataforma Google Flow ofrece una opción de uso sin costo mediante la asignación de 50 créditos diarios, equivalentes a la creación de dos videos al día utilizando el modelo Omni Flash.
Para profundizar en el funcionamiento de estas herramientas y observar de manera directa ejemplos prácticos de su aplicación, te invito a ver el video que hice al respecto para mi canal de YouTube.

