Los modelos de inteligencia artificial están avanzando a pasos agigantados desde que Ghat GPT se hizo público, permitiendo crear textos y fotos de manera muy sencilla. Sin embargo, ahora este desarrollo se está acelerando y se están pudiendo crear herramientas que permiten también crear vídeo, algunas con una calidad aceptable.
Este es el caso de Runwayml, un potente modelo de lenguaje diseñado para obtener imágenes en movimiento, que se pueden crear a partir de una imagen previa o de una descripción. Esto abre paso a una creatividad que hasta hace nada estaba limitada por los recursos que se podían destinar a viajes, además del conocimiento de la grabación de ciertas escenas.
Runwayml se puede usar de forma gratuita, con los créditos que se ofrecen cuando se realiza el registro, aunque cada vídeo consumirá varios. Obviamente hay un modelo de monetización para usuarios avanzados que permite pagar para crear infinitas composiciones.
De imagen a vídeo
La herramienta más llamativa es posiblemente la que permite crear vídeos desde una imagen que se haya tomado. En función de la imagen el sistema creará una animación de mayor o menor calidad, por lo que es importante saber elegir bien las fotos.
En el primer ejemplo que se ha usado se ha seleccionado una imagen muy típica, la de un atardecer en un pueblo. La prueba de foto a vídeo ha resultado todo un éxito, al entender la IA que había un cielo, con nubes, y ha animado esa parte. Obviamente la animación no es perfecta, pero es muy buena.
Sin embargo, esa misma prueba con la imagen como referencia pero indicando además en el texto que se quería un amanecer no ha sido satisfactoria. Parece que es más complejo cuadrar una imagen y una orden de texto que simplemente dejar que la IA haga lo que quiera.
En la segunda prueba se ha apostado por una imagen mucho más complicada. Como se aprecia, son caballos en una de las carreras típicas de finales de verano en Sanlúcar de Barrameda. Además de esta imagen estática, que es lo único que se le ha dado a la IA, había vídeo, por lo que sabíamos qué esperar cuando la IA acabara el trabajo, si es que era capaz.
El resultado, como se puede ver, es muy bueno en cuanto al movimiento, ya que se aprecia que ha detectado que son caballos, y sabe cómo se mueven. Aún así la calidad no es todo lo alta que debería porque deja patrones de movimiento, como si los caballos perdieran parte de las patas en cada paso. Esto es algo muy mejorable aún.
De texto a vídeo
La otra gran función de Runwayml es la de poder crear vídeo simplemente con una descripción. Es algo mucho más potente, pero se pierde la intuición de lo que va a surgir. En el caso del ejemplo se ha usado el comando "A sunset in a city with skycrapers and a lake". Es decir, se buscaba el atardecer de una ciudad con rascacielos y un lago.
Como se aprecia en el vídeo resultante, la idea es bastante fidedigna, pero el movimiento hace que los edificios parezcan que crecen, y eso limita de nuevo la calidad. Con todo, se puede jugar mucho con el movimiento de las cámaras, se puede cambiar la intensidad del movimiento, etc. Esta es una herramienta con la que probar mucho y con la que, en muchas ocasiones, obtener resultados satisfactorios.