La inteligencia artificial (IA) ha dejado de ser una mera herramienta de innovación para convertirse en una parte integral de nuestra vida diaria. La reciente presentación de Veo 2 por parte de DeepMind, ha hecho que muchas mentes se agiten y muchos ojos se abran. ¡Sí, incluso los que están pegados a las pantallas! Este nuevo modelo de generación de vídeo ha estallado en el mercado, superando a su competidor Sora de OpenAI. Pero, ¿realmente es tan impresionante como prometen?

Un poco de historia: ¿La IA de DeepMind es la nueva niña buena del barrio?

Si has vivido bajo una roca durante los últimos años, puede que no conozcas a DeepMind. Esta división de Google se ha hecho famosa por desarrollar modelos de IA que han deslumbrado al mundo: desde jugar al Go y vencer a campeones mundiales, hasta predicciones sobre la estructura de las proteínas con AlphaFold. La historia de esta empresa es como una película de Hollywood: emocionante, llena de giros inesperados y, a veces, con un villano en la esquina.

Cuando se anunció Veo 2, y tras el rugido ensordecedor de las redes sociales, no me quedó más remedio que comprobar de qué se trataba. ¡Y wow, no puedo decir que no me sorprendiera!

Veo 2: Las especificaciones que nos hacen olvidar a Sora

Veo 2 es el nuevo refresco en la fiesta de la IA, y según los primeros vídeos —que por cierto se han compartido como si fueran el último meme de moda— las prestaciones se ven más que prometedoras. A continuación, un desglose de sus juiciosas especificaciones:

  • Duración de vídeo: Puedes generar clips de hasta dos minutos. Sora, por otro lado, solo da la opción de vídeos de 20 segundos. A veces, no sé si ver una serie o una TikTok es lo más frustrante, pero si te dijera que solo puedes ver fragmentos de 20 segundos… uff.
  • Resolución: Veo 2 permite resoluciones de hasta 4K DCI (4.096 x 2.160). Para aquellos que se preguntan: «¿qué significa esto?”. Solo sepa que es como si Sora estuviera intentando impresionar con una foto de Instagram directamente desde un clásico Nokia 3310.

Pero, la verdadera joya está en su capacidad para generar vídeo a partir de un prompt de texto, y también a partir de imágenes de referencia. Imaginen tener imágenes de una tarde de picnic, y a partir de eso, generar una alegre animación. ¡La imaginación no tiene límites!

La física detrás de Veo 2: Cuando la IA entiende más que el promedio de nosotros

Uno de los aspectos que más me intrigó de Veo 2 es cómo la IA parece tener mejor comprensión de la física y de los controles de cámara. Recuerdo un día en particular, estaba grabando a mi gato haciendo travesuras y por supuesto, parecía una obra maestra. Pero, por cada toma genial, había un montón de vídeos donde la cámara se movía como si yo estuviera en un barco en medio de una tormenta.

DeepMind asegura que Veo 2 es capaz de generar vídeos más claros y que entiende dinámicas como la luz y las sombras. ¡Qué alivio! Porque a veces me siento como si dijera: «Mira mamá, un video de arte abstracto», cuando solo era un mal ángulo de cámaras.

La IA de DeepMind está abordando los problemas de coherencia y consistencia que tanto han aquejado a modelos anteriores. En palabras simples: ¡los vídeos no se ven como un collage de imágenes desordenadas!

El rival que nunca fue: Sora de OpenAI

Es curioso —y un poco trágico— ver cómo Sora, que originalmente parecía ser el pececito dorado en este vasto océano de IA, ahora se está ahogando. No se engañen, Sora ha hecho cosas increíbles, pero lo que DeepMind ha demostrado con Veo 2 podría dejar a muchos de nosotros preguntándonos: «¿Dónde se supone que debo colocar mi lealtad?»

Los vídeos de Veo 2 han sido viralizados en plataformas como YouTube y han permitido a usuarios mostrar pies de vídeo dignos de películas de James Cameron. En uno de ellos, donde alguien corta tomates, uno podría legitimar hacer un cortometraje titulado Cortador de Tomates: La Saga. ¿Te imaginas?

La ventaja de Google: ¿Cuán importante es YouTube?

Siendo honesto, parte del secreto del éxito de Veo 2 radica en el acceso a una inmensa cantidad de contenido en YouTube. Cuando uno piensa que cada segundo se suben 500 horas de contenido, no puedo evitar sentir una mezcla de admiración y envidia (¿por qué no filmé más contenido de garabatos durante mis días de universitario?).

El modelo se benefició de un acuerdo previo con los creadores de contenido, lo que les permite entender y aprender de millones de vídeos. Es algo así como llevar a un niño a una tienda de golosinas: ¡no hay manera de que no se entusiasme!

Limitaciones y retos por venir: ¿Es Veo 2 perfecto?

Como cualquier tipo de tecnología, Veo 2 no es un producto terminado. Los responsables de DeepMind han admitido que hay áreas que aún necesitan mejoras, especialmente en cuanto a la coherencia de las representaciones visuales a lo largo de un vídeo. ¿Alguna vez has visto un vídeo donde aparecen dos versiones de la misma persona, pero de repente uno tiene el cabello de un color diferente? Eso es lo que queremos evitar. La consistencia es clave.

Algunos podrían hacer comparaciones con la primera temporada de algunas serie que aman, donde a mitad de viaje el personaje principal tiene un cambio de imagen radical. ¡Menos es más, amigos!

Conclusión: ¿El futuro ya está aquí?

Veo 2 se presenta como un hito en el continuo crecimiento de la IA generativa. Su capacidad para transformar la forma en la que creamos y consumimos contenido en vídeo está, sin duda, en la puerta de al lado.

Así que, la próxima vez que te encuentres viendo un vídeo en línea, tal vez pienses también en la IA que lo respaldó. Imaginar un futuro donde puedes crear tus propios vídeos realistas a partir de simples ideas es tentador y aterrador al mismo tiempo. Pero como siempre, la tecnología sigue avanzando, así que mantente alerta. ¿Quiénes serán los verdaderos ganadores en este juego de IA?

No creo que Sora se rinda fácilmente, pero por ahora, podemos disfrutar de las maravillas que Veo 2 promete traer a nuestra vida cotidiana. Así que, amigos, ¡abramos las palomitas y que comiencen los nuevos vídeos generados por IA! 🎥🍿