Google presenta Veo 2, un modelo de IA para generar video que competirá con Sora
La sólida respuesta de Google a Sora de OpenAI era de esperar, y no tardó mucho en llegar: Veo 2 es un nuevo generador de videos a partir de texto basado en IA; además, tiene dos ventajas sobre su rival en términos de resolución y duración. La herramienta puede generar contenidos de hasta 4K y con dos minutos de duración, frente a los límites de Full HD del agente incorporado a ChatGPT. Al mismo tiempo, la gigante de Mountain View dio a conocer el curioso sistema llamado Whisk.
¿Cómo funciona Veo 2?
El anuncio viene directamente de la división experimental DeepMind de Google, que confirma los últimos rumores y desvela Veo 2, el nuevo modelo de generación de video basado en indicaciones de texto. El funcionamiento sigue siendo el habitual: escribes una frase, lo más detallada posible, describiendo no solo al sujeto o a los objetos, sino también las acciones, la luz, el contexto y cualquier otra cosa que consideres relevante. El sistema recopilará la información y luego de una espera indeterminada, obtendrás los resultados.
Aquí tienes un ejemplo. La indicación fue: «Plano medio, poca profundidad de campo, una niña bonita con estilo de dibujo animado, pelo castaño ondulado, sentada en una cocina de los años ochenta. Tiene una nariz pequeña y ligeramente respingona y orejas pequeñas y redondeadas. Es expresiva y gesticula alegremente mientras habla a la cámara». Google aplicará la marca de agua invisible SynthID para certificar el origen artificial y pondrá el modelo a disposición gradualmente a través de Google Labs, empezando por los probadores beta habituales. Aún no está claro cuándo llegará al público general.
La novedad de Whisk
X content
This content can also be viewed on the site it originates from.
Google también presenta mejoras en su generador de imágenes por IA, Imagen 3, con aún más precisión y rapidez de acción, y la novedad Whisk: un sistema de nuevo dedicado a las imágenes, pero no basado en indicaciones textuales, sino en la reelaboración y remezcla de otras imágenes propuestas por el usuario.
Artículo originalmente publicado en WIRED Italia. Adaptado por Alondra Flores.
Share this content:
Publicar comentario