Google da un paso hacia la IA general con su nuevo modelo del mundo Genie 3

Google da un paso hacia la IA general con su nuevo modelo del mundo Genie 3


Google DeepMind presentó Genie 3, un modelo del mundo (world model) capaz de generar entornos 3D en tiempo real a partir de una imagen o de una indicación de texto. La compañía sostiene que este nuevo algoritmo no solo amplía las posibilidades de crear experiencias educativas, creativas y enfocadas en videojuegos, sino que también representa un paso importante hacia la inteligencia artificial general, aquella que busca igualar o superar las habilidades cognitivas humanas.

The Black Box Lab, una agencia de desarrollo de negocios, explica que los modelos mundiales son algoritmos que construyen representaciones internas de un entorno, lo que permite a las soluciones de IA simular eventos y predecir resultados futuros basados en dichas emulaciones. Este enfoque busca replicar los procesos de razonamiento humano para dotar a las máquinas de una comprensión más profunda del contexto físico.

Según un artículo de TechCrunch, un modelo generativo entrenado con años de video puede identificar con precisión que una pelota de baloncesto rebota, pero carece de la capacidad para entender por qué ocurre. En cambio, un modelo del mundo posee “una comprensión básica” de las causas del rebote, lo que le permite representar el fenómeno y anticipar movimientos futuros con mayor exactitud.


GettyImages-2195941777%2520(1) Google da un paso hacia la IA general con su nuevo modelo del mundo Genie 3

La IA se hará más inteligente no a punta de fuerza bruta, sino gracias a la distribución del trabajo. En esta entrega de PROMPTING abordamos el rol clave del MCP para el futuro.


Google lleva tiempo destinando importantes recursos a la investigación de esta tecnología. A finales del año pasado, la empresa presentó Genie 2, un modelo capaz de crear mundos interactivos a partir de imágenes. En enero, Google formó un equipo especializado en desarrollar modelos del mundo, liderado por Tim Brooks, quien fuera codirector del proyecto Sora de OpenAI.

Con Genie 3, la compañía alcanza su mayor avance en este campo: se trata del primer modelo del mundo de Google que permite la interacción en tiempo real y mejora notablemente la consistencia y el realismo respecto a su predecesor.

El nuevo algoritmo genera automáticamente entornos virtuales en 3D que los usuarios o agentes de IA pueden explorar “durante varios minutos”. Aunque los desarrolladores no precisan una duración exacta, esta extensión supone un gran salto respecto a los 10 a 20 segundos que ofrecía Genie 2.

Las simulaciones se producen a una resolución de 720 píxeles y 24 fotogramas por segundo. Además, son compatibles con “eventos mundiales con indicaciones”, lo que significa que pueden modificarse mediante comandos que cambien aspectos como el clima o la inclusión de nuevos personajes en la escena.

X content

This content can also be viewed on the site it originates from.





Source link

Share this content:

Publicar comentario