Google revela Gemini 2, nuevos agentes de IA y un prototipo de asistente personal
Antes, Google solo quería organizar la información del mundo. Ahora parece más empeñada en verter esa información en algoritmos de inteligencia artificial que se conviertan en ayudantes virtuales obedientes, siempre presentes y cada vez más poderosos.
Google ha anunciado hoy Gemini 2, una nueva versión de su modelo insignia de IA que ha sido entrenada para planificar y ejecutar tareas en las computadoras de un usuario y en la web, y que puede chatear como una persona y dar sentido al mundo físico como un mayordomo virtual.
Un agente digital universal
«He soñado con un asistente digital universal durante mucho, mucho tiempo, como un peldaño en el camino hacia la inteligencia artificial general«, expresó Demis Hassabis, Director General de Google DeepMind, a WIRED antes del anuncio de hoy, aludiendo a la idea de una IA que pueda hacer cualquier cosa que pueda hacer un cerebro humano.
Gemini 2 es, ante todo, otro paso adelante en el uso de la IA, medida según diferentes parámetros utilizados para medir este tipo de cosas. El modelo también ha mejorado sus capacidades «multimodales», lo que significa que es más hábil analizando video y audio, y conversando en voz alta. También ha sido entrenado para planificar y ejecutar acciones en computadoras.
«Durante el último año, hemos estado invirtiendo en el desarrollo de más modelos agénticos», ha dicho hoy el CEO de Google, Sundar Pichai, en un comunicado. Estos modelos, ha añadido Pichai, «pueden entender más sobre el mundo que te rodea, pensar múltiples pasos por delante y tomar medidas en tu nombre, bajo tu supervisión.»
Las empresas tecnológicas creen que los llamados agentes de IA podrían ser el próximo gran salto adelante de la tecnología, con chatbots que cada vez asumen más tareas para los usuarios. Si tienen éxito, los agentes de IA podrían revolucionar la informática personal reservando vuelos, organizando reuniones y analizando y organizando documentos de forma rutinaria. Pero conseguir que la tecnología siga órdenes abiertas de forma fiable sigue siendo un reto, con el riesgo de que los errores se traduzcan en equivocaciones costosas y difíciles de deshacer.
Dos agentes de IA especializados
Aun así, Google cree estar avanzando en la dirección correcta y está presentando dos agentes de IA especializados para demostrar el potencial de Gemini 2: uno para codificación y otro para ciencia de datos. En lugar de limitarse a autocompletar secciones de código, como hacen las actuales herramientas de IA, estos agentes pueden encargarse de tareas más complejas, como la comprobación de código en repositorios o la combinación de datos para permitir el análisis.
La empresa también presenta Project Mariner, una extensión experimental de Chrome capaz de hacerse cargo de la navegación web para realizar tareas útiles para los usuarios. WIRED pudo ver una demostración en vivo en la sede de Google DeepMind en Londres. Se pidió al agente que ayudara a planificar una comida, para lo cual navegó hasta el sitio web de la cadena de supermercados Sainsbury’s, entró en la cuenta del usuario y añadió los artículos pertinentes a su cesta de la compra. Cuando algunos artículos no estaban disponibles, el modelo elegía sustitutos adecuados basándose en sus propios conocimientos de cocina. Google declinó realizar otras tareas, sugiriendo que sigue siendo un trabajo en curso.
«Mariner es nuestra exploración, en gran medida un prototipo de investigación en este momento, de cómo se reimagina la interfaz de usuario con la IA», explica Hassabis.
Share this content:
Publicar comentario