El modelo de IA más avanzado de Google se llama Gemini 2.5 Pro y ya está disponible

El modelo de IA más avanzado de Google se llama Gemini 2.5 Pro y ya está disponible


Google confirmó el lanzamiento de Gemini 2.5 Pro, su modelo de inteligencia artificial (IA) más avanzado hasta la fecha. Este algoritmo cuenta con potentes capacidades de razonamiento y programación, lo que le ha permitido superar ampliamente a sus competidores en la mayoría de las pruebas estándar de rendimiento.

Koray Kavukcuoglu, director tecnológico de Google DeepMind, asegura que Gemini 2.5 Pro puede «razonar sus pensamientos» antes de responder, lo que optimiza su rendimiento y mejora la precisión de sus resultados. Esto implica que la nueva IA es capaz de analizar grandes volúmenes de datos, extraer conclusiones lógicas, incorporar contextos y tomar decisiones fundamentadas.


AI-Lab-Google-Robotics-Arm-Business El modelo de IA más avanzado de Google se llama Gemini 2.5 Pro y ya está disponible

Google presenta su nuevo modelo de inteligencia artificial que dota de más inteligencia a los humanoides y otros robots, y una herramienta diseñada para darles una brújula moral.


El funcionamiento de esta versión de Gemini se basa en técnicas de aprendizaje por refuerzo y en la inducción de cadenas de pensamiento. Google ya había empleado estas metodologías en el desarrollo de Gemini 2.0 y Gemini 2.0 Flash Thinking, pero sostiene que, con su nuevo modelo, ha alcanzado un estándar de rendimiento superior. La compañía explica que su más reciente algoritmo combina un modelo base significativamente mejorado con un proceso de post-entrenamiento avanzado. Esto le permite abordar problemas más complejos en diversas áreas y dar soporte a agentes de IA con mayores capacidades y sensibilidad contextual.

Kavukcuoglu destaca las habilidades de codificación de Gemini 2.5 Pro, que sobresale en la creación de aplicaciones web visuales, herramientas con agentes de código (agentic code) y edición de código. En la evaluación SWE-Bench Verified, un estándar para agentic code, el modelo alcanzó un 63.8 % con configuración de agente personalizada.

El nuevo sistema de IA admite entradas multimodales, lo que significa que puede procesar texto, audio, imágenes, videos y grandes conjuntos de datos. La propuesta debuta en el mercado con una ventana de comprensión de contexto de 1 millón de tokens, aunque se espera que este parámetro se amplíe a 2 millones en el futuro.



Source link

Share this content:

Publicar comentario