Meta presenta Llama 4, su nueva familia de modelos de IA

Meta presenta Llama 4, su nueva familia de modelos de IA


Meta anunció el lanzamiento de Llama 4, una nueva colección de modelos de inteligencia artificial (IA) que promete capacidades equiparables a las de GPT-4o, de OpenAI, Gemini 2.0 Flash, de Google, y DeepSeek-V3. Estos nuevos algoritmos se destacan por ser multimodales y contar con ventanas de contexto de gran escala, que van desde 1 millón hasta 2 billones de tokens.

El primer modelo presentado es Llama 4 Scout. Según Meta, “es el mejor modelo multimodal del mundo en su categoría y supera a todas las generaciones anteriores de Llama”. Su arquitectura está compuesta por 17,000 millones de parámetros activos, una ventana de contexto de 10 millones de tokens (equivalente a unas 15,000 páginas de texto) y un sistema basado en “mezcla de expertos”, que integra 16 submodelos especializados en diversas tareas, temáticas y formatos multimedia que se activan según las solicitudes del usuario.


2150495097 Meta presenta Llama 4, su nueva familia de modelos de IA

Meta AI está en camino de ser el asistente de IA más utilizado del mundo a finales de año, con casi 600 millones de usuarios activos mensuales. India y México se han convertido en dos de los mercados que la más utilizan


Este diseño permite ejecutar el modelo en una sola unidad de procesamiento gráfico (GPU) Nvidia H100, lo cual optimiza su rendimiento y disminuye el consumo de recursos computacionales. De acuerdo con los desarrolladores, Llama 4 Scout supera a Gemma 3, Gemini 2.0 Flash-Lite y Mistral 3.1 en tareas como el análisis profundo de datos, revisiones extensas de código, generación de resúmenes complejos y evaluación legal de documentos extensos.

Por su parte, Llama 4 Maverick es el primer modelo de la serie que incorpora capacidades multimodales de manera nativa, es decir, ha sido entrenado simultáneamente con texto, imágenes y video sin necesidad de etiquetado previo. Su estructura cuenta con 128 expertos, lo que le permite alcanzar un total de 400,000 millones de parámetros, manteniendo activos 17,000 millones por token. Esto lo posiciona como un competidor de alto nivel, capaz de igualar los resultados de DeepSeek V3 y superar a GPT-4o, Gemini 2.0 y Claude 3 Opus en tareas de razonamiento, codificación y comprensión de contenido visual y textual.

Meta destaca que este modelo permite “la creación de sofisticadas aplicaciones de IA que trascienden las barreras del lenguaje. Como nuestro modelo de referencia para asistentes conversacionales y usos generales, Llama 4 Maverick es ideal para la interpretación precisa de imágenes y la escritura creativa”.

Entre sus innovaciones técnicas destaca Llama iRoPE, una arquitectura de atención intercalada que mejora la generalización en contextos extensos al eliminar las tradicionales incrustaciones posicionales. Estas incrustaciones solían añadir información sobre la ubicación de cada palabra (o token) dentro de una secuencia, pero el nuevo enfoque optimiza la eficiencia y precisión en tareas de largo alcance.

En tercer lugar, Meta presentó Llama 4 Behemoth, descrito como “el modelo más avanzado de la compañía y uno de los grandes modelos de lenguaje más inteligentes del mundo”. Aunque aún se encuentra en desarrollo y no está disponible públicamente, cuenta con 288,000 millones de parámetros activos y cerca de 2 billones en total. Este modelo se emplea principalmente para mejorar la calidad de los sistemas más pequeños mediante técnicas de co-destilación. Meta lo considera clave para avanzar hacia agentes de IA más versátiles y autónomos. Según sus pruebas internas, Behemoth supera a GPT-4.5, Claude Sonnet 3.7 y Gemini 2.0 Pro en múltiples evaluaciones relacionadas con las disciplinas STEM (ciencia, tecnología, ingeniería y matemáticas, por sus siglas en inglés).

Una de las características más notables de esta nueva generación es la implementación de la técnica de entrenamiento llamada MetaP, diseñada para facilitar la transferencia eficiente de hiperparámetros entre modelos de distintos tamaños. Esta metodología optimiza el proceso de entrenamiento, especialmente en modelos a gran escala como Behemoth, que requieren grandes volúmenes de datos y recursos computacionales. Además, permite definir y aplicar comportamientos deseados en diferentes versiones del modelo. Junto a esto, Meta ha incorporado un post-entrenamiento personalizado que refuerza el razonamiento mediante estrategias avanzadas de selección de datos y métricas de evaluación específicas.

Al igual que con versiones anteriores, Meta define la familia Llama 4 como “de código abierto”. No obstante, esta afirmación ha sido cuestionada por la comunidad tecnológica debido a las restricciones de su licencia. En particular, se establece que las entidades comerciales con más de 700 millones de usuarios activos mensuales deben solicitar autorización expresa a Meta antes de utilizar los modelos, una condición que, según la Iniciativa de Código Abierto (Open Source Initiative) en 2023, impide clasificarla formalmente como software de código abierto.

Los modelos Llama 4 Maverick y Scout ya están disponibles para descarga a través del sitio web oficial de Meta y la plataforma Hugging Face. Próximamente se integrarán a las principales infraestructuras de nube, soluciones de edge computing y servicios ofrecidos por integradores globales. El público general podrá experimentar sus capacidades mediante Meta AI, el asistente inteligente de la empresa accesible en WhatsApp, Facebook, Instagram y Messenger.



Source link

Share this content:

Publicar comentario