OpenAI lanzará un modelo abierto de IA que competirá contra Llama y R1

OpenAI lanzará un modelo abierto de IA que competirá contra Llama y R1


El CEO Sam Altman anunció que OpenAI lanzará un modelo de IA de ‘peso abierto’ en los próximos meses. «Estamos entusiasmados con el lanzamiento, en los próximos meses, de un nuevo y potente modelo de lenguaje con razonamiento de peso abierto», tuiteó el ejecutivo en X.

La decisión responde al éxito arrollador del modelo R1 de la empresa china DeepSeek, así como a la popularidad de los modelos Llama de Meta.


Sam%2520Altman%25202 OpenAI lanzará un modelo abierto de IA que competirá contra Llama y R1

La empresa de Sam Altman cerró una ronda de 40,000 millones de dólares liderada por SoftBank, alcanzando una valoración de 300,000 millones. Un récord absoluto para una compañía que no cotiza en bolsa.


¿Qué significa peso abierto en IA?

Poco después del lanzamiento del modelo de DeepSeek en enero, Altman afirmó que su empresa estaba «en el lado equivocado de la historia» en lo que respecta a los modelos abiertos, lo que indicaba un probable cambio de rumbo. A inicios de la semana refirió que OpenAI pensaba liberar un modelo de peso abierto durante algún tiempo, añadiendo: «ahora se siente que es importante hacerlo».

Actualmente, la compañía pone su IA a disposición de un chatbot y a través de la nube. R1, Llama y otros modelos de pesos abiertos pueden descargarse gratuitamente y modificarse. Los pesos de un modelo se refieren a los valores dentro de una gran red neuronal, algo que se establece durante el entrenamiento. Los modelos de peso abierto son más baratos y también pueden adaptarse a casos de uso sensibles, como el tratamiento de información altamente confidencial.

OpenAI pudo sentir la necesidad de demostrar que podía entrenar un nuevo modelo de forma barata, ya que el modelo de DeepSeek fue supuestamente entrenado a una fracción del costo de la mayoría de los grandes modelos generativos. «Es una noticia increíble. Con DeepSeek, todo el mundo se está dando cuenta del poder de los pesos abiertos», expresó a WIRED Clement Delangue, cofundador y director general de HuggingFace, una empresa especializada en alojar modelos abiertos de inteligencia artificial. Por su parte, Steven Heidel, miembro del equipo técnico de OpenAI, volvió a publicar el anuncio de Altman y añadió: «Este año lanzaremos un modelo que podrás ejecutar en tu propio hardware«.


chatgpt-organize-projects-gear-%2520182511581 OpenAI lanzará un modelo abierto de IA que competirá contra Llama y R1

Subscribers can now organize their conversations with the AI assistant into neat little folders.


Barata, capaz y más cautelosa

Johannes Heidecke, investigador que trabaja en la seguridad de la IA en OpenAI, también replicó el mensaje en X, sugiriendo que la empresa realizaría «pruebas rigurosas para garantizar que el modelo de peso abierto no pudiera utilizarse fácilmente de forma indebida». A algunos investigadores de IA les preocupa que los modelos de peso abierto puedan ayudar a los delincuentes a lanzar ciberataques o incluso a desarrollar armas biológicas o químicas. «Aunque los modelos abiertos plantean retos únicos, nos guiamos por nuestro Marco de Preparación y no publicaremos modelos que creamos que plantean riesgos catastróficos», escribió Heidecke.

OpenAI también publicó una página web en la que invita a los desarrolladores a solicitar acceso anticipado al próximo modelo. Altman confirmó en su post que la empresa organizará eventos para desarrolladores con prototipos tempranos del nuevo modelo en las próximas semanas.

Meta fue la primera gran empresa de IA en adoptar un enfoque más abierto, lanzando la primera versión de Llama en julio de 2023. En la actualidad existe un número creciente de modelos de IA abiertos. Algunos investigadores señalan que Llama y otros modelos no son «tan trasparentes» como aparentan, porque sus datos de entrenamiento y otros detalles siguen manteniéndose en secreto. Meta también impone una licencia que limita la capacidad de otras empresas para beneficiarse de las aplicaciones y herramientas creadas con Llama.

Artículo publicado originalmente en WIRED, adaptado por Alondra Flores.



Source link

Share this content:

Publicar comentario