Con GPT-4.5, OpenAI tropieza con sus propias ambiciones
Aunque las mejoras son tan graduales como sugiere su nombre, GPT-4.5 sigue siendo la versión más ambiciosa de OpenAI hasta ahora. Lanzado a finales de febrero como avance de investigación, lo que significa básicamente que OpenAI lo considera una versión beta, GPT-4.5 utiliza más potencia de cálculo que sus modelos anteriores y se ha entrenado con más datos.
¿Cuál es el alcance de GPT-4.5? Quién sabe, porque los desarrolladores no lo dicen. ¿Y de dónde proceden estos datos de entrenamiento adicionales? Tampoco dicen nada al respecto. Tomando prestada una frase del exitoso programa de Apple TV, Despido, OpenAI está presentando las supuestas mejoras de este nuevo modelo como misteriosas e importantes.
Cuando se comparan las pruebas de referencia de IA de los modelos de la competencia y las versiones de «razonamiento» de OpenAI, las ventajas de utilizar GPT-4.5 no quedan claras a primera vista. Sin embargo, en la ficha del sistema del modelo y en una entrevista anterior con WIRED, los investigadores de OpenAI que trabajaron en GPT-4.5 afirmaron que las mejoras se notan en los aspectos antropomórficos del modelo, como una intuición más fuerte y una comprensión más profunda de las emociones. Después de sentarme en la oficina de OpenAI el año pasado y escuchar a los directivos hablar sobre el plan de la startup para seguir produciendo ChatGPT como software útil, este no era el lanzamiento que esperaba para 2025. En lugar de adoptar un enfoque más funcional, este modelo intenta ser más emocional.
OpenAI no ha dejado de aumentar su número de contratos con empresas, por lo que cabría esperar que la compañía lanzara versiones de gran envergadura con aplicaciones prácticas incorporadas, especialmente en la versión más cara y potente de su chatbot. Sin embargo, GPT-4.5 se ajusta más a los resultados de un grupo de investigación académica que ha puesto todo su empeño en perseguir la inteligencia artificial general (AGI, por sus siglas en inglés), una versión teórica del algoritmo lo bastante hábil como para sustituir a los trabajadores de cuello blanco y prácticamente divina en su capacidad para procesar información.
Aunque OpenAI argumentaría que estas dos vías están entrelazadas y son igual de importantes, si tu objetivo a corto plazo es ganar dinero con ChatGPT, el farragoso lanzamiento de la semana pasada no tiene sentido; es súper caro y ofrece ganancias marginales que solo los usuarios avezados del chatbot pueden notar. Pero si tu misión global es construir una AGI beneficiosa, que sigue siendo el objetivo principal de OpenAI, entonces imitar los matices de las emociones humanas y las habilidades blandas es un área crítica de mejora. Es ahí donde la empresa podría mantener su posición de liderazgo mientras otros competidores en la carrera de la IA generativa, como el modelo R1 de DeepSeek, mucho más barato, avanzan en otras innovaciones.
Cómo acceder a GPT-4.5
Como ocurre con la mayoría de las nuevas funciones y modelos que llegan para ChatGPT, los suscriptores de pago de OpenAI serán los primeros en acceder a GPT-4.5. En este caso, OpenAI está desbloqueando el acceso primero para los suscriptores de ChatGPT Pro que pagan la abultada cifra de 200 dólares al mes. El gran despliegue de GPT-4.5 a los demás niveles de pago (Plus, Team, Enterprise y Edu) se producirá durante esta semana y la siguiente. Los modelos anteriores han acabado llegando también a la versión gratuita de ChatGPT, pero la empresa aún no tiene previsto lanzar GPT-4.5 a todos los usuarios, debido a su tamaño y a los requisitos informáticos.
Cuando esté disponible en su cuenta, GPT-4.5 será una de las muchas opciones anidadas en el menú desplegable de modelos que aparece al hacer clic en la palabra ChatGPT, en la parte superior de la pantalla. En mi cuenta Pro, esto ha elevado el número total de modelos disponibles a la friolera de nueve opciones diferentes entre las que ahora tengo que elegir. Los desarrolladores de OpenAI me han dicho que esperan simplificar significativamente este proceso en el futuro y hacer que la herramienta de IA elija el modelo más adecuado para cada pregunta que el usuario escriba o pronuncie.
Primeras impresiones del nuevo modelo de OpenAI
El titular provisional que puse en este artículo era «Con GPT-4.5, OpenAI se pierde en la salsa AGI». Y aunque ningún titular que incluya el nombre del modelo va a parecer poético, eso es un poco problemático. Redactar titulares contundentes y concisos es una habilidad difícil que requiere una comunicación clara y un cierto gusto estético, y a menudo implica la intervención de varios editores antes de transmitir el mensaje perfecto. Tenía curiosidad por saber si ChatGPT sería capaz de dar un puñetazo a ese titular, así que lo intenté utilizando tanto el modelo más reciente como GPT-4o, una versión anterior que la empresa describe como «estupenda para la mayoría de las tareas».
Entre todas las mejoras intangibles, GPT-4.5 era mucho más capaz de escribir un titular convincente. Los resultados de GPT-4o eran menos interesantes y tenían menos variedad en general, con la excepción de este bombazo sin sentido: «Con GPT-4.5, OpenAI mantiene un pie en el futuro y otro en el chatbot«. He aquí un remate mucho mejor proporcionado por el nuevo modelo: «Con GPT-4.5, OpenAI tropieza con sus propias ambiciones». Es bastante similar al original, pero potencialmente más claro para los lectores. Tras cierta consternación, los editores humanos de WIRED decidieron optar por el titular generado por GPT-4.5. Me parece justo.
Cambiando de tema, pregunté por qué el precio de una docena de huevos está subiendo aún más durante el inicio de la presidencia de Trump que bajo la de Biden, principalmente para ver qué modelo tendría más éxito en el análisis de artículos web sobre un tema político. Las diferencias aquí fueron más sutiles, pero GPT-4o parecía propenso a sermonearme y repetirse, mientras que GPT-4.5 hizo un mejor trabajo entendiendo mi intención y representando sucintamente múltiples puntos de vista.
¿Y la IA como compañera de investigación? Ahora mismo estoy trabajando en un reportaje y quería ver si la herramienta de investigación profunda de ChatGPT, en la que piensa durante un poco más de tiempo y produce respuestas más profundas, sería realmente útil durante el proceso de preparación. Tras introducir páginas de notas en GPT-4.5 y GPT-4o y esperar unos minutos, ambos resultados me decepcionaron por igual. Si bien es cierto que el formato largo puede ser útil para quienes no tienen experiencia como reporteros, las preguntas que sugería hacer a mis fuentes para el reportaje no me sorprendieron ni me gustaron. Aproveché mejor el tiempo volviendo a leer mis notas escritas en lugar de los informes de 4.000 palabras de ChatGPT.
Después de pasar un par de días chateando en general con GPT-4.5, lo más positivo que experimenté fue que el modelo hace que ChatGPT parezca menos molesto y más conversacional. Esto puede sonar trillado, pero es un factor importante de la experiencia del usuario. Pequeños detalles como el uso de un lenguaje desenfadado y frases de una sola palabra hicieron que el bot resultara menos empalagoso durante nuestros chats. Me veo eligiendo GPT-4.5 para no tener la sensación de estar pidiendo ayuda a un adulador de la información.
Share this content:
Publicar comentario