ChatGPT estrena una función para crear imágenes desde cero y es sorprendentemente buena
OpenAI anuncia el lanzamiento de una función dentro de ChatGPT para la generación de imágenes, dirigida a usuarios Plus, Pro, Team y a aquellos que disfrutan del chatbot de forma gratuita. La herramienta forma parte del modelo multimodal GPT‑4o y se puede utilizar dentro de Sora.
«La generación de imágenes GPT‑4o destaca por la precisión en la representación de texto, el seguimiento exacto de indicaciones y el aprovechamiento de la base de conocimientos y el contexto del chat de GPT‑4o, lo que incluye la transformación de imágenes cargadas o su uso como inspiración visual», reza el comunicado oficial de la compañía. La función permite generar contenidos de alta calidad en respuesta a conversaciones, prompts (instrucciones) y archivos subidos. Concretamente, los usuarios podrán crear imágenes desde cero o modificar fotos existentes según las indicaciones que proporcionen al chatbot.
Una imagen vale más que mil palabras
Según OpenAI, lo más destacado de la generación de imágenes GPT‑4o es la capacidad del modelo para combinar símbolos específicos con contenidos visuales. Desde logotipos hasta infografías, las imágenes pueden transmitir un significado preciso cuando se complementan con símbolos que remiten a un lenguaje y una experiencia compartidos.
GPT‑4o sigue instrucciones detalladas con atención al detalle. Mientras que otros sistemas tienen dificultades con entre 5 y 8 objetos, el generador GPT‑4o puede gestionar hasta 10-20 objetos diferentes. La mayor vinculación de los objetos con sus características y relaciones permite un mejor control.
OpenAI
Está claro que la intención de OpenAI es mejorar la capacidad de su modelo de generación de imágenes, ofreciendo a sus usuarios una amplia gama de opciones. En los próximos días, será posible utilizar la IA generativa de ChatGPT para crear diagramas, infografías, gráficos promocionales para medios sociales, logotipos, invitaciones, etc.
Limitaciones y política de seguridad
Por otro lado, la empresa fundada por Sam Altman refiere que, para evitar conflictos de seguridad, todas las imágenes generadas cuentan con metadatos C2PA, que identificarán una imagen como procedente de GPT‑4o, aportando transparencia. «También hemos desarrollado una herramienta de búsqueda interna que utiliza atributos técnicos de las generaciones para verificar si el contenido proviene de nuestro modelo», explica el comunicado.
Para que la función sea más segura, OpenAI se comprometió a limitar al máximo la generación de imágenes que «puedan violar las políticas de contenido, como material de abuso sexual infantil y deepfakes sexuales». Funcional, práctica y segura, la nueva herramienta del modelo GPT‑4o facilitará a todo el mundo la generación de imágenes.
Artículo originalmente publicado en WIRED Italia. Adaptado por Alondra Flores.
Share this content:
Publicar comentario