El modelo integra las características de codificación de GPT-5.3 Codex
La puntuación del benchmark GDPval alcanza el 83%
GPT-5.4 Pro tiene un precio de $30 y $180 por millón de tokens
OpenAI ha presentado GPT-5.4 como su modelo de IA más avanzado. El sistema está diseñado para cargas de trabajo profesionales y uso empresarial avanzado.
La compañía está implementando el modelo en ChatGPT, la API y Codex. También está disponible una versión GPT-5.4 Pro de mayor rendimiento para tareas complejas.
OpenAI declaró que GPT-5.4 combina razonamiento avanzado y codificación en un solo modelo. El lanzamiento refleja el enfoque de la compañía en herramientas empresariales y para desarrolladores.
GPT-5.4 integra las capacidades de codificación introducidas por primera vez en GPT-5.3 Codex. Mejora el rendimiento en el desarrollo de software y flujos de trabajo de documentos. El modelo admite hojas de cálculo, presentaciones y tareas de datos estructurados. También puede delinear su plan de razonamiento por adelantado dentro de ChatGPT.
Esta característica permite a los usuarios guiar la respuesta mientras aún está en progreso. OpenAI dijo que esto reduce los tokens desperdiciados durante largas cadenas de razonamiento. El modelo admite una ventana de contexto de hasta un millón de tokens. OpenAI ha eliminado la etiqueta beta para esta característica en la API.
Codex también admite la ventana de tokens extendida. Sin embargo, las solicitudes superiores a 272.000 tokens cuentan al doble de la tasa de uso.
GPT-5.4 introduce características nativas de uso del ordenador. Los agentes de IA pueden interactuar con sistemas operativos, sitios web y aplicaciones utilizando entradas de teclado y ratón.
Los desarrolladores pueden automatizar flujos de trabajo de múltiples pasos en diferentes herramientas de software. El sistema también puede seleccionar herramientas dinámicamente a través de una característica llamada búsqueda de herramientas.
La búsqueda de herramientas permite al modelo localizar y usar herramientas externas sin cargar todas las definiciones en la memoria. Este enfoque reduce el uso de tokens en entornos complejos.
OpenAI informó que las respuestas de GPT-5.4 tienen un 18% menos de probabilidades de contener errores que GPT-5.2. Las afirmaciones individuales tienen un 33% menos de probabilidades de ser falsas. La compañía dijo que GPT-5.4 es su modelo de razonamiento más eficiente en tokens hasta la fecha. Utiliza menos tokens para completar muchas tareas de razonamiento.
En el benchmark GDPval, GPT-5.4 obtuvo una puntuación del 83%. Este benchmark mide el rendimiento en 44 ocupaciones en trabajo de conocimiento profesional.
OpenAI dijo que el modelo igualó o superó a los profesionales de la industria en el 83% de las comparaciones. Opus 4.6 de Anthropic obtuvo una puntuación del 79,5% en la misma prueba. En el benchmark FrontierMath, GPT-5.4 Pro obtuvo un 38% en problemas matemáticos avanzados. La versión Thinking obtuvo un 27,1%.
El modelo también tuvo un rendimiento sólido en las pruebas de codificación SWE-Bench Pro. Superó a modelos anteriores de OpenAI y a varios competidores.
En pruebas internas, los evaluadores humanos prefirieron las presentaciones de GPT-5.4 el 68% del tiempo sobre GPT-5.2. El modelo también obtuvo un 87,5% en una tarea de hoja de cálculo modelada en flujos de trabajo bancarios junior.
GPT-5.4 está disponible en versiones Thinking y Pro. GPT-5.4 Thinking cuesta $2,50 por millón de tokens de entrada y $15 por millón de tokens de salida.
GPT-5.4 Pro cuesta $30 por millón de tokens de entrada y $180 por millón de tokens de salida. Es el modelo de mayor precio de OpenAI hasta la fecha. La versión Thinking está disponible para usuarios Plus, Team y Pro en ChatGPT. La versión Pro está disponible para usuarios Pro y Enterprise.
Los desarrolladores pueden acceder a los modelos a través de la API bajo gpt-5.4 y gpt-5.3-pro. El lanzamiento expande la infraestructura de IA de OpenAI en plataformas de consumo y empresariales.
La publicación Sam Altman's OpenAI Rolls Out GPT-5.4 Across ChatGPT and API apareció primero en CoinCentral.

