OpenAI actualiza Codex con una nueva versión de GPT-5.
Créditos de la imagen: Bryce Durbin / TechCrunch
OpenAI anunció el lunes que está lanzando una nueva versión de GPT-5 para su agente de codificación AI, Codex. La empresa dice que su nuevo modelo, llamado GPT-5-Codex, pasa más tiempo “pensando” de manera más dinámica que los modelos anteriores, y podría pasar desde unos pocos segundos hasta siete horas en una tarea de codificación. Como resultado, realiza mejor en los benchmarks de codificación agentic.
El nuevo modelo ya está siendo implementado en los productos de Codex, que pueden accederse a través de una terminal, IDE, GitHub o ChatGPT, para todos los usuarios de ChatGPT Plus, Pro, Business, Edu y Enterprise. OpenAI dice que planea hacer el modelo disponible para los clientes de API en el futuro.
Esta actualización es parte del esfuerzo de OpenAI para hacer que Codex sea más competitivo con otros productos de codificación AI, como Claude Code, Cursor de Anysphere o GitHub Copilot de Microsoft. El mercado de herramientas de codificación AI se ha vuelto mucho más concurrido en el último año, debido a la alta demanda de los usuarios. Cursor superó los $500 millones en ARR a principios de 2025 y Windsurf, un editor de código similar, fue el objeto de un intento de adquisición caótico que resultó en la división de su equipo entre Google y Cognition.
OpenAI dice que GPT-5-Codex supera a GPT-5 en SWE-bench Verified, un benchmark que mide las habilidades de codificación agentic, así como en un benchmark que mide el rendimiento en tareas de refactorización de código de grandes repositorios establecidos.
(Crédito: OpenAI)
La empresa también dice que entrenó a GPT-5-Codex para realizar revisiones de código, y pidió a ingenieros de software con experiencia que evaluaran los comentarios de revisión del modelo. Los ingenieros informaron que GPT-5-Codex hizo menos comentarios incorrectos, pero añadió más “comentarios de alto impacto”.
En una reunión, el líder del producto de Codex de OpenAI, Alexander Embiricos, dijo que gran parte del aumento en el rendimiento se debe a las habilidades de “pensamiento dinámico” de GPT-5-Codex. Los usuarios pueden estar familiarizados con el enrutador de GPT-5 en ChatGPT, que dirige las consultas a diferentes modelos según la complejidad de la tarea. Embiricos dijo que GPT-5-Codex funciona de manera similar, pero no tiene un enrutador debajo, y puede ajustar el tiempo que dedica a una tarea en tiempo real.
Embiricos dice que esto es una ventaja frente a un enrutador, que decide cuánta potencia computacional y tiempo dedicar a un problema desde el principio. En cambio, GPT-5-Codex puede decidir que necesita dedicar otra hora a un problema cinco minutos después. Embiricos dijo que ha visto al modelo dedicar hasta siete horas en algunos casos.

