Entrada

OpenAI lanza un agente de propósito general en ChatGPT.

OpenAI logo con espirales de colores pastel (Créditos de la imagen: Bryce Durbin TechCrunch)

Créditos de la imagen: Bryce Durbin / TechCrunch

OpenAI está lanzando un nuevo agente de inteligencia artificial general en ChatGPT, que la empresa dice que puede completar una amplia variedad de tareas informáticas en nombre de los usuarios. OpenAI dice que el agente puede navegar automáticamente por el calendario de un usuario, generar presentaciones y diapositivas editables y ejecutar código.

La herramienta, llamada ChatGPT agent, combina varias capacidades de las herramientas anteriores de OpenAI, como la capacidad de Operator para hacer clic en sitios web y la capacidad de Deep Research para sintetizar información de docenas de sitios web en un informe de investigación conciso. OpenAI dice que los usuarios podrán interactuar con el agente simplemente pidiéndolo en ChatGPT en lenguaje natural.

El jueves, OpenAI está desplegando ChatGPT agent a los suscriptores de sus planes Pro, Plus y Team. Para activar la herramienta, los usuarios pueden seleccionar “modo agente” en el menú de herramientas de ChatGPT.

El lanzamiento de ChatGPT agent representa el intento más audaz hasta ahora de OpenAI para convertir ChatGPT en un producto agente que pueda tomar acciones y descargar tareas para los usuarios, en lugar de solo responder preguntas. En los últimos años, empresas de Silicon Valley como OpenAI, Google y Perplexity han presentado docenas de agentes de inteligencia artificial que han prometido hacer exactamente eso. Sin embargo, estas versiones iniciales de agentes de inteligencia artificial han tenido dificultades con tareas complejas y parecen menos atractivas como productos que la visión final que los ejecutivos de tecnología presentan sobre los agentes de inteligencia artificial.

Dicho esto, OpenAI dice que ChatGPT agent es mucho más capaz que sus ofertas anteriores.

El nuevo agente de OpenAI puede acceder a ChatGPT connectors, permitiendo a los usuarios conectar aplicaciones como Gmail y GitHub para que el agente pueda encontrar información relevante a sus consultas. Además, OpenAI dice que ChatGPT agent tiene acceso a una terminal y puede usar APIs para acceder a ciertas aplicaciones.

El modelo subyacente de ChatGPT agent ofrece un rendimiento de estado de la arte en varios benchmarks, según OpenAI.

La empresa dice que el modelo de ChatGPT agent obtiene una puntuación del 41.6% en Humanity’s Last Exam (pass@1), una prueba difícil compuesta por miles de preguntas en más de cien materias. Esto es aproximadamente el doble de lo que obtuvieron o3 y o4-mini en la prueba.

En FrontierMath, uno de los benchmarks matemáticos más difíciles conocidos, OpenAI dice que ChatGPT agent obtiene una puntuación del 27.4% cuando tiene acceso a herramientas, como una terminal para la ejecución de código. La puntuación anterior de estado de la arte proviene de o4-mini, que obtuvo solo un 6.3%.

OpenAI destaca que desarrolló ChatGPT agent con la seguridad en mente, principalmente porque el producto presenta algunas nuevas capacidades que podrían hacerlo más peligroso en manos de un actor malintencionado. Sin embargo, cuán capaz es realmente ChatGPT agent sigue siendo una incógnita.

Esta entrada está licenciada bajo CC BY 4.0 por el autor.