Google despliega Gemini Deep Think AI, un modelo de razonamiento que prueba múltiples ideas en paralelo.
Créditos de la imagen: Google DeepMind
Google DeepMind está lanzando Gemini 2.5 Deep Think, que, según la empresa, es su modelo de razonamiento de inteligencia artificial más avanzado, capaz de responder preguntas explorando y considerando múltiples ideas simultáneamente y luego utilizando esas salidas para elegir la mejor respuesta.
Los suscriptores al plan de suscripción de Google de $250 por mes Ultra tendrán acceso a Gemini 2.5 Deep Think en la aplicación Gemini a partir del viernes.
Presentado por primera vez en mayo en Google I/O 2025, Gemini 2.5 Deep Think es el primer modelo de agente múltiple de Google disponible públicamente. Estos sistemas generan múltiples agentes de inteligencia artificial para abordar una pregunta en paralelo, un proceso que requiere significativamente más recursos computacionales que un solo agente, pero que tiende a resultar en mejores respuestas.
Google utilizó una variación de Gemini 2.5 Deep Think para ganar una medalla de oro en la Olimpiada Internacional de Matemáticas (IMO) de este año.
Junto con Gemini 2.5 Deep Think, la empresa está liberando el modelo que utilizó en la IMO a un grupo selecto de matemáticos y académicos. Google dice que este modelo de inteligencia artificial “toma horas para razonar”, en lugar de segundos o minutos como la mayoría de los modelos de inteligencia artificial orientados al consumidor. La empresa espera que este modelo de IMO mejore los esfuerzos de investigación y busca obtener retroalimentación sobre cómo mejorar el sistema de agente múltiple para casos de uso académicos.
Google señala que el modelo Gemini 2.5 Deep Think representa una mejora significativa respecto a lo que anunció en I/O. La empresa también afirma haber desarrollado “técnicas de aprendizaje por refuerzo novedosas” para incentivar a Gemini 2.5 Deep Think a hacer un mejor uso de sus caminos de razonamiento.
“Deep Think puede ayudar a las personas a abordar problemas que requieren creatividad, planificación estratégica y mejoras paso a paso,” dijo Google en un blog compartido con TechCrunch.
El modelo Gemini 2.5 Deep Think alcanza un rendimiento de estado de la arte en Humanity’s Last Exam (HLE) — una prueba desafiante que mide la capacidad de la inteligencia artificial para responder miles de preguntas crowdsourced en matemáticas, humanidades y ciencia. Google afirma que su modelo obtuvo una puntuación de 34.8% en HLE (sin herramientas), en comparación con Grok 4 de xAI, que obtuvo 25.4%, y o3 de OpenAI, que obtuvo 20.3%.
Google también dice que Gemini 2.5 Deep Think supera a los modelos de inteligencia artificial de OpenAI, xAI y Anthropic en LiveCodeBench6, una prueba desafiante de tareas de codificación competitiva. El modelo de Google obtuvo una puntuación de 87.6%, mientras que Grok 4 obtuvo 79% y o3 de OpenAI obtuvo 72%.
Puntuaciones de referencia. Créditos de la imagen: Google
Gemini 2.5 Deep Think trabaja automáticamente con herramientas como la ejecución de código y Google Search, y la empresa dice que es capaz de producir “respuestas mucho más largas” que los modelos de inteligencia artificial tradicionales.
En las pruebas de Google, el modelo produjo tareas de desarrollo web más detalladas y estéticamente agradables en comparación con otros modelos de inteligencia artificial. La empresa afirma que el modelo podría ayudar a los investigadores y “potencialmente acelerar el camino hacia el descubrimiento”.
Escenas de arte creadas por la IA de Google (Crédito: Google)
Parece que varios laboratorios de inteligencia artificial líderes están convergiendo hacia el enfoque de agente múltiple.
Elon Musk’s xAI recientemente lanzó su propio sistema de agente múltiple, Grok 4 Heavy, que afirma que logró un rendimiento líder en la industria en varios benchmarks. El investigador de OpenAI, Noam Brown, dijo en un podcast que el modelo de inteligencia artificial no lanzado que utilizó para ganar una medalla de oro en la Olimpiada Internacional de Matemáticas (IMO) de este año también era un sistema de agente múltiple. Mientras tanto, el Agente de investigación de Anthropic, que genera informes de investigación exhaustivos, también está impulsado por un sistema de agente múltiple.
A pesar del fuerte rendimiento, parece que los sistemas de agente múltiple son aún más costosos de servir que los modelos de inteligencia artificial tradicionales. Esto significa que las empresas tecnológicas pueden mantener estos sistemas bloqueados detrás de sus planes de suscripción más caros, lo que ha hecho xAI y ahora Google.
En las próximas semanas, Google dice que planea compartir Gemini 2.5 Deep Think con un grupo selecto de probadores a través de la API de Gemini. La empresa dice que quiere entender mejor cómo los desarrolladores y las empresas pueden utilizar su sistema de agente múltiple.


