Anthropic lanza Claude Sonnet 4.5, su mejor modelo de IA para programación.
Créditos de la imagen: Anthropic
El lunes, Anthropic lanzó un nuevo modelo de frontera llamado Claude Sonnet 4.5, que afirma ser de vanguardia en las pruebas de codificación. La empresa dice que Claude Sonnet 4.5 es capaz de construir “aplicaciones listas para producción”, un salto en la fiabilidad en comparación con los modelos de IA anteriores.
Claude Sonnet 4.5 estará disponible a través de la API de Claude y en el chatbot de Claude.ai. El precio para los desarrolladores es el mismo que el de Claude Sonnet 4: $3 por millón de tokens de entrada (aproximadamente 750,000 palabras, o más que la serie completa de El Señor de los Anillos) y $15 por millón de tokens de salida.
En el último año, los modelos de IA de Anthropic han emergido como una preferencia entre desarrolladores y empresas, en gran medida debido a su fuerte rendimiento en tareas de ingeniería de software. Apple y Meta reportedly utilizan modelos de IA de Claude internamente, y Anthropic ha hecho un negocio significativo vendiendo acceso a API de aplicaciones de codificación como Cursor, Windsurf y Replit. Recientemente, OpenAI’s GPT-5 ha desafiado la supremacía de Anthropic en el espacio, superando a los modelos de Claude en una variedad de pruebas de codificación.
Anthropic dice que Claude Sonnet 4.5 ofrece un rendimiento de vanguardia en varias pruebas de codificación, incluyendo SWE-Bench Verified. Sin embargo, el investigador de IA de Anthropic, David Hershey, le dice a TechCrunch que es difícil capturar el rendimiento de Claude Sonnet 4.5 en las pruebas de codificación.
Hershey dice que ha visto a Claude Sonnet 4.5 codificar de manera autónoma durante hasta 30 horas en las primeras pruebas con algunos clientes empresariales. En ese tiempo, observó cómo el modelo de IA no solo construía una aplicación, sino que también ponía en marcha servicios de bases de datos, compraba nombres de dominio y realizaba una auditoría SOC 2 para asegurarse de que el producto era seguro.
En un comunicado compartido con TechCrunch, el CEO de Cursor, Micheal Truell, dijo que Claude Sonnet 4.5 representa un rendimiento de vanguardia en la codificación, especialmente en tareas de largo alcance. Jeff Wang, CEO de Windsurf, dijo en un comunicado que Claude Sonnet 4.5 representa una “nueva generación de modelos de codificación”.
Anthropic también afirma que Claude Sonnet 4.5 es su modelo de frontera más alineado hasta la fecha, con tasas más bajas de síndrome de la adulación y de engaño que los modelos anteriores. La empresa dice que también ha mejorado la susceptibilidad de Claude a los ataques de inyección de prompts.
Además del lanzamiento de Claude Sonnet 4.5, Anthropic también está lanzando el SDK de Claude Agent. La empresa dice que esta es la misma infraestructura que potencia Claude Code y puede ayudar a los desarrolladores a construir sus propios agentes.
Anthropic también está lanzando una vista previa de investigación temporal llamada “Imagine con Claude” para suscriptores de Max, que muestra al modelo de IA generando software en tiempo real. La empresa dice que el modelo responderá a las solicitudes del usuario en tiempo real, sin funcionalidad predeterminada ni código preescrito.
