Entrada

Anthropic launches a Claude AI agent that lives in Chrome.

Anthropic Claude's new Chrome integration.

Créditos de la imagen: Anthropic

Anthropic está lanzando una vista previa de investigación de un agente de inteligencia artificial basado en navegador, impulsado por sus modelos de AI Claude, que la empresa anunció el martes. El agente, Claude para Chrome, se está desplegando para un grupo de 1000 suscriptores en el plan Max de Anthropic, que cuesta entre $100 y $200 por mes. La empresa también está abriendo una lista de espera para otros usuarios interesados.

Al agregar una extensión a Chrome, los usuarios seleccionados pueden ahora chatear con Claude en una ventana lateral que mantiene el contexto de todo lo que ocurre en su navegador. Los usuarios también pueden dar permiso al agente Claude para realizar acciones en su navegador y completar algunas tareas en su nombre.

El navegador se está convirtiendo rápidamente en el siguiente campo de batalla para los laboratorios de inteligencia artificial, que buscan utilizar integraciones de navegador para ofrecer conexiones más fluidas entre los sistemas de inteligencia artificial y sus usuarios. Perplexity recently launched its own browser, Comet, que cuenta con un agente de inteligencia artificial que puede descargar tareas para los usuarios. OpenAI reportedly is close to launching its own browser de inteligencia artificial, que se rumorea que tiene características similares a Comet. Mientras tanto, Google mismo ha lanzado integraciones de Gemini con Chrome en los últimos meses.

La carrera para desarrollar un navegador de inteligencia artificial es especialmente urgente dado la decisión inminente en el caso antitrust de Google, que se espera cualquier día. El juez federal en el caso ha sugerido que podría obligar a Google a vender su navegador Chrome. Perplexity submitted an oferta no solicitada de $34.5 mil millones por Chrome, y el CEO de OpenAI, Sam Altman, sugirió que su empresa también estaría dispuesta a comprarlo.

En el post del blog del martes, Anthropic advirtió que el auge de los agentes de inteligencia artificial con acceso al navegador representa nuevos riesgos de seguridad. La semana pasada, el equipo de seguridad de Brave dijo que había encontrado que el agente del navegador Comet podría ser vulnerable a ataques de inyección de prompts indirectos, donde el código oculto en un sitio web podría engañar al agente para que ejecute instrucciones maliciosas cuando procese la página.

(El jefe de comunicaciones de Perplexity, Jesse Dwyer, le dijo a TechCrunch en un correo electrónico que la vulnerabilidad que Brave planteó ya ha sido corregida.)

Anthropic dice que espera utilizar esta vista previa de investigación para capturar y abordar nuevos riesgos de seguridad, aunque la empresa ya ha introducido varias defensas contra los ataques de inyección de prompts. La empresa dice que su intervención redujo la tasa de éxito de los ataques de inyección de prompts del 23.6% al 11.2%.

Por ejemplo, Anthropic dice que los usuarios pueden limitar el acceso del agente de navegador Claude a ciertos sitios en la configuración de la aplicación, y la empresa, por defecto, ha bloqueado a Claude del acceso a sitios que ofrecen servicios financieros, contenido para adultos y contenido pirateado. La empresa también dice que el agente de navegador Claude solicitará permiso del usuario antes de “realizar acciones de alto riesgo como publicar, comprar o compartir datos personales”.

Esto no es el primer intento de Anthropic en modelos de inteligencia artificial que pueden controlar la pantalla de tu computadora. En octubre de 2024, la empresa lanzó un agente de inteligencia artificial que podía controlar tu PC — sin embargo, las pruebas en ese momento revelaron que el modelo era bastante lento e unreliable.

Las capacidades de los modelos de inteligencia artificial agentic han mejorado bastante desde entonces. TechCrunch ha encontrado que los agentes de inteligencia artificial modernos que utilizan navegadores, como Comet y ChatGPT Agent, son bastante fiables para descargar tareas simples para los usuarios. Sin embargo, muchos de estos sistemas aún luchan con tareas más complejas.

Esta entrada está licenciada bajo CC BY 4.0 por el autor.