Reflection raises $2B to be America’s open frontier AI lab, challenging DeepSeek
Image Credits:Getty Images
Reflexión, una startup fundada hace solo un año por dos investigadores anteriores de Google DeepMind, ha recaudado $2 mil millones a una valoración de $8 mil millones, un aumento del 15x desde su valoración de $545 millones hace siete meses. La empresa, que inicialmente se centraba en agentes de codificación autónoma, ahora se posiciona como una alternativa de código abierto a laboratorios cerrados como OpenAI y Anthropic, y como un equivalente occidental a las empresas chinas de inteligencia artificial como DeepSeek.
La startup fue lanzada en marzo de 2024 por Misha Laskin, quien lideró el modelado de recompensas para el proyecto Gemini de DeepMind, y Ioannis Antonoglou, quien co-creó AlphaGo, el sistema de inteligencia artificial que derrotó al campeón mundial en el juego de tablero Go en 2016. Su experiencia en el desarrollo de estos sistemas de inteligencia artificial avanzados es central en su pitch, que es que el talento adecuado en inteligencia artificial puede construir modelos fronterizos fuera de las grandes empresas tecnológicas establecidas.
Junto con su nueva ronda, Reflexión anunció que ha reclutado a un equipo de talento de élite de DeepMind y OpenAI, y ha construido una pila de entrenamiento de inteligencia artificial avanzada que promete estar abierta para todos. Quizás lo más importante, Reflexión dice que ha “identificado un modelo comercial escalable que se alinea con nuestra estrategia de inteligencia abierta”.
El equipo de Reflexión actualmente cuenta con aproximadamente 60 personas, principalmente investigadores y ingenieros en infraestructura, entrenamiento de datos y desarrollo de algoritmos, según Laskin, el CEO de la empresa. Reflexión ha asegurado un clúster de computación y espera lanzar un modelo de lenguaje fronterizo el próximo año que ha sido entrenado en “tens de trillones de tokens”, según le dijo a TechCrunch.
“Hemos creado algo que antes solo se pensaba posible dentro de los principales laboratorios del mundo: una plataforma de LLM y aprendizaje por refuerzo a gran escala capaz de entrenar modelos Mixture-of-Experts (MoEs) a gran escala en la frontera”, escribió Reflexión en un post en X. “Vimos la efectividad de nuestro enfoque de primera mano cuando lo aplicamos al dominio crítico de la codificación autónoma. Con este hito desbloqueado, ahora estamos trayendo estos métodos a la razón agente general”.
MoE se refiere a una arquitectura específica que potencia los LLMs fronterizos, sistemas que anteriormente solo los grandes laboratorios de inteligencia artificial cerrados eran capaces de entrenar a gran escala. DeepSeek tuvo un momento de breakthrough cuando descubrió cómo entrenar estos modelos a gran escala de manera abierta, seguido por Qwen, Kimi y otros modelos en China.
“DeepSeek y Qwen y todos estos modelos son nuestra llamada de atención porque si no hacemos nada al respecto, entonces efectivamente, el estándar global de inteligencia será construido por alguien más”, dijo Laskin. “No será construido por América”.
Laskin añadió que esto pone a los Estados Unidos y sus aliados en una desventaja porque las empresas y los estados soberanos a menudo no usarán modelos chinos debido a posibles repercusiones legales.
“Entonces, o puedes elegir vivir en una desventaja competitiva o levantarte a la altura de las circunstancias”, dijo Laskin.
Los tecnólogos estadounidenses han celebrado ampliamente la nueva misión de Reflexión. David Sacks, el Czar de AI y Criptografía de la Casa Blanca, escribió en X: “Es genial ver más modelos de inteligencia artificial de código abierto en América. Un segmento significativo del mercado global preferirá el costo, la personalización y el control que ofrece el código abierto. Queremos que Estados Unidos gane en esta categoría también”.
Clem Delangue, cofundador y CEO de Hugging Face, una plataforma abierta y colaborativa para constructores de inteligencia artificial, le dijo a TechCrunch sobre la ronda: “Esto es realmente una buena noticia para la inteligencia artificial de código abierto en América. Ahora el desafío será demostrar una alta velocidad de compartir modelos y conjuntos de datos de inteligencia artificial abierta (similar a lo que estamos viendo de los laboratorios que dominan en inteligencia artificial abierta)”.
La definición de Reflexión de ser “abierto” parece centrarse más en el acceso que en el desarrollo, similar a las estrategias de Meta con Llama o Mistral. Laskin dijo que Reflexión liberará los pesos del modelo, es decir, los parámetros centrales que determinan cómo funciona un sistema de inteligencia artificial, para su uso público, mientras mantiene los conjuntos de datos y las tuberías de entrenamiento completas como propiedad.
“En realidad, lo más impactante es el peso del modelo, porque el peso del modelo cualquiera puede usarlo y empezar a experimentar con él”, dijo Laskin. “La pila de infraestructura, solo un puñado selecto de empresas puede usarla realmente”.
Ese equilibrio también subyace en el modelo de negocio de Reflexión. Los investigadores podrán usar los modelos de forma gratuita, dijo Laskin, pero los ingresos provendrán de grandes empresas que construyan productos sobre los modelos de Reflexión y de gobiernos que desarrollen “inteligencia soberana”, es decir, modelos de inteligencia artificial desarrollados y controlados por naciones individuales.
“Una vez que te metes en ese territorio donde eres una gran empresa, por defecto quieres un modelo abierto”, dijo Laskin. “Quieres algo sobre lo que tengas propiedad. Puedes ejecutarlo en tu infraestructura. Puedes controlar sus costos. Puedes personalizarlo para diversos tipos de cargas de trabajo. Porque estás pagando una cantidad desproporcionada de dinero por inteligencia artificial, quieres ser capaz de optimizarlo tanto como sea posible, y realmente ese es el mercado al que estamos sirviendo”.
Reflexión aún no ha lanzado su primer modelo, que será principalmente de texto, con capacidades multimodales en el futuro, según Laskin. Utilizará los fondos de esta última ronda para obtener los recursos de computación necesarios para entrenar los nuevos modelos, el primero de los cuales la empresa espera lanzar a principios del próximo año.
Los inversores en la última ronda de Reflexión incluyen Nvidia, Disruptive, DST, 1789, B Capital, Lightspeed, GIC, Eric Yuan, Eric Schmidt, Citi, Sequoia, CRV y otros.
