General Intuition raises $134M seed to teach agents spatial reasoning using video game clips.
Créditos de la imagen: General Intuition
Medal, una plataforma para subir y compartir clips de videojuegos, ha lanzado un nuevo laboratorio de investigación de inteligencia artificial que utiliza su colección de videos de juegos para entrenar y construir modelos fundacionales y agentes de inteligencia artificial que pueden entender cómo se mueven los objetos y entidades a través del espacio y el tiempo – un concepto conocido como razonamiento espacial-temporal.
Llamada General Intuition, la startup apuesta a que el conjunto de datos de Medal – que consiste en 2 billones de videos al año de 10 millones de usuarios activos mensuales en decenas de miles de juegos – supera a alternativas como Twitch o YouTube para el entrenamiento de agentes.
“Cuando juegas videojuegos, básicamente transfieres tu percepción, generalmente a través de una vista en primera persona de la cámara, a diferentes entornos,” Pim de Witte, CEO de Medal y General Intuition, le dijo a TechCrunch. Señaló que los jugadores que suben clips tienden a publicar ejemplos muy negativos o positivos, que sirven como casos útiles para el entrenamiento. “Obtienes un sesgo de selección hacia exactamente el tipo de datos que realmente quieres usar para el trabajo de entrenamiento.”
Este foso de datos es lo que, según se informa, atrajo la atención de OpenAI, que a finales del año pasado intentó adquirir Medal por $500 millones, según The Information. (Ni OpenAI ni General Intuition quisieron comentar sobre el informe.)
Es lo que ha llevado a General Intuition a recaudar una impresionante suma de $133.7 millones en financiamiento inicial, liderado por Khosla Ventures y General Catalyst con participación de Raine.
Equipo fundador de General Intuition. Créditos de la imagen: General Intuition
La startup planea utilizar los fondos para aumentar su equipo de investigadores y ingenieros centrados en entrenar un agente general que pueda interactuar con el mundo que lo rodea, con aplicaciones iniciales en videojuegos y drones de búsqueda y rescate.
De Witte dice que el equipo fundador ya ha hecho avances: el modelo de General Intuition puede entender entornos en los que no fue entrenado y predecir acciones dentro de ellos. Puede hacerlo puramente a través de la entrada visual; los agentes solo ven lo que un jugador humano vería, y se mueven a través del espacio siguiendo las entradas del controlador. Este enfoque, dice la empresa, puede transferirse de manera natural a sistemas físicos como brazos robóticos, drones y vehículos autónomos, que a menudo se manipulan por humanos utilizando controladores de videojuegos.
El próximo hito de General Intuition es doble: generar nuevos mundos simulados para entrenar a otros agentes y navegar de manera autónoma por entornos físicos completamente desconocidos.
Ese enfoque técnico está moldeando cómo la empresa planea comercializar su tecnología y la diferencia de los competidores que están construyendo modelos de mundo.
Mientras General Intuition también está construyendo modelos de mundo para entrenar a sus agentes, estos modelos no son el producto. A diferencia de otros creadores de modelos de mundo como DeepMind y World Labs, que están vendiendo sus modelos de mundo Genie y Marble para el entrenamiento de agentes y la creación de contenido, General Intuition se centra en otros casos de uso para evitar problemas de derechos de autor.
“Nuestro objetivo no es producir modelos que compitan con los desarrolladores de juegos,” dijo de Witte.
En lugar de eso, las aplicaciones de juegos de la startup se centran en crear bots y personajes no jugadores que puedan superar a los tradicionales “bots deterministas,” o personajes preprogramados que producen el mismo resultado cada vez.
“[Los bots] pueden escalar a cualquier nivel de dificultad,” dijo Moritz Baier-Lentz, miembro fundador de General Intuition y socio en Lightspeed Ventures, a TechCrunch. “No es atractivo crear un bot que derrote a todos, pero si puedes escalar gradualmente y llenar la liquidez para cualquier situación del jugador para que su tasa de victoria siempre esté alrededor del 50%, eso maximizará su compromiso y retención.”
De Witte también tiene un background en trabajo humanitario, lo que informa el enfoque de la startup en potenciar drones de búsqueda y rescate que a veces tienen que navegar por entornos desconocidos y extraer información sin GPS.
En última instancia, de Witte y Baier-Lentz ven la funcionalidad central de General Intuition – el razonamiento espacial-temporal — como una pieza crucial en la carrera hacia la inteligencia general artificial (AGI). Mientras que los principales laboratorios de inteligencia artificial se centran en construir modelos de lenguaje cada vez más potentes, General Intuition cree que la verdadera AGI requiere algo que los modelos de lenguaje grandes fundamentalmente carecen.
“Como humanos, creamos texto para describir lo que está sucediendo en nuestro mundo, pero al hacerlo, pierdes mucha información,” dijo de Witte. “Pierdes la intuición general sobre el razonamiento espacial-temporal.”

