Entrada

DataCurve obtiene $15 millones para enfrentar a ScaleAI.

Fundadores de Datacurve Serena Ge y Charley Lee

Créditos de la imagen: Chemistry VC

Con el crecimiento de las empresas de IA, la lucha por los datos de alta calidad se ha convertido en uno de los campos más competitivos de la industria, impulsando empresas como Mercor, Surge y, sobre todo, ScaleAI de Alexandr Wang. Pero ahora que Wang se ha unido a Meta para dirigir la IA, muchos inversores ven una oportunidad — y están dispuestos a financiar empresas con estrategias nuevas y convincentes para la recolección de datos de entrenamiento.

La empresa Y Combinator Datacurve es un ejemplo de ello, enfocada en datos de alta calidad para el desarrollo de software. El jueves, la empresa anunció una ronda de Series A de $15 millones, liderada por Mark Goldberg en Chemistry, con participación de empleados de DeepMind, Vercel, Anthropic y OpenAI. La ronda de Series A sigue a una ronda de semilla de $2.7 millones, que atrajo la inversión de Balaji Srinivasan, ex CTO de Coinbase.

Datacurve utiliza un sistema de “cazadores de recompensas” para atraer a ingenieros de software calificados a completar los conjuntos de datos más difíciles de encontrar. La empresa ha distribuido más de $1 millón en recompensas hasta ahora.

Sin embargo, la cofundadora Serena Ge dice que el mayor incentivo no es el dinero. Para servicios de alta valor como el desarrollo de software, el salario siempre será mucho menor para el trabajo de datos que para el empleo convencional — por lo que la ventaja más importante de la empresa es la experiencia del usuario.

“Tratamos esto como un producto de consumo, no como una operación de etiquetado de datos,” dijo Ge. “Pasamos mucho tiempo pensando en cómo podemos optimizarlo para que las personas que queremos se interesen y se unan a nuestra plataforma.”

Esto es especialmente importante a medida que las necesidades de los datos post-entrenamiento se vuelven más complejas. Mientras que los modelos anteriores se entrenaban en conjuntos de datos simples, los productos de IA actuales dependen de entornos de aprendizaje por refuerzo complejos, que deben construirse a través de la recolección de datos específica y estratégica. A medida que los entornos se vuelven más sofisticados, las necesidades de datos se vuelven tanto más intensas en cantidad como en calidad — un factor que podría dar a las empresas de recolección de datos de alta calidad como Datacurve una ventaja.

Como empresa en una etapa temprana, Datacurve se centra en la ingeniería de software, pero Ge dice que el modelo podría aplicarse con la misma facilidad a campos como finanzas, marketing o incluso medicina.

“Lo que estamos haciendo ahora es crear una infraestructura para la recolección de datos post-entrenamiento que atrae y retiene a personas altamente competentes en sus propios dominios,” dice Ge.

Esta entrada está licenciada bajo CC BY 4.0 por el autor.