Entrada

Seoul-based Datumo raises $15.5M to take on Scale AI, backed by Salesforce.

LLM word with icons as vector illustration. AI concept of Large Language Models

Créditos de la imagen: Getty Images

La mayoría de las organizaciones dicen que no están completamente preparadas para usar el AI generativo de manera segura y responsable, según un informe reciente de McKinsey. Una preocupación es la explicabilidad – entender cómo y por qué el AI toma ciertas decisiones. Mientras que el 40% de los encuestados la considera un riesgo significativo, solo el 17% está tomando medidas activas al respecto, según el informe.

La empresa de Seúl Datumo comenzó como una empresa de etiquetado de datos de AI y ahora quiere ayudar a las empresas a construir AI más seguros con herramientas y datos que permitan probar, monitorear y mejorar sus modelos — sin necesidad de conocimientos técnicos. El lunes, la startup recaudó $15.5 millones, lo que elevó su total recaudado a aproximadamente $28 millones, de inversores como Salesforce Ventures, KB Investment y SBI Investment, entre otros.

David Kim, CEO de Datumo y ex investigador de AI en la Agencia de Desarrollo de Defensa de Corea, se frustró por la naturaleza cronófaga del etiquetado de datos, por lo que tuvo una nueva idea: una aplicación basada en recompensas que permite a cualquiera etiquetar datos en su tiempo libre y ganar dinero. La startup validó la idea en un concurso de startups en KAIST (Korea Advanced Institute of Science and Technology). Kim cofundó Datumo, anteriormente conocido como SelectStar, junto con cinco alumni de KAIST en 2018.

Antes de que la aplicación estuviera completamente desarrollada, Datumo logró obtener decenas de miles de dólares en ventas precontractuales durante la fase de descubrimiento del cliente del concurso, principalmente de empresas y startups lideradas por alumni de KAIST.

En su primer año, la startup superó los $1 millón en ingresos y firmó varios contratos clave. Hoy, la startup cuenta con grandes empresas coreanas como Samsung, Samsung SDS, LG Electronics, LG CNS, Hyundai, Naver y el gigante de telecomunicaciones de Seúl SK Telecom entre sus clientes. Sin embargo, hace unos años, los clientes comenzaron a pedirle a la empresa que fuera más allá del simple etiquetado de datos. La startup de siete años ahora tiene más de 300 clientes en Corea del Sur y generó aproximadamente $6 millones en ingresos en 2024.

“Querían que puntuáramos las salidas de sus modelos de AI o las comparáramos con otras salidas,” dijo Michael Hwang, cofundador de Datumo, a TechCrunch. “Fue entonces cuando nos dimos cuenta: ya estábamos evaluando modelos de AI — sin saberlo.” Datumo se centró en esta área y lanzó el primer conjunto de datos de referencia de Corea del Sur centrado en la confianza y seguridad del AI, añadió Hwang.

“Empezamos con el etiquetado de datos, luego nos expandimos a conjuntos de datos de pretraining y evaluación a medida que maduraba el ecosistema de LLM,” dijo Kim a TechCrunch.

La reciente inversión de $14.3 mil millones de Meta en Scale AI, similar a una adquisición destaca la importancia de este mercado. Poco después de ese acuerdo, el fabricante de modelos de AI y competidor de Meta, OpenAI dejó de usar los servicios de Scale AI. El acuerdo de Meta también indica que la competencia por los datos de entrenamiento de AI está aumentando.

Datumo comparte algunas similitudes con empresas como Scale AI en la provisión de conjuntos de datos de pretraining, y con Galileo y Arize AI en la evaluación y monitoreo de AI. Sin embargo, se diferencia por sus conjuntos de datos con licencia, especialmente los datos extraídos de libros publicados, que la empresa afirma que ofrecen una rica razón estructurada humana pero son notorios por ser difíciles de limpiar, según el CEO Kim.

A diferencia de sus competidores, Datumo también ofrece una plataforma de evaluación completa llamada Datumo Eval, que genera automáticamente datos de prueba y evaluaciones para verificar respuestas inseguras, sesgadas o incorrectas sin necesidad de scripting manual, añadió Kim. El producto insignia es una herramienta de evaluación sin código diseñada para no desarrolladores, como los equipos de política, confianza y seguridad, y cumplimiento.

Cuando se le preguntó sobre la atracción de inversores como Salesforce Ventures, Kim explicó que la startup había organizado una charla de fuego con Andrew Ng, fundador de DeepLearning.AI, en un evento en Corea del Sur. Después del evento, Kim compartió la sesión en LinkedIn, lo que llamó la atención de Salesforce Ventures. Después de varias reuniones y videollamadas, los inversores extendieron un compromiso suave. Todo el proceso de financiación duró aproximadamente ocho meses, dijo Hwang.

La nueva financiación se utilizará para acelerar los esfuerzos de R&D, especialmente en el desarrollo de herramientas de evaluación automatizadas para AI empresarial, y para escalar las operaciones de mercado global en Corea del Sur, Japón y EE. UU. La startup, que tiene 150 empleados en Seúl, también estableció una presencia en Silicon Valley en marzo.

Esta entrada está licenciada bajo CC BY 4.0 por el autor.