Entrada

Vocal Image está utilizando inteligencia artificial para ayudar a las personas a comunicarse mejor.

Imagen del CEO de Vocal Image Nick Lakhoika en el evento de lanzamiento del programa de startups de AI

Créditos de la imagen:

Con 4 millones de descargas de aplicaciones, la startup estonia Vocal Image se propone ayudar a las personas a mejorar su voz y habilidades de comunicación con coaching potenciado por AI. Sin embargo, entre sus 160.000 usuarios activos, podría ser su CEO, Nick Lakhoika, quien mejor encarne su misión.

Lakhoika nació en Bielorrusia, no hablaba inglés hasta su mudanza a Estonia, y alguna vez padeció ansiedad al hablar. Sin embargo, llegó a ganar “muchos concursos de pitch” en nombre de la startup de coaching vocal, que fue inspirada por su propia historia, le contó a TechCrunch.

“Cuando estaba en la escuela, me acosaban por mi dicción confusa”, dijo Lakhoika. En sus primeros años de veinte, como joven y fundador inseguro, conoció a una coach vocal, Maryna “Rusia” Shukiurava, quien le enseñó que la voz y la comunicación podían ser entrenadas.

Para ayudar a los demás, comenzaron un canal de YouTube que eventualmente se convirtió en Vocal Image, que posiciona su aplicación basada en suscripción como una alternativa asequible al coaching uno a uno que puedes usar en casa. “Puedes hacer movimientos extraños, sonidos extraños […] y sentirte seguro”, dijo Lakhoika.

Con una biblioteca interactiva que incluye trabalenguas, ejercicios de respiración y consejos sobre gestos, Vocal Image también se está inclinando cada vez más hacia el AI para dar retroalimentación automatizada y consejos personalizados, en gran parte gracias a la adición del cofundador y CTO Mikalai Karaliou, dijo Lakhoika.

Estos viajes guiados suelen centrarse en objetivos relacionados con el trabajo, como mejorar habilidades profesionales o de liderazgo, y desarrollar habilidades de oratoria o presentación. Sin embargo, Vocal Image también apoya a las personas que simplemente quieren aumentar su confianza, así como a la comunidad LGBTQ, a la que Shukiurava había estado apoyando en Bielorrusia.

Aunque el trío es de Bielorrusia, fueron parte de los muchos fundadores bielorrusos que dejaron su país natal después de que las protestas fallaran en derrocar al presidente Alexander Lukashenko y fueran recibidos con represión brutal. Lakhoika eligió Estonia por su entorno empresarial, que hasta ahora ha sido favorable para la startup.

Poco después de mudarse a Tallin, Vocal Image se unió al acelerador local Startup Wise Guys, que considera a la startup como una de sus “historias de éxito” debido a su rápido crecimiento. Según Lakhoika, la startup alcanzó $6.5 millones en ingresos recurrentes anuales (ARR) con menos de $1 millón en financiamiento pre-semilla.

Recientemente, la startup levantó una ronda de semilla de $3.6 millones liderada por el fondo de inversión en edtech francés Educapital, con participación de Specialist VC de Estonia y Generations Fund de Alemania, según TechCrunch.

Hasta agosto, la startup afirma tener $12 millones de ARR y algunos 50.000 usuarios pagados, dijo Lakhoika. Con un equipo de 20 personas, incluidos la mayoría de los exiliados bielorrusos, Vocal Image ahora planea crecer su equipo de desarrollo y desplegar más localizaciones (además del inglés, español, alemán, francés, ucraniano y ruso).

Este financiamiento llega poco después de que la startup fuera seleccionada por Hugging Face, Meta y Scaleway como uno de los cinco ganadores de su Programa de Startups de AI Europeo, pero también en un momento en que enfrenta una mayor competencia. Por ejemplo, la empresa de edtech Headway recently agregó un entrenador de habla potenciado por AI a su aplicación de habilidades sociales, Skillsta. Sin embargo, Vocal Image puede contar con su propio depósito de AI conforme a GDPR.

Con más de 35.000 grabaciones al día, Vocal Image ha recopilado más de 1 millón de muestras de voz reales. Y lo mejor, estas grabaciones están etiquetadas por la comunidad a través de Voice Rating, una característica colaborativa que permite a los usuarios decidir si otros suenan “confiados” o “infantiles”.

Este tipo de conjunto de datos es exactamente lo que las aplicaciones como Vocal Image necesitan para mejorar su precisión. También podría ayudar a las startups de AI a afinar sus voces artificiales, creando aún más viento en popa para la startup más allá de sus raíces B2C.

Esta entrada está licenciada bajo CC BY 4.0 por el autor.