Los próximos modelos de Llama de Meta pueden tener características de voz mejoradas.
El próximo gran modelo de IA “abierto” de Meta podría centrarse en la voz, según un informe del Financial Times.
Según el artículo, Meta está planeando introducir funciones de voz mejoradas con Llama 4, el próximo buque insignia de su familia de modelos Llama, que se espera que llegue en “semanas”. Según se informa, Meta se ha centrado especialmente en permitir a los usuarios interrumpir el modelo a mitad de la conversación, de forma similar al Modo de voz de OpenAI para ChatGPT y la experiencia Gemini Live de Google.
En comentarios de esta semana en una conferencia de Morgan Stanley, el director de productos de Meta, Chris Cox, dijo que Llama 4 será un modelo “omni”, capaz de interpretar y generar de forma nativa voz, así como texto y otros tipos de datos.
El éxito de los modelos abiertos del laboratorio de inteligencia artificial chino DeepSeek, que funcionan a la par o mejor que los modelos Llama de Meta, ha impulsado el desarrollo de Llama a toda marcha. Se dice que Meta se apresuró a establecer salas de guerra para descifrar cómo DeepSeek redujo el costo de ejecución e implementación de modelos.