La startup ElevenLabs, con sede en la ciudad de San Francisco, recientemente anunció que su nuevo modelo de Inteligencia Artificial (IA) ahora puede imitar voces que hablan con fluidez en 30 idiomas diferentes, una expansión increíble de los ocho originales que eran compatibles anteriormente. Para conocer más detalles ¡no deje de leer este post en TECHcetera!
Tiene la capacidad de imitar voces que hablan con fluidez en 30 idiomas diferentes
Si hay algo importante que mencionar es que la compañía utilizó como ejemplo a Lukeman Literary, una agencia literaria y editorial independiente, y explicó que la empresa produce muchos audiolibros cada año en varios idiomas.
Según comentó ElevenLabs en una publicación de blog oficial, al equipo de Lukeman le tomaba semanas producir un solo audiolibro debido a que precisaba encontrar el locutor apropiado, reservar un estudio de grabación y grabar y administrar la postproducción. Según indicaron“ahora el todo el proceso lleva unas pocas horas”.
Según la startup ElevenLabs, el nuevo modelo Multilingual v2 ofrece un audio “emocionalmente rico” que consigue capturar las inflexiones matizadas del habla natural. Los usuarios escriben el texto que quieren que se diga en el idioma de destino y la Inteligencia Artificial crea una voz en off perfecta.
Hay que destacar que la empresa brinda 2 opciones principales de clonación de voz; una herramienta de conversión de texto a voz y por otro lado, un “VoiceLab” para clonar voces concretas.
Los usuarios cargan muestras de voz para poder crear un clon de voz personalizado, que la IA analiza para crear una versión sintética. Esta voz clonada tiene la capacidad de poder luego ser manipulada para decir cualquier cosa imaginable. Desde ElevenLabs aseveran que la última actualización representa que estos dobles de IA ahora pueden hablar con fluidez idiomas como sueco, árabe, así como también malayo, entre otros.
Las capacidades lingüísticas ampliadas también coinciden con el hecho de que ElevenLabs sacó su tecnología de clonación de voz de las pruebas beta. Según se ha conocido, la compañía pretende comercializar la herramienta para aplicaciones prácticas como por ejemplo; narrar audiolibros, como en el caso de Lukeman Literary.