Si hay algo sumamente importante que mencionar es que la última producción de Inteligencia Artificial de Meta es un avance realmente importante para la traducción de texto y voz en tiempo real. Hace poco, la empresa lanzó SeamlessM4T; un modelo multimodal que traduce texto a voz y viceversa. Desde Meta han afirmado que SeamlessM4T es “el primer modelo de traducción y transcripción de IA multimodal y multilingüe todo en uno”, lo que quiere decir que es enormemente capaz de poder traducir y, así mismo, transcribir idiomas al mismo tiempo.
Esto es lo que tiene que conocer sobre SeamlessM4T
Según han informado, SeamlessM4T puede traducir entradas de voz a texto, de voz a voz, de texto a voz y así mismo, de texto a texto para hasta 100 idiomas. Incluso, hay que acotar que las traducciones para salidas de traducción de voz a voz y de texto a voz, logran admitir 35 idiomas.
SeamlessM4T se encuentra disponible públicamente para investigadores y también para desarrolladores con una licencia de investigación. Además del modelo, hay que señalar que Meta también está lanzando su conjunto de datos de entrenamiento llamado SeamlessAlign, que posee 270.000 horas de alineaciones de voz y texto. A diferencia de otras grandes compañías como por ejemplo: OpenAI y Google, Meta se ha esforzado en que sus modelos sean de código abierto y estén disponibles públicamente.
Es importante mencionar que el enfoque de Meta de lanzar modelos de código abierto cuenta con el doble efecto de permitir a los desarrolladores construir y optimizar los productos, al mismo tiempo que gana puntos entre los especialistas en ética de la IA que exigen o demandan transparencia en los sistemas de Inteligencia Artificial Generativos.
Según la publicación del blog, el conjunto de datos de SeamlessM4T (SeamlessAlign) consta de datos disponibles públicamente, existen problemas éticos y legales en torno al uso de obras protegidas por derechos de autor y datos personales sin consentimiento.
Finalmente, hay que destacar que el anuncio de Meta no puntualizó planes concretos para el novedoso “SeamlessM4T”, solo insinuó que quiere “explorar cómo este modelo fundamental puede permitir nuevas capacidades de comunicación”.