Meta Platforms Inc. anunció un modelo de IA que puede transcribir y traducir hasta 100 idiomas. SeamlessM4T admite traducciones entre voz y texto, lo que hace que sea más fácil para las personas interactuar sin importar su idioma nativo.
La empresa matriz de Facebook dijo que el modelo también admite traducciones de voz a voz completas en 36 idiomas, una mejora con respecto a los modelos anteriores, que solo podían traducir voz o texto en un idioma a la vez.
SeamlessM4T también puede realizar varias otras funciones, como reconocimiento de voz, traducción de voz a texto, traducción de texto a texto y traducción de texto a voz.
La compañía está haciendo que su modelo SeamlessM4T disponible al público para uso no comercial, lo que significa que los investigadores y desarrolladores pueden usar el modelo para crear sus propias aplicaciones y mejorar el estado de la traducción de IA.
Los investigadores dicen que el modelo se entrenó en cuatro millones de horas de “audio crudo que proviene de un repositorio público de datos web rastreados”. Los datos de texto se tomaron de conjuntos de datos creados en 2022 al raspar contenido de Wikipedia y otros sitios web relacionados.
Meta admite que los datos no están protegidos por derechos de autor, algo que ha llevado a demandas contra empresas de IA que utilizan datos públicos disponibles para entrenar sus modelos. La compañía describió a SeamlessM4T como un “avance significativo” en el campo de la tecnología de voz a voz y de voz a texto.
En comparación con los enfoques que utilizan modelos separados, el enfoque de sistema único de SeamlessM4T reduce los errores y los retrasos, lo que aumenta la eficiencia y la calidad del proceso de traducción.
Meta
SeamlessM4T se basa en No Language Left Behind de Meta, un modelo de traducción de texto a texto lanzado el año pasado, y Universal Speech Translator, que admite el hakka, una variedad del idioma chino.
También se basa en el marco de Massively Multilingual Speech de la compañía, que proporciona tecnología de reconocimiento de voz, identificación de idioma y síntesis de voz para más de 1.100 idiomas.
El CEO de Meta, Mark Zuckerberg, dijo anteriormente que espera que herramientas como SeamlessM4T faciliten las interacciones entre usuarios de todo el mundo en el metaverso:
Al hacer que sea más fácil para las personas comunicarse entre idiomas, la IA podría ayudar a hacer del metaverso un espacio más inclusivo y accesible para todos.
Mark Zuckerberg
Zuckerberg cree que Meta se beneficia de un ecosistema de IA abierto porque le permite a la compañía externalizar la creación de herramientas orientadas al consumidor para sus plataformas sociales, en lugar de cobrar por el acceso a los modelos.
En su publicación de blog, la compañía escribió:
Nuestro modelo único proporciona traducciones a pedido que permiten a las personas que hablan diferentes idiomas comunicarse de manera más efectiva.
Meta no es la única empresa que desarrolla modelos de traducción basados en IA. Amazon, Microsoft, OpenAI y Google están trabajando en servicios de traducción de IA comerciales o de código abierto. Mozilla creó Common Voice, una gran base de datos multilingüe de voces que se puede utilizar para entrenar algoritmos de reconocimiento de voz automático.
Meta advirtió que SeamlessM4T podría ser propenso a algunas sesgos. Tiende a “generalizar a formas masculinas cuando se traduce de términos neutrales” y funciona mejor cuando se traduce de la referencia masculina (por ejemplo, sustantivos como “él” en inglés) para la mayoría de los idiomas.
Suscríbete a nuestro Canal de Telegram para no perderte ninguna noticia. |
No te pierdas todos los Lanzamientos de Agosto para este año. |
[tribe_this_week]