Los nuevos modelos de IA con Voz Multilingüe usaron grabaciones de la Biblia para entrenarse. El adelanto se comparte como software de código abierto.
La empresa tecnológica Meta -fundadora de Facebook- ha desarrollado modelos de inteligencia artificial capaces de identificar más de 4.000 idiomas y reconocer 1.100 de ellos hablados en voz alta, basándose en audios grabados de la Biblia.
El adelanto implica una mejora sensible en el reconocimiento de idiomas hablados, sumando 40 veces más que cualquier tecnología anterior conocida. “Es un paso importante para preservar las lenguas que corren el riesgo de desaparecer”, dice la empresa dueña de Facebook e Instagram.
Sus modelos Massively Multilingual Speech (MMS) tienen como objetivo “facilitar a las personas el acceso a la información y el uso de dispositivos en su idioma preferido”.
Meta los está poniendo a disposición en software de acceso abierto, para que “otros en la comunidad de investigación puedan aprovechar nuestro trabajo”.
El libro más traducido y locutado del mundo
Hay alrededor de 7.000 idiomas en el mundo, pero los modelos de reconocimiento de voz existentes cubren solo alrededor de 100 de ellos de manera integral.
Para superar esto y entrenar el modelo, crearon dos conjuntos de datos con textos religiosos cuyas traducciones y grabaciones de audio de personas que los leen están disponibles públicamente en diferentes idiomas.
Uno de los conjuntos contiene grabaciones de audio del Nuevo Testamento y su texto correspondiente extraído de Internet en 1.107 idiomas, lo que proporcionó un promedio de 32 horas de datos por idioma; el otro contiene grabaciones sin etiqueta de varias otras lecturas religiosas cristianas.
Sin embargo, enfatizan que “si bien el contenido de las grabaciones de audio es religioso, nuestro análisis muestra que esto no sesga el modelo para producir un lenguaje más religioso”.
En el futuro, Meta espera “aumentar la cobertura de MMS para admitir aún más idiomas y también abordar el desafío de manejar dialectos, que a menudo es difícil para la tecnología de voz existente”.
Publicado en: PROTESTANTE DIGITAL – Ciencia – Meta usa la Biblia para que la IA pueda reconocer más de 4.000 idiomas