Citant le traducteur "Babel Fish" issu de l'œuvre de science-fiction The Hitchhiker's Guide to the Galaxy, Meta a dévoilé le 22 août un modèle d'intelligence artificielle capable de comprendre jusqu'à 100 langues. Multilingue et multimodal, cet outil intitulé SeamlessM4T est accessible publiquement et gratuitement à des fins de recherche, tout comme la base de données SeamlessAlign sur laquelle il repose.



Considérant qu'"il est de plus en plus important de pouvoir communiquer et comprendre des informations dans n'importe quelle langue", à l'heure d'un monde interconnecté, les ingénieurs de Meta ont entraîné le traducteur sur des centaines de milliers d'heures de conversations orales dans différentes langues.



Le résultat est un outil alimenté par l'intelligence artificielle capable d'assurer une traduction tous azimuts : de la parole vers le texte (près de 100 langues d'entrée et de sortie), du texte vers la parole (près de 100 langues d'entrée et 35 de sortie), du texte vers le texte (près de 100 langues d'entrée et de sortie) et de la parole vers la parole (près de 100 langues d'entrée et 36 de sortie).

La suite logique de nombreux projets

Si Meta considère ce déploiement comme "une avancée significative", c'est parce que l'entreprise californienne, qui développe des réseaux sociaux mondialisés, travaille de longue date sur la traduction automatisée. L'an dernier, elle a ainsi donné des nouvelles de son projet Universal Speech Translator en traduisant en anglais du hokkien, un dialecte utilisé en Chine qui n'a pas de forme écrite.



En l'espace de quelques mois, Meta a également développé No Language Left Behind, un traducteur du texte vers le texte capable de comprendre 200 langues, la base de données speech-to-speech SpeechMatrix, et Massively Multilingual Speech, un outil capable de reconnaître à l'oral et synthétiser plus de 1100 langues. "SeamlessM4T s'appuie sur les conclusions de tous ces projets", les rassemblant tous en un outil surpuissant, ont écrit les équipes d'IA de Meta dans une note de blog publiée le 22 août.



L'annonce de SeamlessM4T suit également la récente stratégie open source de Meta, bien que son traducteur ne soit à ce stade pas accessible pour un usage commercial. La firme de Mark Zuckerberg a en effet annoncé, ces dernières semaines, le déploiement de modèles d'intelligence artificielle ouverts comme son LLM Llama 2 ainsi que MusicGen et AudioGen. Objectif : démocratiser ses outils et les perfectionner grâce à leurs utilisateurs.