La pépite française Gladia lance son modèle speech-to-text Solaria

Avec le lancement de Solaria, un modèle d'IA pensé pour briser les barrières linguistiques à l’échelle mondiale, la start-up française ambitionne de proposer des outils qui permettent à chacun de communiquer plus facilement, enlevant la barrière de la langue. Plus d'une centaine de langues sont prises en charge, avec un taux de précision de l'ordre de 94% pour les plus courantes.

Partager
La pépite française Gladia lance son modèle speech-to-text Solaria

La start-up française Gladia donne de la voix à l'intelligence artificielle. "Alors que l’IA continue de redéfinir les interactions entre les entreprises et leurs clients, la capacité à transcrire instantanément et avec précision la parole dans différentes langues n’est plus un luxe, mais une nécessité", affirme-t-elle. Pour répondre à cet impératif, elle a développé un modèle speech-to-text appelé Solaria dont la précision atteint les 94% en anglais et d'autres langues courantes. Un effort de R&D qui fait suite à sa dernière levée de fonds de 16 millions de dollars en octobre dernier.

Un travail de fond effectué sur les langues

Solaria prend par ailleurs en charge plus d'une centaine de langues, est conçu pour capter les nuances les plus subtiles du langage avec une précision quasi humaine. Gladia a effectué un véritable travail de recherche sur le sujet avec la volonté d'être réellement multilingue. Sont ainsi pris en charge bengali, pendjabi, tamoul, ourdou, persan, marathi (marchés à forte population), hébreu, pachto, kazakh, géorgien, mongol (régions clés pour le business, indique-t-elle), créole haïtien, maori, javanais, malgache (nouveaux territoires de l’IA vocale).

Il est également possible pour les utilisateurs de changer de langue naturellement au cours d’un échange avec un code-switching en temps réel. En outre, Solaria propose la traduction instantanée entre toutes les langues prises en charge.

698 ms nécessaires pour générer une transcription complète

Pour parfaire cet outil, il faut qu'il soit également rapide. Avec une latence annoncée de 270 ms, Gladia fait de son outil de transcription en temps réel une référence en la matière. "Que vous développiez des agents vocaux spécialisés dans un secteur ou que vous cherchiez à offrir une expérience client, Solaria vous fournit les fondations nécessaires", promet la start-up. La latence finale - temps nécessaire pour générer une transcription complète une fois que l’utilisateur a fini de parler - est de 698 ms, indique Gladia, "battant la concurrence de plus d’une demi-seconde".

Solaria - Gladia

Le modèle a été développé et entraîné à partir de plusieurs jeux de données, y compris publics tels que Common Voice de Mozilla et Fleurs de Google. "Nous avons également effectué des tests sur des données réelles et anonymisées d’entreprises, issues de centres d’appels, et comparé Solaria aux modèles les plus avancés de chaque concurrent - battant notamment le modèle Nova-3 (anglais uniquement) de Deepgram avec notre modèle multilingue", annonce fièrement Gladia.

Peu importe le secteur d'activité ou le type de déploiement, Solaria est efficace

Pour s'adapter aux différents secteurs d'activité, Solaria propose des fonctionnalités avancées comme l'entraînement à un vocabulaire personnalisé (termes médicaux, financiers, techniques, etc.), l'adaptation des noms de marque/produits, l'extraction de données clés (numéros de téléphone, adresses e-mail, adresses postales), ainsi que la sensibilité linguistique ajustable (adaptation aux termes techniques, argot, expressions idiomatiques par langue).

Sa solution semble par ailleurs prête à l'emploi, peu importe le type de déploiement prévu. "Solaria est conçu pour répondre aux besoins des déploiements de niveau entreprise" avec une infrastructure multi-région robuste et des options de déploiement dédiées aux États-Unis et en Europe ainsi qu'une sécurité des données de niveau entreprise, conforme aux normes RGPD, HIPAA et SOC 2.

SUR LE MÊME SUJET

Sujets associés

NEWSLETTER L'Usine Digitale

Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Votre demande d’inscription a bien été prise en compte.

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes...

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

CHERCHE TALENTS NUMERIQUE

Les formations USINE DIGITALE

Toutes les formations

ARTICLES LES PLUS LUS