Recevez chaque jour toute l'actualité du numérique

x

En Chine, Sogou crée des voix plus naturelles pour les livres audio grâce à l'intelligence artificielle

Après les présentateurs télé et même un juge virtuel, le moteur de recherche chinois Sogou va proposer des avatars d’auteurs de romans pour les livres audio, en partenariat avec Zhangyue Technology.
Twitter Facebook Linkedin Flipboard Email
×

En Chine, Sogou crée des voix plus naturelles pour les livres audio grâce à l'intelligence artificielle
En Chine, Sogou crée des voix plus naturelles pour les livres audio grâce à l'intelligence artificielle © Sogou

Le marché des livres audio est en plein boom en Chine. Pour répondre à la demande de façon qualitative, le moteur de recherche chinois Sogou (filiale de Tencent) veut y appliquer des techniques d'intelligence artificielle. Il a annoncé le 9 août, lors de la conférence China Online Literature (COL+), le projet d'avatar professionnel intelligent Yanny. Ce dernier combine des technologies de synthèse vocale, de reconnaissance d'image et de capacités de prédiction qui lui permettent de créer des avatars réalistes.

 

Des voix synthétiques plus naturelles

Preuve de son efficacité : la keynote de la conférence COL+ a elle-même été présentée par un avatar utilisant Yanny. L'intérêt d'appliquer l'intelligence artificielle au monde du livre audio est d'améliorer la qualité de la lecture. En effet, la plupart des liseuses proposent déjà une option de synthèse vocale pour n'importe quel ouvrage, mais la qualité laisse à désirer. Les clients préfèrent écouter les voix d’auteurs, d'acteurs ou d’autres personnalités lorsqu’ils "consomment" un livre.

 

Mais créer des livres audio lus par des professionnels, voire par les auteurs eux-même, est long et coûteux. La synthétisation de leur voix est une solution beaucoup plus économe et qui peut être appliquée à grande échelle. Pour mettre cette technologie en application, Sogou a également annoncé un partenariat avec Zhangyue Technology, qui commercialise la liseuse électronique iReader. Dans un premier temps, ce sont deux auteurs chinois, Yue Guan et Bu Xin Tian Shang Diao Xian Bing, qui seront représentés par des sosies numériques. La date de disponibilité de ce service n'a pas été précisée.

 

De nombreux projets d'avatars réalistes

Ce n'est pas le premier projet de ce type mené par Sogou. L'entreprise avait déjà introduit en 2018, aux côté de l’agence de presse gouvernementale Xinhua, deux présentateurs télé virtuels dotés de voix et d'expressions proches de celles d’êtres humains, et qui officient encore régulièrement sur le site Internet de Xinhua.

 

L’entreprise, qui affirme être le deuxième moteur de recherches sur mobile en Chine, a également profité de COL+ pour annoncer la participation d’une animatrice virtuelle, Xin Xiaomeng, aux célébrations du 70e anniversaire de la fondation de la République populaire de Chine, en octobre prochain. Et en juin, la société avait créé le premier juge virtuel au monde, qui permet de résoudre des litiges en ligne en temps réel.

 

Enfin, elle a noué un partenariat avec Abu Dhabi Media pour lancer le premier présentateur virtuel parlant l'arabe. "Nous sommes convaincus que nos avatars professionnels permettront des interactions plus naturelles entre l'homme et la machine, précise-t-elle. Nous continuerons à nous concentrer sur l’intelligence artificielle appliquée au langage".

Réagir

* Les commentaires postés sur L’Usine Digitale font l’objet d’une modération par l’équipe éditoriale.

 
media