Actualité web & High tech sur Usine Digitale

Recevez chaque jour toute l'actualité du numérique

x

[Build 2019] Cortana peut maintenant tenir une conversation pendant plusieurs minutes sans en perdre le fil

Vidéo Les assistants vocaux vont-ils enfin devenir une véritable interface utilisateur ? C'est la promesse de Microsoft avec une nouvelle technologie conversationnelle qui sera bientôt intégrée à tous ses services d'intelligence artificielle : Cortana, Bot Framework, Cognitive Services, etc. Dans une vidéo, Cortana parvient à tenir une conversation complexe sans en perdre le fil pendant près de 3 minutes. Du jamais vu jusqu'ici.
Twitter Facebook Linkedin Flipboard Email
×

Cortana peut maintenant tenir une conversation pendant plusieurs minutes sans en perdre le fil
[Build 2019] Cortana peut maintenant tenir une conversation pendant plusieurs minutes sans en perdre le fil © Microsoft

Microsoft ne délaisse pas Cortana, son assistant personnel. Si l'entreprise s'est plus ou moins détournée du marché grand public pour la voix, elle entend bien faire de Cortana un must en entreprise. Cela passe entre autres par la capacité de tenir des conversations plus longues et plus naturelles.

 

A sa conférence Build 2019, ce 6 mai, Microsoft a présenté un exemple impressionnant d'une cadre gérant tout son planning à l'oral de cette manière. Une performance inégalée à l'heure actuelle. Elle est rendue possible par la technologie de Semantic Machines, start-up rachetée en mai 2018.

 

Vers de vraies conversations avec les assistants vocaux

Et ce n'est pas trop tôt. Les géants technologiques (Apple, Google, Amazon, Microsoft...) ont fait grand cas des assistants vocaux ces dernières années, et on ne peut nier qu'Amazon Alexa, par exemple, possède un nombre impressionnants de "skills". Ils peuvent donner la météo, l'état du trafic routier, les résultats sportifs, jouer de la musique, vérifier un agenda, traduire un mot, envoyer un message, raconter des blagues... Mais ils sont incapables de tenir une conversation naturelle. Au mieux, certains peuvent dans le meilleur des cas comprendre qu'une requête en suit une autre, mais ça ne va pas plus loin. Cela limite mécaniquement leur utilisation dans la vie de tous les jours.

 

 

Dans la vidéo servant d'exemple, l'assistant est capable de prendre en compte le temps qu'il va faire un jour donné pour décider que réserver une table dans un patio n'est pas une bonne idée. Il peut interagir avec l'utilisateur pour l'aider à résoudre un conflit, ou à jongler entre plusieurs meetings urgents.

 

Du machine learning pour remplacer les compétences préprogrammées

Réussir à suivre ce genre de requêtes complexes est particulièrement difficile pour les assistants car chaque compétence est programmée manuellement dans un but spécifique, et rarement par les mêmes personnes. De plus, il est très difficile, voire impossible, d'anticiper tous les scénarios de requêtes, ce qui contraint l'utilisateur à formuler ses demandes de manière bien précise.

 

La technologie de Semantic Machines contourne ce problème en appliquant des méthodes de machine learning aux compétences elles-mêmes. Il apprend à relier les demandes et les résultats souhaités à partir d'un entraînement humain (par exemple faire une recherche de résultats sportifs) et peut ensuite l'appliquer à tous les sports, toutes les dates, etc. Il n'est donc plus nécessaire de préprogrammer chaque scénario.

 

Le système est par ailleurs capable de généraliser une demande à partir de contextes qu'il connaît vers de nouveaux contextes. Cela lui permet de s'adapter face à une demande inconnue. Il peut par exemple appliquer sa méthode de recherche de résultats sportifs à la consultation de la météo. C'est une approche très différente de celle employée par les assistants à l'heure actuelle, qui repose sur des mots-clés.

 

Une technologie aussi appliquée au Bot Framework

C'est cette flexibilité et cette adaptabilité qui permet au système de tenir de longues conversation sans en perdre le fil, combinées à une "mémoire" des requêtes précédentes (qui contextualise chaque nouvelle demande) et à la capacité de parler et d'écouter en même temps pour diminuer les temps d'attente. La finalité de cette vision est la disparition du concept de "compétences" isolées pour se tourner vers un système pouvant agréger et mélanger des données provenant de nombreuses sources différentes.

 

Et tout cela ne se limite pas qu'à Cortana. Microsoft a l'intention d'intégrer cette technologie à l'ensemble de ses produits et outils conversationnels. On la retrouvera dans Office 365 par exemple, mais aussi au sein du Bot Framework. Lors de la conférence, Microsoft a révélé que 3000 nouveaux bots sont créés chaque semaine à l'aide de ses outils. Reste à savoir quand les développeurs pourront mettre la main dessus. Microsoft n'a pour le moment pas annoncé de date de sortie.

Réagir

* Les commentaires postés sur L’Usine Digitale font l’objet d’une modération par l’équipe éditoriale.

 
media
Suivez-nous Suivre l'Usine Digitale sur twitter Suivre l'Usine Digitale sur facebook Suivre l'Usine Digitale sur Linked In RSS Usine Digitale