Actualité web & High tech sur Usine Digitale

Le deep learning est la clé du futur de l'analyse vidéo

Twitter Facebook Linkedin Google + Email
×

Tribune Les quantités de données vidéo ont explosé ces dix dernières années avec la banalisation des caméras sur les smartphones, le succès des caméras d'action et l'avènement de plateformes d'hébergement massives comme YouTube ou Dailymotion. Mais ces masses de données sont difficilement exploitables car leur analyse prend beaucoup trop de temps. La solution a ce problème est son automatisation, qui a fait de rapides progrès ces dernières années grâce à l'essor du deep learning.

Le deep learning est la clé du futur de l'analyse vidéo
Le deep learning est la clé du futur de l'analyse vidéo

La vidéo connaît un succès foudroyant, et je ne parle pas simplement de la hausse inéluctable du nombre de vidéos de chatons. Nous sommes entourés d’une myriade de dispositifs intelligents qui enregistrent en continu des quantités astronomiques de données sur ce que nous faisons et la façon dont nous vivons. Fin 2014, IHS Technology a estimé que plus de 245 millions de caméras opérationnelles étaient actives à travers le monde, dont 1144 aux dessus des rues de Paris et dès l’année prochaine, 165 nouvelles caméras de vidéoprotection pourraient faire leur apparition.

 

L'explosion du nombre de vidéos rend leur analyse impossible par les moyens traditionnels

Grâce aux caméras intelligentes, aux dispositifs CCTV et même aux drones équipés de caméras intelligentes, nous sommes désormais capables de réaliser des vidéos à un rythme et une échelle sans précédent, et générons ainsi des volumes colossaux de contenus riches en données. La vidéo est utilisée dans de multiples secteurs, notamment le jeu vidéo, l’application des lois, la gestion des foules lors des grands événements ou encore la distribution, certains magasins exploitant en effet les cartes thermiques pour comprendre et améliorer l’expérience d’achat de leurs clients.

 

Au vu du volume considérable de vidéos produites à l’heure actuelle, il nous est impossible de traiter manuellement les données générées de façon efficace. Une analyse vidéo intelligente doit être effectuée pour filtrer les données inutiles, suivre les objets en mouvement, détecter les anomalies et générer des alarmes afin que les organismes de réglementation puissent prendre les mesures qui s’imposent.

 

Le deep learning est le futur de l'analyse vidéo automatisée

Autrefois, ce type d’analyse vidéo automatisée était purement inenvisageable d’un point de vue technologique. Mais aujourd’hui, le secteur bénéficie des technologies de deep learning ("apprentissage profond"), qui permettent désormais de traiter, voire même d’analyser avec précision, de vastes séquences vidéos. Le deep learning, qui consiste à utiliser des réseaux de neurones "profonds" multi-niveaux et sophistiqués pour créer des systèmes capables d’effectuer une reconnaissance de caractéristiques à partir d’un volume considérable de données d’entraînement non étiquetées, a mobilisé d’importants investissements et projets de recherche. 

 

Les spécialistes des données, que ce soit dans le milieu industriel ou universitaire, utilisent des processeurs graphiques (GPU) pour le deep learning car ils permettent d'effectuer un grand nombre de calculs en parallèle. Cela donne lieu à un large éventail d’applications, notamment la classification des images, l’analyse vidéo, la reconnaissance vocale et le traitement du langage naturel.

 

La reconnaissance faciale automatisée permet de renforcer la sécurité

Dans le secteur de l’analyse vidéo intelligente, Herta fait partie des sociétés qui s’appuient sur la technologie du deep learning. Grâce à ses solutions, cette société espagnole spécialisée dans la reconnaissance faciale permet à ses clients de suivre et identifier instantanément des individus à partir de leurs caractéristiques faciales. Leur technologie est utilisée pour la vidéosurveillance dans une multitude d’applications, telles que la sécurité, la banque, les stades de sport et les centres commerciaux.

 

Utile au secteur de la distribution pour contrer les vols

Prenons l’exemple de la distribution : de nombreux centres commerciaux à travers le monde sont exposés au risque de vol. Il est donc important de disposer d’un système permettant de limiter ce risque. En règle générale, les vols à l’étalage sont commis par un petit groupe de récidivistes. Par conséquent, un système permettant d’identifier ces individus de façon rapide et fiable peut réellement influer sur le nombre de vols perpétrés, ce qui ne sera jamais le cas avec un procédé manuel, la puissance et la rapidité de traitement de l’homme étant bien loin derrière celles d’un ordinateur. En réalité, la plupart des systèmes de reconnaissance faciale utilisés à l’heure actuelle dans la distribution sont si intelligents qu’ils permettent d’informer les agents de sécurité sur leurs téléphones portables dans un délai de sept secondes.

 

Une fiabilité hors du commun pour sécuriser les espaces publics

Les stades, les salles de concerts et les organisateurs d’événements de grande ampleur s’appuient également sur l’analyse vidéo pour assurer la sécurité du public. Autrefois, les individus interdits d’accès aux stades parvenaient malgré tout à entrer car les systèmes de sécurité traditionnels ne permettaient pas de les détecter spécifiquement. Aujourd’hui, grâce aux progrès réalisés en matière de reconnaissance faciale et d’analyse vidéo, le visage de chaque personne peut être scanné, analysé et, si nécessaire, transmis à la sécurité afin que l’entrée lui soit interdite. La technologie a une puissance telle que d’après le National Institute of Standards and Technology américain, les algorithmes actuels de reconnaissance faciale sont 10 fois plus précis que ceux de 2002, et 100 fois plus que ceux de 1995.

 

Une demande en constante augmentation

À l’avenir, la demande en matière d’analyse vidéo intelligente est vouée à augmenter, car de plus en plus de secteurs prennent conscience des avantages qu’elle offre pour leurs applications, mais aussi parce que les systèmes vidéo intelligents s’améliorent et sont capables de détecter et analyser un nombre croissant de comportements.

 

Néanmoins, à mesure que les infrastructures dédiées se développent, la nécessité d’une meilleure intégration des serveurs, capteurs et logiciels augmente également. Personne ne souhaite être contraint de recompiler ou recoder ses applications. Aussi est-il est fondamental que les entreprises qui mettent au point de tels outils travaillent en collaboration afin de mettre au point une plateforme ouverte et intégrée permettant l’interopérabilité de ces solutions.

 

Serge Palaric, vice-président de la division Sales Embedded & OEMs chez NVIDIA Europe
Les avis d'experts et points de vue sont publiés sous la responsabilité de leurs auteurs et n’engagent en rien la rédaction.

Réagir

* Les commentaires postés sur L’Usine Digitale font l’objet d’une modération par l’équipe éditoriale.

media

Les cookies assurent le bon fonctionnement de nos sites et services. En utilisant ces derniers, vous acceptez l'utilisation des cookies.OK

En savoir plus
Suivez-nous Suivre l'Usine Digitale sur twitter Suivre l'Usine Digitale sur facebook Suivre l'Usine Digitale sur Linked In RSS Usine Digitale