Intelligence artificielle : Baidu a triché pour battre Google et Microsoft dans la reconnaissance d'images

Le géant technologique chinois Baidu a faussé ses résultats pour battre Google et Microsoft dans un concours de reconnaissance d'images, l'un des pans les plus prometteurs de l'intelligence artificielle.

Partager
Intelligence artificielle : Baidu a triché pour battre Google et Microsoft dans la reconnaissance d'images
Des exemples d'images que le système de Baidu a pu correctement catégoriser.

Mise à jour : Dans un communiqué de presse datant du 2 juin, les responsables du défi ImageNet ont annoncé avoir détecté un manquement aux règles du concours de la part de Baidu. Entre le 28 novembre et le 13 mai, les chercheurs de l'entreprise chinoise ont créé au moins 30 comptes anonymes avec lesquels ils ont passé le test plus de 200 fois, alors que la limite autorisée est de 2 fois par semaines. Cela inclut plusieurs périodes d'usage intensif, notamment 40 tests en 5 jours du 15 au 19 mars 2015.

Cette technique constitue une tricherie car Baidu a pu optimiser sa performance lors du concours en déterminant à l'avance la meilleure approche à partir de ces nombreux tests. Cela lui a conféré un avantage certain par rapport aux autres compétiteurs. De plus, cela a faussé le but du concours, qui est d'évaluer la performance d'un système capable d'apprendre à reconnaître des images par lui-même. Le résultat de Baidu ne peut donc pas être comparé à ceux obtenus par d'autres équipes comme celles de Google ou Microsoft. De plus, l'équipe d'ImageNet a demandé à Baidu de ne pas passer de nouveaux tests sur leur serveur pour une durée de 12 mois. L'équipe de Baidu a reconnu les faits et amendé sa publication sur le sujet, en affirmant néanmoins son respect de l'intégrité du concours.

Baidu, le titan chinois de la recherche sur Internet, détient le nouveau record de performance en matière de reconnaissance automatique d'images sur la base de données ImageNet. L'information a été rapportée par le Wall Street Journal dans un article du 12 mai. ImageNet regroupe plus d'un million d'images et fait office de benchmark pour les logiciels de vision par ordinateur, l'une des disciplines de l'intelligence artificielle les plus explorées.

Les chercheurs de Baidu ont utilisé un supercalculateur baptisé Minwa, utilisant des réseaux neuronaux, pour organiser les images de la base de données en 1000 catégories prédéfinies. L'identification d'objets dans une image, bien que simple pour l'homme, est un problème complexe pour une machine, comme nous le confiait récemment Eric Horvitz, le directeur du laboratoire de Microsoft Research à Redmond.

"Force brute"

Ce champ de recherche a fait beaucoup de progrès ces dernières années. Microsoft Research a obtenu un taux d'erreur de 4,94 % en février 2015, record battu dans la foulée par Google avec 4,8% et que Baidu vient de battre à nouveau en obtenant un taux de seulement 4,58% d'erreurs. Par comparaison, un être humain entraîné obtient généralement un taux d'erreur d'environ... 5 %. Peut-être le signe qu'il est temps pour les chercheurs de passer à des tâches plus difficiles, comme la détection et la localisation d'objets.

La classification de ces images s'effectue grâce à des algorithmes de Deep Learning, qui analysent et comparent en profondeur de large quantités de données. Comparé aux travaux précédents, les chercheurs de Baidu expliquent qu'ils ont utilisé un modèle plus grand, des images de plus haute résolution et davantage d'exemples. Leur succès est aussi dû à une approche s'appuyant sur une très grande puissance de calcul, qu'ils qualifient eux-mêmes de "force brute". Baidu ne compte d'ailleurs pas s'arrêter là et prévoit de construire un supercalculateur encore plus puissant d'ici 18 mois, qui serait capable d'effectuer 7 millions de milliards (7 billiards) de calculs par seconde.

Julien Bergounhoux

La publication des chercheurs de Baidu sur leurs travaux :

SUR LE MÊME SUJET

Sujets associés

NEWSLETTER L'Usine Digitale

Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Votre demande d’inscription a bien été prise en compte.

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes...

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

ARTICLES LES PLUS LUS