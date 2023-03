L’histoire veut que la ruée vers l’or qui a caractérisé le far west américain ait surtout permis d’enrichir les vendeurs de pioches. Alors que les technologies d’intelligence artificielle génératives affolent le secteur de la Tech, il est un fournisseur mieux placé que tout autre pour en profiter : Nvidia.

Le lancement de services cloud dédiés à l’IA générative, baptisés Nvidia AI Foundations et annoncés ce 21 mars 2023 lors de sa conférence GTC, n’est donc pas surprenant. Nvidia s’adresse aux entreprises qui disposent déjà d’une importante masse de données propriétaires, et qui souhaitent mettre au point leurs propres modèles plutôt que de voir leurs contenus cannibalisés par d’autres (Midjourney et Stable Diffusion, pour ne pas les nommer).

Et les clients répondent présent. Adobe, Getty Images, Morningstar, Quantiphi et Shutterstock font partie des entreprises ayant signé pour le service. Adobe a annoncé sa solution en résultant, nommée Firefly, ce jour-même lors de sa conférence Summit.

Picasso, pour l’image, la vidéo et la 3D

Shutterstock a également présenté une initiative visant à entraîner des modèles capables de générer des maquettes 3D à partir de simples requêtes textuelles. Elle s’appuie sur Nvidia Picasso, car deux services sont en réalité proposés au sein d’AI Foundations : Picasso, qui génère des images, vidéos et de la 3D, et NeMo pour le langage.

Ces services seront introduits "dans les mois qui viennent" pour les clients de Shutterstock par le biais d’une intégration au sein de sa boîte à outil Creative Flow. Ils seront aussi disponibles directement sur Turbosquid, une plateforme d’hébergement de maquettes 3D, et seront à terme accessibles depuis la plateforme de conception collaborative Nvidia Omniverse.

Comme pour Adobe, l’idée est à la fois d’accélérer la création d’assets en générant automatiquement des formes ou des textures, mais aussi de simplifier la création de maquettes pour les utilisateurs n’ayant pas de compétence en conception 3D. Shutterstock précise au passage que les artistes contribuant à l’entraînement des modèles d’IA seront rémunérés au travers de son "Contributor Fund".

Quant à Getty Images, autre grande banque d’images, elle collabore là encore avec Adobe pour développer des modèles générant des images à partir de texte, mais aussi des vidéos. Même fonctionnement : les images en résultant auront l’attribution idoine, une licence valable, et les artistes ayant contribué à l’entraînement des modèles seront rémunérés en fonction des revenus générés par les modèles.

NeMo, pour créer des chatbots spécialisés

Pour la partie textuelle, NeMo peut gérer des modèles allant de 8 à 530 milliards de paramètres. Nvidia met en avant la possibilité de définir des domaines de compétences spécifiques et de faire apprendre au modèle à réaliser des tâches données. Surtout, il est possible d’augmenter les modèles en temps réel avec des données propriétaires pour les rendre plus pertinents. Nvidia cite des cas d’usage de chatbot intelligent pour le service client, d’analyse de marché, ou de recherche interne sur les réseaux d’entreprise.

Morningstar, un cabinet de conseil en investissements financiers, est l’un des premiers utilisateurs de NeMo. Il s’en sert pour "collecter des données à valeur ajoutée à partir de grandes quantités de contenus structurés et non structurés", d’après Shariq Ahmad, en charge de la Data Collection Technology chez Morningstar. L’entreprise s’intéresse aussi à la capacité de NeMo d’extraire rapidement les points clés de documents financiers complexes.

Enfin, Quantiphi, une société d’ingénierie spécialisée dans l’IA, utilise NeMo pour développer une solution d’IA générative modulaire qui permettra aux entreprises de créer des grands modèles de langage personnalisés et toujours dotés des informations les plus récentes afin d’augmenter la productivité des employés de bureau.

En accès anticipé pour certains clients

NeMo et Picasso tournent sur DGX Cloud, un service accessible directement depuis un navigateur web. Les développeurs peuvent y accéder à l’aide d’APIs, et une fois que les modèles sont prêts à être déployés, les entreprises peuvent utiliser le service cloud AI Foundations pour traiter les calculs d’inférence.

Ils sont tous deux composés de six éléments distincts : des modèles pré-entraînés (pour les clients ne souhaitant pas en créer de zéro), des frameworks pour le traitement des données, des bases de données de vecteurs, des moteurs d’inférence optimisés, des APIs et un support par des ingénieurs Nvidia pour aider les clients à personnaliser les modèles. Picasso est en "private preview" pour le moment et NeMo en "early access".