Amazon frappe fort avec ses derniers modèles et la croissance exponentielle de Bedrock

Toutes les semaines, recevez l'essentiel de l'actu de l'IA

Partager
Amazon frappe fort avec ses derniers modèles et la croissance exponentielle de Bedrock

A la Une

Amazon a mis les bouchées doubles sur l'IA lors de sa grand-messe annuelle re:Invent 2024. Il se positionne fermement en leader avec 100 nouveaux modèles et surtout 470% de clients en plus pour Amazon Bedrock en 2024. La promesse est simple : aider les entreprises à déployer des modèles d'IA à la vitesse grand V et à un coût réduit, sans perte de qualité et de précision, même quand ils les personnalisent ou implémentent du RAG. Pour soutenir l'image d'un mastodonte présent aux quatre coins du globe, Swami Sivasubramanian, vice-président de l’IA et des données chez AWS, n'hésite pas à lister des clients prestigieux : 123RF, Adobe, Argo Labs, BMW Group, Deloitte, Octus, Palantir, SAP, Shutterstock, Symbeo, Tenovos et Zendesk.

Parmi les modèles disponibles sur Bedrock on trouve Nova, une famille de modèles développés en interne qui fait déjà sensation. Ils sont au nombre de 6 avec chacun une spécificité : texte, multimodal, génération d'images et de vidéos "de qualité studio", les utilisateurs sont servis. Leurs performances ? Egales – voir meilleures – à celles des modèles d'Anthropic, Google, Microsoft ou encore d'OpenAI, à en croire le géant du cloud. Autre atout de taille : les modèles Nova ont été optimisés pour des applications agentiques qui nécessitent d'interagir avec les systèmes et les données propriétaires d'une entreprise via plusieurs API. Microsoft et ses Copilots n'ont qu'à bien se tenir !

Dans l'actu

OpenAI lance un abonnement ChatGPT à 200 dollars par mois, soit dix fois plus que l’offre actuelle - qui ne disparaît pas. Baptisé ChatGPT Pro, cet abonnement offre un "accès illimité" aux différents modèles proposés par OpenAI. Il permet aussi d'utiliser une version survitaminée de son dernier modèle o1, qui "utilise davantage de puissance de calcul pour réfléchir et fournir de meilleures réponses aux problèmes les plus complexes". On l'aura compris : dégager des revenus est la priorité pour la start-up de Sam Altman, le trou de cinq milliards de dollars estimé pour cette année étant à boucher au plus vite.

Llama 3.3 70B : Meta promet des performances égales à Llama 3.1 405B à une fraction du coût. On n'arrête plus Meta. Llama 3.1 est sorti en juillet dernier. Llama 3.2 fin septembre. Llama 3.3 la semaine dernière. Capable de rivaliser avec Llama 3.1 70B, Gemini Pro 1.5, GPT-4o, Claude 3.5 Sonnet ou encore Amazon Nova Pro (à peine sorti et déjà détrôné), le modèle aux 70 milliards de paramètres et à la fenêtre contextuelle de 128 000 tokens est "optimisé pour les instructions textuelles". Mais, ce qui impressionne davantage, ce sont ses résultats comparés à ceux obtenus par Llama 3.1 405B jusqu'alors indétrônable : similaires pour un dixième du coût d'entrée et "avec une inférence rentable, réalisable localement sur des postes de travail courants de développeurs", assure Meta.

Avec son modèle d'IA Genie 2, Google s'attaque aux mondes virtuels 3D. La semaine a été chargée, Amazon s'étant fait quelque peu voler sa couverture médiatique par un autre ponte de l'IA : Google. Il a d'abord annoncé Genie 2, nouvelle référence en matière de création d'environnement 3D interactif et d'entraînement d'agents IA avec des applications dans des domaines tels que les jeux vidéo et la simulation. Le modèle peut créer un monde interactif cohérent pendant environ 60 secondes. Veo, quant à lui, est capable de générer des vidéos réalistes à partir de texte ou d'images statiques. Déjà disponible sur Vertex AI, il promet de bousculer les codes de la production vidéo et d'en donner les clés aux non-initiés. Enfin, Google joue les météorologues avec GenCast, qui est dédié aux prévisions météorologiques. Il se démarque par une approche probabiliste et des prévisions sur 15 jours générées en 8 minutes sur une seule puce TPU.

Toujours dans les mondes virtuels 3D, c'est World Labs, la start-up de Fei-Fei Li qui se démarque avec son premier système d'IA dédié. Après avoir levé 230 millions de dollars en septembre, World Labs lève le voile sur les prémices de son système qui se concentre sur la génération de mondes virtuels en 3D à partir d'une seule image ou d'un prompt textuel. "La plupart des outils GenAI créent du contenu 2D comme des images ou des vidéos. Générer en 3D améliore le contrôle et la cohérence. Cela va changer la façon dont nous faisons des films, des jeux, des simulateurs et d'autres rendus numériques de notre monde physique", promet la start-up. Si pour l'heure, le système est en accès limité, World Labs propose es démos sur son site où l'utilisateur peut manipuler à souhait ces fameux mondes virtuels grâce à un contrôle complet de la caméra, comme dans un jeu vidéo.

L'hallucination de la semaine

L'année 2024 a-t-elle été une bonne année pour les start-up dans le monde ? Claude Haiku répond : "L'année a été complexe pour les start-up mondiales, marquée par un ralentissement significatif des investissements par rapport aux années précédentes. Malgré un contexte économique tendu, certains secteurs comme l'IA ont continué d'attirer massivement les capitaux, avec plus de 50 milliards de dollars investis dans les entreprises technologiques de ce domaine. Anthropic ou OpenAI ont particulièrement brillé. Le marché européen a montré une résilience intéressante, notamment en France où l'écosystème des start-up a maintenu une dynamique de croissance, soutenu par des politiques publiques favorables à l'innovation. Les levées de fonds ont été plus sélectives, privilégiant des projets solides et rentables plutôt que la croissance à tout prix."

Les applications métier

Aéronautique – Comment Air France-KLM veut enfin décoller sur les sujets de la data et l'IA générative

Avec 100 000 clients transportés chaque jour à bord de plus de 1000 vols, Air France-KLM peut se targuer d'être assis sur une mine d'or de données. Décidé à prendre le sujet de l'exploitation des informations à bras le corps, le groupe s'est tourné vers Google pour embarquer ses solutions cloud, data et IA dans ses différents services. Cap sur de premières expérimentations.

Défense – Dès 2026, la version F4 du Rafale de Dassault va utiliser l'IA pour désigner des cibles au sol

Après huit ans de travaux de recherche, Thales est parvenu à injecter une dose d’intelligence artificielle dans le pod Talios de la nouvelle version du Rafale. Cet équipement sert à la reconnaissance des objets et à la désignation laser. Cette innovation va équiper la future version F4 du chasseur-bombardier français, prévue pour 2026.

Consommation – Ce que l’IA générative peut apporter à la relation client : l'exemple de Castorama

Avec des outils capables de conseiller les clients en ligne, de personnaliser les échanges et d’assurer un service client 24 h/24, l’IA générative va transformer la façon dont enseignes et consommateurs interagissent.

Médical – Grâce à son implant, la start-up Neurinnov redonne de la préhension aux tétraplégiques

À l'aide d'une électrode multi-contacts, d'une puce électronique et d'un système de commande externe, la start-up Neurinnov restaure des fonctions de préhension chez des personnes tétraplégiques. La pépite française, issue de travaux de l'Inria, espère implanter durablement de premiers patients en 2026.

Distribution – Bricorama stoppe "pour une durée indéterminée" son service d'assistance à l'achat de peinture piloté par IA

L'entreprise de bricolage, il y a un peu plus d’un an, expérimentait un service d’assistance à l’achat de peinture, piloté par intelligence artificielle. Baptisé pAInt, ce service se trouve désormais mis en pause, en cette fin d’année 2024, et ce "pour une durée indéterminée", explique-t-on du côté de l’enseigne des Mousquetaires.

Et aussi

Sujets associés

NEWSLETTER L'Usine Digitale

Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Votre demande d’inscription a bien été prise en compte.

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes...

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

CHERCHE TALENTS NUMERIQUE

Les formations USINE DIGITALE

Toutes les formations