OpenAI dégaine de nouveaux modèles qui raisonnent mieux mais hallucinent plus
A la Une
OpenAI a travaillé d'arrache-pied ces derniers mois. Il y a d'abord la mise au placard de GPT-4 : après deux ans de bons et loyaux services, il sera remplacé par GPT-4o le 30 avril. Lancé en mai 2024, ce dernier est capable de traiter le texte, les images et l'audio de manière native. Ce changement intervient dans un contexte général de renouvellement des modèles chez OpenAI. Autres petits nouveaux, GPT-4.1, GPT-4.1-mini et GPT-4.1-nano sont désormais disponibles dans l'API.
Les modèles o3 et o4-mini, derniers de la série o, viennent aussi s'ajouter à la longue liste de modèles de raisonnement d'OpenAI. Leur différence ? Ils peuvent utiliser et combiner tous les outils intégrés à ChatGPT : recherche web, analyse de fichiers ou de données avec Python, raisonnement poussé sur des entrées visuelles et même génération d’images. Leur plus gros souci ? Les hallucinations. "Le modèle o4-mini est moins performant que o1 et o3 dans notre évaluation PersonQA", admet OpenAI, justifiant cela par "moins de connaissances". Seulement voilà, o3 – pourtant jugé meilleur – souffre également des mêmes maux. Et les causes restent encore inconnues.
Dans l'actu
Meta impose un opt-out pour entraîner son IA avec les données des utilisateurs européens. Un mois après le lancement de son chatbot dans l'UE, le géant des réseaux sociaux débute l'utilisation des données publiques disponibles sur ses plateformes pour entraîner "Meta AI". Sont concernées les publications et les commentaires publics ainsi que "les interactions des utilisateurs avec l’IA de Meta, telles que les questions et les requêtes" des utilisateurs de plus de 18 ans. Ni les messages privés, ni les publications des mineurs ne sont concernés (encore heureux !). Un formulaire d'opposition est mis à la disposition des utilisateurs réfractaires.
L'Union européenne injecte 140 millions d'euros dans "les technologies clés". Dans le cadre de son programme "Pour une Europe numérique", la Commission européenne lance quatre appels à projets pour un montant de 140 millions d'euros. L'objectif est de déployer des technologies clés, telles que l'IA générative, les semi-conducteurs ou encore le quantique. Mauvais élève, l'UE est par ailleurs à la traîne sur le sujet de la gouvernance liée à l'IA. Les meilleurs restent les entreprises nord-américaines qui disposent d'équipes dédiées plus importantes que les entreprises européennes. C'est le constat qui ressort de l'AI Governance Profession Report 2025, publié par l'International Association of Privacy Professionals (IAPP) et Credo AI.
Secoué par les restrictions d'exportation, Nvidia promet de construire des serveurs d'IA aux Etats-Unis. Face à l'administration Trump, le géant manque de flancher. Après avoir tenu tête pendant des années en développant des puces "moins performantes" spécifiquement à destination du marché chinois, la firme américaine va finalement devoir lâcher ses H20 - représentant 5,5 milliards de dollars de charges. Sans se démonter, Nvidia prévoit d'investir 500 milliards de dollars sur les quatre prochaines années pour produire des serveurs d'IA sur le sol américain avec TSMC. Le géant américain mise aussi sur l'adoption de ses super puces GB200 pour faire remonter sa cote. En s'appuyant sur CoreWeave, ses serveurs optimisés pour les applications d'IA font la joie de premiers clients clés, à l'instar de Cohere, IBM et Mistral AI.
Google embarque Claude, l'IA d'Anthropic, dans sa suite Workspace. Deux fonctionnalités font leur apparition avec l'assistant IA développé par Anthropic. D'une part, une fonctionnalité de recherche, de l'autre l'intégration à Google Workspace connectant ainsi e-mails, agenda et documents à Claude. Ce dernier peut ainsi effectuer des recherches à la fois dans un environnement de travail interne et sur le web. Ainsi, rassembler les notes de réunion de la semaine dernière, identifier les actions à mener dans les échanges d'e-mails de suivi, rechercher des documents, sont autant d'actions que Claude peut assurer. De quoi faire sérieusement de l'ombre à OpenAI et ChatGPT.
Databricks s'offre Fennel et sa plateforme d'ingénierie des données. Après trois ans d'aventure consacrés à automatiser et à simplifier la création de bonnes données pour entraîner et alimenter les modèles d’IA, l'équipe de Fennel rejoint les rangs de Databricks et poursuivra le développement de sa plateforme au sein de sa branche ingénierie. Leur ambition reste la même : "permettre aux entreprises et aux équipes de toute taille d'exploiter l'apprentissage automatique en temps réel pour créer des produits agréables pour leurs clients".
L'image de la semaine
Votre politesse pourrait coûter très cher à la planète. (Généré par GPT-4o).
Les entretiens de la semaine
"L'IA est fondamentalement meilleure pour les défenseurs que pour les attaquants", assure Vasu Jakkal, Microsoft. La patronne de la sécurité chez Microsoft en est persuadée : l'intelligence artificielle va redonner l'avantage aux entreprises face aux cyberattaquants. Un renversement de situation rendu possible par les quantités de données dont disposent les défenseurs, et grâce auxquelles les agents IA peuvent s'améliorer en permanence.
"Nous sommes les seuls à avoir toutes les modalités disponibles", promet Warren Barkley, Google Cloud. A l'occasion de l'événement Google Cloud Next à Las Vegas, L'Usine Digitale a rencontré Warren Barkley, qui dirige les équipes produit de Vertex AI (IA, ML, LLM, plateformes, agents). Avec, nous sommes revenus sur les différentes annonces faites, notamment l'intégration du modèle de génération de musique Lyria. Pour ce mélomane, c'est également l'occasion d'aborder l'impact de ces modèles d'IA générative sur les métiers de la création et la manière d'appréhender au mieux ces changements.
Les applications métier
Secteur public – La métropole du Grand Paris lance un chantier d'ampleur pour transformer ses services publics avec l'IA
L'intelligence artificielle s'immisce partout, même dans les services publics français ! Forte de plusieurs expérimentations réussies, la Métropole du Grand Paris se dote d'une stratégie IA qui s'adresse aussi bien aux agents qu'aux administrés des communes.
Commerce – Rakuten accélère encore sur l’IA avec un centre technologique européen à Paris
Le groupe japonais inaugure son Rakuten Tech Center Europe à Paris, un hub technologique visant à stimuler l'innovation et renforcer ses activités en intelligence artificielle sur le marché européen. Le site accueille cinquante salariés spécialisés dans l’IA, les data centers, le cloud computing, le développement des marketplaces et le support informatique. Des membres du centre d’incubation dédié à la recherche en IA, Rakuten Institute of Technology, ont également rejoint les bureaux de ce centre technologique.