Meta met le paquet sur l'open source avec ses modèles Llama 3.1

Toutes les semaines, recevez l'essentiel de l'actu de l'IA

Partager
Meta met le paquet sur l'open source avec ses modèles Llama 3.1

A LA UNE

Meta met le paquet sur l'open source avec ses modèles Llama 3.1. La firme s'engage à rendre l'IA accessible à tous. C'est en tout cas l'ambition exprimée par son fondateur Mark Zuckerberg dans une lettre ouverte. Persuadé que l'open source est la voie royale pour propager cette techno au plus grand nombre, Meta voit dans sa dernière itération de modèles Llama 3.1 une première réponse. Son modèle phare comporte pas moins de 405 milliards de paramètres, est doté d'une fenêtre contextuelle de 128 000 tokens et peut rivaliser avec nombre de LLM, incluant GPT-4, GPT-4o, et Claude 3.5 Sonnet.

Au-delà de cette version gargantuesque, Llama 3.1 comprend deux autres versions respectivement de 8 et 70 milliards de paramètres. Sans surprise, Meta pousse sur le devant de la scène son modèle le plus massif. La firme le décrit comme "le premier modèle disponible en libre accès qui rivalise avec les meilleurs modèles d’IA en termes de capacités de pointe dans les domaines de la connaissance générale, de l’orientation, des mathématiques, de l’utilisation d’outils et de la traduction multilingue".

Un travail qui a coûté cher : le modèle a été entraîné sur plus de 15 000 milliards de tokens. Pour y parvenir, les équipes de Meta ont optimisé la pile complète d’entraînement et poussé cela sur plus de 16 000 GPU H100, un exploit pour l'entraînement d'un tel modèle à cette échelle. Un nombre ridiculement important quand on sait que la firme s'est constituée une mine d'or de GPU : son infrastructure compte l'équivalent de 600 000 H100 aux dernières nouvelles.

DANS L'ACTU

Mistral AI pousse ses modèles d'IA sur Google Cloud afin d'attirer plus de clients. Le fleuron français poursuit sa stratégie de distribution de modèles. Codestral, Mistral Large 2 et Mistral Nemo rejoignent ainsi la liste des 150 LLM que l'hyperscaler américain propose en accès libre depuis sa plateforme Vertex AI Model Garden. La start-up a plusieurs cordes à son arc pour s'implanter sur le marché de l'IA générative et toucher davantage de clients. Début juillet, Dassault Systèmes a ainsi annoncé la signature d'un partenariat avec Mistral AI pour apporter aux industriels "une intelligence artificielle de pointe dans un environnement de confiance". En parallèle, la jeune pousse a lancé il y a quelques mois sa propre offre de services. Mistral AI veut gagner sa croûte et tous les moyens sont bons.

Ray-Ban connectées : Meta veut investir dans EssilorLuxottica pour renforcer leur partenariat. Le patron du groupe de lunettes franco-italien se dit prêt à accueillir une prise de participation de l'ordre de 5% par Meta sous forme d'achat d'actions sur le marché. Une annonce qui n'a pas manqué de faire réagir les investisseurs : l'action a bondi en Bourse dans la foulée. Via cet investissement, la firme américaine pourrait renforcer son partenariat avec EssilorLuxottica autour des lunettes connectées. Si la première version lancée en 2021 n'avait pas fait mouche, la dernière génération lancée en octobre 2023 – sans écran, mais intégrant un assistant intelligent basé sur Llama 2 – semble en effet avoir remporté un franc succès au point que Meta prépare une troisième génération de lunettes d'ici fin 2025.

OpenAI planche sur un prototype de moteur de recherche baptisé SearchGPT. Google n'a qu'à bien se tenir. Avec son outil SearchGPT, la start-up californienne s'attaque à un marché pour le moins concurrentiel et le géant de la recherche risque de ne pas apprécier l'affront. Si pour l'heure l'outil est disponible uniquement auprès d'un petit nombre d'utilisateurs – incluant des éditeurs de presse avec lesquels OpenAI a conclu des accords ces derniers mois –, il pourrait bien passer rapidement de la phase de test à celle de lancement auprès du grand public et des entreprises.

L'intelligence artificielle fait des émules chez les TPE-PME françaises. Les grands industriels ne sont pas les seuls à s'emparer de l'intelligence artificielle. Les TPE et PME prennent également le sujet au sérieux. Un sondage de la CPME révèle que l'IA est adoptée par plus de la moitié des chefs d'entreprise interrogés. Sont mises en avant les pratiques habituelles telles que la création de contenus, l'analyse de données pour l'aide à la prise de décision, l'automatisation des tâches administratives et la personnalisation des recommandations pour les clients.

Le ministère américain du Commerce publie un outil de mesure des risques inhérents aux LLM. L'Institut national chargé des normes et de la technologie aux Etats-Unis a publié une plateforme de test conçue pour aider les utilisateurs et les développeurs de systèmes d'IA à mesurer comment certains types d'attaques peuvent dégrader les performances d'un modèle. Le logiciel baptisé Dioptra présente toutefois une limitation majeure : il ne fonctionne que sur des modèles qui peuvent être téléchargés et utilisés localement, comme la famille Llama de Meta. De fait, les modèles bloqués derrière une API, comme GPT-4o d'OpenAI, sont interdits à ce stade. Dommage quand on sait que nombre d'entreprises dans le monde utilisent la famille GPT.

L'HALLUCINATION DE LA SEMAINE

Quels pays ont la main sur la production de semi-conducteurs dans le monde ? Le Chat de Mistral (LLM Large 2) répond : "Les principaux pays ayant la main sur la production de semi-conducteurs dans le monde sont Taïwan, avec TSMC comme leader, les États-Unis, avec des entreprises comme Intel et Qualcomm, la Corée du Sud, avec Samsung et SK Hynix, le Japon, avec Toshiba et Renesas, et la Chine, qui investit massivement pour réduire sa dépendance aux importations. L'Europe, bien que moins dominante, possède également des acteurs importants comme STMicroelectronics et Infineon Technologies. Ces pays et entreprises sont essentiels pour la chaîne d'approvisionnement mondiale des semi-conducteurs."

LES APPLICATIONS MÉTIER

Agroalimentaire – Danone signe un contrat pluriannuel avec Microsoft pour intégrer l'IA dans ses activités

Le géant de l'agroalimentaire français veut briller dans le domaine de l'intelligence artificielle. Décidé à embarquer l'ensemble de ses salariés dans cette transformation, Danone signe un accord pluriannuel avec Microsoft. Au-delà de la montée en compétences, l'industriel cible sa chaîne logistique qu'il espère rationaliser au moyen de l'IA.

Automobile – Citroën embarque ChatGPT dans ses véhicules les plus récents

Coup d'accélérateur pour ChatGPT. L'outil phare d'OpenAI s'invite dans les véhicules particuliers et utilitaires de Citroën, et ce dans plus d'une quinzaine de pays. L'assistant est intégré dans le système d’info divertissement du constructeur français grâce au système de reconnaissance vocale et audio de SoundHound.

Retail – Comment Alibaba utilise les JO pour présenter ses innovations

Alibaba, partenaire mondial des Jeux olympiques depuis 2017, utilise l’événement sportif comme vitrine de l’innovation. Chris Tung, chief marketing officer du groupe Alibaba, présente notamment la Wonder Avenue, une animation qui plonge le grand public dans le retail du futur.

Défense – Pour sécuriser les Jeux olympiques, les autorités misent sur les innovations technologiques

Afin de démultiplier leur action et renforcer leur réactivité lors des Jeux olympiques, les forces de l’ordre ont développé diverses innovations technologiques. Lutte anti-drones, vidéoprotection algorithmique, jumeaux numériques... Les outils déployés permettront de couvrir une multitude de menaces.

ET AUSSI

Sujets associés

NEWSLETTER L'Usine Digitale

Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Votre demande d’inscription a bien été prise en compte.

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes...

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

CHERCHE TALENTS NUMERIQUE

Les formations USINE DIGITALE

Toutes les formations