Mistral AI lance Mistral Large, un modèle multilingue qui rivalise avec GPT-4, et s'allie à Microsoft

Mistral AI lance un nouveau modèle, baptisé "Mistral Large", dédié au raisonnement de haut niveau pour des tâches complexes. Avec lui, la start-up se rapproche des performances du modèle GPT-4 d'OpenAI. En parallèle, elle signe un partenariat avec Microsoft pour la commercialisation de ce modèle sur Azure AI, et pour le développement de futurs modèles dédiés notamment au secteur public européen.

Partager
Mistral AI lance Mistral Large, un modèle multilingue qui rivalise avec GPT-4, et s'allie à Microsoft
(au centre) Arthur Mensch, co-fondateur et CEO de Mistral AI, déclare : "Nous sommes fiers de dévoiler aujourd’hui Mistral Large, quelques mois seulement après le lancement de Mixtral 8x7B".

Mistral AI poursuit son objectif de s'imposer comme la référence de l'intelligence artificielle générative. La start-up française fait un pas de plus dans cette voie avec sa dernière annonce en date : "Mistral Large", un grand modèle de langage capable d'"atteindre des capacités de raisonnement de très haut niveau".

Des performances proches de GPT-4

Ce modèle "commercial" n'est pas ouvert : la start-up compte le vendre à de grandes entreprises. Ce n'est en soit pas surprenant, il faut bien qu'elle génère des profits. Et il a de quoi séduire. Il atteint, sur la série de benchmarks couramment utilisés, des performances qui égalent presque celles de GPT-4.

Selon la start-up, ce modèle – dévoilé quelques mois seulement après le modèle ouvert Mixtral 8x7B – "possède des capacités de raisonnement uniques, maîtrise le code et les mathématiques, et parle couramment cinq langues (français, anglais, allemand, espagnol et italien) conformément à l'engagement de Mistral AI de promouvoir les spécificités culturelles et linguistiques de l’intelligence artificielle générative". Mistral Large peut également traiter des centaines de pages de documents en un seul essai.

Mistral AI performances

Ci-dessus, une comparaison de GPT-4, Mistral Large (pré-entraîné), Claude 2, Gemini Pro 1.0, GPT-3.5 et LLaMA 2 70B sur MMLU (Measuring massive multitask language understanding), fournie par Mistral AI.

Le Chat, un assistant conversationnel multilingue

Dans une démarche pédagogique, Mistral AI a également dévoilé "Le Chat" (en référence à l'animal, jouant sur le double sens avec l'anglais "to chat") qui n'est autre qu'un assistant conversationnel qui s'interface avec ses LLMs (comme ChatGPT avec GPT-3 ou 4). Disponible dès aujourd’hui en accès bêta pour les premiers clients de Mistral AI, cet assistant multilingue sera bientôt utilisable par toutes les entreprises, "avec des mécanismes de modération fine et des capacités d'auto-déploiement", promet la start-up.

Un partenariat stratégique avec Microsoft

L'autre grande annonce est la signature par Mistral AI d'un partenariat pluriannuel avec Microsoft pour la commercialisation de ses modèles sur Azure AI. La start-up avait déjà mis ses modèles ouverts à disposition sur Azure en novembre et sur Google Cloud au mois de décembre, mais Microsoft devient ainsi son premier "revendeur".

Le partenariat se décompose en trois pans. D'abord, l'accès de Mistral AI à l'infrastructure de calcul haute performance de Microsoft pour l'entraînement et l'inférence de ses modèles de pointe. De quoi peut-être alléger ses dépenses en GPU, difficiles à maintenir très longtemps pour une start-up face aux titans du cloud.

Ensuite, la commercialisation à grande échelle, avec une disponibilité sous forme de Model-as-a-Service dans Azure AI Studio. Les clients Azure pourront utiliser Mistral Large dans son interface cloud native, avec des crédits Azure, et disposeront d’un accès support direct à l'équipe technique de Mistral AI. De premiers clients bêta-testent déjà le modèle depuis quelques semaines.

Et enfin, une collaboration à titre exploratoire pour l'entraînement de modèles conçus spécifiquement pour certains clients, dont "des acteurs du secteur public européen". Pour Arthur Mensch, cofondateur et directeur général de Mistral AI, ce partenariat représente "une avancée majeure dans notre engagement de rendre l'IA de pointe accessible à tous".

SUR LE MÊME SUJET

Sujets associés

NEWSLETTER L'Usine Digitale

Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Votre demande d’inscription a bien été prise en compte.

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes...

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

CHERCHE TALENTS NUMERIQUE

Les formations USINE DIGITALE

Toutes les formations

ARTICLES LES PLUS LUS