Mistral AI lance Mistral Large, un modèle multilingue qui rivalise avec GPT-4, et s'allie à Microsoft
Mistral AI lance un nouveau modèle, baptisé "Mistral Large", dédié au raisonnement de haut niveau pour des tâches complexes. Avec lui, la start-up se rapproche des performances du modèle GPT-4 d'OpenAI. En parallèle, elle signe un partenariat avec Microsoft pour la commercialisation de ce modèle sur Azure AI, et pour le développement de futurs modèles dédiés notamment au secteur public européen.
Célia Séramour
Mis à jour
26 février 2024
Mistral AI poursuit son objectif de s'imposer comme la référence de l'intelligence artificielle générative. La start-up française fait un pas de plus dans cette voie avec sa dernière annonce en date : "Mistral Large", un grand modèle de langage capable d'"atteindre des capacités de raisonnement de très haut niveau".
Des performances proches de GPT-4
Ce modèle "commercial" n'est pas ouvert : la start-up compte le vendre à de grandes entreprises. Ce n'est en soit pas surprenant, il faut bien qu'elle génère des profits. Et il a de quoi séduire. Il atteint, sur la série de benchmarks couramment utilisés, des performances qui égalent presque celles de GPT-4.
Selon la start-up, ce modèle – dévoilé quelques mois seulement après le modèle ouvert Mixtral 8x7B – "possède des capacités de raisonnement uniques, maîtrise le code et les mathématiques, et parle couramment cinq langues (français, anglais, allemand, espagnol et italien) conformément à l'engagement de Mistral AI de promouvoir les spécificités culturelles et linguistiques de l’intelligence artificielle générative". Mistral Large peut également traiter des centaines de pages de documents en un seul essai.
Ci-dessus, une comparaison de GPT-4, Mistral Large (pré-entraîné), Claude 2, Gemini Pro 1.0, GPT-3.5 et LLaMA 2 70B sur MMLU (Measuring massive multitask language understanding), fournie par Mistral AI.
Le Chat, un assistant conversationnel multilingue
Dans une démarche pédagogique, Mistral AI a également dévoilé "Le Chat" (en référence à l'animal, jouant sur le double sens avec l'anglais "to chat") qui n'est autre qu'un assistant conversationnel qui s'interface avec ses LLMs (comme ChatGPT avec GPT-3 ou 4). Disponible dès aujourd’hui en accès bêta pour les premiers clients de Mistral AI, cet assistant multilingue sera bientôt utilisable par toutes les entreprises, "avec des mécanismes de modération fine et des capacités d'auto-déploiement", promet la start-up.
Un partenariat stratégique avec Microsoft
L'autre grande annonce est la signature par Mistral AI d'un partenariat pluriannuel avec Microsoft pour la commercialisation de ses modèles sur Azure AI. La start-up avait déjà mis ses modèles ouverts à disposition sur Azure en novembre et sur Google Cloud au mois de décembre, mais Microsoft devient ainsi son premier "revendeur".
Le partenariat se décompose en trois pans. D'abord, l'accès de Mistral AI à l'infrastructure de calcul haute performance de Microsoft pour l'entraînement et l'inférence de ses modèles de pointe. De quoi peut-être alléger ses dépenses en GPU, difficiles à maintenir très longtemps pour une start-up face aux titans du cloud.
Ensuite, la commercialisation à grande échelle, avec une disponibilité sous forme de Model-as-a-Service dans Azure AI Studio. Les clients Azure pourront utiliser Mistral Large dans son interface cloud native, avec des crédits Azure, et disposeront d’un accès support direct à l'équipe technique de Mistral AI. De premiers clients bêta-testent déjà le modèle depuis quelques semaines.
Et enfin, une collaboration à titre exploratoire pour l'entraînement de modèles conçus spécifiquement pour certains clients, dont "des acteurs du secteur public européen". Pour Arthur Mensch, cofondateur et directeur général de Mistral AI, ce partenariat représente "une avancée majeure dans notre engagement de rendre l'IA de pointe accessible à tous".
SUR LE MÊME SUJET
Mistral AI lance Mistral Large, un modèle multilingue qui rivalise avec GPT-4, et s'allie à Microsoft
Tous les champs sont obligatoires
0Commentaire
Réagir