Mistral 7B contre Mixtral 8x7B

DEV - 26/03

Une startup française, Mistral AI a publié deux impressionnants grands modèles de langage (LLM) - Mistral 7B...

Une startup française, Mistral AI a publié deux impressionnants grands modèles de langage (LLM) : Mistral 7B et Mixtral 8x7B. Ces modèles repoussent les limites des performances et introduisent une meilleure innovation architecturale visant à optimiser la vitesse d'inférence et l'efficacité des calculs.

Mistral 7B : petit mais puissant

Mistral 7B est un modèle de transformateur de 7,3 milliards de paramètres qui dépasse sa catégorie de poids. Malgré sa taille relativement modeste, il surpasse les 13 milliards de paramètres du modèle Llama 2 dans tous les benchmarks. Il surpasse même le plus grand modèle Llama 1 de 34 milliards de paramètres pour les tâches de raisonnement, de mathématiques et de génération de code.

Deux fondements de l'efficacité de Mistral 7B :

Attention aux requêtes groupées (GQA)
Attention à fenêtre coulissante (SWA)

GQA accélère considérablement la vitesse d'inférence et réduit les besoins en mémoire pendant le décodage en partageant les clés et les valeurs sur plusieurs requêtes au sein de chaque couche de transformateur.

SWA, d'autre part, permet au modèle de gérer des séquences d'entrée plus longues à un coût de calcul inférieur en introduisant une « fenêtre d'attention » configurable qui limite le nombre de jetons auxquels le modèle s'occupe à un moment donné.

Nom	Nombre de paramètres	Nombre de paramètres actifs	Min. RAM GPU pour l'inférence (Go)
Mistral-7B-v0... [Courte citation de 8% de l'article original]

Tags : llm - ai - cloud - base de données vectorielles - logiciel - codage - développement - ingénierie - inclusif - communauté -

Article automatiquement traduit - Source et Copyright images et textes : - DEV
Lien vers la traduction, consulter la traduction de l'article sur Google Translate : https://translate.google.com/translate?hl=en&sl=auto&tl=fr&u=https://firstfinger.in/mistral-7b-vs-mixtral-8x7b/
Lien original, consulter l'article dans son intégralité ici : https://firstfinger.in/mistral-7b-vs-mixtral-8x7b/
Lien direct sur notre site : http://newsexplorer.fr/article/17192912/Mistral-7B-contre-Mixtral-8x7B
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.