Azure Small Language Models : évaluation de Phi-3, Llama 3 et Snowflake Arctic pour la production

DEV - 17/01

Dans le paysage en évolution rapide de l'IA générative, l'industrie est témoin d'un changement important....

Dans le paysage en évolution rapide de l’IA générative, le secteur est témoin d’un changement important. Alors que le mantra « plus c'est gros, c'est mieux », dominé par « plus c'est gros, c'est mieux ». Cependant, le vent tourne. À mesure que les organisations passent des projets pilotes expérimentaux aux applications de production, l’attention s’est déplacée vers les petits modèles linguistiques (SLM). Ces modèles offrent une latence plus faible, des coûts de calcul réduits et la possibilité de fonctionner sur des appareils de pointe tout en conservant des performances qui rivalisent avec des modèles massifs comme GPT-4 dans des tâches spécifiques.

Microsoft Azure s'est positionné comme la première destination pour ces modèles, en les proposant via le framework Model-as-a-Service (MaaS) et le catalogue de modèles Azure AI. Dans cet article, nous proposons une analyse technique approfondie de trois des SLM les plus importants disponibles sur Azure : Phi-3 de Microsoft, Llama 3 (8B) de Meta et Snowflake Arctic. Nous analyserons leurs architectures, leurs performances de référence, leurs stratégies de déploiement et leur rentabilité pour vous aider à décider quel modèle correspond à votre charge de travail spécifique.

1. Microsoft Phi-3 : le maître de l'efficacité

La famille Phi-3 de Microsoft représente une avancée majeure dans la manière d'obtenir la qualité des modèles. Plutôt que de s'appuyer sur le volume considérable de données récupérées sur le Web, Phi-3 a été formé sur des données « spécifiques à Phi-3 », une combinaison de données Web hautement filtrées et de données synthétiques conçues pour ressembler à la clarté et à la valeur pédagogique des manuels scolaires.

Architecture et variantes

Le Phi-3 est disponible en plusieurs tailles, mais le Phi-3 Mini (paramètres 3,8B) est le plus populaire pour les cas d'utilisation SLM. Malgré sa petite taille, il surpasse fréquemment les modèles deux fois plus grands (comme Llama 2 7B ou Mistral 7B) dans les tâches de raisonnement et de logique. Il utilise une architecture Transformer dense et est optimisé pour ONNX Runtime, ce qui le rend idéal pour le déploiement multiplateforme.

Avantages et inconvénients

Avantages :

Efficacité inégalée : empreinte de ressources extrêmement faible ; peut s'exécuter sur des instances de base uniquement CPU ou sur des a...
[Courte citation de 8% de l'article original]

Tags : azur - ai - flocon de neige - Microsoft - logiciel - codage - développement - ingénierie - inclusif - communauté -

Article automatiquement traduit - Source et Copyright images et textes : - DEV
Lien vers la traduction, consulter la traduction de l'article sur Google Translate : https://translate.google.com/translate?hl=en&sl=auto&tl=fr&u=https://dev.to/jubinsoni/azure-small-language-models-evaluating-phi-3-llama-3-and-snowflake-arctic-for-production-35h6
Lien original, consulter l'article dans son intégralité ici : https://dev.to/jubinsoni/azure-small-language-models-evaluating-phi-3-llama-3-and-snowflake-arctic-for-production-35h6
Lien direct sur notre site : http://newsexplorer.fr/article/30661723/Azure-Small-Language-Models%C2%A0--%C3%A9valuation-de-Phi-3--Llama-3-et-Snowflake-Arctic-pour-la-production
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.