🔥Comparaison de codage Claude Opus 4.6 et Sonnet 4.6 ✅

DEV - 05/03
Anthropic a récemment abandonné la gamme Claude 4.6 mise à jour, et comme d'habitude, les deux noms intéressent tout le monde...

Anthropic a récemment abandonné la gamme Claude 4.6 mise à jour et, comme d'habitude, les deux noms qui intéressent tout le monde sont Opus 4.6 et Sonnet 4.6.

Opus est le modèle le plus cher possible, et Sonnet est le modèle le moins cher et le plus général que beaucoup de gens utilisent au quotidien. Je voulais donc voir à quoi ressemble le véritable écart lorsque vous demandez aux deux de construire quelque chose de sérieux, pas une démo de jouet.

En termes de référence, il y a bien sûr une différence, mais cela ne semble pas si énorme lorsqu'il s'agit de SWE et de codage agent.

Je l'ai gardé super basique : un test (mais un gros), même invite, même workflow. J'ai juste comparé à quel point ils se sont rapprochés sans que j'intervienne.

⚠️ REMARQUE : Ne prenez pas le résultat de ce test comme une règle absolue. Il ne s'agit que d'une tâche de codage réelle, exécutée dans ma configuration, pour vous donner une idée de la façon dont ces deux modèles ont fonctionné pour moi.

TL;DR

Si vous voulez juste ce qu’il faut emporter, voici le deal avec ces modèles :

Premièrement, l’Opus 4.6 constitue actuellement le summum en matière de codage. Au moment de la rédaction, il s’agit essentiellement de l’OG, et rien d’autre ne s’en rapproche autant.

  • Claude Opus 4.6 a réalisé un parcours plus propre. Il a également rencontré un échec de test, mais l'a corrigé rapidement, a livré une intégration CLI + Tensorlake fonctionnelle et l'a fait avec beaucoup moins de jetons. Le coût approximatif équivalent à l'API (sortie uniquement) s'est élevé à environ 1,00 $, ce qui est un peu fou compte tenu de la taille du projet.
  • Claude Sonnet 4.6 Étonnam...
    [Courte citation de 8% de l'article original]
Loading...