Android Bench : Google lance le premier benchmark IA pour le développement mobile

BlogNouvellesTechnologies - 11/03
Google dévoile Android Bench, un benchmark open source testant les LLM sur de vraies Pull Requests. Gemini 3.1 Pro domine avec 72,4 % de réussite.

À mesure que les assistants IA s’installent dans Android Studio et les workflows GitHub, une question devient embarrassante : quel modèle aide réellement, et lequel se contente de produire du code plausible mais fragile ?

Avec Android Bench, Google tente de remettre un peu de science dans un marché saturé de promesses, en évaluant les LLMs sur des tâches Android proches du terrain : issues, pull requests, correctifs qui doivent build, passer les tests et résoudre le problème...
[Courte citation de 8% de l'article original]

Loading...