Compar:IA : un premier bilan de ses tests d'IA à l'aveugle - ZDNET

Louis Adam - ZDNet - 05/11

Le programme Compar:IA, porté par la Dinum, permet de comparer les réponses obtenues par différents modèles d'intelligence artificielle. Une initiative bienvenue.

Il existe de nombreux tests pour jauger les forces et les faiblesses des modèles de langages.

Toute l’actualité de la tech pour les pros chaque jour dans notre newsletter

En savoir plus sur l’utilisation des données personnelles

Ils s'appuient sur différents critères allant du temps de réponse à la complexité des réponses proposées.

Compar:IA s'appuie sur une autre approche : les préférences purement subjectives des utilisateurs.

Un classement à contre courant

Le principe de ce programme lancé en octobre 2024 et porté par une équipe de la direction interministérielle du numérique est en effet de proposer aux internautes d'évaluer les différentes réponses proposées par des modèles de langage face à un même prompt.

Les deux réponses sont proposées de façon anonymisées et l'utilisateur est invité à voter pour celle qui lui plait le plus, en jugeant de son caractère utile, complet ou sa mise en forme. Une fois le vote réalisé, l'utilisateur peut révéler le nom des modèles ayant répondu à sa demande, et obtenir des informations supplémentaires, par exemple sur la consommation énergétique du modèle ou son mode de fonctionnement.

En se basant sur ce fonctionnement, le programme Compar:IA a publié cette semaine son classement des modèles de langage préférés des utilisateu...
[Courte citation de 8% de l'article original]

Tags : Gemini - IA Générative - Intelligence artificielle (IA) - Mistral AI - Technologie -

Source et Copyright images et textes : Louis Adam - ZDNet
Lien original, consulter l'article dans son intégralité ici : https://www.zdnet.fr/actualites/comparia-un-premier-bilan-de-ses-tests-dia-a-laveugle-484510.htm
Lien direct sur notre site : http://newsexplorer.fr/article/29529915/Compar-IA---un-premier-bilan-de-ses-tests-d%27IA-%C3%A0-l%27aveugle---ZDNET
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.