L’Allen Institute for AI (Ai2) vient de publier son modèle de langage multimodal open source Molmo, capable de comprendre et d’annoter les images. Disponible en différentes tailles, il peut même fonctionner sur un smartphone.
au sommaire
Il existe de plus en plus de modèles d'intelligence artificielle multimodaux, comme GPT-4o, Claude 3.5 et Gemini 1.5, mais les plus performants sont propriétaires. Pour tenter de les concurrencer, l’Allen Institute for AI (Ai2) vient d'annoncer son modèle sous licence libre, le...
[Courte citation de 8% de l'article original]