Commencer le voyage AI/ML avec Ollama, Langchain4J et JBang

DEV - 20/03
Le domaine de l'IA/ML, en particulier l'IA générative, a suscité une attention considérable dans le monde entier suite...

Le domaine de l’IA/ML, en particulier l’IA générative, a suscité une attention considérable dans le monde entier suite à l’émergence de ChatGPT. Par conséquent, il y a eu un regain d’intérêt pour le développement de divers modèles et outils dans ce domaine.

Dans cet article, nous verrons comment interagir avec les modèles d'IA à l'aide de Java. Mais avant cela, nous examinerons ce qu’est un « modèle d’IA », les termes et concepts qui y sont associés.

Introduction à l'IA/ML

Les modèles d’intelligence artificielle (IA) sont des algorithmes informatiques conçus pour traiter et produire des informations, imitant souvent les capacités cognitives humaines. En assimilant des modèles et des informations provenant d'ensembles de données étendus, ces modèles ont la capacité de générer des prédictions, du texte, des images ou d'autres formes de résultats, augmentant ainsi une multitude d'applications couvrant divers secteurs.

Il existe de nombreux modèles d’IA, chacun étant conçu pour répondre à des objectifs spécifiques. Bien que ChatGPT ait attiré l'attention pour ses capacités d'entrée et de sortie de texte, d'autres modèles et sociétés proposent une gamme d'entrées et de sorties pour répondre à divers besoins, notamment les images, l'audio, la vidéo, etc.

Ce qui distingue les modèles tels que GPT (Generative Pre-trained Transformer), c'est que cette fonctionnalité de pré-formation transforme l'IA en un outil de développement polyvalent, éliminant ainsi le besoin d'une compréhension approfondie de l'apprentissage automatique ou de la formation de modèles.

LLM - Grands modèles de langage

LLM (Large Language Model) fait référence à un type de modèle d'IA conçu pour comprendre et générer du texte de type humain à un niveau de compétence élevé. Les LLM sont formés sur de grandes quantités de données textuelles et sont capables d'effectuer un large éventail de tâches de traitement du langage naturel, notamment la génération de texte, la traduction, le résumé, la réponse à des questions, etc. Des exemples de LLM incluent les modèles GPT (Generative Pre-trained Transformer) tels que GPT-3, BERT (Bidirectionnel Encoder Representations from Transformers) et autres. Ces modèles ont démontré des capacités impressionnantes en matière de compréhension et de génération de texte, ce qui a conduit à leur utilisation généralisée dans diverses applications, notamment les chatbots, les assistants virtuels, les outils de création de contenu, etc.

L'intégration de LLM dans des applications nécessite l'accès à des fournisseurs de LLM comme OpenAI, Google Vertex AI, Azure OpenAI, etc., ou à des logiciels comme Ollama, LM Studio, LocalAI, etc. qui permettent d'exécuter des LLM localement. Nous verrons comment exécuter des LLM localement plus loin dans cet article.

Voyons quelques termes et concepts supplémentaires avant d'entrer dans le code intégré aux LLM.

Jetons

Dans le contexte des grands modèles linguistiques (LLM), les jetons font référence aux unités de texte de base traitées par le modèle. Ces jetons p...
[Courte citation de 8% de l'article original]

Loading...