# Présentation de l'architecture de chiffon médical #llmszoomcamp

DEV - 04/10
Ce document fournit une explication complète du système de génération (RAG) (RAG) de la récupération ...

Ce document fournit une explication complète de l'architecture du système de génération (RAG) de la récupération (RAG), décomposant chaque composant et montrant comment ils fonctionnent ensemble pour fournir des informations médicales précises.

1. Qu'est-ce que le chiffon?

Le chiffon combine la puissance de:

  • Renseignante des informations: trouver des documents pertinents à partir d'une base de connaissances
  • Génération de langues: utiliser des LLM pour synthétiser des réponses cohérentes
  • Contexte Coutr: assurer que les réponses sont basées sur des preuves récupérées

2. Débit d'architecture de haut niveau

[Question de l'utilisateur] ↓ [Recherche hybride: vecteur + BM25] ↓ [Assemblage de contexte et construction rapide] ↓ [Génération LLM (GPT-4O-MINI / GPT-4O)] ↓ [Évaluation de la réponse et évaluation de la qualité] ↓ [Calcul des métriques et emballage de réponse]
Entrez le mode de sortie en mode plein écran

3. Pipe de traitement détaillé

Étape 1: Traitement des requêtes

  • Nettoyez et normalisez la question médicale d'entrée
  • Préparez la requête à la recherche sémantique et lexicale

Étape 2: Récupération hybride

  • Recherche de vecteur: similitude sémantique utilisant des intégres 384 dimensions
  • Recherche BM25: correspondance exacte basée sur les mots clés
  • RRF Fusion: combine les deux approches en utilisant la fusion de rang réciproque

Étape 3: Assemblage de contexte

  • Sélectionnez les études médicales les plus pertinentes les plus pertinentes
  • Format récupéré des documents dans un contexte structuré
  • Appliquer des améliorations de score spécifiques au domaine médical

Étape 4: Génération de réponses

  • Construire une invite médicale spécialisée avec un contexte récupéré
  • Générer une réponse à l'aide de modèles OpenAI avec des paramètres contrôlés
  • Appliquer les directives de sécurité médicale

Étape 5: Assurance qualité

  • Évaluez la pertinence de réponse à l'aide de LLM-AS-A-JUDUS
  • Calculer les scores de confiance et les métadonnées
  • Suivre les mesures et les coûts de performance

4. Composants du système de base

ComposantEmplacement du fichierResponsabilité principale
Orchestrateur de chiffonsrc / core / rag.pyCoordination du pipeline principal
Base de données vectoriellesrc / database / vector_db.pyRecherche hybride + fusion RRF
Ingestion de donnéesscripts / ingest.pyTraitement et indexation des docu...
[Courte citation de 8% de l'article original]
Loading...