Des nouvelles ont été ajoutées en tête de listes.
Remontez pour les voir.
Inscription à la newsletter
# Présentation de l'architecture de chiffon médical #llmszoomcamp
DEV -
04/10
Ce document fournit une explication complète du système de génération (RAG) (RAG) de la récupération ...
Ce document fournit une explication complète de l'architecture du système de génération (RAG) de la récupération (RAG), décomposant chaque composant et montrant comment ils fonctionnent ensemble pour fournir des informations médicales précises.
1. Qu'est-ce que le chiffon?
Le chiffon combine la puissance de:
Renseignante des informations: trouver des documents pertinents à partir d'une base de connaissances
Génération de langues: utiliser des LLM pour synthétiser des réponses cohérentes
Contexte Coutr: assurer que les réponses sont basées sur des preuves récupérées
2. Débit d'architecture de haut niveau
[Question de l'utilisateur] ↓ [Recherche hybride: vecteur + BM25] ↓ [Assemblage de contexte et construction rapide] ↓ [Génération LLM (GPT-4O-MINI / GPT-4O)] ↓ [Évaluation de la réponse et évaluation de la qualité] ↓ [Calcul des métriques et emballage de réponse]
Entrez le mode de sortie en mode plein écran
3. Pipe de traitement détaillé
Étape 1: Traitement des requêtes
Nettoyez et normalisez la question médicale d'entrée
Préparez la requête à la recherche sémantique et lexicale
Étape 2: Récupération hybride
Recherche de vecteur: similitude sémantique utilisant des intégres 384 dimensions
Recherche BM25: correspondance exacte basée sur les mots clés
RRF Fusion: combine les deux approches en utilisant la fusion de rang réciproque
Étape 3: Assemblage de contexte
Sélectionnez les études médicales les plus pertinentes les plus pertinentes
Format récupéré des documents dans un contexte structuré
Appliquer des améliorations de score spécifiques au domaine médical
Étape 4: Génération de réponses
Construire une invite médicale spécialisée avec un contexte récupéré
Générer une réponse à l'aide de modèles OpenAI avec des paramètres contrôlés
Appliquer les directives de sécurité médicale
Étape 5: Assurance qualité
Évaluez la pertinence de réponse à l'aide de LLM-AS-A-JUDUS
Calculer les scores de confiance et les métadonnées
Suivre les mesures et les coûts de performance
4. Composants du système de base
Composant
Emplacement du fichier
Responsabilité principale
Orchestrateur de chiffon
src / core / rag.py
Coordination du pipeline principal
Base de données vectorielle
src / database / vector_db.py
Recherche hybride + fusion RRF
Ingestion de données
scripts / ingest.py
Traitement et indexation des docu... [Courte citation de 8% de l'article original]
Loading...
🍪
Le modèle économique de notre site repose sur l'affichage de publicités personnalisées basées sur l'utilisation de cookies publicitaires. En continuant votre visite sur notre site, vous consentez à l'utilisation de ces cookies.
Politique de confidentialité