Des nouvelles ont été ajoutées en tête de listes.
Remontez pour les voir.
Inscription à la newsletter
⚡🦀 Déployez une application LLM ultra-rapide et légère avec Rust-Rig-LanceDB
DEV -
22/11
TL;DR Une procédure pas à pas sur le déploiement d'une application LLM à l'aide de Rig & LanceDB sur AWS...
TL;DR
Une procédure pas à pas pour déployer une application LLM à l'aide deGréement&LanceDBsur AWS Lambda. Vous apprendrez à préparer votre application, à choisir le bon backend de stockage (comme S3 ou EFS) et à optimiser les performances en utilisant efficacement les métriques cloud.
Statistiques : Rig RAG Agent utilisant LanceDB sur AWS :
Faible utilisation de la mémoire (96 Mo - 113 Mo)
Démarrages à froid rapides (constamment 160 ms)
Statistiques : Agent LangChain RAG utilisant LanceDB sur AWS :
Utilisation de la mémoire plus élevée (246 Mo - 360 Mo)
Démarrages à froid plus lents (1 900 ms - 2 700 ms)
Aller aux métriques ⏬
Table des matières
Comment déployer votre application Rig avec LanceDB : un guide étape par étape
Introduction
Conditions préalables
Notre cas d'usage : Montréal 🌇
Présentation rapide de LanceDB 💾
Backends de stockage LanceDB
S3 - Magasin d'objets
Stockage éphémère Lambda - Système de fichiers local
EFS - Système de fichiers virtuel
Métriques sur le cloud ☁️
Mémoire, processeur et temps d'exécution
Application Agent Langchain Montréal 🐍
Package de déploiement
Mémoire, processeur et temps d'exécution
Comparaison finale entre Rig et LangChain
Ressources
Introduction
Bienvenue dans Déployez votre application Rig ! Les applications créées avec Rig varient en complexité en fonction de l'utilisation du LLM, des bases de données vectorielles pour RAG et du déploiement de l'infrastructure. Cette série explore diverses configurations pour une utilisation en production.
⭐ Le point culminant du jour : l'intégration de Rig's LanceDB ! ⭐
Nous allons déployer un agent Rig en utilisant OpenAIintégration de texte-ada-002etGPT-4o, s'appuyant sur le magasin de vecteurs LanceDB et déployé sur AWS Lambda.
💡 Si vous êtes nouveau sur Rig et que vous souhaitez recommencer depuis le début ou si vous recherchez des tutoriels supplémentaires, consultez notre série de blogs.
Allons-y !
Conditions préalables
Avant de commencer la construction, assurez-vous d'avoir les éléments suivants :
❗ Nous n'expliquerons pas comment écrire votre application RAG avec Rig, mais uniquement comment la déployer. Assurez-vous donc de lire d’abord ce tutoriel pour vous aider à coder votre application.
Un clone durig-montreal-lancedbcaisse qui comprend deux binaires distincts : unchargeur(écrit des données dans LanceDB) et unapplication(exécute RAG sur LanceDB).
Un compte AWS et quelques connaissances de base sur les déploiements sur AWS, y compris les modèles Cloudformation
Une clé API OpenAI
Notre cas d'usage : Montréal 🌇
L'application dansrig-montreal-lancedbDonnées RAG issues des données ouvertes de Montréal. La municipalité de Montréal génère et gère de grandes quantités de données grâce à ses activités, telles que des données sur l'agriculture, la politique, les transports, la santé et bien plus encore. L’application open data publie tous ces ensembles de données et les rend librement accessibles à tous les citoyens ! Notre application indexera les métadonnées de tous les en... [Courte citation de 8% de l'article original]
Loading...
🍪
Le modèle économique de notre site repose sur l'affichage de publicités personnalisées basées sur l'utilisation de cookies publicitaires. En continuant votre visite sur notre site, vous consentez à l'utilisation de ces cookies.
Politique de confidentialité