AccueilContact

Niveaux de Complexité- Applications RAG

Publié dans Développement Web
12 juillet 2024
3 min read
Niveaux de Complexité- Applications RAG

Levels of Complexity: Applications RAG

Le cours RAG

Je construis actuellement un cours RAG, si vous êtes intéressé par le cours, veuillez remplir ce formulaire.

Ce post est un guide complet pour comprendre et mettre en œuvre des applications RAG à différents niveaux de complexité. Que vous soyez un débutant désireux d’apprendre les bases ou un développeur expérimenté cherchant à approfondir vos compétences, vous trouverez des informations précieuses et des connaissances pratiques pour vous aider dans votre parcours. Embarquons ensemble dans cette exploration passionnante et débloquons tout le potentiel des applications RAG.

Si vous souhaitez en savoir plus sur ma pratique de consultation, consultez ma page. Si vous êtes intéressé par une collaboration, veuillez me contacter via.

Il s’agit d’un travail en cours et principalement un plan de ce que je veux écrire. Je recherche principalement des retours d’informations.

Niveau 1: Les bases

Bienvenue au niveau fondamental des applications RAG ! Ici, nous commencerons par les bases, posant les fondations pour votre voyage dans le domaine de la Génération Augmentée par Récupération. Ce niveau est conçu pour vous initier aux concepts et techniques essentiels pour travailler avec les modèles RAG. À la fin de cette section, vous aurez une compréhension solide de la manière de parcourir les systèmes de fichiers pour la génération de texte, de découper et de traiter le texte par lots, et d’interagir avec les API d’incorporation. Plongeons et explorons ensemble les capacités passionnantes des applications RAG !

  1. Parcourir de manière récursive le système de fichiers pour générer du texte.
  2. Utiliser un générateur pour le découpage du texte.
  3. Utiliser un générateur pour envoyer des requêtes par lots de manière asynchrone à une API d’incorporation.
  4. Stocker des données dans LanceDB.
  5. Implémenter une interface en ligne de commande pour interroger, incorporer des questions, produire des morceaux de texte et générer des réponses.

Pipeline de traitement

Pipeline de recherche

Pipeline de réponse

Niveau 2: Traitement plus structuré

Ici, nous plongeons plus profondément dans le monde des applications RAG. Ce niveau est conçu pour ceux qui ont compris les bases et sont prêts à explorer des techniques avancées et des optimisations. Ici, nous nous concentrons sur l’amélioration de l’efficacité et de l’efficience de nos applications RAG grâce à une meilleure programmation asynchrone, des stratégies de découpage améliorées et des mécanismes de réessai robustes dans les pipelines de traitement.

Dans le pipeline de recherche, nous introduisons des méthodes sophistiquées telles que de meilleurs algorithmes de classement, l’expansion et la réécriture de requêtes, et l’exécution de requêtes parallèles pour élever la qualité et la pertinence des résultats de recherche.

De plus, le pipeline de réponse est affiné pour fournir des réponses plus structurées et informatives, citant des morceaux de texte spécifiques et utilisant un modèle de réponse en continu pour une meilleure interaction.

Traitement

  1. Meilleure Asyncio
  2. Meilleur Découpage
  3. Meilleurs Réessais

Recherche

  1. Meilleur Classement (Cohere)
  2. Expansion / Réécriture de requêtes
  3. Requêtes parallèles

Réponse

  1. Citer des morceaux de texte spécifiques
  2. Modèle de réponse en continu pour une meilleure structure.

Niveau 3: Observabilité

Au niveau 3, l’accent est mis sur la pratique critique de l’observabilité. Cette étape met l’accent sur l’importance de mettre en œuvre des mécanismes de journalisation complets pour surveiller et mesurer les performances multifacettes de votre application. Établir une observabilité robuste vous permet de localiser et de résoudre rapidement les goulots d’étranglement ou les problèmes, garantissant un fonctionnement optimal. Ci-dessous, nous détaillons plusieurs types de journaux clés qui sont essentiels pour atteindre cet objectif.

Élargissement du suivi des événements larges

Journaliser comment les requêtes sont réécrites

Journaliser les citations

Journaliser les scores moyens de cosinus et les scores de réordonnancement

Journaliser les métadonnées au niveau de l’utilisateur pour la recherche

Avoir des utilisateurs

Niveau 4: Évaluations

Les évaluations à ce stade sont cruciales pour comprendre la performance et l’efficacité de nos systèmes. Principalement, nous traitons deux systèmes distincts : le système de recherche et le système de réponse aux questions (QA). Il est courant de voir un accent important mis sur l’évaluation du système QA, étant donné son interaction directe avec les requêtes de l’utilisateur final. Cependant, il est tout aussi important de ne pas négliger le système de recherche. Le système de recherche agit comme l’épine dorsale, récupérant des informations pertinentes sur lesquelles le système QA construit ses réponses. Une stratégie d’évaluation complète devrait inclure les deux systèmes, les évaluant individuellement et comment ils s’intègrent et se complètent mutuellement pour fournir des réponses précises et pertinentes aux requêtes de l’utilisateur.

Évaluation du système de recherche

Évaluation du système de réponse

L’objectif des données synthétiques

Niveau 5: Comprendre les lacunes

À ce stade, vous devriez avoir un ensemble de données extrêmement diversifié en utilisant à la fois les données synthétiques et les données de production. Nous devrions également avoir une suite de scores que nous pouvons utiliser pour évaluer la qualité de nos réponses.

Regroupement des requêtes

Sujets à venir

Comme nous continuons à explorer les profondeurs des applications RAG, les domaines suivants seront abordés dans les niveaux suivants, chacun conçu pour améliorer la complexité et la fonctionnalité de vos systèmes RAG :

  • Niveau 6: Manipulation avancée des données
  • Niveau 7: Amélioration des requêtes
  • Niveau 8: Techniques de résumé
  • Niveau 9: Modélisation des résultats

Le cours RAG

Je construis actuellement un cours RAG, si vous êtes intéressé par le cours veuillez remplir ce formulaire.

Commentaires

Source de l’article


Share

Article précédent
Nouveau Style d'Écriture Vue

Articles similaires

Choses étranges apprises en écrivant un émulateur x86
12 juillet 2024
1 min
© 2024, All Rights Reserved.

Liens Rapides

Partenariats et opportunités publicitairesContactez nous

Réseaux Sociaux