Quand un fournisseur vous parle de « RAG », d'« agents » ou de « pipelines de données », il décrit trois familles d'outils très différentes avec des coûts, des risques et des bénéfices très différents. Les confondre, c'est risquer d'acheter la mauvaise solution. Voici la traduction.
RAG : vos documents qui répondent aux questions
Le problème que ça résout : « L'information existe quelque part dans nos dossiers, mais la retrouver prend des heures. »
Un système RAG (retrieval-augmented generation) connecte un modèle de langage à vos documents : dossiers clients, contrats, procédures, devis passés. Quand on lui pose une question, il retrouve d'abord les passages pertinents dans vos archives, puis formule une réponse en citant ses sources ce qui vous permet de vérifier chaque affirmation.
C'est l'outil type d'une étude notariale qui cherche la bonne clause dans vingt ans de dossiers, ou d'un entrepreneur qui veut s'appuyer sur ses devis passés pour chiffrer une soumission.
Sa limite : un RAG vaut ce que valent vos documents. Si l'information est obsolète ou contradictoire, les réponses le seront aussi. La préparation des documents est souvent la moitié du travail.
Agent : un système qui exécute une suite d'actions
Le problème que ça résout : « Cette suite de tâches répétitives nous gruge des heures chaque jour. »
Un agent ne fait pas que répondre : il agit, selon des règles définies. Trier des demandes entrantes, proposer un premier rendez-vous, envoyer un rappel, collecter un formulaire puis passer la main à un humain pour tout ce qui sort du cadre.
C'est l'« accueil qui ne dort jamais » d'une clinique : les demandes simples suivent leur cours automatiquement, et l'équipe concentre son temps là où son jugement compte.
Sa limite : un agent a besoin de règles claires et de garde-fous. Quelles décisions peut-il prendre seul? Lesquelles exigent une validation humaine? Un agent déployé sans ces réponses est un risque, pas un outil.
Pipeline de données : l'ordre avant l'intelligence
Le problème que ça résout : « Nos données existent, mais elles sont éparpillées, mal structurées, pleines d'erreurs de saisie. »
Un pipeline rassemble des données de sources multiples, les structure, détecte les anomalies et prépare des sorties prêtes à valider des rapports TPS/TVQ, par exemple. C'est la famille la moins spectaculaire en démonstration, et souvent celle qui dégage le plus de valeur au quotidien.
C'est aussi, fréquemment, le prérequis des deux autres : impossible de bâtir un bon RAG ou un bon agent sur des données en désordre.
Le bon outil dépend du problème jamais l'inverse
Vous remarquerez le motif : chaque famille d'outils répond à une catégorie de problème précise. La bonne démarche part donc de votre irritant, pas du catalogue. Méfiez-vous de quiconque vous propose une solution avant d'avoir compris votre problème, vos données et ce que « succès » veut dire pour vous.
C'est exactement le rôle d'un diagnostic : nommer le problème, examiner les données, et seulement ensuite choisir l'outil RAG, agent, pipeline… ou parfois un simple script bien pensé.