RAG4AO
Recherche augmentée pour appels d'offres — comparer intelligemment les documents CCTP par thématique
Discuter d'un projet similaireRéponse courte
RAG4AO est une plateforme de recherche augmentée (RAG) développée par Digit-AI pour les équipes de réponse aux appels d'offres publics. Elle analyse automatiquement les CCTP sur 12 dimensions thématiques (clauses sociales, réglementation, prestations…) grâce à 12 index vectoriels FAISS distincts. Résultat : le temps de recherche de précédents AO similaires passe de 2–4 heures à moins de 2 minutes (−98 %), avec une couverture d'analyse multipliée par 4 à 6.
Contexte & Enjeux
Un processus manuel, chronophage et dépendant de la mémoire individuelle
Les équipes de réponse aux appels d'offres publics gèrent des centaines de CCTP hétérogènes (PDF, DOCX, TXT). Chaque nouveau marché doit être comparé manuellement aux précédents pour identifier des similarités, capitaliser sur les réponses passées et évaluer la pertinence d'une candidature — un processus entièrement manuel, chronophage et non tracé.
Recherche documentaire inefficace
Aucun outil ne permet de retrouver rapidement les CCTP passés proches d'un nouveau marché.
Perte de connaissance
Le savoir est détenu par quelques experts, sans capitalisation structurée ni traçabilité.
Analyse superficielle
La comparaison se fait sur le titre ou l'objet du marché, sans granularité thématique (clauses sociales, réglementation, prestations…).
Temps de décision allongé
Entre la publication d'un AO et la décision go/no-go, les équipes perdent un temps précieux à chercher des AO précédents.
Périmètre fonctionnel
Responsables de réponse aux AO, chefs de projet, direction achats/commercial. Processus couverts : indexation batch du corpus, recherche de similarité, consultation de l'historique, administration multi-tenant.
Contraintes principales
Architecture multi-tenant cloisonnée · RGPD strict (aucun téléchargement externe) · Volumétrie centaines à milliers de CCTP · Infrastructure légère Docker compatible Railway et on-premise.
Objectifs & Périmètre
Trois niveaux d'objectifs, chacun relié à un KPI mesuré
Objectif stratégique
Réduire le temps de décision sur les appels d'offres en fournissant une comparaison documentaire rapide et structurée par thématique.
Objectif opérationnel
Automatiser l'analyse thématique des CCTP sur 12 dimensions métier : intitulé, synthèse, acheteur, clauses sociales/environnementales, périmètre, enjeux, sites, prestations, réglementation, critères, moyens, durée.
Objectif technique
Déployer une plateforme multi-tenant conteneurisée (Docker) avec recherche vectorielle FAISS, sans rupture de service et sans téléchargement des documents originaux.
Stack Technique
Une architecture RAG multi-thématique avec 12 index FAISS distincts
Frontend
Backend
LLM & Embeddings
Recherche vectorielle & NLP
Documents & Data
Infrastructure
Pattern différenciant — RAG multi-thématique : contrairement à un RAG classique à index unique, RAG4AO maintient 12 index FAISS distincts (un par thème). Chaque document est décomposé en 12 facettes par le LLM, chaque facette est vectorisée et indexée séparément. La recherche s'effectue thème par thème, offrant une granularité et une explicabilité impossibles avec un index monolithique.
Schémas d'Architecture
Vue d'ensemble applicative et pipeline d'indexation détaillé

Résultats, Gains & ROI
Des gains mesurés sur l'ensemble du cycle de réponse aux appels d'offres
| Indicateur | Avant RAG4AO | Après RAG4AO | Gain |
|---|---|---|---|
| Temps de recherche de précédents AO | 2–4 heures par AO (manuel) | 30 secondes à 2 minutes | ~98 % de réduction |
| Couverture thématique | 2–3 critères (titre, objet, montant) | 12 thèmes analysés automatiquement | ×4 à ×6 |
| Temps de réponse recherche | N/A | 10 à 30 secondes | Ultra rapide |
| Documents exploitables | Dizaines (mémoire individuelle) | Centaines à milliers (corpus complet) | ×10 à ×100 |
| Capacité d'indexation batch | N/A | ~500–700 documents/heure | Nouveau processus |
Gains qualitatifs
Explicabilité
Résultats structurés par thème : l'utilisateur comprend pourquoi deux documents sont similaires (mêmes clauses sociales, mêmes prestations, même réglementation…).
Capitalisation du savoir
Le corpus indexé constitue une mémoire organisationnelle pérenne, indépendante des individus et accessible à toute l'équipe.
Réduction d'erreurs
L'analyse automatique sur 12 dimensions évite les oublis : clause environnementale non détectée, exigence réglementaire manquée…
Souveraineté des données
Option Ollama (LLM local comme Mistral ou Deepseek) pour un traitement 100 % on-premise, sans fuite de données vers des API tierces. Compatible RGPD.
Scalabilité
Architecture multi-tenant permettant l'onboarding de nouvelles entités sans redéploiement. Rôles SuperAdmin / CompanyAdmin / User.
Adoption facilitée
Interface moderne React 19, dark/light mode, Tailwind CSS 4. Expérience proche des moteurs de recherche grand public.