Le RAG (Retrieval Augmented Generation) est la technologie clé qui rend l'IA exploitable dans le domaine juridique. Décrit pour la première fois par Facebook AI Research en 2020, le principe est élégant : au lieu de se fier uniquement à la mémoire interne du LLM (souvent source d'hallucinations), on ajoute une étape de recherche documentaire en amont de la génération. Le modèle consulte d'abord une base de données externe — codes, jurisprudence, contrats — puis génère sa réponse en s'appuyant sur ces documents.
Concrètement, un système RAG fonctionne en trois étapes : indexation des documents juridiques sous forme d'embeddings vectoriels, recherche des passages les plus pertinents par rapport à la question posée, et génération d'une réponse qui cite et synthétise ces sources. Cette architecture réduit considérablement les hallucinations car le modèle est contraint de fonder ses réponses sur des données factuelles.
Pour les professionnels du droit, le RAG est la différence entre un chatbot grand public et un outil juridique fiable. Les solutions legaltech les plus sérieuses — Doctrine, Lexis+AI, GenIA-L — utilisent toutes des architectures RAG pour garantir que chaque réponse est traçable jusqu'à sa source. C'est cette approche qui permet de concilier la puissance générative des LLM avec l'exigence de précision et de vérification propre au droit.