RAG: definición e IA jurídica | Glosario Legaltech

RAG (Retrieval Augmented Generation)

El RAG (Retrieval Augmented Generation) es una técnica que combina la búsqueda documental con un LLM. Antes de generar una respuesta, el modelo busca la información pertinente en una base externa (leyes, jurisprudencia, contratos) y luego la integra para producir una respuesta fundamentada en fuentes reales y verificables. Es la tecnología más crítica para la IA jurídica.

El RAG (Retrieval Augmented Generation) es la tecnología clave que hace que la IA sea aprovechable en el ámbito jurídico. Descrito por primera vez por Facebook AI Research en 2020, el principio es elegante: en lugar de fiarse únicamente de la memoria interna del LLM (a menudo fuente de alucinaciones), se añade una etapa de búsqueda documental previa a la generación. El modelo consulta primero una base de datos externa (códigos, jurisprudencia, contratos) y luego genera su respuesta apoyándose en esos documentos.

En concreto, un sistema RAG funciona en tres etapas: indexación de los documentos jurídicos en forma de embeddings vectoriales, búsqueda de los pasajes más pertinentes respecto a la pregunta planteada y generación de una respuesta que cita y sintetiza esas fuentes. Esta arquitectura reduce considerablemente las alucinaciones, ya que el modelo se ve obligado a fundamentar sus respuestas en datos factuales.

Para los profesionales del derecho, el RAG es la diferencia entre un chatbot de uso general y una herramienta jurídica fiable. Las soluciones legaltech más serias (Doctrine, Lexis+AI, GenIA-L) utilizan todas arquitecturas RAG para garantizar que cada respuesta sea trazable hasta su fuente. Es este enfoque el que permite conciliar la potencia generativa de los LLM con la exigencia de precisión y verificación propia del derecho.

Términos relacionados