El NLP (Natural Language Processing) es la rama de la inteligencia artificial dedicada a la interacción entre las máquinas y el lenguaje humano. Reúne un conjunto de técnicas: tokenización (división del texto en unidades), análisis sintáctico, reconocimiento de entidades nombradas (identificación de nombres, fechas, importes), análisis de sentimiento y resumen automático. Cada uno de estos componentes tecnológicos encuentra una aplicación directa en el derecho.
En el sector jurídico, el NLP está omnipresente. Permite la extracción automática de cláusulas en los contratos, la clasificación de documentos jurídicos por tipo y por materia, la identificación de las partes y de los importes en las resoluciones judiciales, y la síntesis de documentos extensos. Ya en 2016, investigadores demostraron que un modelo de NLP podía predecir las resoluciones del TEDH con un 79 % de precisión.
Los avances recientes de los LLM han ampliado considerablemente las capacidades del NLP jurídico. Hoy en día, las herramientas legaltech combinan técnicas de NLP clásicas (extracción, clasificación) con la potencia generativa de los grandes modelos de lenguaje para ofrecer soluciones completas: desde la búsqueda semántica hasta la redacción asistida, pasando por el análisis predictivo de los litigios.