Proyectos

2026 · En solitario · sistema LLM / recuperación

GraphRAG con control de acceso

Un sistema GraphRAG agéntico donde el nivel de acceso del usuario se aplica dentro de la propia recuperación — el modelo nunca ve un fragmento que quien pregunta no puede leer, así que no puede filtrarlo.

El problema

El RAG corporativo tiene un fallo silencioso: el recuperador trae un fragmento que el usuario nunca tuvo permiso para leer, y el modelo resume diligentemente el secreto. La mayoría de sistemas lo "arreglan" depurando la respuesta después — demasiado tarde, el dato ya llegó al modelo. Strata aplica el control de acceso dentro de la recuperación.

Enfoque y compromisos

El nivel de acceso del usuario es un techo: public < internal < confidential < restricted. Esa ACL se aplica como filtro dentro de la búsqueda vectorial de Qdrant y de la cláusula WHERE del grafo en Neo4j, antes de que ningún contexto llegue al generador — así que un dato de mayor nivel ni siquiera puede recuperarse, mucho menos filtrarse.

Sobre esa frontera está la ingeniería de recuperación:

Resultados

Lo que señalaría

Los conjuntos dorados son pequeños (10–20 ítems, una sola ejecución, en una GPU local de 8 GB), así que las diferencias entre paso único y agente están dentro del ruido — y por eso cada informe de evaluación guarda las respuestas en bruto. Así detecté un bug en el comparador de rechazos que era culpa de la métrica, no del modelo.