LlamaIndex · ChromaDB · 3 verdicts · Industrias Reguladas

CortexRAG Engine™

Contract-Aware Retrieval Augmented Generation

Stack RAG especializado para industrias reguladas. Valida cada chunk recuperado contra el Prisma Estático™ del cliente antes de generar. Si el contexto no es suficiente, el sistema dice "no sé" — antes de alucinar.

✓ PASS — Respuesta verificada ✗ FAIL — Contradice el contrato ⚠ INSUFFICIENT CONTEXT

Pipeline de Validación

Query
Pregunta del usuario
Hybrid Search
Vector + BM25
CrossEncoder
Reranking
SI Scoring
Chunk vs Prisma™
Verdict
PASS/FAIL/INSUF

RAG que entiende tu contrato

No es solo recuperar documentos. Es verificar que cada respuesta respeta el contrato específico de tu cliente.

CrossEncoder Reranker

Reranking semántico profundo post-retrieval. Los chunks más relevantes para la pregunta específica suben al top, los genéricos se descartan.

Multilingual Embedder

Embeddings multilingüe optimizados para documentos bancarios en español. Funciona con contratos en español, inglés y mezclas jurídicas.

INSUFFICIENT CONTEXT Enforcer

Cuando el contexto recuperado no es suficiente para responder con certeza, el sistema retorna INSUFFICIENT en vez de alucinar una respuesta.

Chunk-level SI Scoring

Cada chunk recuperado se evalúa con el Semantic Integrity Score contra el Prisma Estático™. Solo los chunks que pasan el umbral contribuyen a la respuesta.

ChromaDB + Hybrid Search

Vector search + BM25 combinados. Stub para desarrollo local, ChromaDB real para producción. API idéntica en ambos modos.

LlamaIndex Specializado

Capa RAG construida sobre LlamaIndex con nodos y postprocessors customizados para documentos legales y contractuales en español.

Validación en 4 líneas

Cada respuesta verificada contra el contrato real de tu cliente.

rag_validation_demo.py
from cortexgovernor.validators.rag_contract import RagContractValidator

validator = RagContractValidator(
    contract_path="prisma_bancario.yaml",
    backend="chromadb"  # o "stub" para dev
)

result = await validator.validate_response(
    question="¿Cuál es la tasa de interés anual?",
    response="La tasa es 24% anual.",
    retrieved_chunks=chunks
)

# result.verdict    = "PASS"        ← verificado contra contrato
# result.si_score   = 0.82          ← integridad semántica
# result.citations  = ["Cláusula 4.2 — Tasa Ordinaria"]
# result.confidence = 0.94

# Cuando el contexto no alcanza:
# result.verdict = "INSUFFICIENT_CONTEXT"
# → El sistema no alucina. Devuelve el control.

RAG Estándar vs CortexRAG Engine™

RAG Estándar

  • Recupera y genera sin validar el contrato
  • Si no hay contexto, inventa una respuesta
  • Sin citas de cláusulas específicas
  • No detecta contradicciones internas
  • Sin audit trail regulatorio

CortexRAG Engine™

  • Cada chunk validado contra el Prisma™
  • INSUFFICIENT_CONTEXT en vez de alucinar
  • Citations exactas por cláusula y página
  • Detección de contradicciones pre-deploy
  • Audit trail CNBV/CONDUSEF completo

RAG que no alucina. Por diseño.

Cada respuesta verificada. Cada cita trazable. Cada duda devuelta al humano.