System Configuration

Overview

SIAA v2.1.25 is configured through a combination of constants defined in siaa_proxy.py and environment variables. This page covers all configuration parameters and their recommended values.

Core Configuration Constants

Ollama Connection

These settings control how SIAA connects to the Ollama AI service:

OLLAMA_URL = "http://localhost:11434"
MODEL = "qwen2.5:3b"
VERSION = "2.1.25"

OLLAMA_URL

string

default:"http://localhost:11434"

Base URL for the Ollama API endpoint. Must be accessible from the SIAA server.

MODEL

string

default:"qwen2.5:3b"

Ollama model identifier. The 3B parameter model provides optimal balance between speed and quality for Spanish judicial text.

VERSION

string

default:"2.1.25"

SIAA system version. Displayed in status endpoint and startup banner.

File Paths

CARPETA_FUENTES = "/opt/siaa/fuentes"
LOG_ARCHIVO = "/opt/siaa/logs/calidad.jsonl"

CARPETA_FUENTES

string

default:"/opt/siaa/fuentes"

Root directory containing source documents (.md and .txt files). Subdirectories are treated as separate collections.

LOG_ARCHIVO

string

default:"/opt/siaa/logs/calidad.jsonl"

Path to the quality monitoring log file. Contains one JSON record per query.

The parent directory for LOG_ARCHIVO must exist or have write permissions for automatic creation.

Document Processing

These parameters control how documents are chunked and processed:

CHUNK_SIZE = 800              # Maximum characters per chunk
CHUNK_OVERLAP = 300           # Overlapping characters between chunks
MAX_CHUNKS_CONTEXTO = 3       # Chunks sent to model per document
MAX_DOCS_CONTEXTO = 2         # Maximum documents used per query

CHUNK_SIZE

integer

default:"800"

Maximum size of each text chunk in characters. Larger values provide more context but increase processing time.

CHUNK_OVERLAP

integer

default:"300"

Number of overlapping characters between consecutive chunks. Prevents splitting articles or procedures across chunk boundaries.

MAX_CHUNKS_CONTEXTO

integer

default:"3"

Maximum chunks sent to the AI model per document. Automatically increased to 4 for documents with >80 chunks.

Francotirador mode (ratio ≥3.0): 1 chunk ≈ 800 chars
Binóculo mode (ratio ≥1.8): 2 chunks ≈ 1,600 chars
Escopeta mode (ratio <1.8): 3 chunks ≈ 2,400 chars

MAX_DOCS_CONTEXTO

integer

default:"2"

Maximum number of documents retrieved per query. Set to 1 when specific document patterns (PSAA, PCSJA, acuerdo) are detected.

Cache Configuration

CACHE_MAX_ENTRADAS = 200      # Maximum cached responses
CACHE_TTL_SEGUNDOS = 3600     # Cache entry lifetime (1 hour)
CACHE_SOLO_DOC = True         # Only cache document queries

CACHE_MAX_ENTRADAS

integer

default:"200"

Maximum number of responses stored in cache. Uses LRU (Least Recently Used) eviction policy.

CACHE_TTL_SEGUNDOS

integer

default:"3600"

Time-to-live for cache entries in seconds. Default is 1 hour (3600s). Expired entries are automatically removed.

CACHE_SOLO_DOC

boolean

default:"true"

When true, only document-based queries are cached. Conversational queries (greetings, etc.) are never cached.

Cache hit rate of 30-40% is expected across 26 judicial offices making similar queries. Cache hits return responses in ~5ms vs ~44s without cache.

Network & Timeout Settings

TIMEOUT_CONEXION = 8          # Connection timeout (seconds)
TIMEOUT_RESPUESTA = 180       # Response timeout (seconds)
TIMEOUT_HEALTH = 5            # Health check timeout (seconds)
MAX_OLLAMA_SIMULTANEOS = 2    # Concurrent Ollama requests
HILOS_SERVIDOR = 16           # Server thread pool size

TIMEOUT_CONEXION

integer

default:"8"

Timeout for establishing connection to Ollama in seconds.

TIMEOUT_RESPUESTA

integer

default:"180"

Maximum time to wait for Ollama response in seconds (3 minutes).

TIMEOUT_HEALTH

integer

default:"5"

Timeout for Ollama health check requests in seconds.

MAX_OLLAMA_SIMULTANEOS

integer

default:"2"

Maximum number of concurrent requests to Ollama. Prevents resource exhaustion on the AI service.

HILOS_SERVIDOR

integer

default:"16"

Thread pool size for the Waitress WSGI server. Controls maximum concurrent client connections.

Logging Configuration

LOG_MAX_LINEAS = 5000         # Maximum log entries before rotation

LOG_MAX_LINEAS

integer

default:"5000"

Maximum number of entries in the quality log before automatic rotation. When limit is reached, only the most recent 4,000 entries are kept.

Environment Variables

SIAA reads optional environment variables for deployment-specific configuration:

export SIAA_SERVER_IP="192.168.1.100"
export SIAA_SERVER_PORT="5000"

SIAA_SERVER_IP

string

default:""

Real IP address of the SIAA server. Used for generating document links in responses. If empty, falls back to request.host (may fail behind reverse proxy).

SIAA_SERVER_PORT

string

default:"5000"

Port exposed to browsers. Use "80" if behind Nginx reverse proxy, "5000" for direct access.

Example: Setting Environment Variables

# Set before starting SIAA
export SIAA_SERVER_IP="192.168.1.100"
export SIAA_SERVER_PORT="80"
python siaa_proxy.py

Flask Application Configuration

SIAA runs as a Flask application with CORS enabled:

app = Flask(__name__)
CORS(app)  # Cross-Origin Resource Sharing enabled for all routes

The server uses Waitress as the production WSGI server:

from waitress import serve
serve(app, host="0.0.0.0", port=5000,
      threads=HILOS_SERVIDOR, channel_timeout=200)

Directory Structure Requirements

Document Source Directory

The CARPETA_FUENTES directory should follow this structure:

/opt/siaa/fuentes/
├── documento1.md              # General collection
├── documento2.txt             # General collection
├── acuerdo_psaa16-10476.md   # General collection
└── normativa/                 # Named collection
    ├── circular_001.md
    └── resolucion_002.md

Root-level files belong to the “general” collection
Subdirectories create named collections (e.g., “normativa”)
Only .md and .txt files are processed
File encoding should be UTF-8

Log Directory

Create the log directory with appropriate permissions:

sudo mkdir -p /opt/siaa/logs
sudo chown siaa:siaa /opt/siaa/logs
sudo chmod 755 /opt/siaa/logs

Performance Tuning

Optimizing for Response Speed

For faster responses (target <30s):

CHUNK_SIZE = 800              # Smaller chunks = faster processing
MAX_CHUNKS_CONTEXTO = 3       # Limit context size
MAX_DOCS_CONTEXTO = 2         # Fewer documents per query

Optimizing for Accuracy

For more comprehensive responses:

CHUNK_SIZE = 1200             # Larger chunks = more context
MAX_CHUNKS_CONTEXTO = 4       # More chunks per document
MAX_DOCS_CONTEXTO = 3         # More documents per query

Increasing context size improves accuracy but may cause slower responses and potential timeouts. Monitor response times via /siaa/log endpoint.

Configuration Verification

Verify your configuration at startup by checking the banner output:

==============================================================
  SIAA — Proxy Inteligente v2.1.25
  Sistema Inteligente de Apoyo Administrativo
  Seccional Bucaramanga — Rama Judicial
==============================================================
  Modelo:         qwen2.5:3b
  Fuentes:        /opt/siaa/fuentes
  Chunk size:     800 chars
  Chunk overlap:  300 chars
  Max chunks/doc: 3
  Tokenizador:    alfanumérico + números ≥4 dígitos
  Artículo bonus: +10 con grado°, +5 sin grado
  Doc específico: max_docs=1 para PSAA/PCSJA/acuerdo
==============================================================

Get Started

Core Features

Document Processing

System Architecture

Administration

System Configuration

Overview

Core Configuration Constants

Ollama Connection

File Paths

Document Processing

Cache Configuration

Network & Timeout Settings

Logging Configuration

Environment Variables

Example: Setting Environment Variables

Flask Application Configuration

Directory Structure Requirements

Document Source Directory

Log Directory

Performance Tuning

Optimizing for Response Speed

Optimizing for Accuracy

Configuration Verification

Next Steps

Monitoring

Log Analysis

Build docs developers (and LLMs) love

Get Started

Core Features

Document Processing

System Architecture

Administration

​Overview

​Core Configuration Constants

​Ollama Connection

​File Paths

​Document Processing

​Cache Configuration

​Network & Timeout Settings

​Logging Configuration

​Environment Variables

​Example: Setting Environment Variables

​Flask Application Configuration

​Directory Structure Requirements

​Document Source Directory

​Log Directory

​Performance Tuning

​Optimizing for Response Speed

​Optimizing for Accuracy

​Configuration Verification

​Next Steps

Monitoring

Log Analysis

Build docs developers (and LLMs) love

Overview

Core Configuration Constants

Ollama Connection

File Paths

Document Processing

Cache Configuration

Network & Timeout Settings

Logging Configuration

Environment Variables

Example: Setting Environment Variables

Flask Application Configuration

Directory Structure Requirements

Document Source Directory

Log Directory

Performance Tuning

Optimizing for Response Speed

Optimizing for Accuracy

Configuration Verification

Next Steps