Saltar al contenido

Seleccion de modelo

import { Aside } from ‘@astrojs/starlight/components’;

El tool calling es un requisito obligatorio para el agente ReAct. No todos los modelos lo soportan correctamente. Esta guia te ayuda a elegir el modelo adecuado.

Por RAM disponible

RAM disponibleModeloComandoRAM usadaNotas
8–16 GBqwen3:8bollama pull qwen3:8b~5 GBRapido, calidad minima viable
16 GBqwen3:14bollama pull qwen3:14b~9 GBRecomendado — mejor ratio calidad/RAM
32 GBqwen3:14b o qwen3:30bollama pull qwen3:30b~19 GB30b = MoE, mas rapido, 256 K contexto
48 GB+qwen3:32bollama pull qwen3:32b~20 GBMaxima calidad, denso, ~15-22 tok/s en M4
48 GB+ (documentos largos)qwen3:30bollama pull qwen3:30b~19 GBMoE, ventana de 256 K contexto ideal para evidencias grandes

Tras descargar el modelo, establece OLLAMA_MODEL en tu .env:

Ventana de terminal
OLLAMA_MODEL=qwen3:14b # o el que hayas descargado

Que evitar

ModeloPor que evitar
qwen3.5:*Tool calling roto en Ollama (marzo 2026) — incompatibilidad de formato que causa HTTP 500 en cada llamada de herramienta (#14493)
qwen2.5Superado por Qwen3 en todos los benchmarks
Modelos sin tool callingEl agente ReAct no puede funcionar sin esta capacidad

Alternativas cloud (sin Ollama)

Si no quieres instalar Ollama o necesitas maxima calidad, puedes usar LLMs en la nube:

Ventana de terminal
# OpenAI
LLM_PROVIDER=openai
OPENAI_MODEL=gpt-4o
OPENAI_API_KEY=sk-...
# Anthropic
LLM_PROVIDER=anthropic
ANTHROPIC_MODEL=claude-3-5-sonnet-20241022
ANTHROPIC_API_KEY=sk-ant-...

Benchmark de calidad (orientativo)

Para el caso de uso de OSINT (analisis de IOCs, redaccion de informes, razonamiento sobre amenazas):

ModeloVelocidadCalidad de analisisTool calling
qwen3:8b★★★★★★★★★★★★
qwen3:14b★★★★★★★★★★★★★
qwen3:30b★★★★★★★★★★★★★★
qwen3:32b★★★★★★★★★★★★★
gpt-4o★★★★★★★★★★★★★
claude-3-5-sonnet★★★★★★★★★★★★★

Como cambiar el modelo

Ventana de terminal
# 1. Descarga el nuevo modelo
ollama pull qwen3:32b
# 2. Actualiza .env
OLLAMA_MODEL=qwen3:32b
# 3. Reinicia el agente
osint-agent

No hay que reiniciar ningun servicio — el agente lee el modelo del .env en cada arranque.