Gobierno & Seguridad 9 min de lectura26 de febrero de 2026

OWASP Top 10 para aplicaciones LLM: los riesgos de seguridad de la IA

La lista OWASP Top 10 para LLM (edición 2025) recoge los principales riesgos de seguridad de las aplicaciones con modelos de lenguaje. Repasamos cada uno y cómo mitigarlo.

Escudo de seguridad sobre componentes de una aplicación con IA

En resumen

El OWASP Top 10 para aplicaciones LLM (edición 2025) es la referencia de facto sobre los riesgos de seguridad propios de los sistemas con modelos de lenguaje. Los riesgos más críticos siguen siendo la inyección de prompts, la divulgación de información sensible y la agencia excesiva. Conocerlos es el primer paso para diseñar IA segura.

Las aplicaciones con LLM introducen una superficie de ataque nueva que las prácticas de seguridad tradicionales no cubren del todo. OWASP, la organización detrás del conocido Top 10 de seguridad web, mantiene una lista específica para LLM. Esta es la edición 2025:

¿Cuáles son los 10 riesgos (2025)?

1LLM01 — Inyección de prompts: entradas que manipulan al modelo para saltarse instrucciones o ejecutar acciones no deseadas. El riesgo número uno.
2LLM02 — Divulgación de información sensible: el modelo expone datos privados, confidenciales o regulados.
3LLM03 — Cadena de suministro: vulnerabilidades en modelos, datasets o componentes de terceros.
4LLM04 — Envenenamiento de datos y modelos: datos maliciosos en entrenamiento o ajuste que alteran el comportamiento.
5LLM05 — Manejo inadecuado de salidas: confiar en la salida del modelo sin validar puede provocar XSS, inyección u otros fallos aguas abajo.
6LLM06 — Agencia excesiva: dar al modelo demasiada autonomía o permisos para actuar sobre sistemas reales.
7LLM07 — Filtración del prompt de sistema: exponer instrucciones del sistema que revelan lógica o secretos.
8LLM08 — Debilidades de vectores y embeddings: fallos en sistemas RAG y bases vectoriales (fugas, envenenamiento del índice).
9LLM09 — Desinformación: el modelo genera información falsa presentada con apariencia fiable.
10LLM10 — Consumo no acotado: uso descontrolado de recursos que provoca degradación o costes desbocados.

¿Cómo se mitigan los más críticos?

Contra inyección de prompts: separa instrucciones de datos, valida y delimita las entradas, y nunca concedas confianza implícita a contenido externo recuperado.
Contra divulgación de datos: minimiza el contexto sensible, aplica control de acceso en la capa de herramientas y filtra salidas.
Contra agencia excesiva: aplica mínimo privilegio a cada herramienta, exige confirmación humana en acciones críticas y registra todo.
Contra manejo inadecuado de salidas: trata la salida del LLM como entrada no confiable; sanea antes de ejecutar o renderizar.

La regla de oro de la seguridad en IA: nunca confíes implícitamente ni en la entrada que llega al modelo ni en la salida que produce.

Puntos clave

La inyección de prompts (LLM01) sigue siendo el riesgo número uno.
Trata entradas y salidas del LLM como no confiables por defecto.
La agencia excesiva se controla con mínimo privilegio y auditoría.
OWASP LLM Top 10 es el punto de partida; combínalo con un marco de gobierno como NIST AI RMF.

El Top 10 enumera los riesgos técnicos; para gestionarlos de forma sistemática a nivel organizativo conviene apoyarse en marcos como NIST AI RMF y Google SAIF, y aplicar estos controles al diseñar agentes empresariales.

Fuentes y lecturas recomendadas

¿Quieres aplicar esto en tu organización? Conoce nuestro servicio de Gobierno, Seguridad & Cumplimiento.

Hablemos

¿Tienes un reto de datos o IA?

Conversemos sobre cómo llevar estas ideas a producción con gobierno, seguridad y operación.

Agendar diagnóstico

OWASP Top 10 para aplicaciones LLM: los riesgos de seguridad de la IA

¿Cuáles son los 10 riesgos (2025)?

¿Cómo se mitigan los más críticos?

Fuentes y lecturas recomendadas

Artículos relacionados

Gobernanza de IA con NIST AI RMF y Google SAIF

Cómo diseñar agentes de IA empresariales con control y trazabilidad

¿Tienes un reto de datos o IA?