Ir al contenido

SLA / SLO / SLI

Los SLAs, SLOs y SLIs definen compromisos de disponibilidad, objetivos internos e indicadores medibles para la fiabilidad de servicios de TI.

¿Qué son SLA, SLO y SLI?

Estos tres términos forman la base de la fiabilidad de servicios modernos. Definen, miden y comunican cuán fiable es un servicio de TI, tanto internamente para equipos de ingeniería como externamente para clientes y socios.

SLI – Service Level Indicator

Un SLI es una métrica concreta y medible que cuantifica un aspecto de la calidad del servicio. Ejemplos: porcentaje de disponibilidad, tiempo de respuesta en milisegundos, tasa de error por solicitud. Los SLIs son los datos brutos de los que se derivan los SLOs.

SLO – Service Level Objective

Un SLO define el valor objetivo para un SLI. Ejemplo: "el 99,9 % de las solicitudes se responden en menos de 200 ms." Los SLOs son objetivos internos que el equipo de ingeniería busca alcanzar. Son deliberadamente más estrictos que los SLAs para crear un margen.

SLA – Service Level Agreement

Un SLA es un acuerdo contractual entre proveedor y cliente que define niveles mínimos de servicio y consecuencias por incumplimiento. Los SLAs se basan en SLOs pero son legalmente vinculantes e incluyen provisiones de compensación.

Error Budgets

El concepto de error budget complementa los SLOs: si tu SLO es 99,9 % de disponibilidad, tienes un presupuesto de 0,1 % de tiempo de inactividad. Por mes, eso equivale a aproximadamente 43 minutos. Mientras el presupuesto no se agote, los equipos pueden desplegar nuevas funcionalidades. Cuando se agota, el foco cambia a estabilidad.

Definir SLIs correctamente

  • Elige SLIs relevantes desde la perspectiva del usuario
  • Limita a 3–5 por servicio
  • Usa percentiles (P95, P99) en lugar de promedios para latencias
  • Captura SLIs automáticamente mediante sistemas de monitorización como Prometheus

SLOs en la práctica

Los SLOs no son valores rígidos sino que se ajustan iterativamente. Google recomienda comenzar con un SLO que refleje el rendimiento actual y luego ajustarlo gradualmente. Los dashboards de SLO en Grafana hacen el estado transparente para todos los equipos.

Gestión de SLAs para el Mittelstand

Para las empresas medianas, una gestión de SLAs bien pensada es crucial: genera confianza en los clientes, da prioridades claras a los equipos de ingeniería y permite decisiones basadas en datos sobre desarrollo de funcionalidades vs. trabajo de estabilidad.

¿Por qué devRocks?

Te ayudamos a definir SLIs, SLOs y SLAs que se ajusten a tus servicios y requisitos de negocio. Desde la implementación de métricas hasta políticas de error budget y dashboards de SLA, construimos una cultura de fiabilidad en tu equipo.

Preguntas frecuentes sobre SLA / SLO / SLI

Para la mayoría de aplicaciones web, 99,9 % de disponibilidad es un buen punto de partida. Esto permite unos 43 minutos de inactividad al mes. 99,99 % requiere un esfuerzo significativamente mayor y solo tiene sentido para servicios críticos de negocio.

Error Budget = 1 – SLO. Con un SLO del 99,9 %, tu error budget es 0,1 %. En un mes de 30 días, eso son 43,2 minutos de inactividad permitida.

Los equipos internos trabajan mejor con SLOs que con SLAs. Los SLOs establecen objetivos sin penalizaciones contractuales y permiten un equilibrio saludable entre desarrollo de funcionalidades y fiabilidad.

Prometheus para recolección de métricas, Grafana para dashboards y Alertmanager para notificaciones son la combinación estándar. Alternativamente, servicios cloud como Datadog ofrecen funciones de SLO integradas.

¿Te interesa?

Hablemos de tu proyecto. Te asesoramos sin compromiso.

Contactar

Última actualización: abril 2026