SLA / SLO / SLI
Los SLAs, SLOs y SLIs definen compromisos de disponibilidad, objetivos internos e indicadores medibles para la fiabilidad de servicios de TI.
¿Qué son SLA, SLO y SLI?
Estos tres términos forman la base de la fiabilidad de servicios modernos. Definen, miden y comunican cuán fiable es un servicio de TI, tanto internamente para equipos de ingeniería como externamente para clientes y socios.
SLI – Service Level Indicator
Un SLI es una métrica concreta y medible que cuantifica un aspecto de la calidad del servicio. Ejemplos: porcentaje de disponibilidad, tiempo de respuesta en milisegundos, tasa de error por solicitud. Los SLIs son los datos brutos de los que se derivan los SLOs.
SLO – Service Level Objective
Un SLO define el valor objetivo para un SLI. Ejemplo: "el 99,9 % de las solicitudes se responden en menos de 200 ms." Los SLOs son objetivos internos que el equipo de ingeniería busca alcanzar. Son deliberadamente más estrictos que los SLAs para crear un margen.
SLA – Service Level Agreement
Un SLA es un acuerdo contractual entre proveedor y cliente que define niveles mínimos de servicio y consecuencias por incumplimiento. Los SLAs se basan en SLOs pero son legalmente vinculantes e incluyen provisiones de compensación.
Error Budgets
El concepto de error budget complementa los SLOs: si tu SLO es 99,9 % de disponibilidad, tienes un presupuesto de 0,1 % de tiempo de inactividad. Por mes, eso equivale a aproximadamente 43 minutos. Mientras el presupuesto no se agote, los equipos pueden desplegar nuevas funcionalidades. Cuando se agota, el foco cambia a estabilidad.
Definir SLIs correctamente
- Elige SLIs relevantes desde la perspectiva del usuario
- Limita a 3–5 por servicio
- Usa percentiles (P95, P99) en lugar de promedios para latencias
- Captura SLIs automáticamente mediante sistemas de monitorización como Prometheus
SLOs en la práctica
Los SLOs no son valores rígidos sino que se ajustan iterativamente. Google recomienda comenzar con un SLO que refleje el rendimiento actual y luego ajustarlo gradualmente. Los dashboards de SLO en Grafana hacen el estado transparente para todos los equipos.
Gestión de SLAs para el Mittelstand
Para las empresas medianas, una gestión de SLAs bien pensada es crucial: genera confianza en los clientes, da prioridades claras a los equipos de ingeniería y permite decisiones basadas en datos sobre desarrollo de funcionalidades vs. trabajo de estabilidad.
¿Por qué devRocks?
Te ayudamos a definir SLIs, SLOs y SLAs que se ajusten a tus servicios y requisitos de negocio. Desde la implementación de métricas hasta políticas de error budget y dashboards de SLA, construimos una cultura de fiabilidad en tu equipo.
Preguntas frecuentes sobre SLA / SLO / SLI
Para la mayoría de aplicaciones web, 99,9 % de disponibilidad es un buen punto de partida. Esto permite unos 43 minutos de inactividad al mes. 99,99 % requiere un esfuerzo significativamente mayor y solo tiene sentido para servicios críticos de negocio.
Error Budget = 1 – SLO. Con un SLO del 99,9 %, tu error budget es 0,1 %. En un mes de 30 días, eso son 43,2 minutos de inactividad permitida.
Los equipos internos trabajan mejor con SLOs que con SLAs. Los SLOs establecen objetivos sin penalizaciones contractuales y permiten un equilibrio saludable entre desarrollo de funcionalidades y fiabilidad.
Prometheus para recolección de métricas, Grafana para dashboards y Alertmanager para notificaciones son la combinación estándar. Alternativamente, servicios cloud como Datadog ofrecen funciones de SLO integradas.
Términos relacionados
Servicios relacionados
Pipelines CI/CD
Sistemas de entrega automatizados que reducen los ciclos de despliegue de semanas a minutos.
Kubernetes
Orquestación de contenedores a gran escala: diseñamos, operamos y gestionamos clústeres Kubernetes listos para producción.
Observabilidad
Monitoreo y alertas Full-Stack que predicen incidencias antes de que los usuarios se vean afectados.
Última actualización: abril 2026