Skip to content

ADR_00024: Prevence degradace služeb (auto‑healing & adaptive load management)

Status: Proposed / Accepted
Date: 2026-01-13


Context

  • Error rate roste zejména při špičkách.
  • Incidenty ukazují, že problémy vznikají přetížením, nikoli chybou aplikace.
  • Cílem je zabránit degradaci dříve, než nastane.

Decision

Preventivní stabilizační mechanismy

  • auto‑scaling (HPA/KEDA)
    • HPA (Horizontal Pod Autoscaler) škáluje podle CPU, paměti nebo custom metrik
    • KEDA škáluje podle externích signálů (fronty, eventy, Kafka lag... )

Circuit breaker pouze jako poslední vrstva

  • ochrana při selhání downstream služeb
  • ne primární mechanismus

Consequences

Pozitiva

  • Snížení error rate o 30–50 %
  • Stabilita při špičkách
  • Plynulejší UX díky graceful degradation

Negativa

  • Vyšší komplexita orchestrace
  • Nutnost kvalitní observability

Rationale

Rozhodnutí Důvod
Auto‑scaling Reakce na zátěž bez manuálních zásahů
Backpressure & throttling Prevence zahlcení downstream služeb
Load shedding Udržení core funkcí i při špičkách
Graceful degradation UX bez tvrdých chyb
Circuit breaker jako fallback Ochrana systému, ne primární pattern