ADR_00024: Prevence degradace služeb (auto‑healing & adaptive load management)
Status: Proposed / Accepted
Date: 2026-01-13
Context
- Error rate roste zejména při špičkách.
- Incidenty ukazují, že problémy vznikají přetížením, nikoli chybou aplikace.
- Cílem je zabránit degradaci dříve, než nastane.
Decision
Preventivní stabilizační mechanismy
- auto‑scaling (HPA/KEDA)
- HPA (Horizontal Pod Autoscaler) škáluje podle CPU, paměti nebo custom metrik
- KEDA škáluje podle externích signálů (fronty, eventy, Kafka lag... )
Circuit breaker pouze jako poslední vrstva
- ochrana při selhání downstream služeb
- ne primární mechanismus
Consequences
Pozitiva
- Snížení error rate o 30–50 %
- Stabilita při špičkách
- Plynulejší UX díky graceful degradation
Negativa
- Vyšší komplexita orchestrace
- Nutnost kvalitní observability
Rationale
| Rozhodnutí | Důvod |
|---|---|
| Auto‑scaling | Reakce na zátěž bez manuálních zásahů |
| Backpressure & throttling | Prevence zahlcení downstream služeb |
| Load shedding | Udržení core funkcí i při špičkách |
| Graceful degradation | UX bez tvrdých chyb |
| Circuit breaker jako fallback | Ochrana systému, ne primární pattern |