Kalkulator SLA
Oblicz maksymalny dozwolony czas przestoju na podstawie odsetka SLA.
Wprowadź SLA
Spis treści
Kompleksowy przewodnik SLA
Co to jest SLA?
Umowa o poziomie usług (SLA) jest umową między usługodawcą a klientem, która określa oczekiwany poziom usług, zazwyczaj wyrażony jako procent czasu przestoju. SLA określa maksymalną dozwoloną ilość przestoju w danym okresie (dzień, miesiąc lub rok) i często obejmuje kary finansowe lub kredyty na usługi, jeżeli dostawca nie spełnia gwarancji. SLA są powszechne w hostingu w chmurze, telekomunikacji, SaaS i usług zarządzanych.
Jak oblicza się czas przestoju?
Wzór jest następujący: Czas przestoju = (1 − SLA%) × Okres. Na przykład z 99.9% SLA ponad rok (525,600 minut): Przestój = 0,1% × 525,600 = 526 minut (około 8,76 godziny) rocznie. Kalkulator ten stosuje tę samą logikę do okresów dziennych, miesięcznych i rocznych, dzięki czemu można zobaczyć maksymalne dopuszczalne przestoje w każdym oknie.
SLA vs SLO vs SLI
SLA (umowa o poziomie usług) jest gwarancją umowną. SLO (Service Level Objective) jest celem wewnętrznym, do którego dążysz - zazwyczaj ustawione wyżej niż SLA utworzyć bufor. SLI (wskaźnik poziomu usług) jest rzeczywistą miarą metryczną mierzoną przez użytkownika (np. odsetek dostępności z monitorowania). Dobra praktyka: ustawić SLO 0.5-1% powyżej SLA tak, że normalna zmienność nie narusza umowy.
- Uptime %: Odsetek SLA (np. 99,9%) jest zagwarantowana dostępność. Reszta to czas przestoju.
- The "nines": 99% = dwie dziewiątki; 99,9% = trzy dziewiątki; 99.99% = cztery dziewiątki; 99,999% = 5 dziewiątek. Więcej dziewiątek = mniej dozwolone przestoje i zazwyczaj wyższe koszty.
- Kredyty usługowe: Typowe środki zaradcze w przypadku naruszenia (np. 10- 25% opłaty miesięcznej za 0,1% poniżej SLA), a nie zwroty pieniężne.
- Wyłączenia: Zaplanowana konserwacja, siła wyższa i awarie spowodowane przez klienta są zazwyczaj wykluczone z przestoju.
Perspektywa klienta i dostawcy
Jako klient
- Dostajesz jasną gwarancję na czas nieokreślony i kredyty, jeśli dostawca zawiedzie.
- Użyj tego kalkulatora, aby zobaczyć ile czasu przestoju pozwala SLA (za dzień, miesiąc, rok).
- Negocjować wyłączenia, metodę pomiaru i limity kredytowe w umowie.
- Wyższa SLA (np. 99,99%) zwykle kosztuje więcej; równowaga ze skutkami dla przedsiębiorstw.
Jako dostawca
- Dokonujesz maksymalnego przestoju; przekroczenie tego powoduje napisy lub kary.
- Ustaw wewnętrzne SLOS nad SLA, aby uniknąć złamania.
- Zdefiniuj dokładnie to, co liczy się jako przestoje i wykluczyć planową konserwację.
- Monitorowanie dostępności przy użyciu tej samej metodologii, jaką zastosowano w umowie.
Korzyści ze stosowania SLA
- Jasność: Obie strony zgadzają się co do oczekiwanej dostępności i konsekwencji niepowodzenia.
- Odpowiedzialność: Dostawca ma motywację do realizacji celu; klient ma określone środki zaradcze.
- Planowanie: Wiedza o maksymalnym dozwolonym czasie przestoju (np. 43 min / miesiąc dla 99.9%) pomaga w planowaniu zdolności i reagowania na incydenty.
- Zaufanie: Opublikowane SLA (np. dostawcy chmur) wspierają przejrzystość i porównanie.
Ograniczenia i względy
- SLA jest gwarancją dostępności, a nie zerowego przestoju. Dozwolone wyłączenie może nadal mieć wpływ na użytkowników.
- Kredyty usługowe rzadko pokrywają następcze szkody (utracone dochody, reputacja); stosuje się pułapy odpowiedzialności.
- Definicje przestojów różnią się: należy wyraźnie określić częściowe przestoje, minimalny czas trwania i wyłączenia.
- Osiągnięcie pięciu dziewiątek (99.999%) wymaga znacznych zwolnień i kosztów; nie wszystkie systemy tego potrzebują.
SLA nie zapobiega przerwom - określa, ile czasu przestoju jest dozwolone i co się dzieje, jeśli dostawca go przekroczy. Zawsze definiuj to, co liczy się jako przestoje, jak jest mierzone i co jest wykluczone (utrzymanie, siła wyższa). Kredyty usługowe są zazwyczaj ograniczone i muszą być zgłaszane w krótkim oknie; nie zastępują planowania ciągłości działania.
Wybór odpowiedniego poziomu SLA
Wybór odpowiedniego SLA zależy od wpływu działalności gospodarczej, kosztów i wykonalności. Rozważ:
- Krytyczność: Ile kosztuje jedna godzina przestoju? Systemy dochodów dla klientów indywidualnych często wymagają 99.9% lub wyżej.
- Koszt: Wyższe SLA (99.99%, 99.999%) wymagają zwolnień i inżynierii; premie mogą być znaczące.
- Normy branżowe: Dostawcy chmur często oferują 99.99.99%; telekomunikacja i finanse mogą wymagać pięciu dziewiątek.
- Pomiar: Upewnij się, że umowa określa interwał wyborczy, lokalizacje i sposób, w jaki planowane utrzymanie jest wykluczone.
Szybkie referencje: przestoje przez SLA
| SLA | Na miesiąc | Na rok |
|---|---|---|
| 99% | 7.3 h | 3.65 days |
| 99.9% | 43.8 min | 8.76 h |
| 99.99% | 4.4 min | 52.6 min |
| 99.999% | 26 sec | 5.26 min |
SLA określają jasne oczekiwania co do dostępności i zapewniają środki zaradcze w przypadku, gdy usługodawca nie jest dostępny. Użyj tego kalkulatora, aby przekształcić wartości procentowe SLA w konkretne limity czasu przestoju (na dzień, miesiąc, rok) i połączyć je z jasnymi warunkami umowy na pomiar, wyłączenia i kredyty usługowe. Dla usług krytycznych, inwestować w monitoring i architekturę, które mogą rzeczywiście spełnić SLA obiecane lub wymagane.
SLA poziomy wyjaśnione
Typowe poziomy SLA i ich konsekwencje. AWS, Azure i GCP zazwyczaj oferują 99.9% do 99,99% w zależności od usługi; pięć dziewiątek (99.999%) wymaga N + 2 zwolnień i jest powszechne w telekomunikacji i bankowości podstawowej.
99% – 99.5%
~ 7, 3 h / miesiąc (99%) lub ~ 3,6 h / miesiąc (99,5%). Nadaje się do niekrytycznych narzędzi wewnętrznych, dev / stanu. Niskie koszty, mniejsza gwarancja.
99.9% (three nines)
~ 43,8 min / miesiąc. Wspólne dla aplikacji biznesowych, e-commerce, SaaS. Standard przemysłowy dla wielu dostawców chmur.
99.99% (four nines)
~ 4,4 min / miesiąc. Systemy krytyczne, usługi finansowe, bramy płatnicze. Wymaga zbędnej architektury.
99.999% (five nines)
~ 26 sekund / miesiąc. Telekomunikacja, misja krytyczna (np. 911, bankowość podstawowa). Bardzo drogie do osiągnięcia i eksploatacji.
Tabela referencyjna czasu przestoju
Użyj tej tabeli, aby zobaczyć maksymalny dozwolony czas przestoju na dzień, miesiąc i rok dla wspólnych poziomów SLA. Wartości pochodzą z (1 - SLA%) × okres w minutach.
| SLA | Na dzień | Na miesiąc | Na rok |
|---|---|---|---|
| 99% | 14.4 min | 7.3 h | 3.65 days |
| 99.9% | 1.44 min | 43.8 min | 8.76 h |
| 99.99% | 8.6 sec | 4.4 min | 52.6 min |
| 99.999% | 0.86 sec | 26 sec | 5.26 min |
Wybór i negocjowanie SLA
Przy definiowaniu lub negocjowaniu SLA należy skupić się na jasności i wymierności. Poniższe punkty pomagają uniknąć sporów i zapewniają wykonalność umowy.
- Określić, co liczy się jako przestoje (z wyjątkiem obsługi technicznej? minimalny czas trwania?)
- Określ pomiar: interwał wyborczy, lokalizacje i jak dostępność % oblicza się
- Dołącz kredyty lub kary za usługi; typowy 10- 25% kredyt na 0,1% poniżej SLA
- Wymagane zgłaszania incydentów i analizy przyczyn w ciągu 30 dni
- Określić, co liczy się jako przestoje (z wyjątkiem obsługi technicznej? Zaplanowane awarie ogłoszone z góry?)
- Wyższe SLA kosztują więcej - równowaga ze skutkami dla przedsiębiorstw. 1-godzinna przerwa może kosztować mniej niż premia za 99.99%.
- W umowie należy uwzględnić kredyty na usługi lub kary. Typowe: 10- 25% kredyt na 0,1% poniżej SLA.
- Wymagane przejrzyste raportowanie incydentów i analiza przyczyn źródłowych (RCA) w ciągu 30 dni.
- Rozważyć oddzielne SLA dla różnych poziomów usług (np. premia vs wsparcie standardowe).
- Określić metodologię pomiaru: czas trwania badania (1 min? 5 min?), liczba punktów monitorowania, zasięg geograficzny.
- Avoid ambiguity: define "available" precisely (e.g., HTTP 200 within 5 seconds from at least 2 of 3 regions).
Co liczy czas przestoju?
Definicje SLA różnią się w zależności od umowy. Aby uniknąć sporów, należy wyjaśnić na piśmie:
- Planowana konserwacja: zwykle wykluczona. Musi być ogłoszony 5-14 dni wcześniej.
- Siła wyższa: klęski żywiołowe, wojny - zazwyczaj wykluczone.
- Przekroczenia spowodowane przez użytkownika: Twoja błędna konfiguracja - wykluczona.
- Częściowe braki: Niektórzy dostawcy liczą tylko całkowitą niedostępność; pogorszone wyniki mogą się nie liczyć.
- Minimum outage duration: Outages under 5 minutes may be excluded ("consumption" clauses).
- Zależności od trzech stron: Przekroczenia spowodowane przez dostawców wyższego szczebla (chmura, CDN, DNS) mogą się liczyć lub nie - wyjaśnić w umowie.
Kredyty i kary za usługi
W przypadku naruszenia SLA kredyty usługowe są typowym środkiem zaradczym (nie zwrotem gotówki). Przykładowa struktura:
- 99.9% uszkodzone, ale ≥ 99,0%: 10% kredyt
- 99.0% uszkodzone, ale ≥ 95,0%: 25% kredyt
- & lt; 95,0%: 50- 100% kredyt
Kredyty są zazwyczaj ograniczone (np. 100% z opłaty miesięcznej). Musisz odebrać je w ciągu 30- 60 dni. Kredyty nie pokrywają następczych szkód (utracona sprzedaż, reputacja) - należy rozważyć odrębne przepisy dotyczące odpowiedzialności za usługi krytyczne.
SLA według przemysłu
Typowe oczekiwania SLA różnią się w zależności od sektora. Użyj tego jako odniesienia przy definiowaniu lub negocjowaniu własnego SLA.
- Handel elektroniczny / handel detaliczny: 99.9-99.95%. Każda minuta przestoju podczas szczytu (Czarny Piątek, Boże Narodzenie) może oznaczać tysiące utraconych dochodów.
- Opieka zdrowotna / HIPAA: 99.99% lub wyżej w przypadku systemów zwróconych do pacjenta. Ciśnienie regulacyjne i bezpieczeństwo pacjenta napędzają rygorystyczne wymagania.
- Bankowość / fintech: 99.99-99.999%. Przetwarzanie płatności i bankowość podstawowa często wymagają pięciu dziewiątek. Systemy transakcyjne muszą być bardzo dostępne.
- SaaS / B2B: 99.9% jest wspólnym punktem odniesienia; klienci przedsiębiorstw często negocjują 99.95% lub 99,99% ze wsparciem premium.
- Wewnętrzne narzędzia IT / dev: 99% może wystarczyć do umieszczenia, CI / CD, wewnętrzne deski rozdzielcze. Wpływ działalności gospodarczej jest niższy niż w przypadku systemów zwróconych do klientów.
Monitorowanie i zgodność SLA
Aby śledzić zgodność SLA potrzebujesz spójnych pomiarów i jasnych definicji. Poniższe praktyki przyczyniają się do unikania sporów i wspierania dokładnej sprawozdawczości.
- Monitoring uptime z wielu punktów geograficznych (uniknąć fałszywych pozytywnych z jednej lokalizacji)
- Spójny interwał wyborczy odpowiadający definicji SLA (np. kontrole 1-minutowe)
- Dokładne rejestrowanie incydentów za pomocą znaczników czasu rozpoczęcia / końca do obliczania dostępności
- Wyłączenie planowanej konserwacji; zapewnienie przestrzegania przez monitoring okien utrzymania
- Przejrzysta sprawozdawczość: strony stanu i miesięczne raporty dostępności
Wieloregionalne lub wielousługowe SLA: Jeśli zależy od kilku komponentów (API, baza danych, CDN), każdy z 99.9%, łączna dostępność jest niższa. Przykład: API 99.9% × DB 99.9% ≈ 99,8% end-to-end. Projektowanie redundancji i awarii, aby uniknąć awarii mieszania.