Szukaj
Close this search box.

Zarządzanie incydentami, czyli: rejestruj zgłoszenia

Leszek Piotrowski
Leszek Piotrowski

Trochę teorii

Głównym celem Zarządzania Incydentem jest jak najszybsze przywrócenie normalnego działania usługi, minimalizując niekorzystny wpływ na działanie innych usług, a wszystko to z zapewnieniem możliwie najwyższego poziomu jakości oraz dostępności (czyli SLA).

Do głównych zadań realizowanych w ramach tego procesu należą:

  • Wykrywanie i rejestrowanie incydentów,
  • Klasyfikacja incydentów i pierwsze próby ich rozwiązania,
  • Rozwiązywanie incydentów
  • Zamykanie incydentów,
  • Eskalacja, monitorowanie, śledzenie i komunikacja

Czym jest incydent

Według ITIL incydentem jest każde zdarzenie, które nie jest częścią standardowego działania usługi i które powoduje lub może spowodować przerwę w dostarczaniu usługi informatycznej. Powstanie incydentu może być spowodowane np. brakiem dostępu do systemu czy błędem w aplikacji uniemożliwiającym normalną pracę z systemem. Incydenty mogą być rejestrowane przez użytkowników jak również przez systemy automatycznego monitoringu.

Pamiętaj!

Prośba o nową lub dodatkową usługę lub też zmianę dowolnego elementu konfiguracji czy procedury nie jest incydentem. Są to tzw. prośby o zmianę (RFC). W praktyce postępowanie w przypadku incydentów i próśb o zmianę nie różni się znacząco, zatem zostały one zaliczone do procesu zarządzania incydentami. Różnica jest tylko w SLA, czyli terminie rozwiązania.

Planowanie zarządzania incydentem

Zarządzanie incydentami będzie różniło się w zależności od firmy, ale kluczem do sukcesu jest zawsze zdefiniowanie kategorii, poziomów ważności, priorytetów, ról/zespołów wsparcia, oraz określenie poziomów SLA, na podstawie tych danych.

Określ kategorie

Te elementy zależą tylko i wyłącznie od twojej organizacji. Istnieją tu zagrożenia i chęć stworzenia kategorii na każdy incydent. Takie postępowanie jest niewłaściwe i prowadzi do utworzenia bardzo dużej ilości kategorii, a w rezultacie doprowadzi to do sytuacji, kiedy przy klasyfikacji zawsze będzie wybierana opcja o nazwie „inne”.

Prioryteryzuj incydenty

Każdy incydent musi mieć priorytet. Jeśli chcesz nadać priorytet incydentowi, musisz ocenić jego wpływ na organizację (m.in. liczbę osób których dotyczy incydent), a także możliwe konsekwencje dla organizacji. Pamiętaj jeśli pozwolisz użytkownikowi na wybieranie tych parametrów, zawsze będziesz miał incydenty o najwyższym priorytecie.

Określ zespoły wsparcia

Ich zadaniem będzie rozwiązywanie incydentów w kolejnych jego etapach. Będą one również powiadamiane przy eskalacji nierozwiązanych incydentów. W zależności od wielkości organizacji może istnieć wiele zespołów wsparcia, w najmniejszych organizacjach może być jeden zespół wsparcia.

Natomiast w dużych organizacjach ich ilość jest podyktowana tylko i wyłącznie procesem przepływu pracy. Zawsze istnieje pierwsza linia wsparcia czyli HelpDesk, natomiast z założenia kolejne poziomy są bardziej techniczne lub wyspecjalizowane w konkretnych systemach.

Role i obowiązki

Należy określić role i obowiązki związane z zarządzaniem incydentami. Będą się one różnić w zależności od wielkości organizacji, ilości i wielkości zespołu i innych czynników. Podstawowe role, które powinny być zawsze przydzielone to:

Manager ds. incydentów: osoba odpowiedzialna w każdym zespole za nadzorowanie rozwiązywania incydentu.
Manager lub Rada ds. badania krytycznych incydentów: grupa osób lub osoba odpowiedzialna za przeprowadzanie analizy incydentów krytycznych dla infrastruktury.

Komunikacja wielokanałowa

W zależności od wybranego rozwiązania interfejs do rejestrowania incydentów może być modyfikowany (w droższych rozwiązaniach) lub nie w systemach które są zamknięte.

Natomiast niezależnie od wybranego rozwiązania każdy system powinien umożliwiać rejestrację incydentu kilkoma kanałami:

  • mail
  • formularz www
  • telefon, zespół helpdesk powinien mieć możliwość rejestracji incydentu w imieniu zgłaszającego

Incydenty systemów automatycznego monitorowania

System powinien również mieć możliwość rejestrowania i automatycznego zamykania incydentów pochodzących od systemów automatycznego monitoringu, np. incydent o zwiększonym zużyciu pamięci RAM serwera, system powinien mieć możliwość zarejestrowania takiego incydentu oraz zamknięcia go jeśli problem ustąpił np. w czasie 15 min od zarejestrowania.

Jakie statusy może przyjmować incydent oraz na jakim etapie jest rozwiązanie incydentu, np.:

  • Zarejestrowane – po utworzeniu rekordu w systemie.
  • Klasyfikacja – po zarejestrowaniu rekordu następuje automatyczna i/lub ręczna klasyfikacja przez zespól pierwszej linii wsparcia
  • Przekazane – po przekazaniu do kolejnych linii wsparcia.
  • Rozwiązane – po zamknięciu Incydentu
  • Zamknięte – po upływie okresu czasu przewidzianego na reklamację, od daty uzyskania statusu Rozwiązane.

Delegowanie

Z definicji helpdesk czyli pierwsza linia wsparcia musi być w stanie rozwiązać wiele najczęstszych incydentów bez eskalacji. W chwili gdy już to nie jest to możliwe, muszą zebrać jak najwięcej informacji, aby kolejne poziomy wsparcia mogły szybko rozwiązać incydent.

W systemie powinny istnieć zdefiniowane role, dzięki czemu członkowie zespołu błyskawicznie wiedzą, czego się od nich oczekuje.

Eskalacja

Czasami incydent nie zostaje szybko rozwiązany przez przypisany zespół. W przypadku, gdy tak się stanie, kolejnym krokiem jest automatyczna eskalacja do kolejnego eksperta lub zespołu ekspertów, którzy są lepiej przygotowani do rozwiązania tego konkretnego incydentu.

Rozwiązanie

Na tym etapie kończy się sytuacja awaryjna, a zespół przechodzi do usuwania szkód i analizy bez wskazywania winnych, która ma na celu ustalanie przyczyny incydentu i zmniejszenie ryzyka jego wystąpienia w przyszłości.

Baza wiedzy

Niezależnie od tego, czy już mamy istniejącą bazę wiedzy, czy dopiero planujemy ją budować, proces powinien być dość prosty, np.:

  • proste utworzenie i dodanie artykułów do bazy wiedzy bezpośrednio z incydentu
  • udostępnianie bazy wiedzy zespołom wsparcia
  • udostępnianie użytkownikowi końcowemu artykułów z bazy wiedzy w celu umożliwienia samo-rozwiązania incydentu

SLAService Level Agreement

W SLA deklarujemy, że będziemy świadczyć naszą usługę na konkretnym, wymiernym poziomie. 

Oczywiście SLA i mierniki można definiować dowolnie. Bardzo istotne jest by SLA były realne i możliwe do zrealizowania.

Istnieje kilka dość popularnych mierników, np.:

  • czas wykorzystany do zamknięcia zgłoszenia. Np.: deklarujemy, że przynajmniej 90% wszystkich incydentów będzie wykonana w ciągu 48h od zgłoszenia
  • nieodebrane połączenie czyli procentowa ilość połączeń, z których użytkownik zrezygnował w trakcie oczekiwania
  • ilość połączeń oddzwanianych czyli na ile połączeń nieodebranych oddzwoniła pierwsza linia
  • czas oczekiwania na połączenie z pierwszą linią wsparcia
  • ilość problemów rozwiązanych w trakcie pierwszego kontaktu.

Wybór narzędzia

Odpowiednie narzędzie powinno w pełni nadzorować proces zarządzania incydentem, a nie tylko tworzyć i rozsyłać powiadomienia.

Powinno mieć następujące cechy:

  • pojedynczy punk kontaktu z użytkownikiem – stwórz łatwy interfejs do rejestrowania incydentów,
  • bezproblemowa integracja z innymi aplikacjami i systemami;
  • automatyzacja procesów reakcji na incydenty które powiadomią określone osoby z danego zespołu wsparcia
  • komunikacja z zgłaszającym powinna być na bieżąco realizowana w celu informowania go statusie zgłoszenia
  • raportowanie incydentów , ilość zgłoszeń, ilość zgłoszeń terminowo rozwiązanych, ilość zgłoszeń zagrożonych nierozwiązaniem w terminie itp.
  • analiza rozwiązań – zapewnia narzędzia do uczenia się na podstawie przeszłych incydentów oraz do ich rozwiązań. Pozwala budować bazę wiedzy oraz poprawić dobre praktyki reagowania na incydenty.


Masz pytania?
Skontaktuj się z autorem
Leszek Piotrowski
Leszek Piotrowski

Podobne artykuły

BLOG
Krzysztof Tyl

Październik – miesiącem bezpieczeństwa

Postanowienia noworoczne w październiku?!?  Więcej sportu. Rodzina jest najważniejsza. Zdrowe odżywianie. Dbanie o zdrowie. Praktykowanie wdzięczności. Lista książek do przeczytania. Nowe hobby lub przebranżowienie. Więcej

Aktualności
Anna Maciocha

Pięć lat współpracy z Grupą Polenergia

🔌 Pięć lat niezachwianej współpracy: utrzymanie przepływu ciepła i energii! 💡Dziś IT Challenge, jako część grupy Euvic, ma zaszczyt świętować pięć lat niezachwianej współpracy z Grupa Polenergia,

Zgłoszenie serwisowe

Dane firmy

Masz pytanie? Napisz do nas