Szanowni Klienci, w ostatnich dniach miała miejsce poważna awaria u naszego zewnętrznego dostawcy usług serwerowych, która mocno wpłynęła na działanie systemu fireTMS. Jesteśmy świadomi niedogodności które przez to Państwa spotkały, dlatego chcielibyśmy w poniższym wpisie wyjaśnić sytuację, a także poinformować o krokach, które w związku z nią podjęliśmy.
Co się dokładnie wydarzyło?
W piątek 12 lipca, zaraz po rozpoczęciu pracy naszej firmy, została zdiagnozowana i potwierdzona awaria po stronie zewnętrznego dostawcy usług serwerowych. Natychmiast przystąpiliśmy do wdrożenia procedur w przypadku tego rodzaju awarii, niestety wystąpiły problemy z wydajnością naszej infrastruktury awaryjnej. W istotny sposób wpłynęły one na spowolnienie działania systemu fireTMS, a także chwilowe przerwy w dostępie do usługi. Awaria po stronie zewnętrznego dostawcy usług została naprawiona we wtorek 16 lipca, z kolei w środę 17 lipca infrastruktura fireTMS powróciła do stanu sprzed awarii.
Co zrobiliśmy po stronie fireTMS w trakcie awarii?
W momencie zdiagnozowania problemu, nasz zespół developerski w trybie niezwłocznym rozpoczął prace mające na celu utrzymanie działania fireTMS. Przez cały czas analizował sytuację, reagował i wdrażał wszelkie możliwe kroki do poprawy tej trudnej sytuacji. Niestety nasze środowisko awaryjne okazało się niewystarczająco wydajne. Przez to system wolno działał, a praca w nim była znacznie utrudniona.
Pomimo niepełnej wydajności serwera pomocniczego, jak również długiego czasu trwania awarii u dostawcy zewnętrznego, zaangażowanie i bieżące działania naszego zespołu developerskiego pozwoliły zapobiec utracie danych w systemie. Zakończenie awarii u dostawcy zewnętrznego oraz przywrócenie infrastruktury fireTMS pozwoliły od razu wrócić do standardowego korzystania z systemu. Z równym zaangażowaniem nasz Dział Wsparcia Technicznego starał się udzielać bieżących informacji o awarii oraz w miarę możliwości odpowiadać na wszystkie Państwa zapytania. Nie było to proste, zważywszy, że przez cały czas trwania awarii zewnętrzny dostawca usług nie podał konkretnych informacji na temat dnia i godziny jej naprawy. Ponadto, aby na bieżąco Państwa informować o statusie awarii, umieściliśmy w systemie oraz na infolinii odpowiednie komunikaty.
Co zamierzamy zrobić?
Jako profesjonalna firma z 10-letnim stażem na rynku mamy świadomość powagi i skutków sytuacji, która miała miejsce. Choć nie ponosimy odpowiedzialności za awarie po stronie usługodawcy zewnętrznego oraz czas ich naprawienia, to wyciągnęliśmy z tej sytuacji wnioski. W związku z tym, że nasza infrastruktura awaryjna nie była w pełni wydajna, podjęliśmy kroki, które mają na celu zapobiegać podobnym problemom w przyszłości. Wiążą się one przede wszystkim z inwestycją w serwery zastępcze, które w razie takich awarii zapewnią wydajność systemu, a tym samym nie spowalnią jego działania i pozwolą Państwu standardowo pracować. Przeznaczymy też maksymalne zasoby czasowe i ludzkie, aby zapasowa infrastruktura sieciowa była w pełni wydajna w razie konieczności awaryjnego użytku.
Nie chcemy zawieść Państwa zaufania, dlatego dołożymy wszelkich starań, aby jeszcze lepiej zabezpieczyć się na przyszłość. Jeszcze raz przepraszamy za powstałe utrudnienia.
Więcej szczegółów znajdziesz we wpisie technicznym post mortem.