Po pierwsze ciągłość działania

Fundusze strukturalne z Unii Europejskiej, przygotowania do Euro 2012, duża liczba inwestycji drogowych i infrastrukturalnych – pomimo trudności gospodarczych, w ostatnich latach Polska jest dużym placem budowy. Każda duża inwestycja to setki, a nawet tysiące jednostek zaangażowanego sprzętu, kilometry ogrodzeń i rusztowań, mobilna baza socjalna dla pracowników. Firma Ramirent uczestniczy w największych projektach budowlanych w Polsce, dostarczając wszelkiego rodzaju urządzenia i maszyny – od ciężkiego sprzętu, telehandlerów, podnośników, kontenerów, rusztowań i wind, aż po drobne akcesoria. Z usług Ramirent korzystają firmy budowlane, wykonawcze, instalacyjne, zakłady przemysłowe, stocznie, władze lokalne i krajowe, jak również klienci indywidualni.

Dla firmy, która cieszy się prestiżowym tytułem „Rental Company of the Year” przyznanym przez uznaną w branży organizację European Rental Association, troska o profesjonalizm oraz utrzymanie najwyższych standardów obsługi klientów jest priorytetem.

W tym celu zarówno na szczeblu centralnym, jak i lokalnym podejmowane są działania zmierzające do udoskonalania usług i ich jakości oraz poprawy ciągłości działania i bezpieczeństwa. Także w obszarze IT realizowane są prace zmierzające do zapewnienia nieprzerwanej pracy systemów informatycznych, nawet w wypadku dużych katastrof naturalnych.

W Ramirent  uznano, że w infrastrukturze IT firmy w Polsce konieczne jest skorzystanie z zapasowego centrum przetwarzania danych odpowiednio oddalonego, które w razie poważnej awarii będzie w stanie w krótkim czasie przejąć zadania podstawowego centrum przetwarzania danych.

W skali firmy był to jeden z najważniejszych projektów informatycznych w 2010 roku. Hosting zapasowej infrastruktury zapewnia centrum przetwarzania danych BCC. Centrum Outsourcingowe BCC dostarcza odpowiednie kompetencje w celu zapewnienia utrzymania i monitorowania środowiska zapasowego.

Zapasowe IT

Podstawowe centrum przetwarzania danych Ramirent obsługuje wszystkie firmowe systemy IT, w tym profile użytkowników wykorzystywane zdalnie z rozproszonych lokalizacji na terenie całego kraju. Krytyczne systemy działają w architekturze wysokiej dostępności (Microsoft Cluster Service). Na wypadek awarii centrum przetwarzania danych dysponuje łączami zapasowymi, a także własnym agregatem prądotwórczym, zdolnym podtrzymywać pracę serwerów przez określony czas. Standardy pracy centrum przetwarzania są zgodne z najlepszymi praktykami zarządzania IT.

Zapewnienie usługi ciągłości działania również w wypadku poważnych katastrof nie jest możliwe bez korzystania z zapasowego centrum przetwarzania danych i konfiguracji systemów w taki sposób, aby było możliwe ich przełączenie w założonym, odpowiednio krótkim czasie.

Co więcej – systemy zapasowe powinny zapewniać usługi na poziomie nieodbiegającym od tych, do jakich są przyzwyczajeni użytkownicy – zarówno pod względem czasu reakcji, jak i dostępności.

Kamil Lisiecki, Menedżer IT w Ramirent

O bezpośrednich powodach decyzji mówi Kamil Lisiecki, Menedżer IT w Ramirent w Polsce: „Bezpieczeństwo i ciągłość działania IT to dla nas priorytet. Przy tak rozproszonej lokalizacji naszych oddziałów i pracowników utrzymanie niezawodnej komunikacji z firmowymi systemami wymaga dodatkowych zabezpieczeń, by dotrzymać restrykcyjnych parametrów dostępności, jakich wymaga od nas biznes.

Jednak nie na wszystko mamy wpływ. Najlepszym przykładem jest duża awaria prądu w Szczecinie sprzed dwóch lat, co więcej znajdujemy się na terenach zagrożonych powodzią –  bez względu na poziom zabezpieczenia serwery nie wygrają z żywiołem… Jeśli nawet nasza infrastruktura przetrwa, to musimy się liczyć z tym, że w takich wypadkach dostawcy Internetu czy też energii elektrycznej nie są w stanie zagwarantować bezawaryjnego działania ich usług. Dlatego zdecydowaliśmy się na uruchomienie zapasowego centrum przetwarzania danych w niezależnej, zewnętrznej lokalizacji. Ciągła replikacja danych biznesowych zapewnia nam wysoki poziom bezpieczeństwa”.

Potrzebne i oby się nie przydało…

W związku z wysokimi kosztami budowy drugiego ośrodka przetwarzania danych firma Ramirent zdecydowała się na skorzystanie z centrum przetwarzania danych BCC jako swojego centrum zapasowego. W efekcie za rozsądną cenę otrzymała gwarancję działania kluczowych systemów informatycznych.

Udostępnienie „zapasowych” systemów i danych pracownikom i klientom w ciągu kilkudziesięciu minut od zgłoszenia awarii, co gwarantuje umowa z BCC, jest czasem akceptowanym z biznesowego punktu widzenia. W praktyce oznacza to, że w wypadku poważnej awarii, która uniemożliwi pracę centrum w Szczecinie, zaczyna działać centrum zapasowe. A zatem użytkownicy mogą dalej wykonywać swoje codzienne zadania. Warto zauważyć, że przełączenie się na instalację zapasową jest przewidywane tylko w bardzo wyjątkowych okolicznościach.

Replikacja danych

W ramach usługi ZCPD Centrum Outsourcingowe BCC realizuje dla Ramirent usługę kolokacji infrastruktury zapasowej, wraz z hostingiem systemów wspomagających, potrzebnych do utrzymania środowiska.

BCC (aktualnie All for One Poland) odpowiada nie tylko za utrzymanie zapasowych zasobów danych, ale także stworzyło infrastrukturę konieczną do replikacji danych pomiędzy tymi dwoma instalacjami – podstawowym centrum w Szczecinie i zapasowym w BCC.

Najważniejsze usługi, które zostały objęte replikacją do systemu zapasowego, to: zintegrowany system ERP, baza danych Microsoft SQL Server, Microsoft Terminal Services, rozproszony sieciowy system plików (Distributed File System) oraz system nazw domenowych (Domain Name System, DNS). Dodatkowo replikowane są także konta użytkowników w Active Directory.

Replikacja między bliźniaczymi bazami danych zaprojektowana jest w sposób umożliwiający minimalizację czasu niedostępności systemów głównych w przypadku niedostępności podstawowego centrum przetwarzania danych Ramirent. Baza danych w centrum przetwarzania danych BCC pozostaje w trybie gotowości, czekając na podjęcie pracy w wypadku awarii.

Aby zwiększyć wydajność bazy danych i przyspieszyć jej replikację, konsultanci BCC przeprowadzili dodatkowo reorganizację zadań wewnątrz bazy, między innymi dzieląc dane na tzw. pakiety transferowe.

Replikacja danych odbywa się poprzez bezpieczne, szyfrowane łącze WAN, zestawione w konfiguracji site to site. Przepustowość tego kanału jest uzależniona od liczby i rozmiarów przesyłanych pakietów danych i oczekiwań klienta związanych z akceptowalnym czasem niedostępności systemu na wypadek awarii.

Monitoring replikacji danych

Dla zapewnienia ciągłości usługi Centrum Outsourcingowe BCC monitoruje w trybie ciągłym zasoby Ramirent dostępne w centrum przetwarzania danych BCC. Monitoring obejmuje: warstwę łącza danych, serwery, systemy oraz usługi i wykonywany jest w czasie rzeczywistym (online). Badane są również poszczególne procesy i zadania odpowiedzialne za całość replikacji.

Infrastruktura techniczna Centrum Outsourcingowego BCC

Centrum przetwarzania danych BCC (aktualnie All for One Poland) jest zlokalizowane na terenie Nickel Technology Park Poznań (NTPP) w podpoznańskich Złotnikach. Infrastruktura IT spełnia najwyższe światowe wymagania w zakresie bezpieczeństwa
i wydajności. Centrum przetwarzania danych BCC w Złotnikach jest wyposażone w:

  • redundantne zasilanie (dwie niezależne linie zasilające), zabezpieczone przez redundantne systemy UPS pracujące równolegle, dodatkowo zabezpieczone generatorem prądotwórczym
  •  podwójny system wykrywania pożaru i gaszenia gazem dla każdej strefy w centrum przetwarzania danych
  • redundantną klimatyzację w postaci szaf chłodniczych
  • podłogę techniczną, pod którą zainstalowane są czujniki wykrywania wilgoci
  • czujki ruchu i czujniki drgań sejsmicznych systemy wykrywania pożaru oraz wilgoci zintegrowane z centralą telefoniczną, które w przypadku wykrycia niepożądanych zdarzeń powiadamiają automatycznie odpowiedzialne służby
  • monitoring (24 godzin na dobę przez 7 dni w tygodniu) agencji ochrony mienia oraz kamery wideo rejestrujące obraz
  • chronione strefy dostępu, do których dostęp mają wyłącznie uprawnione osoby

W Centrum Outsourcingowym BCC usługa monitorowania jest realizowana w oparciu o plany ciągłości działania na wypadek awarii i certyfikowane procedury bezpieczeństwa, m.in. zgodnie z normami ISO 9001:2008, ISO/IEC 20000 i ISO/IEC 27001. Na w pełni zautomatyzowany system monitorujący składa się kilka zintegrowanych ze sobą, niezależnych aplikacji. Konsultanci są dostępni w trybie 24/7.

Procedura ciągłości działania

W ramach uruchomienia usługi replikacji stworzono i przetestowano procedurę ciągłości działania (PCD) przełączania podstawowego centrum przetwarzania danych na zapasowe centrum przetwarzania danych. Jest ona częścią składową procedury ciągłości działania IT w Ramirent.

Dokument ten szczegółowo określa postępowanie na wypadek awarii oraz zdarzeń odbiegających od normy, kroki, które powinny być podjęte jako reakcja w dokładnie opisanych, nietypowych sytuacjach, w tym oczywiście procedurę przełączania się na centrum zapasowe. Testy sprawdzające poprawność przełączania, czas odzyskiwania pełnej sprawności oraz wpływ na bieżącą pracę systemów odbywają się raz do roku.

Procedura ciągłości działania określa również zasady bieżącej współpracy: tworzenia backupów w centrum zapasowym itp. – by zapewnić bezpieczeństwo danych i systemów w tej lokalizacji.

Do zapoznania się z procedurą zobowiązani są administratorzy systemów, zarówno w BCC, jaki i w firmie Ramirent.

A co jeśli…

Obecnie co kilka minut kolejna partia danych z systemów IT Ramirent jest wysyłana do kopii systemu w centrum przetwarzania danych BCC. Ten proces odbywa się w tle i jest niezauważalny dla użytkowników aplikacji. Monitorowanie procesu w trybie ciągłym zapewnia błyskawiczną reakcję w przypadku wystąpienia odchyleń (przekroczenia wartości progowych), co wiąże się z podjęciem określonych działań naprawczych.

Zasady bezpieczeństwa i system wysokiej dostępności IT wdrożone w Ramirent praktycznie wykluczają możliwość, by awaria pojedynczego serwera, podstawowego łącza internetowego albo krótkotrwała przerwa w dostawie prądu spowodowały niewydolność podstawowego centrum przetwarzania danych.

Zapasowe centrum jest przewidziane na wypadek dużych katastrof naturalnych (np. powódź) lub innych niedających się przewidzieć zdarzeń (pożar, atak terrorystyczny, awaria łącz internetowych na dużą skalę). Jeśli takie krytyczne zdarzenie, skutkujące niedostępnością systemów IT w bieżącej pracy wystąpi, Menedżer IT po stronie Ramirent podejmie decyzję o przełączeniu. W tej samej chwili uruchomione zostaną procedury ciągłości działania poprzez Centrum Outsourcingowe BCC.

W rezultacie w ciągu określonego czasu zapasowe CPD w BCC przejmie rolę podstawowego CPD. Wszyscy pracownicy dostaną komunikat o awarii wraz z instrukcją, by korzystali z „zapasowych” połączeń umożliwiających logowanie się do systemów.

Dla użytkowników, którzy od chwili przełączenia będą pracować w nowej infrastrukturze, zmiana ta pozostanie nieodczuwalna. Nie zmieni się ich zakres uprawnień czy interfejsy systemowe. Także wydajność systemu będzie zapewniona na odpowiednim poziomie.

W ramach procedury ciągłości działania opracowano także zasady postępowania i odpowiedzialności w procesie przywracania funkcjonalności podstawowego centrum przetwarzania danych. Odpowiednia procedura została przetestowana w ramach projektu.

Na wszelki wypadek

Jak podsumowuje Kamil Lisiecki: „Dzięki zastosowaniu zaproponowanych przez BCC (aktualnie All for One Poland) rozwiązań opartych na replikacji serwerów bazy danych w trybie stand by możemy sporo zaoszczędzić na licencjach dla drugiej bazy danych. To był dodatkowy argument. Jednak jeśli rozważamy usługę zapasowego centrum przetwarzania danych pod kątem finansów – radzę większą uwagę przykładać nie do tego, jakie ponosimy koszty jej bieżącego utrzymania, ale jakie straty finansowe i biznesowe spowoduje niedostępność podstawowych systemów IT naszej firmy. Dlatego zapasowe centrum porównałbym do polisy ubezpieczeniowej – ponosimy koszty jego utrzymania i trzymamy kciuki, byśmy nie musieli z niego korzystać”.

Ramirent jest największą w Polsce i wiodącą na rynkach światowych siecią wypożyczalni sprzętu budowlanego i rusztowań. Firma oferuje wynajem wysokiej jakości sprzętu bez operatora i powiązane z nim usługi dodatkowe, takie jak doradztwo techniczne, serwis oraz transport. Grupa zatrudnia 3 tys. specjalistów w 344 punktach obsługi klienta, w 13 państwach w północnej, centralnej i wschodniej Europie. W Polsce Ramirent obecny jest od 2000 roku, firma posiada ponad 40 oddziałów na terenie całego kraju oraz zatrudnia 500-osobową wykwalifikowaną kadrę pracowników.