Projekt Proof-of-Concept przeprowadzony w firmie Sokołów był swoistym laboratorium dla rozwiązania SAP HANA for BW. HANA przyspieszyła przetwarzanie danych ponad 10 razy. Ale to nie jedyne wnioski z tego przedsięwzięcia…

Od 2012 roku możliwa jest instalacja hurtowni danych SAP Business Warehouse (SAP BW) z użyciem rozwiązania SAP HANA (The High Performance Analytical Appliance by SAP) zamiast klasycznej bazy danych. Rozszerzenie możliwości zastosowania produktu SAP HANA, umożliwiające jego użycie łącznie z SAP BW jest informacją pozytywną. Taka kombinacja dwóch produktów SAP pozwala na zarządzanie danymi za pomocą mechanizmów hurtowni danych i jednocześnie udostępnia niesamowitą wydajność i elastyczność związaną z najnowszymi technologiami składowania danych.

Chcąc sprawdzić to rozwiązanie w praktyce, BCC (aktualnie All for One Poland) wraz z jednym z największych przedsiębiorstw branży przetwórstwa mięsnego – z Sokołowem i we współpracy z liderem na rynku serwerów – z firmą Hewlett Packard Polska, postanowiła wykonać projekt Proof-of-Concept (PoC) sprawdzający przydatność tej platformy. Niniejszy artykuł stanowi podsumowanie doświadczeń z tego przedsięwzięcia.

SAP HANA to nowatorskie rozwiązanie firmy SAP AG, którego podstawą jest baza danych oparta na pamięci (in-memory database). Produkt bazuje na przetwarzaniu w pamięci RAM, zamiast składowaniu danych na dyskach. Obok klasycznego układu danych w wierszach, oferuje możliwość przechowywania danych w układzie kolumnowym, co znacznie przyspiesza raportowanie. Dodatkowo rozwiązanie od początku zaprojektowano tak, by w pełni wykorzystać wieloprocesorowość. Dzięki temu produkt SAP HANA jest nawet stukrotnie szybszy od tradycyjnych baz danych. Oprócz zapewnienia wydajności rozwiązanie zawiera wbudowane elementy dodatkowe, takie jak: silnik przetwarzania grafów (szukanie najlepszej ścieżki), silnik tekstowy (wyszukiwanie w danych nieustrukturalizowanych), bibliotekę funkcji biznesowych (do wykorzystania przez zewnętrzne aplikacje), bibliotekę funkcji predykcji (np. clustering, analiza ABC, algorytm C4.5, regresja liniowa), wbudowany język R do obliczeń statystycznych.

Firma Sokołów S.A. dotychczas korzystała z hurtowni danych SAP BW w wersji 7.02, zainstalowanej na wydajnej platformie IBM iSeries.

Na potrzeby testu przygotowano dodatkowy serwer aplikacyjny hurtowni danych SAP BW w wersji 7.3 oparty na platformie bazodanowej SAP HANA dostarczonej przez firmę HP Polska. Na serwer ten zmigrowano zawartość hurtowni danych przedsiębiorstwa Sokołów SA. Możliwe stało się raportowanie z systemu dotychczasowego i z systemu nowego oraz porównanie wyników ich działania.

Porównanie serwera obecnego z serwerem HANA użytym do testów
Element Serwer dotychczasowy IBM iSeries SAP BW oparty na SAP HANA
Wersja SAP BW SAP Netweaver BW 7.02 SAP Netweaver BW 7.3 on HANA
Baza danych DB2 UDB for iSeries V6R1 SAP HDB 1.0 In-Memory Database
System OS i5/OS V6R1 (OS/400) SUSE Linux Enterprise Server 11.2
Procesory 5x POWER6 4.2 GHz 8x Westmere EX Intel E7-4870 2,4 GHz
Pamięć RAM 80 GB 512 GB (maksymalne wykorzystanie 93 GB)
Dyski 36 x 141 GB LOG: 2x Fusion-io ioDrive Duo 320 GB, konfiguracja RAID 0, DATA: 24x 146 GB disks 15k rpm, konfiguracja RAID 5

Metodologia testowania

Testy wydajności analiz przeprowadzono, analizując prędkość widzianą „od strony użytkownika” i zakładając jak najbardziej elastyczną architekturę hurtowni danych opartą na produkcie HANA. Wykluczyło to stosowanie tzw. „agregatów” przyspieszających raportowanie, które są powszechnie stosowane w dotychczas używanym systemie SAP BW. Zastosowanie „agregatów” umożliwia wykonanie raportów (bez nich przekraczany był limit czasu dla raportu). Tworzenie nowych raportów było obciążone w obecnym systemie dodatkowym nakładem na dostosowanie, bądź stworzenie nowych struktur przyspieszających wykonanie analiz.

Jednym z zadań, stawianych platformie HANA, było pozbycie się tej dodatkowej pracy administracyjnej utrudniającej swobodne tworzenie raportów przez użytkowników końcowych. Działanie platformy SAP HANA analizowano więc bez dodatkowej optymalizacji analiz za pomocą „agregatów” danych. W pomiarach nie oddzielano także czasów przetwarzania po stronie bazy danych, od czasów poświęcanych przez serwer na wyświetlenie znalezionych wyników. Choć porównanie tylko czasów wyszukiwania danych pozwoliłoby zaprezentować lepsze wyniki dla nowej platformy, uznano, że dla użytkownika końcowego ważny jest sumaryczny czas od uruchomienia raportu do otrzymania wyników. Taki „biznesowy” czas postanowiono więc zmierzyć.

Na potrzeby wydajności wczytywania danych skupiono się na kilku największych zbiorach tychże danych. Porównano czasy historycznego wczytywania danych na dotychczas wykorzystywanej platformie do czasów zarejestrowanych w systemie opartym na produkcie SAP HANA. Zmierzone czasy odniesiono do liczby wczytanych rekordów danych, co pozwoliło na porównanie przyspieszenia wczytywania dla pojedynczego rekordu.

Przykładowe pomiary czasu reakcji na działania użytkownika – raportowanie
Raport

Czas wykonania

Serwer dotychczasowy z agregacją danych

Czas wykonania Platforma SAP HANA, bez agregacji danych

Przyśpieszenie

(krotność)

Raport rentowności za okres 00:03:17 00:00:18 11
Zbiorówka 2 00:00:51 00:00:03 17
Zbiorówka 1 00:00:18 00:00:02 9
Raport rentowności na dzień 00:03:42 00:00:07 32
Porównanie wycen i cen bazowych 00:02:25 00:00:14 10
Średnie przyspieszenie (bez optymalizacji po stronie SAP HANA) 11

Zmierzone wyniki

Wyniki pomiarów w zakresie raportowania są zgodne z oczekiwaniami. Hurtownia danych oparta na nowej platformie dostępu do danych SAP HANA, pomimo rezygnacji z agregacji danych, okazała się ponad dziesięciokrotnie szybsza, a co ważniejsze czasy odpowiedzi nawet na zapytania łączące podczas wykonania raportów dane z kilku dostawców danych, były stabilne i utrzymywały się zawsze poniżej jednej minuty. Można przypuszczać, że gdyby zastosowano optymalizację danych w „agregatach” wydajność mogłaby ulec zwiększeniu o kolejny rząd wielkości.

Porównanie czasów wczytywania danych do hurtowni danych
Obszar Czas wykonania/ Ilość rekordów
Serwer dotychczasowy
Czas wykonania/ Ilość rekordów
Platforma SAP HANA
Przyśpieszenie
(krotność)
Dane modułu analiz rentowności CO-PA

08:35:54 / 2 682 216

11,544 ms/rekord

04:12:41 / 7 226 592

2,098 ms/rekord

5

 

Korzyści biznesowe z zastosowania platformy SAP HANA łącznie z hurtownią SAP BW
Nazwa Opis korzyści biznesowych
Przyspieszenie wydajności systemu SAP BW w zakresie raportowania Przyspieszenie rzędu 10 razy, przy założeniu braku optymalizacji SAP BW opartego na SAP HANA (brak konieczności optymalizacji daje inne korzyści związane z polepszoną samoobsługą i mniejszym nakładem administracyjnym). Jeśliby optymalizować hurtownię opartą na platformie SAP HANA można by osiągnąć przyspieszenia nawet stukrotne.
Zwiększenie samoobsługi pracowniczej w zakresie tworzenia raportów Umożliwienie tworzenia raportów bezpośrednio na poziomie pozycji pojedynczych i brak konieczności tworzenia agregatów optymalizujących wydajność pozwala użytkownikom biznesowym na tworzenie raportów ad-hoc, bez konieczności współdziałania z działem IT.
Zmienione podejście do raportowania Aby analizować dane nie trzeba dłużej tworzyć sztywnych raportów. Można korzystać z analiz danych (np. z narzędzia SAP BusinessObjects Explorer) ułatwiających odkrywanie danych w obszarze bez tworzenia raportów.
Zmniejszone koszty administrowania hurtownią danych Ponieważ przy zastosowaniu platformy HANA zazwyczaj nie trzeba optymalizować struktur danych pod kątem wydajności, uproszczeniu ulega model danych. Hurtownia danych jest prostsza do zarządzania, co zmniejsza koszty administracyjne.
Lepsza współpraca hurtowni danych SAP BW z narzędziami raportowymi SAP BusinessObjects Ze względu na wzrost wydajności hurtowni danych SAP BW nie trzeba optymalizować zapytań dla raportów tworzonych w narzędziach SAP BusinessObjects. Umożliwia to tworzenie generycznych zapytań po stronie SAP BW na poziomie obszaru danych i tworzenie szczegółowych analiz tylko narzędziami SAP BusinessObjects (bez konieczności tworzenia zapytań w obu systemach)
Szybsza i częstsza aktualizacja danych analitycznych Ze względu na znaczne zwiększenie wydajności wczytywania danych do systemu SAP BW (zmierzone pięciokrotne przyspieszenie) możliwe jest wcześniejsze udostępnianie zsynchronizowanych z systemami źródłowymi danych (szczególne znaczenie w okresach zamknięcia miesiąca). Dodatkowo możliwe jest także zwiększenie częstotliwości wczytywania danych do hurtowni, by udostępniać dane jak najbardziej aktualne. W przypadkach konieczności ponownego wczytywania danych (np. reorganizacja danych) czasy niedostępności systemu można zminimalizować.

Wnioski

Zastosowanie platformy SAP HANA jako warstwy przechowującej dane dla hurtowni danych SAP BW ma wiele zalet. Oprócz ewidentnego wzrostu wydajności (ponad dziesięciokrotnego) ważne jest uproszczenie administrowania hurtownią danych, przez co możliwe jest znaczne zwiększenie samoobsługi pracowniczej. Użytkownicy biznesowi nie muszą dłużej współpracować ze wsparciem IT, by utworzyć raport, który wykonuje się w rozsądnym czasie. Lepsza współpraca szybkiej hurtowni danych opartej na SAP HANA z narzędziami SAP BusinessObjects także może być dużą zaletą. Zamiast tworzyć zapytanie dla każdego z raportów w SAP BusinessObjects wreszcie można tworzyć zapytania generyczne udostępniające platformie raportowej całe obszary danych. Zwiększenie wydajności wczytywania danych pozwoli na szybsze i częstsze odświeżanie danych analitycznych. Ewentualne prace administracyjne związane ze zmianami modelu danych można wykonać w nowym systemie, w krótszym czasie z mniejszym wpływem na użytkowników. Co najważniejsze sam proces migracji do nowej platformy nie wymaga przerw w działaniu systemów analitycznych. Można go wykonać na kilka sposobów, etapowo, tak, by użytkownicy zauważali tylko pozytywne zmiany, a wszelkie dotychczas stosowane rozwiązania nadal działały, co najwyżej lepiej.

Bogdan Biłas, Dyrektor Spółki ds. Informatyki, SOKOŁÓW

SAP HANA sposobem na optymalizację czasu pracy
Wpływ na decyzję Sokołowa o wzięciu udziału w testowaniu SAP HANA miały trzy kluczowe czynniki. Po pierwsze, w ostatnim czasie uległ skróceniu okres raportowania finansowego do naszych właścicieli, a co za tym idzie, nasze służby finansowe i kontrolingowe mają jeszcze mniej czasu na przygotowanie comiesięcznych raportów. Kolejna przyczyna to powód techniczny. Systematyczny przyrost danych transakcyjnych bezpośrednio wpływa na czas trwania synchronizacji danych z SAP ERP do SAP BW, co wydłuża czas udostępnienia hurtowni użytkownikom biznesowym. Trzeci powód – to wydajność zapytań. Coraz dłuższy czas od momentu uruchomienia raportu do momentu udostępnienia wyników końcowych, to dla nas dość duży problem.
Wyniki testu okazały się dość zaskakujące. Dziesięciokrotne skrócenie czasów odpowiedzi na zapytania, to imponujący wynik. Zastosowanie zapytań optymalizujących z pewnością może dać jeszcze bardziej spektakularne efekty.
Sądzimy, że SAP HANA jest jednym z niewielu rozwiązań, które są w stanie w bardzo istotny sposób zmienić jakość pracy analityków biznesowych. W naszej firmie każdego dnia wykonuje się około 90 różnego rodzaju raportów na potrzeby różnych komórek organizacyjnych. To dość duże wyzwanie, a wobec tego czas dostępu do danych ma absolutnie kluczowe znaczenie. Sądzimy, że wszyscy pracownicy Sokołowa S.A., którzy codziennie zajmują się raportowaniem biznesowym zaobserwowaliby bardzo istotny wzrost komfortu pracy oraz znacznie lepsze wykorzystanie swojego czasu. Co ma oczywiście swój wymiar finansowy dla Spółki.
Bogdan Biłas, Dyrektor Spółki ds. Informatyki, SOKOŁÓW

 

Platforma do wymagających zastosowań
Technologia SAP HANA ułatwia firmom osiągniecie istotnej przewagi konkurencyjnej, dzięki możliwości podejmowania decyzji w trybie czasu rzeczywistego. Na dzisiejszym, niezwykle konkurencyjnym, rynku, przy dynamicznie zmieniającym się otoczeniu biznesowym, to właśnie natychmiastowa analiza dostępnych danych jest kluczem do sukcesu przedsiębiorstwa. HP przy ścisłej współpracy z SAP przygotowała predefiniowane konfiguracje sprzętowe, które najlepiej spełniają wymagania bezpieczeństwa i wydajności. Chcąc udowodnić przydatność tej innowacyjnej technologii w rzeczywistości biznesowej, zdecydowaliśmy się wraz z BCC na przeprowadzenie tego projektu. Do testów, wykonanych z firmą Sokołów, wykorzystaliśmy platformę HP ProLiant DL 980, dedykowaną do najbardziej wymagających i obciążających zastosowań.
Przystępując do testów, chcieliśmy sprawdzić, jak wiele korzyści może przynieść w praktyce technologia SAP HANA połączona z wydajnymi urządzeniami HP ProLiant DL 980. Oczekiwaliśmy przede wszystkim kilkukrotnego przyspieszenia wydajności w zakresie raportowania na testowanej platformie. Wyniki testów zdecydowanie spełniły nasze oczekiwania i potwierdziły, że technologia in-memory może z powodzeniem zastąpić tradycyjne modele i technologie raportowania. Jesteśmy przekonani, że to rozwiązanie zapewni klientom lepszą produktywność oraz pomoże obniżyć koszty.
Ogromne ilości danych, zwiększające się bardzo dynamicznie, nawet o 50% rocznie – to obecnie problem każdego dużego i coraz częściej również średniego przedsiębiorstwa. By móc te informacje przekształcić w wiedzę niezbędną do szybkiego podejmowania trafnych decyzji, potrzebne są innowacyjne rozwiązania, takie jak technologia SAP HANA. Jest to rozwiązanie, które z pewnością sprawdzi się i przyniesie korzyści zarówno firmom klasy enterprise, instytucjom publicznym, ale również wielu innowacyjnym firmom średniej wielkości.
Daniel Sławniak, Alliance/ISV Manager, Hewlett-Packard Polska
Grupa Sokołów SA jest jednym z liderów branży mięsnej w Polsce. W skład Grupy wchodzi siedem dużych, nowoczesnych zakładów produkcyjnych: w Sokołowie Podlaskim, Czyżewie, Kole, Jarosławiu, Tarnowie, Dębicy oraz w Robakowie k. Poznania. Należą do niej również spółki zależne: Agro-Sokołów z trzema dużymi gospodarstwami rolno-hodowlanymi, Sokołów-Service – zapewniająca obsługę techniczną, oraz Sokołów-Logistyka. Grupa Sokołów posiada potencjał produkcyjny umożliwiający dzienną produkcję około 1200 ton wysokiej jakości wyrobów. Marka Sokołów jest obecnie najlepiej rozpoznawalna na polskim rynku produktów mięsnych. Rozbudowana sieć sprzedaży obejmująca wszystkie kanały dystrybucji, w tym nowocześnie zorganizowaną sieć własną, zapewniają dostępność produktów na terenie całego kraju. W działalności Grupy ważną rolę odgrywa eksport. Średnio 25-30% ogólnej wielkości sprzedaży trafia na rynki zagraniczne, w tym głównie do Unii Europejskiej.
HP powstała w 1939 roku. Obecnie jest największą na świecie firmą w branży informatycznej, oferuje drukarki, sprzęt komputerowy, oprogramowanie, usługi oraz infrastrukturę informatyczną z wykorzystaniem technologii przetwarzania w chmurze oraz różnych opcji łączności. Prowadzi działalność w ponad 170 krajach. Posiada kompleksową ofertę produktów wykorzystujących zaawansowane technologie. Obejmuje ona infrastruktury informatyczne, urządzenia kieszonkowe oraz superkomputery o największej na świecie mocy obliczeniowej. Znajdują się w niej również produkty i usługi z dziedzin takich jak fotografia i rozrywka cyfrowa oraz systemy obliczeniowe i systemy drukowania dla klientów indywidualnych. Centrala firmy znajduje się w Palo Alto w Kalifornii.