Prosty przypadek

SAP AG jakiś czas temu zapowiedział przygotowanie szeregu aplikacji przyspieszających operacje biznesowe opartych na SAP HANA. Jednym z pierwszych produktów, wykorzystującym potencjał architektury przetwarzającej dane w pamięci, jest SAP CO-PA Accelerator.

Narzędzie to, za pomocą technologii SAP HANA, przyspiesza raportowanie w obszarze kontrolingu rentowności segmentów rynku (CO-PA). Pozwala na ograniczoną implementację nowej technologii w obszarze analizy wyniku, zazwyczaj krytycznym dla przedsiębiorstwa. Wdrożenie produktu SAP CO-PA Accelerator dotyczy jedynie raportowania operacyjnego w systemie ERP i nie wymusza jednoczesnej instalacji innych rozwiązań BI.

Rysunek 1. Schemat rozwiązania SAP CO-PA Accelerator

Ulepszone raportowanie w czasie rzeczywistym

Inną z nowości jest wprowadzenie SAP Landscape Transformation (LT) Replication Server, pozwalającego zwiększyć efektywność przejmowania informacji z systemów SAP do pamięci HANA. SAP HANA pełni w tym wypadku rolę elastycznej i ultraszybkiej hurtowni danych. Do analizy danych konieczny jest jeszcze system raportowy np. SAP Business Object BI Suite.

Dotychczas oferowana replikacja za pomocą Sybase Replication Server ograniczała się do przejmowania danych z tabel bazy danych. Ponieważ systemy SAP korzystają z baz danych, to dostęp na tym poziomie jest możliwy. Z uwagi jednak na fakt, iż wiele ważnych tabel SAP jest zakodowanych (tzw. tabele klastrowe), dostęp do użytecznych informacji z poziomu bazy jest ograniczony.

SAP LT Replication Server omija to ograniczenie, umożliwiając przejmowanie danych z systemów SAP na poziomie tabel aplikacyjnych (rozkodowanych), oraz umożliwia przejmowanie danych z innych systemów poprzez połączenie na poziomie bazy. Pozwala to na konfigurację replikacji z systemów SAP do SAP HANA w czasie rzeczywistym i umożliwia wydajne raportowanie na ciągle aktualnych danych (real time replication). Rozwiązanie wymaga instalacji narzędzia SAP LT Replication Serwer i modelowania struktur  raportowania z przejętych tabel  aplikacyjnych po stronie SAP HANA.

Rysunek 2. Wykorzystanie SAP HANA do raportowania w czasie rzeczywistym

Bezpośredni dostęp do danych przekształconych do postaci biznesowej

Innym przełomowym ulepszeniem jest odczyt bezpośredni ekstraktorów danych hurtowni danych SAP BW przez SAP HANA (Direct Extraction Connection = HANA DXC). Pozwala on na pobieranie do SAP HANA danych biznesowych przygotowanych i udostępnionych dla raportowania za pomocą rozwijanych już od wielu lat ekstraktorów SAP.

Znakomicie ułatwia to implementację obszarów danych raportowych. Nie potrzeba definiować połączeń relacyjnych pomiędzy tabelami transakcyjnymi bazy danych. Ekstraktory udostępniają dane w formie uporządkowanej, bezpośrednio gotowej do raportowania. Dla użytkownika oznacza to prostotę, szybkość i poprawność implementacji. Przy tym podejściu do pozyskiwania danych, traci się jednak ciągłą ich aktualizację. Import danych z ekstraktorów jest zazwyczaj planowany w regularnych odstępach czasu (off-line, wczytywane tylko zmiany). Od częstotliwości odczytów danych zależy ich aktualność.

Rysunek 3. Dostęp do danych biznesowych za pomocą ekstraktorów SAP (off-line)

Zaawansowane przetwarzanie danych raportowych za pomocą ETL

Dla klientów wymagających złożonego przetwarzania danych przed ich przygotowaniem do raportowania, SAP rozwinął możliwości użycia narzędzia dedykowanego do ekstrakcji i przetwarzania danych (ETL = Extraction, Transformation & Loading).

Produkt z portfolio SAP BusinessObjects (SAP BOBJ Data Integrator) może teraz przejmować dane z ekstraktorów SAP i dostarczać je do HANA. Dzięki użyciu integratora można pobierać dane z tych samych ekstraktorów, z których pobiera się za pomocą odczytu bezpośredniego (DXC), ale możliwości przetwarzania ich są w tym przypadku nieporównanie większe. Oczywiście wdrożenie z użyciem dodatkowego narzędzia pośredniczącego jest bardziej złożone niż przy połączeniu bezpośrednim. Niestety obsługa wczytywania przyrostowego danych z ekstraktorów SAP za pomocą SAP BOBJ Data Integrator, podlega niekiedy ograniczeniom. Dlatego przy wyborze tego rozwiązania kluczowe jest sprawdzenie obsługi dla konkretnych źródeł danych.

Rysunek 4. Wykorzystanie narzędzia ETL do odczytu i transformacji danych dla HANA

HANA jako baza danych dla hurtowni danych

Jeszcze inną alternatywą, szczególnie atrakcyjną dla firm już wykorzystujących hurtownię danych SAP BW, jest implementacja SAP HANA zastępująca tradycyjną bazę danych (HANA DB for SAP BW). Pozwala to na wielokrotne przyspieszenie zarówno wczytywania informacji do hurtowni danych SAP, jak i raportowania tych danych, bez ponoszenia kosztów zmiany wykorzystywanych dotychczas rozwiązań.

Migracja do nowej bazy danych opartej na SAP HANA jest operacją stosunkowo prostą i szybką do wykonania w porównaniu do tradycyjnych projektów rozwoju hurtowni danych w jakimkolwiek narzędziu.

Rozwiązania SAP HANA DB for BW jest dostępne od wersji SAP BW 7.3 i u wielu klientów będzie wymagało także projektu upgrade’u hurtowni danych. Oprócz wielokrotnych przyrostów prędkości raportowania, projekt taki może wpłynąć na zmianę struktur danych w hurtowni. Tradycyjnie w hurtowni danych przechowuje się i utrzymuje osobno pozycje pojedyncze (poszczególne linie) transakcji  i dane zagregowane. Dzięki użyciu SAP HANA jako podstawy hurtowni, w wielu przypadkach można zrezygnować z postaci zagregowanej i przechowywać jedynie dane w postaci pozycji pojedynczych i raportować w ich oparciu. Ułatwia to znacznie zarządzanie hurtownią danych.

Rysunek 5. HANA zamiast bazy danych hurtowni danych SAP BW

Każde z przedstawionych powyżej rozwiązań ma swoje zalety i ograniczenia. Aby ułatwić ich porównanie informacje te zebrano w poniższej tabeli.

Tabela 1. Podsumowanie nowych rozwiązań integracyjnych SAP HANA
RozwiązanieZaletyOgraniczenia
SAP CO-PA Accelerator oparty na SAP HANANiskie koszty wdrożenia/ licencji. Przyspieszenie raportowania operacyjnego CO-PA w systemie ERP.Przyspiesza tylko raportowanie analiz rentowności sprzedaży CO-PA w systemie SAP ERP.
SAP HANA podłączona do SAP ERP/CRM/SRM lub z systemem bazy danych za pomocą SAP LT Replication Server (SLT)Szybkie i proste w implementacji połączenie z replikacją danych on-line.Brak przejęcia biznesowych właściwości danych (dostęp na poziomie tabel aplikacyjnych SAP / tabel bazy danych). Konieczność odtworzenia relacji pomiędzy tabelami z systemu źródłowego w SAP HANA. Brak możliwości przeprowadzenia złożonych transformacji  danych.
SAP HANA podłączona do SAP ERP/CRM/SRM za pomocą bezpośredniego dostępu do ekstraktorów (DXC)Bardzo proste w implementacji (nie wymaga narzędzi pośredniczących) połączenie z replikacją danych na poziomie biznesowym. Nie wspiera replikacji on-line, ale wspiera replikację off-line z obsługą przyrostowego wczytywania zmian (tzw. delta).Ze względu brak narzędzi pośredniczących w połączeniu ograniczone możliwości transformacji danych (tylko poprzez rozszerzenia ekstraktorów lub proste transformacje w SAP HANA)
SAP HANA podłączona do SAP ERP/CRM/SRM lub innych źródeł danych za pomocą narzędzia SAP BusinessObjects Data Integrator (DI).Elastyczne narzędzie umożliwiające połączenie i złożoną transformację danych z systemów źródłowych do systemu docelowego (SAP HANA).Możliwość podłączenia do ekstraktorów systemu SAP ERP ograniczona do źródeł danych przygotowanych dla operacyjnych dostawców danych. Nie wszystkie typy wczytywania przyrostowego (delta) są obsługiwane.
SAP NetWeaver Business Warehouse on SAP HANAWykorzystanie dotychczasowych rozwiązań zaimplementowanych w hurtowni danych SAP BW. Brak konieczności przeprowadzania skomplikowanego projektu przy migracji do tego rozwiązania z klasycznej hurtowni danych. Szacunkowa długość projektu migracji – 2 tygodnie.Rozwiązanie tylko na  potrzeby raportowania za pomocą hurtowni danych SAP BW. Warstwy HANA w modelu licencyjnym BW on HANA nie można wykorzystać do raportowania bezpośredniego.

Praktyczne podejście

Jeśli istnieje tyle możliwości różnych konfiguracji wykorzystania SAP HANA, to którą wybrać i czy warto? Ponieważ pierwsze pytanie jest łatwiejsze zaczniemy od niego. Odpowiedź na pytanie o konfigurację zależeć będzie od źródeł danych, które miałyby lub stanowią obecnie podstawę dla raportowania.

Raportowanie operacyjne w module CO-PA

Jeśli najważniejszą bolączką w raportowaniu jest wydajność raportowania CO-PA w systemie ERP, a przedsiębiorstwo nie przewiduje szybkiego rozwoju swoich potrzeb raportowych, dobrym rozwiązaniem może być SAP CO-PA Accelerator oparty na SAP HANA. Należy jednak zauważyć, że wdrożenie hurtowni danych SAP BW w obszarze analiz rentowności  może także znacząco przyspieszyć raportowanie danych CO-PA, a przy tym otwiera drogę do wykorzystania narzędzi hurtowni dla innych obszarów danych. Nie bez znaczenia może tu być także kwestia ceny licencji rozwiązania SAP CO-PA Accelerator.

Raportowanie danych z systemu SAP ERP

W prostych przypadkach, kiedy najważniejsze jest raportowanie bezpośrednio z systemu SAP ERP, warto rozważyć  połączenie produktów SAP HANA jako zbioru danych, raportowanych przy pomocy SAP BusinessObjects BI Suite.

Użycie bezpośredniego połączenia HANA do ekstraktorów (DXC) systemu ERP zapewni szybką i łatwą implementację rozwiązania. Dzięki pominięciu warstwy pośredniczącej (bezpośrednie połączenie ERP-HANA) rozwiązanie będzie niedrogie w utrzymaniu i prawie bezobsługowe.

Jeśli ważne jest raportowanie w czasie rzeczywistym, zamiast bezpośredniego podłączenia do ekstraktorów można użyć narzędzia SAP LT Replication Server. Użytkownik zyskuje replikację on-line tabel z danymi, ale traci możliwość wykorzystania wiedzy biznesowej zawartej w ekstraktorach.

W przypadkach, gdy oprócz danych transakcyjnych z systemów SAP raportowane mają być dane z innych systemów (najczęściej baz danych), warto rozważyć kilka opcji. W prostych przypadkach danych z systemów poza SAP można nie przejmować do SAP HANA i łączyć na poziomie raportów SAP BusinessObjects BI. Niestety przy takim podejściu rezygnujemy z potencjału HANA dla tych danych. W przypadkach, gdy chcemy ten potencjał wykorzystać, możemy skorzystać z podejść opisanych w kolejnym akapicie.

Tabela 2. Polecane warianty raportowania bezpośrednio z systemu SAP ERP z użyciem SAP HANA
RozwiązanieKiedy polecane
SAP HANA podłączona do SAP ERP/CRM/SRM za pomocą bezpośredniego dostępu do ekstraktorów (DXC)Średnio złożone zastosowania raportowe niewymagające replikacji on-line.
SAP HANA podłączona do SAP ERP/CRM/SRM lub z systemem bazy danych za pomocą SAP LT Replication ServerProste zastosowania raportowe wymagające replikacji on-line.

Raportowanie danych transakcyjnych zgromadzonych w bazach danych

Aby wykorzystać przetwarzanie w pamięci do przyspieszenia danych spoza SAP przechowywanych w bazach danych można użyć SAP LT replication server (replikacja on-line) lub narzędzia bardziej zaawansowanego, lepiej nadającego się do skomplikowanych transformacji danych – SAP BOBJ Data Integrator (off-line).

Uwaga! Należy pamiętać, że w przypadkach najbardziej zaawansowanych przekształceń danych (duże przedsiębiorstwa) najlepszym rozwiązaniem nie będzie podłączenie do danych transakcyjnych, ale wykorzystanie jako warstwy pośredniczącej tradycyjnej hurtowni danych (opartej na bazie danych lub hurtowni danych SAP BW) przyspieszonej za pomocą SAP HANA.

Tabela 3. Polecane warianty raportowania informacji zawartych w bazach danych z użyciem SAP HANA
RozwiązanieKiedy polecane
SAP HANA podłączony do systemów bazy danych za pomocą SAP LT Replication ServerProste zastosowania raportowe wymagające replikacji on-line.
SAP HANA podłączony do systemów bazy danych za pomocą narzędzia SAP BusinessObjects Data Integrator  (DI)Złożone transformacje danych podczas przekazywania z systemów źródłowych do systemu docelowego  SAP HANA. Replikacja off-line.

Raportowanie danych zgromadzonych w hurtowniach danych opartych na bazach danych

W przypadku, gdy dane obecnie są zgromadzone w hurtowni danych zbudowanych w sposób tradycyjny, w oparciu o relacyjne bazy danych , nie należy myśleć o SAP HANA jako o narzędziu, które może zastąpić to rozwiązanie. Przetwarzanie w pamięci może zmienić podejście do wdrażania hurtowni i dodać nowe możliwości, ale nie jest zamiennikiem dla porządkowania i przetwarzania danych, tak często występujących w hurtowniach. Dlatego w przypadku istniejących hurtowni danych należy postrzegać HANA jako warstwę dodatkową, tzw. elastyczny zbiór danych (Agile Data Mart), który może przyczynić się zwiększenia wydajności raportowania.

Wielokrotne przyspieszenie z czasem może wpłynąć na zmianę architektury hurtowni danych. Być może niepotrzebne będą dłużej agregacje danych, które były dotychczas konieczne, by zapewnić zadowalający czas odpowiedzi. Wdrożenie SAP HANA jako dodatkowego elementu hurtowni danych umożliwia administratorom większe skupienie się na wymaganiach biznesu, a nie na optymalizacji prędkości analiz.

Rysunek 6. Relacyjna hurtownia danych (np. Sybase IQ) + SAP HANA + SAP BusinessObjects BI

Tabela 4. Polecane warianty raportowania z użyciem SAP HANA informacji zawartych w hurtowniach danych opartych na bazach danych.
RozwiązanieKiedy polecane
SAP HANA jako elastyczny zbiór danych (Agile Data Mart) dla hurtowni zbudowanej na bazie danych np. Sybase IQIstnieje lub jest wymagana biznesowo (porządkowanie, scalanie i transformowanie danych) hurtownia danych zaimplementowana w oparciu o systemy bazy danych.

Raportowanie danych zgromadzonych w hurtowni danych SAP BW

Firmy, które posiadają obecnie hurtownię SAP Business Warehouse lub które jej nie posiadają, ale mają system ERP i złożone potrzeby raportowe, oraz mają, bądź spodziewają się problemów wydajnościowych, powinny wybrać rozwiązanie SAP BW on HANA (HANA jako baza danych dla hurtowni SAP BW). Dzięki połączeniu elastyczności hurtowni danych, z prędkością przetwarzania w pamięci, uzyskana zostanie nowa jakość, niemożliwa do osiągnięcia w żadnym z tych narzędzi z osobna.

Tabela 5. Polecane warianty raportowania z użyciem SAP HANA informacji zawartych w hurtowni danych SAP BW
RozwiązanieKiedy polecane
SAP NetWeaver Business Warehouse on SAP HANA (HANA DB for BW)Wykorzystanie dotychczasowych rozwiązań zaimplementowanych w hurtowni danych SAP BW lub konieczność wykorzystania hurtowni, dla której większość informacji pochodzi z systemów SAP

 

Rysunek 6. Drzewo decyzyjne rozwiązań SAP HANA

Dlaczego SAP HANA?

Powodów do implementacji rozwiązania przetwarzającego dane w pamięci może być wiele. Szybkość przetwarzania dużych ilości danych jest największą zaletą SAP HANA. Możliwość analizowania informacji z systemów transakcyjnych w czasie rzeczywistym też często może być decydująca. Łatwiejsze zarządzanie dostępem do informacji (mniejszy nakład administracyjny niż w przypadku tradycyjnych rozwiązań) może być dodatkowym czynnikiem wpływającym na wybór SAP HANA. Wiele nowych aplikacji SAP będzie opartych na tej platformie, dzięki czemu przed użytkownikami otworzą się nowe możliwości.

Jeśli nie HANA, to co?

SAP HANA pod względem funkcjonalności jest świetnym rozwiązaniem, ale ze względu na koszty licencyjne i koszty wdrożenia nie zawsze będzie ono implementowane od razu. Co mogą wybrać firmy, które już teraz potrzebują dobrego rozwiązania przyspieszającego raportowanie, a inwestycję w najlepszy produkt chcą nieco odsunąć w czasie?

Dla firm, które chcą rozwinąć raportowanie w oparciu o dane spoza systemów SAP, najlepszym rozwiązaniem może okazać się platforma Sybase IQ, która pozwoli na stworzenie hurtowni danych, wykorzystującej niektóre elementy przetwarzania w pamięci oferowane również przez SAP HANA. Z kolei dla firm, które chcą raportować dane z systemu SAP ERP, a nie posiadają jeszcze hurtowni danych SAP BW, naturalnym krokiem będzie jej wdrożenie.

Dla firm, które już mają hurtownię danych SAP BW i potrzebują zwiększenia jej wydajności, a nie chcą jeszcze inwestować w SAP HANA, rozwiązaniem będzie optymalizacja przez zmianę modelu danych, wykorzystanie agregacji i partycjonowania.

Przyszłość architektury SAP HANA

Można zakładać, że nowe możliwości wykorzystania SAP HANA i związane z tą platformą przyspieszenie operacji o kilka rzędów wielkości sprawią, że już wkrótce będzie to całkiem popularne narzędzie, wspierające aplikacje analityczne i planistyczne.

Firma SAP AG zapowiada kolejne zastosowania dla architektury przetwarzającej dane w pamięci. Docelowo wszystkie systemy transakcyjne (ERP/CRM/SRM/SCM etc.) oparte na platformie SAP Netweaver, będą mogły wykorzystywać SAP HANA zamiast zwykłej bazy danych. Oprócz drastycznego zwiększenia wydajności tych systemów, przyczyni się to do powstania zupełnie nowych aplikacji, które teraz ze względu na ograniczenia przetwarzania nie mają racji bytu. Z niecierpliwością czekamy zatem na kolejne zastosowania SAP HANA.