Co to jest Data Governance?
Data Governance w wolnym tłumaczeniu to nic innego jak zarządzanie danymi, a dokładniej rzecz biorąc, proces zarządzania danymi, w ramach którego dbamy o właściwą dostępność informacji przetwarzanych w firmie. W dużej mierze za Data Governance uważa się wszelkie szczegóły dotyczące dostępności oraz integralności danych wraz z ich bezpieczeństwem.
Dlaczego odpowiednie podejście do zarządzania danymi jest ważne?
W dobie coraz większych ilości danych w każdej firmie wprowadzenie jasnych i zrozumiałych definicji dla konkretnych pojęć biznesowych pozwala w szybki sposób podejmować decyzje oraz dostosowywać się do nowych przepisów. To z kolei prowadzi między innymi do redukcji potencjalnych kar regulacyjnych. Patrząc z jeszcze innej strony, pojawianie się rozbieżności w przedstawianych raportach wiąże się z koniecznością analizy problemu, ponownego przygotowania danych, a to wszystko wymaga dodatkowego czasu. Ten wiąże się z kosztami, których minimalizacja jest priorytetem dla każdej firmy, zwłaszcza w okresie kryzysu gospodarczego. Dobrze zarządzane dane to też podstawa do tworzenia trafnych wniosków z analiz, a tym samym maksymalizacji zysków.
Cele skutecznego zarządzania danymi
Celem Data Governance jest stworzenie zaufania do danych, z którymi obcują pracownicy firmy. Dotyczy to zarówno programistów, analityków, jak i działów księgowych, sprzedaży, czyli praktycznie wszystkich, których praca zależna jest od dostępnych informacji. Dlatego w ramach procesu zarządzania danymi kluczowe jest to, aby każdy interpretował konkretne pojęcia w ten sam sposób. Jeśli wspomniana księgowość oraz analitycy w ramach raportowania sprzedaży nie przedstawiają rozbieżnych wartości, to oznacza, że mamy do czynienia z jednolitym podejściem do danych. Niemniej, jest to trudne zadanie w dobie rosnących ilości przetwarzanych informacji oraz mnogości systemów, zwłaszcza w większych, rozwijających się firmach. Bez właściwego procesu Data Governance zbudowanie zaufania do danych jest w przypadku tych ostatnich praktycznie niemożliwe.
Jakie role są niezbędne w Data Governance?
Podstawą Data Governance jest wprowadzenie odpowiedzialności za dane. W firmach, w których zarządzanie danymi stoi na niskim poziomie, nie ma w ogóle mowy o jasno określonym właścicielstwu danych i pojęć biznesowych. W momencie, gdy wiemy, do kogo zwracać się w zakresie konkretnych potrzeb, sytuacje patowe – pokroju różnych interpretacji tych samych pojęć biznesowych – odchodzą w niepamięć. Identyfikacja właścicieli to jedno z zadań zespołu Data Governance i zaledwie część całego procesu.
- Zespół Data Governance składa się najczęściej z programistów, analityków i architektów z dużym przekrojem wiedzy na temat istniejących rozwiązań w organizacji. Jego rolą jest realizowanie programu zarządzania danymi w firmie, czyli między innymi wspomniana identyfikacja właścicieli, ale także wykorzystywanych pojęć biznesowych. Monitoring jakości danych to często też zadanie tego zespołu, jeśli nie została wydzielona osobna jednostka, z którą prowadzona jest ścisła współpraca.
- Komitet ds. Data Governance. Wspomniany program zarządzania danymi w firmie ustalany jest w ramach komitetu, który składa się z dyrektorów wysokiego szczebla. W ramach prac definiowane są standardy i zasady, które mają obowiązywać w organizacji, w tym także między innymi reguły dostępu do danych oraz wszelkie procedury wdrażania zmian. W przypadku sporów biznesowych, braku możliwości uzgodnienia pojęć biznesowych, to właśnie komitet podejmuje decyzje.
- Data i Business Stewards, a więc osoby najbliższe konkretnym danym (i pojęciom biznesowym) zarówno od strony merytorycznej, jak i technicznej. Ich obowiązki obejmują sprawowanie pieczy nad konkretnym zakresem danych w ramach ustalonych procesów zarządzania. To również oni odpowiadają za wdrażanie konkretnych zmian i zasad.
Na czym polega praca w zespole Data Governance?
1. Identyfikacja grup danych
Jeśli już wiemy, że Data Governance odnosi się do dbania o jednolitą interpretację danych, to zespół musi odpowiednio podzielić wszelkie informacje przetwarzane w firmie. Przekłada się to na identyfikację grup danych (silosów) z doprecyzowaniem ich znaczenia dla całej organizacji. Jednocześnie określana jest ich wrażliwość w ramach aktualnych przepisów. Im starsza i większa firma, tym większe ryzyko zaistnienia zdecentralizowanych systemów raportowych lub sprzedażowych. Może to wynikać z różnych fuzji lub po prostu braku odpowiednich standardów korporacyjnych i architektonicznych.
2. Zebranie i ujednolicenie pojęć biznesowych na poziomie organizacyjnym
W ramach identyfikacji grup danych powiązywane są procesy i różnorakie przepływy istniejące w firmie. Jest to także najczęściej pierwszy moment, w którym może okazać się, że w organizacji istnieją nieformalne procesy przetwarzania danych. Celem zespołu Data Governance jest wychwycenie takich sytuacji i uporządkowanie procesów.
Dodatkowym punktem, który jest niezbędny we właściwym zarządzaniu danymi, jest zebranie wszelkich pojęć biznesowych oraz klasyfikacji wykorzystywanych w firmie, a później ujednolicenie definicji. Ponownie – różne jednostki mogą w odmienny sposób patrzeć między innymi na sprzedaż w ramach poszczególnych transakcji. To jedna z najbardziej powszechnych przyczyn odmiennych wniosków z teoretycznie tych samych analiz. Jeżeli jedna osoba inaczej interpretuje produkty sprzedawane w organizacji, to mówimy o wyniku złego zarządzania danymi i rolą Data Governance jest uspójnienie wszelkich definicji.
3. Monitorowanie jakości danych
Kolejna część pracy w zakresie Data Governance, obok identyfikacji najważniejszych danych i potwierdzeniu pojęć biznesowych na szczeblu całej organizacji, to badanie jakości danych. W końcu, jeśli wiemy, co jest czym i gdzie tego szukać, to jeszcze należy zadbać o to, aby dostępne dane były godne zaufania w ramach podstawowych atrybutów (przedstawiam je poniżej). Sposobów na wysoką jakość danych jest wiele, ale fundamentalne wymiary według DAMA (Data Management Association – Stowarzyszenie Zarządzania Danymi) odnoszą się do:
- Dostępności – czy dane dostępne są na czas (na przykład w ramach codziennego przetwarzania).
- Kompletności – czy dane są kompletne względem systemów źródłowych lub historycznych wyników (na przykład: dostępność wszystkich pozycji faktur).
- Spójności – czy dane w różnych systemach przedstawiają taką samą informację (na przykład aktywność konkretnego klienta).
- Poprawności – czy dane są zapisywane w taki sam sposób (na przykład organizacja formatu zapisywania adresów).
- Dokładności – czy dane mają swoje odwzorowanie w rzeczywistości (na przykład sprawdzenie poprawności numeru PESEL pod kątem płci klienta).
Podsumowując poszczególne punkty, Data Governance dba o to, aby każdy patrzył na dane w taki sam sposób, aby każdy wiedział, gdzie szukać konkretnych informacji, a poszczególne procesy bazowały na wspólnych standardach, nad którymi pieczę sprawują odpowiedzialne osoby.
Jednocześnie przetwarzane dane są monitorowane pod kątem potencjalnych nieścisłości. W tym wszystkim również ważne jest budowanie świadomości znaczenia i zrozumienia danych, zarówno na poziomie organizacji jako całości, jak i wśród poszczególnych pracowników.
Co to Data Governance? Podsumowanie
Zmierzając już do końca omawiania Data Governance – trzeba wiedzieć, że zarządzanie danymi odnosi się do wprowadzania spójności w firmie. W całym procesie najważniejsze jest to, aby:
- Każdy wiedział, w jaki sposób interpretować konkretne pojęcie biznesowe i które klasyfikacje stosować w ramach konkretnych potrzeb.
- Każdy wiedział, gdzie szukać konkretnych informacji i jak uzyskać do nich dostęp.
- Dane były godne zaufania, czyli odpowiednio wysokiej jakości.
Brzmi prosto, ale umiejętność wdrożenia tych punktów i zbudowania świadomości w całej organizacji to proces długotrwały oraz wymagający cierpliwości. Szczególnie na samym początku, gdy dostawcy i odbiorcy danych przyzwyczajeni są do dotychczasowych standardów, które mogły istnieć od wielu lat i nigdy nie być zmieniane oraz dostosowywane do aktualnych warunków.