ETL i migracje 6 min czytania 13 maja 2026

Audyt danych — co się dzieje w Fazie 0 i dlaczego bez niej nie ma wyceny

Każda rozmowa o projekcie BI prędzej czy później dochodzi do tego samego punktu: klient pyta o cenę, a ja mówię "najpierw muszę zobaczyć dane". To nie jest wymówka — to jedyna uczciwa odpowiedź, zanim wiem co faktycznie jest w środku.

Co to jest Faza 0 i ile trwa

Faza 0 to audyt danych i środowiska — krok, który wykonuję przed każdym projektem BI, niezależnie od jego skali. Odbywa się zdalnie, bez wizyty on-site. Czas trwania zależy od liczby źródeł i ich złożoności: jedno źródło SQL to jeden dzień, a kilka baz danych, pliki Excel w różnych strukturach i zewnętrzne API — to może być kilka dni. Staram się minimalizować czas audytu, ale jakość analizy źródeł jest zbyt ważna, żeby ją skracać na siłę.

Wynik Fazy 0 to nie prezentacja z logo. To dokument roboczy: potwierdzony zakres projektu, zidentyfikowane ryzyka i finalna wycena. Od tej wyceny nie ma niespodzianek w środku projektu.

Co konkretnie sprawdzam

Audyt obejmuje trzy obszary. Każdy z nich może zmienić zakres lub cenę projektu — dlatego wszystkie trzy muszą być sprawdzone przed wyceną.

1. Stan danych w systemie ERP

System ERP ma setki zbiorów danych. Klient może mieć licencję na moduł, którego prawie nie używa — albo intensywnie korzystać z modułu, o którym nie wspomniał podczas pierwszej rozmowy. Sprawdzam, które tabele są faktycznie zasilone danymi: ile jest dokumentów handlowych, jak daleko sięga historia rozrachunków, ile rekordów ma baza kontrahentów.

Sprawdzam też typy dokumentów, które faktycznie występują w bazie — faktury, korekty, proformy, dokumenty wewnętrzne. To determinuje, co mogę wciągnąć do raportu, a co wymaga dodatkowej logiki filtrowania. Klient, który mówi "chcę raporty ze sprzedaży", może mieć w systemie tysiące dokumentów — ale tylko część z nich to faktyczna sprzedaż.

2. Jakość danych

To obszar, który najczęściej zmienia zakres projektu. Kilka przykładów z audytów, które przeprowadzałem:

  • Duplikaty kontrahentów. Ten sam podmiot zapisany jako "ABC Sp. z o.o.", "ABC spółka z o.o." i "ABC" — trzy rekordy, jeden podmiot. Każdy duplikat to błąd w raporcie: sumy się nie zgadzają, klient pojawia się w kilku miejscach rankingu. Dane kontrahentów mają zazwyczaj 20–30% duplikatów.
  • Dane poza systemem ERP. Umowy najmu prowadzone w Excelu, bo "ktoś kiedyś tak ustawił". Budżety w Google Sheets. Historia z poprzedniego systemu ERP w archiwalnej bazie na osobnym serwerze. Klient oczekuje, że raport obejmie wszystko — a ja muszę wiedzieć, gdzie to wszystko jest.
  • Niestandardowe użycie pól. Numer lokalu wpisany w pole "uwagi" zamiast w dedykowane pole. Kod projektu zakodowany w numerze dokumentu. To się zdarza — i każdy taki przypadek wymaga niestandardowej logiki w pipeline danych, której nie ma w standardowej wycenie.
  • Brakująca historia. Klient chce analizę 3-letnią, a dane w systemie sięgają tylko 18 miesięcy wstecz. Albo sięgają dalej, ale wcześniejsze dane mają inną strukturę, bo firma kilka lat temu zmieniła sposób prowadzenia dokumentacji.

3. Infrastruktura i dostęp

Sprawdzam, jak zbudowane jest środowisko techniczne klienta: czy system ERP jest zainstalowany lokalnie czy w chmurze dostawcy, czy sieć firmowa pozwala na połączenie zewnętrzne (potrzebne gdy baza analityczna jest w Azure), czy możliwe jest stworzenie konta z dostępem tylko do odczytu. Jeśli są dodatkowe źródła — MySQL, zewnętrzne API, pliki Excel na dysku sieciowym — sprawdzam jak można do nich uzyskać dostęp.

Zdarza się, że środowisko wymaga konfiguracji IT po stronie klienta — np. otwarcia portów lub zainstalowania agenta do połączenia. To może wydłużyć projekt o 1–2 tygodnie, jeśli dział IT ma długą kolejkę. Wolę to wiedzieć na początku.

Dlaczego bez audytu wycena jest bezużyteczna

Wycena projektu BI bez audytu danych to jak wycena remontu bez oglądania mieszkania. Można podać jakąś kwotę — ale będzie albo zawyżona "na wszelki wypadek", albo niska z ryzykiem dopłat w środku projektu. Żadna z tych opcji nie służy klientowi.

Dwa projekty, które wyglądają identycznie w opisie — "raporty z systemu ERP dla firmy z branży nieruchomości" — mogą różnić się nakładem pracy o 100–200%. Kilka konkretnych przykładów niespodzianek, które zmieniają zakres i cenę:

Niestandardowe dokumenty. Klient ma 8 000 faktur, z czego 1 200 to dokumenty wewnętrzne, które trzeba wykluczyć z analizy. Wykluczenie wymaga rozpoznania wzorca w numeracji lub typie dokumentu — to dodatkowy czas w pipeline, którego nie ma w standardowej wycenie.

Umowy w pięciu Excelach. Umowy najmu są w pięciu różnych plikach z różnymi strukturami kolumn. Każdy plik wymaga osobnego connectora i logiki mapowania. Zamiast jednego źródła danych — pięć, każde z innymi problemami jakościowymi.

Archiwalna baza na osobnym serwerze. Historia w systemie ERP sięga tylko do 2022 roku. Dane wcześniejsze są w archiwalnej bazie, do której klient dopiero musi uzyskać dostęp — co wymaga interwencji dostawcy systemu. Projekt rusza z 3-tygodniowym opóźnieniem.

340 duplikatów kontrahentów. Deduplication to dodatkowa warstwa logiki w Silver — identyfikacja, reguły łączenia, weryfikacja z klientem, testy. W zależności od skali to 1–3 dni roboczych, których nie ma w wycenie "z głowy".

Audyt często pokazuje też pozytywne niespodzianki: dane są w lepszym stanie niż zakładano, pewne raporty można dostarczyć szybciej, klient ma dane, o których sam nie wiedział że ma. To też jest wartość.

Co dostaje klient po audycie

Po Fazie 0 klient dostaje cztery rzeczy:

  • 1 Potwierdzony zakres projektu — które dane, które raporty, które KPI. Bez ogólników.
  • 2 Zidentyfikowane ryzyka i ograniczenia — czego nie ma w danych, co wymaga dodatkowej pracy, co jest niemożliwe przy aktualnej jakości danych. To nie są złe wiadomości — to realna podstawa do decyzji.
  • 3 Finalna wycena — stała, z podziałem na etapy, bez "od-do". Od tej liczby projekt jest rozliczany.
  • 4 Opcjonalnie: co można dostarczyć od razu — rzeczy do wdrożenia w pierwszym tygodniu na podstawie dostępnych danych, bez czekania na pełne wdrożenie.

Ile kosztuje audyt

Zakres wyceny audytu zależy od liczby źródeł danych i czasu potrzebnego na analizę. Proste środowisko z jednym systemem ERP to inny nakład niż kilka baz danych, pliki Excel w różnych strukturach i zewnętrzne API. Warunki rozliczenia ustalamy indywidualnie przed rozpoczęciem audytu.

Dla firmy, która rozważa projekt BI za kilkadziesiąt tysięcy złotych, audyt to racjonalny koszt weryfikacji zakresu przed podjęciem decyzji — i jedyna droga do wyceny, której można zaufać.

Podsumowanie

Faza 0 to krok, który chroni klienta przed niespodziankami w środku projektu i daje realną podstawę do decyzji. Bez niej wycena jest strzelaniem w ciemno — zbyt wysoka, żeby była uczciwa, albo zbyt niska, żeby była realna. Każdy projekt, który prowadzę, zaczyna się od audytu — niezależnie od tego, czy klient przychodzi z gotowym zakresem, czy z ogólnym pytaniem "co można zrobić z naszymi danymi".

Najczęstsze pytania

Ile trwa audyt danych?

Od jednego do kilku dni roboczych — zależy od liczby źródeł i ich złożoności. Jedno źródło SQL to jeden dzień. Kilka baz danych, pliki Excel w różnych strukturach i zewnętrzne API — to może być kilka dni. Audyt odbywa się zdalnie, nie wymaga wizyty on-site.

Czy audyt wymaga dostępu do naszego systemu ERP?

Tak — potrzebuję dostępu do bazy danych z uprawnieniami tylko do odczytu lub dostępu do środowiska testowego. Nie wprowadzam żadnych zmian w systemie. Standardowo tworzymy osobne konto SQL z minimalnym zakresem uprawnień.

Co jeśli dane okażą się w złym stanie?

To jest właśnie po to jest audyt — żeby to wiedzieć przed projektem, nie w środku. Jeśli jakość danych wymaga dodatkowej pracy, to będzie wpisane w zakres i wycenę. Żadnych niespodzianek w połowie projektu.

Czy mogę dostać wycenę bez audytu?

Mogę podać orientacyjny zakres cenowy na podstawie opisu — ale to nie jest wycena projektu, tylko punkt wyjścia do rozmowy. Finalna wycena jest możliwa dopiero po audycie danych.

Chcesz wiedzieć jak wyglądają Twoje dane?

Opisz z jakiego systemu korzystasz — odpiszę z pierwszymi pytaniami potrzebnymi do Fazy 0.

Porozmawiajmy

Wpisz szukane słowo…