Automatyczna ekstrakcja danych z rysunków technicznych to jedna z moich ostatnich realizacji dla zakładu z branży automotive. Cała automatyczna ekstrakcja danych działa offline, na serwerze firmy, ponieważ rysunki są poufne. Krótko mówiąc, automatyczna ekstrakcja danych oznacza tu model AI, który czyta plik PDF i zapisuje gotowe dane wprost do ERP.

Sam ten arkusz zawiera blok uwag, tabliczkę rysunkową, dziesiątki tolerancji i kilka przekrojów. Człowiek przepisuje to ręcznie kilka minut. Model robi tę samą pracę w kilka sekund.
Czym jest automatyczna ekstrakcja danych z rysunku
Zakład dostaje rysunki od dostawców w formie plików PDF. Każdy arkusz zawiera tabliczkę, materiał, tolerancje i listę uwag. Dlatego dane istnieją, jednak pozostają zamknięte w obrazie.
Od pliku PDF do gotowych pól
System renderuje każdą stronę PDF w rozdzielczości 300 DPI. Następnie wycina tabliczkę i czyta ją w pierwszej kolejności. Na końcu analizuje cały arkusz pod kątem wymiarów gabarytowych. W praktyce wynikiem jest czysty JSON, gotowy dla dowolnego systemu.
Model wyciąga z każdego arkusza między innymi:
- numer rysunku, numer wyrobu, rewizję, autora i datę,
- gatunek materiału, masę odkuwki i normę zużycia,
- chropowatość powierzchni, obróbkę cieplną i twardość,
- tolerancje długości, szerokości, grubości i kątów,
- wymiary gabarytowe w milimetrach oraz listę części.
Dlaczego automatyczna ekstrakcja danych działa offline
Rysunki w automotive to tajemnica handlowa. Na przykład dostawca tier-1 nie wyśle ani jednego wymiaru do publicznej chmury. Dlatego usługi OCR w chmurze odpadły już na starcie.
Model AI na serwerze w zakładzie
Cały model działa więc na serwerze wewnątrz zakładu. Żaden rysunek nie opuszcza budynku. Ponadto dział IT zachowuje pełną kontrolę nad sprzętem, wagami modelu i logami. Z drugiej strony narzędzie SaaS wysłałoby każdy arkusz do cudzego centrum danych.

Weźmy ten rysunek korbowodu. Zawiera pełną listę części z pozycją, ilością, numerem części, opisem i masą. Model czyta także tę tabelę, wiersz po wierszu.
Jak działa automatyczna ekstrakcja danych w praktyce
Silnikiem jest otwarty model wizyjno-językowy Qwen2.5-VL, uruchamiany lokalnie przez Ollamę. Ponadto model nie potrzebuje internetu i działa na firmowym GPU lub maszynie Apple Silicon.
Trzy przebiegi i jeden model wizyjny
Pipeline czyta każdy arkusz w trzech przebiegach, które działają równolegle. Pierwszy zajmuje się tabliczką rysunkową. Drugi odczytuje materiał, tolerancje i uwagi. Trzeci mierzy gabaryty wyrobu. Co więcej, model najpierw przepisuje surowy tekst, a potem parsuje własne notatki, co eliminuje większość halucynacji na drobnych wymiarach.
Jednostki na rysunkach bywają różne. Dlatego system w locie przelicza cale na milimetry, a funty na kilogramy.
Automatyczna ekstrakcja danych a eksport do ERP
Odczyt arkusza to dopiero połowa pracy. Dane muszą trafić tam, gdzie pracują planiści, czyli do ERP. Dlatego JSON mapuje się na pola danych podstawowych w systemie, którego używa zakład.
SAP, IFS, Oracle i pozostałe systemy
Produkcja to największy segment rynku ERP. W efekcie większość zakładów używa jednego z kilku pakietów:
- SAP S/4HANA — największy ERP pod względem liczby klientów,
- Oracle Fusion Cloud ERP oraz NetSuite,
- Microsoft Dynamics 365,
- Infor CloudSuite Industrial i IFS Cloud,
- Epicor Kinetic.
W praktyce odczytane pola stają się rekordem materiału, wejściem do marszruty albo pozycją do wyceny. W efekcie planista przestaje przepisywać, a zaczyna sprawdzać.
Koszty: automatyczna ekstrakcja danych dedyk vs licencja
Zakres: jeden zakład, rysunki dostawców, model offline oraz eksport do jednego ERP. Horyzont 3 lat.
| Pozycja | Licencjonowane IDP w chmurze + ręczne sprawdzanie | Dedykowany build u mnie |
|---|---|---|
| Opłaty za dokument w chmurze (rok 1) | 30 000 – 90 000 PLN | 0 PLN — Twój własny model |
| Wdrożenie, konektory, mapowanie ERP | 40 000 – 120 000 PLN | W cenie projektu |
| Jednorazowa budowa (reader + eksport do ERP) | — | 25 000 – 45 000 PLN netto |
| Dane opuszczają zakład? | Tak — do chmury | Nie — w pełni offline |
| Lata 2–3 opłat + support | 80 000 – 220 000 PLN | 0 PLN (opcjonalny support ~8 000 PLN/rok) |
| 3 lata razem | 150 000 – 430 000 PLN | 25 000 – 60 000 PLN |
Krótko mówiąc, dedykowany build zwraca się długo przed roczną subskrypcją licencjonowanego IDP.
Automatyczna ekstrakcja danych — jak zacząć
- Wybierz jeden format rysunku o największym wolumenie.
- Zdefiniuj dokładnie pola, których ERP potrzebuje jako dane podstawowe.
- Postaw model offline na jednym firmowym serwerze.
- Zweryfikuj JSON na 50 znanych arkuszach przed startem.
- Wepnij eksport do SAP, IFS lub Twojego ERP.
Jeśli to brzmi jak Twoja hala, zajrzyj na stronę główną — większość projektów startuje od jednego formatu rysunku i jednego celu w ERP.
Podsumowanie — automatyczna ekstrakcja danych
Automatyczna ekstrakcja danych zamienia poufne pliki PDF w dane gotowe do ERP, bez wysyłania czegokolwiek do chmury. Model czyta tabliczkę, tolerancje i listę części, a następnie eksportuje dane wprost do SAP lub IFS. Dla pojedynczego zakładu automotive ta droga jest szybsza, tańsza i bezpieczniejsza niż ręczne przepisywanie oraz licencja w chmurze.
Więcej: SAP w Wikipedii.
LATEST POSTS