Automatyczna ekstrakcja danych z rysunków technicznych to jedna z moich ostatnich realizacji dla zakładu z branży automotive. Cała automatyczna ekstrakcja danych działa offline, na serwerze firmy, ponieważ rysunki są poufne. Krótko mówiąc, automatyczna ekstrakcja danych oznacza tu model AI, który czyta plik PDF i zapisuje gotowe dane wprost do ERP.

Automatyczna ekstrakcja danych z rysunku technicznego odkuwki

Sam ten arkusz zawiera blok uwag, tabliczkę rysunkową, dziesiątki tolerancji i kilka przekrojów. Człowiek przepisuje to ręcznie kilka minut. Model robi tę samą pracę w kilka sekund.

Czym jest automatyczna ekstrakcja danych z rysunku

Zakład dostaje rysunki od dostawców w formie plików PDF. Każdy arkusz zawiera tabliczkę, materiał, tolerancje i listę uwag. Dlatego dane istnieją, jednak pozostają zamknięte w obrazie.

Od pliku PDF do gotowych pól

System renderuje każdą stronę PDF w rozdzielczości 300 DPI. Następnie wycina tabliczkę i czyta ją w pierwszej kolejności. Na końcu analizuje cały arkusz pod kątem wymiarów gabarytowych. W praktyce wynikiem jest czysty JSON, gotowy dla dowolnego systemu.

Model wyciąga z każdego arkusza między innymi:

  • numer rysunku, numer wyrobu, rewizję, autora i datę,
  • gatunek materiału, masę odkuwki i normę zużycia,
  • chropowatość powierzchni, obróbkę cieplną i twardość,
  • tolerancje długości, szerokości, grubości i kątów,
  • wymiary gabarytowe w milimetrach oraz listę części.

Dlaczego automatyczna ekstrakcja danych działa offline

Rysunki w automotive to tajemnica handlowa. Na przykład dostawca tier-1 nie wyśle ani jednego wymiaru do publicznej chmury. Dlatego usługi OCR w chmurze odpadły już na starcie.

Model AI na serwerze w zakładzie

Cały model działa więc na serwerze wewnątrz zakładu. Żaden rysunek nie opuszcza budynku. Ponadto dział IT zachowuje pełną kontrolę nad sprzętem, wagami modelu i logami. Z drugiej strony narzędzie SaaS wysłałoby każdy arkusz do cudzego centrum danych.

Automatyczna ekstrakcja danych z rysunku korbowodu i jego listy części

Weźmy ten rysunek korbowodu. Zawiera pełną listę części z pozycją, ilością, numerem części, opisem i masą. Model czyta także tę tabelę, wiersz po wierszu.

Jak działa automatyczna ekstrakcja danych w praktyce

Silnikiem jest otwarty model wizyjno-językowy Qwen2.5-VL, uruchamiany lokalnie przez Ollamę. Ponadto model nie potrzebuje internetu i działa na firmowym GPU lub maszynie Apple Silicon.

Trzy przebiegi i jeden model wizyjny

Pipeline czyta każdy arkusz w trzech przebiegach, które działają równolegle. Pierwszy zajmuje się tabliczką rysunkową. Drugi odczytuje materiał, tolerancje i uwagi. Trzeci mierzy gabaryty wyrobu. Co więcej, model najpierw przepisuje surowy tekst, a potem parsuje własne notatki, co eliminuje większość halucynacji na drobnych wymiarach.

Jednostki na rysunkach bywają różne. Dlatego system w locie przelicza cale na milimetry, a funty na kilogramy.

Automatyczna ekstrakcja danych a eksport do ERP

Odczyt arkusza to dopiero połowa pracy. Dane muszą trafić tam, gdzie pracują planiści, czyli do ERP. Dlatego JSON mapuje się na pola danych podstawowych w systemie, którego używa zakład.

SAP, IFS, Oracle i pozostałe systemy

Produkcja to największy segment rynku ERP. W efekcie większość zakładów używa jednego z kilku pakietów:

  • SAP S/4HANA — największy ERP pod względem liczby klientów,
  • Oracle Fusion Cloud ERP oraz NetSuite,
  • Microsoft Dynamics 365,
  • Infor CloudSuite Industrial i IFS Cloud,
  • Epicor Kinetic.

W praktyce odczytane pola stają się rekordem materiału, wejściem do marszruty albo pozycją do wyceny. W efekcie planista przestaje przepisywać, a zaczyna sprawdzać.

Koszty: automatyczna ekstrakcja danych dedyk vs licencja

Zakres: jeden zakład, rysunki dostawców, model offline oraz eksport do jednego ERP. Horyzont 3 lat.

Pozycja Licencjonowane IDP w chmurze + ręczne sprawdzanie Dedykowany build u mnie
Opłaty za dokument w chmurze (rok 1) 30 000 – 90 000 PLN 0 PLN — Twój własny model
Wdrożenie, konektory, mapowanie ERP 40 000 – 120 000 PLN W cenie projektu
Jednorazowa budowa (reader + eksport do ERP) 25 000 – 45 000 PLN netto
Dane opuszczają zakład? Tak — do chmury Nie — w pełni offline
Lata 2–3 opłat + support 80 000 – 220 000 PLN 0 PLN (opcjonalny support ~8 000 PLN/rok)
3 lata razem 150 000 – 430 000 PLN 25 000 – 60 000 PLN

Krótko mówiąc, dedykowany build zwraca się długo przed roczną subskrypcją licencjonowanego IDP.

Automatyczna ekstrakcja danych — jak zacząć

  1. Wybierz jeden format rysunku o największym wolumenie.
  2. Zdefiniuj dokładnie pola, których ERP potrzebuje jako dane podstawowe.
  3. Postaw model offline na jednym firmowym serwerze.
  4. Zweryfikuj JSON na 50 znanych arkuszach przed startem.
  5. Wepnij eksport do SAP, IFS lub Twojego ERP.

Jeśli to brzmi jak Twoja hala, zajrzyj na stronę główną — większość projektów startuje od jednego formatu rysunku i jednego celu w ERP.

Podsumowanie — automatyczna ekstrakcja danych

Automatyczna ekstrakcja danych zamienia poufne pliki PDF w dane gotowe do ERP, bez wysyłania czegokolwiek do chmury. Model czyta tabliczkę, tolerancje i listę części, a następnie eksportuje dane wprost do SAP lub IFS. Dla pojedynczego zakładu automotive ta droga jest szybsza, tańsza i bezpieczniejsza niż ręczne przepisywanie oraz licencja w chmurze.

Więcej: SAP w Wikipedii.