KWALIFIKACJA EKA6 - TEST WIEDZY NR 5

PYTANIE NR 3.
Co to jest "szum" w kontekście przetwarzania obrazów w procesie optycznego rozpoznawania znaków (OCR)?
A.
B.
C.
D.
Wyjaśnienie poprawnej odpowiedzi:
Szum w OCR to zakłócenia widoczne w obrazie (np. plamki, losowe piksele, zniekształcenia tła), które utrudniają segmentację liter i obniżają poprawność rozpoznawania znaków. Nie jest to dźwięk skanera ani "komunikat błędu" programu, tylko cecha jakości obrazu wejściowego.

Pełne wyjaśnienie:

W kontekście optycznego rozpoznawania znaków (OCR) "szum" oznacza niepożądane zakłócenia i artefakty w obrazie, które nie należą do właściwej treści dokumentu, a mogą pogarszać odczyt znaków. Mogą to być m.in. drobne kropki, ziarnistość, smugi, przebijanie druku z drugiej strony kartki, nierówne tło papieru, kompresja, poruszenie podczas skanowania czy zagniecenia.

Dlaczego odpowiedź "Są to niepożądane artefakty lub deformacje na obrazie, które mogą zakłócić proces OCR." jest poprawna? Ponieważ OCR działa na obrazie: wykrywa kształty liter, linie tekstu i kontrast między tłem a znakami. Gdy w obrazie pojawiają się zakłócenia, algorytmy mogą:

  • pomylić szum z elementami liter (np. kropka jako część znaku),
  • zniekształcić krawędzie znaków podczas progowania (binarizacji),
  • utrudnić podział tekstu na wiersze i pojedyncze znaki,
  • zwiększyć liczbę błędów rozpoznania i konieczność ręcznej korekty.

Odpowiedź "Jest to dźwięk wydawany przez skaner podczas skanowania dokumentu." jest niepoprawna, bo odnosi się do zjawiska akustycznego, a pytanie dotyczy przetwarzania obrazów (czyli danych graficznych, nie dźwięku).

Odpowiedź "Jest to błąd generowany przez oprogramowanie OCR podczas przetwarzania obrazu." także nie pasuje do definicji: błąd programu to komunikat lub nieprawidłowe działanie, a "szum" opisuje właściwość/defekt obrazu wejściowego (danych), który może prowadzić do gorszych wyników, nawet gdy program działa poprawnie.

Odpowiedź "Jest to informacja zawarta w dokumencie, która nie jest potrzebna do procesu OCR." myli pojęcia. "Niepotrzebna informacja" może oznaczać np. logo, tabelę czy grafikę, ale nie jest to szum w sensie technicznym. Szum to zwykle losowe lub przypadkowe zakłócenia jakości, które utrudniają analizę obrazu.

W praktyce biurowej warto pamiętać: im lepszy skan (ostrość, kontrast, brak zabrudzeń), tym mniej "szumu" i wyższa skuteczność OCR, a to przekłada się na szybsze wprowadzanie danych i mniej poprawek.

Dodatkowe pytania

Dodatkowe pytania (FAQ):
Szum to niepożądane zakłócenia widoczne w obrazie (np. kropki, smugi, ziarnistość, nierówne tło), które nie są treścią dokumentu. W OCR szum utrudnia wykrywanie kształtów liter i może powodować błędne rozpoznanie znaków lub konieczność ręcznych poprawek.
OCR rozpoznaje znaki na podstawie kontrastu i konturów. Szum "dodaje" fałszywe piksele albo deformuje litery, przez co algorytm może pomylić kropki z częścią znaku, zgubić cienkie linie lub błędnie podzielić tekst na znaki. Efekt to więcej literówek w wyniku.
Najczęściej to zabrudzenia szyby skanera, zagniecenia i plamy na papierze, słaba jakość wydruku, przebijanie tekstu z drugiej strony kartki, zbyt niska rozdzielczość, poruszenie podczas skanowania oraz agresywna kompresja obrazu. Każde z nich obniża czytelność liter dla OCR.
Szum jest cechą obrazu wejściowego: widać go na skanie jako zakłócenia. Błąd programu to zwykle komunikat, awaria lub błędne działanie niezależne od tego, czy obraz jest "czysty". Jeśli ten sam OCR działa dobrze na dobrych skanach, a źle na zaszumionych, problemem jest jakość obrazu.
Pomaga wyczyszczenie szyby skanera, dociśnięcie kartki, skan w wyższej rozdzielczości, poprawa kontrastu oraz użycie funkcji typu odszumianie, usuwanie tła, prostowanie (deskew) i przycinanie. Celem jest wyraźny tekst i jednolite tło, aby OCR łatwo odróżnił litery.
Nie. W przetwarzaniu obrazów "szum" oznacza zakłócenia w obrazie (piksele, artefakty), a nie dźwięk urządzenia. Skaner może hałasować mechanicznie, ale to nie ma znaczenia dla definicji szumu w OCR. Liczy się to, co widać w pliku graficznym.
Zwykle pomaga skan w trybie czarno-białym lub w skali szarości (zależnie od dokumentu), wyższa rozdzielczość oraz poprawny kontrast/jasność. Zbyt niska rozdzielczość i zbyt mocna kompresja potrafią "rozsypać" krawędzie liter. W praktyce warto testować 2–3 ustawienia na próbce.
Gdy skan ma drobne kropki, ziarnistość albo nierówne tło, filtry odszumiające mogą poprawić czytelność. Trzeba jednak uważać: zbyt silne odszumianie może "zjeść" cienkie elementy liter (np. kreski, ogonki). Najlepiej porównać wynik OCR przed i po filtrze.
Najczęściej: więcej literówek w odczytanych danych, błędy w numerach faktur lub NIP, trudniejsze wyszukiwanie w archiwum, a także dłuższy czas pracy przez konieczność ręcznej korekty. Przy automatycznym obiegu dokumentów duży szum może też obniżyć skuteczność klasyfikacji i indeksacji.
Typowe pomyłki to utożsamianie "szumu" z hałasem urządzenia albo z błędem oprogramowania. Często też myli się szum z "niepotrzebną treścią" (np. logo), zamiast rozumieć go jako zakłócenia jakości obrazu. Na egzaminie warto zapamiętać: szum = defekt obrazu.
info

Około 60% zdających odpowiada poprawnie na to pytanie. średnie

Według specjalistów z branży: "Szum w OCR to zakłócenia widoczne w obrazie (np. plamki, losowe piksele, zniekształcenia tła), które utrudniają segmentację liter i obniżają poprawność rozpoznawania znaków."

Źródła:

  • Wikipedia (EN): Optical character recognition – sekcje o wejściu obrazowym i wpływie jakości skanu: https://en.wikipedia.org/wiki/Optical_character_recognition (dostęp 2026-03-01)
  • Wikipedia (PL): Szum (sygnał) – ujęcie ogólne pojęcia szumu jako zakłóceń w sygnale/obrazie: https://pl.wikipedia.org/wiki/Szum_(sygna%C5%82) (dostęp 2026-03-01)
  • Tesseract OCR (GitHub): tesseract-ocr/tesseract – dokumentacja i zagadnienia jakości obrazu/deskew/thresholding w praktyce OCR: https://github.com/tesseract-ocr/tesseract (dostęp 2026-03-01)

Materiały:

  • Podręczniki/opracowania o OCR i przetwarzaniu obrazu w digitalizacji dokumentów
  • Dokumentacja narzędzi OCR używanych w biurze (np. ustawienia jakości skanu, filtry obrazu)
  • Materiały szkoleniowe z elektronicznego obiegu dokumentów i archiwizacji cyfrowej

Aktualizacja pytania: 31.03.2026



Aktualizacja pytania: 31.03.2026
📡 Brak połączenia internetowego