W kontekście optycznego rozpoznawania znaków (OCR) "szum" oznacza niepożądane zakłócenia i artefakty w obrazie, które nie należą do właściwej treści dokumentu, a mogą pogarszać odczyt znaków. Mogą to być m.in. drobne kropki, ziarnistość, smugi, przebijanie druku z drugiej strony kartki, nierówne tło papieru, kompresja, poruszenie podczas skanowania czy zagniecenia.
Dlaczego odpowiedź "Są to niepożądane artefakty lub deformacje na obrazie, które mogą zakłócić proces OCR." jest poprawna? Ponieważ OCR działa na obrazie: wykrywa kształty liter, linie tekstu i kontrast między tłem a znakami. Gdy w obrazie pojawiają się zakłócenia, algorytmy mogą:
- pomylić szum z elementami liter (np. kropka jako część znaku),
- zniekształcić krawędzie znaków podczas progowania (binarizacji),
- utrudnić podział tekstu na wiersze i pojedyncze znaki,
- zwiększyć liczbę błędów rozpoznania i konieczność ręcznej korekty.
Odpowiedź "Jest to dźwięk wydawany przez skaner podczas skanowania dokumentu." jest niepoprawna, bo odnosi się do zjawiska akustycznego, a pytanie dotyczy przetwarzania obrazów (czyli danych graficznych, nie dźwięku).
Odpowiedź "Jest to błąd generowany przez oprogramowanie OCR podczas przetwarzania obrazu." także nie pasuje do definicji: błąd programu to komunikat lub nieprawidłowe działanie, a "szum" opisuje właściwość/defekt obrazu wejściowego (danych), który może prowadzić do gorszych wyników, nawet gdy program działa poprawnie.
Odpowiedź "Jest to informacja zawarta w dokumencie, która nie jest potrzebna do procesu OCR." myli pojęcia. "Niepotrzebna informacja" może oznaczać np. logo, tabelę czy grafikę, ale nie jest to szum w sensie technicznym. Szum to zwykle losowe lub przypadkowe zakłócenia jakości, które utrudniają analizę obrazu.
W praktyce biurowej warto pamiętać: im lepszy skan (ostrość, kontrast, brak zabrudzeń), tym mniej "szumu" i wyższa skuteczność OCR, a to przekłada się na szybsze wprowadzanie danych i mniej poprawek.