W procesie optycznego rozpoznawania znaków (OCR) obraz dokumentu przechodzi zwykle etap wstępnego przetwarzania. Jednym z typowych kroków jest skalowanie (zmiana rozmiaru obrazu), czyli dopasowanie jego wymiarów lub rozdzielczości do parametrów oczekiwanych przez kolejne etapy rozpoznawania.
Dlaczego "normalizacja rozmiaru obrazu do standardowego formatu" jest poprawna?
OCR działa najstabilniej, gdy wejście ma porównywalną skalę: wysokość znaków, gęstość pikseli i proporcje są zbliżone w wielu dokumentach. Skalowanie pomaga więc ujednolicić materiał pochodzący z różnych źródeł (skaner, telefon, różne ustawienia DPI), co zmniejsza ryzyko, że znaki będą zbyt małe, zbyt duże albo "rozmyte" przez nieodpowiednią interpolację.
Dlaczego pozostałe odpowiedzi są błędne?
- "Zmniejszenie rozmiaru pliku obrazu" – to dotyczy kompresji (np. ustawień JPEG, PDF, PNG), czyli ilości danych zapisanych na dysku. Można mieć mały plik o dużych wymiarach (silna kompresja) albo duży plik o małych wymiarach (bez kompresji). To inny cel niż skalowanie.
- "Poprawa jakości obrazu" – skalowanie samo w sobie nie musi poprawiać jakości; bywa wręcz, że pogarsza szczegóły (np. przy niekorzystnej interpolacji). "Poprawa jakości" jest zbyt ogólna i nie wskazuje konkretnego mechanizmu OCR.
- "Usunięcie szumów z obrazu" – odszumianie realizują filtry (np. medianowy, bilateralny) lub metody redukcji zakłóceń. Skalowanie może zmienić wygląd szumu, ale nie jest standardowo nazywane odszumianiem.
Wskazówka egzaminacyjna: jeśli w odpowiedziach pojawia się rozróżnienie "wymiary/format obrazu" vs "rozmiar pliku", to skalowanie wiąże się z wymiarami, a nie z "wagą" pliku. W OCR myśl o ujednoliceniu wejścia dla algorytmu.