KWALIFIKACJA EKA6 - TEST WIEDZY NR 2

PYTANIE NR 5.
Jaki jest cel skalowania obrazu w procesie optycznego rozpoznawania znaków (OCR)?
A.
B.
C.
D.
Wyjaśnienie poprawnej odpowiedzi:
Skalowanie w OCR służy głównie do ujednolicenia wymiarów/rozdzielczości obrazu, aby algorytm dostawał dane w przewidywalnym formacie.
Nie jest to to samo co kompresja pliku, "ogólna poprawa jakości" ani odszumianie, które realizuje się innymi operacjami.

Pełne wyjaśnienie:

W procesie optycznego rozpoznawania znaków (OCR) obraz dokumentu przechodzi zwykle etap wstępnego przetwarzania. Jednym z typowych kroków jest skalowanie (zmiana rozmiaru obrazu), czyli dopasowanie jego wymiarów lub rozdzielczości do parametrów oczekiwanych przez kolejne etapy rozpoznawania.

Dlaczego "normalizacja rozmiaru obrazu do standardowego formatu" jest poprawna?
OCR działa najstabilniej, gdy wejście ma porównywalną skalę: wysokość znaków, gęstość pikseli i proporcje są zbliżone w wielu dokumentach. Skalowanie pomaga więc ujednolicić materiał pochodzący z różnych źródeł (skaner, telefon, różne ustawienia DPI), co zmniejsza ryzyko, że znaki będą zbyt małe, zbyt duże albo "rozmyte" przez nieodpowiednią interpolację.

Dlaczego pozostałe odpowiedzi są błędne?

  • "Zmniejszenie rozmiaru pliku obrazu" – to dotyczy kompresji (np. ustawień JPEG, PDF, PNG), czyli ilości danych zapisanych na dysku. Można mieć mały plik o dużych wymiarach (silna kompresja) albo duży plik o małych wymiarach (bez kompresji). To inny cel niż skalowanie.
  • "Poprawa jakości obrazu" – skalowanie samo w sobie nie musi poprawiać jakości; bywa wręcz, że pogarsza szczegóły (np. przy niekorzystnej interpolacji). "Poprawa jakości" jest zbyt ogólna i nie wskazuje konkretnego mechanizmu OCR.
  • "Usunięcie szumów z obrazu" – odszumianie realizują filtry (np. medianowy, bilateralny) lub metody redukcji zakłóceń. Skalowanie może zmienić wygląd szumu, ale nie jest standardowo nazywane odszumianiem.

Wskazówka egzaminacyjna: jeśli w odpowiedziach pojawia się rozróżnienie "wymiary/format obrazu" vs "rozmiar pliku", to skalowanie wiąże się z wymiarami, a nie z "wagą" pliku. W OCR myśl o ujednoliceniu wejścia dla algorytmu.

Dodatkowe pytania

Dodatkowe pytania (FAQ):
Skalowanie to zmiana wymiarów obrazu (np. liczby pikseli na szerokość i wysokość) lub dopasowanie rozdzielczości tak, by wejście miało przewidywalny format. W OCR pomaga to ujednolicić "wielkość" tekstu w pikselach i poprawić stabilność rozpoznawania.
Algorytmy OCR lepiej działają, gdy znaki mają podobną wysokość i grubość w pikselach. Normalizacja przez skalowanie ogranicza różnice między skanami z różnych urządzeń i ustawień, dzięki czemu segmentacja znaków i dopasowanie wzorców jest mniej podatne na błędy.
Nie. Skalowanie zmienia wymiary obrazu (piksele), a zmniejszenie rozmiaru pliku zwykle wynika z kompresji (np. JPEG) lub ustawień zapisu PDF. Możesz mieć mały plik i duży obraz albo duży plik i mały obraz — to dwa różne parametry.
Często stosuje się: korekcję obrotu/pochylenia, przycięcie marginesów, poprawę kontrastu, binarizację, odszumianie oraz skalowanie do spójnych wymiarów. Konkretne kroki zależą od jakości skanu i rodzaju dokumentu (np. faktura, umowa, pismo).
Gdy skany pochodzą z różnych źródeł (skaner, telefon), mają różną rozdzielczość lub tekst jest wyraźnie zbyt mały/duży w obrazie. Przeskalowanie do stałych parametrów ułatwia automatyczne rozpoznanie i poprawia porównywalność wyników w archiwum.
Najczęściej myli się skalowanie z kompresją (rozmiar pliku) oraz z "poprawą jakości" jako hasłem ogólnym. Częsty błąd to też utożsamienie skalowania z odszumianiem. Na egzaminie warto rozdzielać: wymiary obrazu, kompresję oraz filtry jakości.
Nie zawsze. Zbyt mocne powiększenie może wprowadzać artefakty interpolacji, a zbyt mocne zmniejszenie usuwa detale liter. Skalowanie pomaga głównie wtedy, gdy doprowadza tekst do "rozsądnej" wielkości w pikselach i ujednolica wejście dla algorytmu.
Typowe sygnały to: zlepianie się liter, gubienie kropek i kresek (np. "i", "l"), błędy w znakach diakrytycznych oraz nierówne wyniki między stronami. Jeśli tekst jest bardzo drobny albo bardzo duży w obrazie, warto rozważyć skalowanie.
Rozdzielczość wpływa na to, ile pikseli opisuje litery. Zbyt niska utrudnia odczyt cienkich elementów, zbyt wysoka zwiększa koszt obliczeń i rozmiar danych. Skalowanie bywa użyte do wyrównania materiału, gdy źródła mają różne ustawienia.
Warto opanować podstawowe pojęcia: skanowanie, rozdzielczość, format pliku, kompresja, skalowanie, binarizacja i odszumianie. Ćwicz rozróżnianie tych terminów na przykładach dokumentów (faktury, umowy), bo pytania często sprawdzają właśnie różnice definicyjne.
info

Statystycznie 58% uczniów zna prawidłową odpowiedź. średnie

Źródła:

  • OpenCV Documentation: Geometric Image Transformations (resize / scaling) – https://docs.opencv.org/4.x/da/d54/group__imgproc__transform.html (dostęp: 2026-02-26)
  • Tesseract OCR (GitHub Wiki): ImproveQuality (preprocessing, m.in. rescaling) – https://github.com/tesseract-ocr/tessdoc/blob/main/ImproveQuality.md (dostęp: 2026-02-26)
  • Wikipedia: Optical character recognition (sekcje o preprocessing/normalization) – https://en.wikipedia.org/wiki/Optical_character_recognition (dostęp: 2026-02-26)

Materiały:

  • Dokumentacja narzędzi OCR używanych w praktyce biurowej (funkcje preprocesingu: skalowanie, binarizacja, korekcja pochylenia)
  • Podstawowe tutoriale z przetwarzania obrazu: zmiana rozmiaru, rozdzielczość, interpolacja
  • Instrukcje skanowania dokumentów: zalecane parametry rozdzielczości dla tekstu oraz wpływ jakości wejścia na rozpoznawanie

Aktualizacja pytania: 31.03.2026



Aktualizacja pytania: 31.03.2026
📡 Brak połączenia internetowego