KWALIFIKACJA EKA6 - TEST WIEDZY NR 2

PYTANIE NR 5.

Jaki jest cel skalowania obrazu w procesie optycznego rozpoznawania znaków (OCR)?

A.	Zmniejszenie rozmiaru pliku obrazu.
B.	Normalizacja rozmiaru obrazu do standardowego formatu.
C.	Poprawa jakości obrazu.
D.	Usunięcie szumów z obrazu.
	Zostaw bez odpowiedzi

Wyjaśnienie poprawnej odpowiedzi:
Skalowanie w OCR służy głównie do ujednolicenia wymiarów/rozdzielczości obrazu, aby algorytm dostawał dane w przewidywalnym formacie.
Nie jest to to samo co kompresja pliku, "ogólna poprawa jakości" ani odszumianie, które realizuje się innymi operacjami.

Pełne wyjaśnienie:

W procesie optycznego rozpoznawania znaków (OCR) obraz dokumentu przechodzi zwykle etap wstępnego przetwarzania. Jednym z typowych kroków jest skalowanie (zmiana rozmiaru obrazu), czyli dopasowanie jego wymiarów lub rozdzielczości do parametrów oczekiwanych przez kolejne etapy rozpoznawania.
Dlaczego "normalizacja rozmiaru obrazu do standardowego formatu" jest poprawna?
OCR działa najstabilniej, gdy wejście ma porównywalną skalę: wysokość znaków, gęstość pikseli i proporcje są zbliżone w wielu dokumentach. Skalowanie pomaga więc ujednolicić materiał pochodzący z różnych źródeł (skaner, telefon, różne ustawienia DPI), co zmniejsza ryzyko, że znaki będą zbyt małe, zbyt duże albo "rozmyte" przez nieodpowiednią interpolację.
Dlaczego pozostałe odpowiedzi są błędne?
"Zmniejszenie rozmiaru pliku obrazu" – to dotyczy kompresji (np. ustawień JPEG, PDF, PNG), czyli ilości danych zapisanych na dysku. Można mieć mały plik o dużych wymiarach (silna kompresja) albo duży plik o małych wymiarach (bez kompresji). To inny cel niż skalowanie.
"Poprawa jakości obrazu" – skalowanie samo w sobie nie musi poprawiać jakości; bywa wręcz, że pogarsza szczegóły (np. przy niekorzystnej interpolacji). "Poprawa jakości" jest zbyt ogólna i nie wskazuje konkretnego mechanizmu OCR.
"Usunięcie szumów z obrazu" – odszumianie realizują filtry (np. medianowy, bilateralny) lub metody redukcji zakłóceń. Skalowanie może zmienić wygląd szumu, ale nie jest standardowo nazywane odszumianiem.
Wskazówka egzaminacyjna: jeśli w odpowiedziach pojawia się rozróżnienie "wymiary/format obrazu" vs "rozmiar pliku", to skalowanie wiąże się z wymiarami, a nie z "wagą" pliku. W OCR myśl o ujednoliceniu wejścia dla algorytmu.

Dodatkowe pytania

Dodatkowe pytania (FAQ):

Co to jest skalowanie obrazu w przygotowaniu skanu do OCR?

Skalowanie to zmiana wymiarów obrazu (np. liczby pikseli na szerokość i wysokość) lub dopasowanie rozdzielczości tak, by wejście miało przewidywalny format. W OCR pomaga to ujednolicić "wielkość" tekstu w pikselach i poprawić stabilność rozpoznawania.

Dlaczego normalizacja rozmiaru obrazu pomaga w rozpoznawaniu tekstu?

Algorytmy OCR lepiej działają, gdy znaki mają podobną wysokość i grubość w pikselach. Normalizacja przez skalowanie ogranicza różnice między skanami z różnych urządzeń i ustawień, dzięki czemu segmentacja znaków i dopasowanie wzorców jest mniej podatne na błędy.

Czy skalowanie obrazu to to samo co zmniejszenie rozmiaru pliku?

Nie. Skalowanie zmienia wymiary obrazu (piksele), a zmniejszenie rozmiaru pliku zwykle wynika z kompresji (np. JPEG) lub ustawień zapisu PDF. Możesz mieć mały plik i duży obraz albo duży plik i mały obraz — to dwa różne parametry.

Jakie są typowe etapy wstępnego przetwarzania obrazu przed OCR?

Często stosuje się: korekcję obrotu/pochylenia, przycięcie marginesów, poprawę kontrastu, binarizację, odszumianie oraz skalowanie do spójnych wymiarów. Konkretne kroki zależą od jakości skanu i rodzaju dokumentu (np. faktura, umowa, pismo).

Kiedy warto przeskalować skan dokumentu przed OCR w pracy biurowej?

Gdy skany pochodzą z różnych źródeł (skaner, telefon), mają różną rozdzielczość lub tekst jest wyraźnie zbyt mały/duży w obrazie. Przeskalowanie do stałych parametrów ułatwia automatyczne rozpoznanie i poprawia porównywalność wyników w archiwum.

Jakie błędy są najczęstsze przy myleniu skalowania z innymi operacjami OCR?

Najczęściej myli się skalowanie z kompresją (rozmiar pliku) oraz z "poprawą jakości" jako hasłem ogólnym. Częsty błąd to też utożsamienie skalowania z odszumianiem. Na egzaminie warto rozdzielać: wymiary obrazu, kompresję oraz filtry jakości.

Czy skalowanie zawsze poprawia jakość rozpoznawania OCR?

Nie zawsze. Zbyt mocne powiększenie może wprowadzać artefakty interpolacji, a zbyt mocne zmniejszenie usuwa detale liter. Skalowanie pomaga głównie wtedy, gdy doprowadza tekst do "rozsądnej" wielkości w pikselach i ujednolica wejście dla algorytmu.

Jak rozpoznać, że skan jest w złej skali dla OCR?

Typowe sygnały to: zlepianie się liter, gubienie kropek i kresek (np. "i", "l"), błędy w znakach diakrytycznych oraz nierówne wyniki między stronami. Jeśli tekst jest bardzo drobny albo bardzo duży w obrazie, warto rozważyć skalowanie.

Jakie znaczenie ma rozdzielczość przy skanowaniu dokumentów do OCR?

Rozdzielczość wpływa na to, ile pikseli opisuje litery. Zbyt niska utrudnia odczyt cienkich elementów, zbyt wysoka zwiększa koszt obliczeń i rozmiar danych. Skalowanie bywa użyte do wyrównania materiału, gdy źródła mają różne ustawienia.

Jak przygotować się do pytań o OCR na egzaminie z prac biurowych?

Warto opanować podstawowe pojęcia: skanowanie, rozdzielczość, format pliku, kompresja, skalowanie, binarizacja i odszumianie. Ćwicz rozróżnianie tych terminów na przykładach dokumentów (faktury, umowy), bo pytania często sprawdzają właśnie różnice definicyjne.

info

Statystycznie 58% uczniów zna prawidłową odpowiedź. średnie

Źródła:

OpenCV Documentation: Geometric Image Transformations (resize / scaling) – https://docs.opencv.org/4.x/da/d54/group__imgproc__transform.html (dostęp: 2026-02-26)
Tesseract OCR (GitHub Wiki): ImproveQuality (preprocessing, m.in. rescaling) – https://github.com/tesseract-ocr/tessdoc/blob/main/ImproveQuality.md (dostęp: 2026-02-26)
Wikipedia: Optical character recognition (sekcje o preprocessing/normalization) – https://en.wikipedia.org/wiki/Optical_character_recognition (dostęp: 2026-02-26)

Materiały:

Dokumentacja narzędzi OCR używanych w praktyce biurowej (funkcje preprocesingu: skalowanie, binarizacja, korekcja pochylenia)
Podstawowe tutoriale z przetwarzania obrazu: zmiana rozmiaru, rozdzielczość, interpolacja
Instrukcje skanowania dokumentów: zalecane parametry rozdzielczości dla tekstu oraz wpływ jakości wejścia na rozpoznawanie

Aktualizacja pytania: 31.03.2026

LOGOWANIE

KWALIFIKACJA EKA6 - TEST WIEDZY NR 2

Dodatkowe pytania

Dodatkowe pytania (FAQ):

Zobacz też: