Technologia OCR (optyczne rozpoznawanie znaków) polega na analizie obrazu, wykrywaniu kształtów liter oraz zamianie ich na znaki tekstowe, które można edytować w edytorze (kopiować, poprawiać, formatować). To właśnie opisuje sformułowanie: "przetwarzając plik graficzny do postaci edytowalnej". Plik graficzny (skan, zdjęcie) sam w sobie nie ma warstwy tekstowej, więc aby uzyskać tekst edytowalny, potrzebne jest rozpoznanie znaków.
Odpowiedź "OCR" jest więc poprawna, bo wskazuje technologię odpowiedzialną za konwersję obraz → tekst.
Pozostałe odpowiedzi dotyczą innych klas narzędzi wspierających dostępność, ale nie wykonują rozpoznawania znaków:
- "Screen Reader" to czytnik ekranu. Odczytuje informacje dostępne w interfejsie systemu i aplikacji (np. etykiety, role kontrolek, tekst w polach). Nie "wydobywa" automatycznie tekstu z obrazu, jeśli aplikacja nie udostępnia go jako tekst.
- "Text to Speech" (synteza mowy) zamienia już istniejący tekst na dźwięk. To etap "tekst → mowa", a nie "obraz → tekst". W praktyce TTS często działa razem z OCR (najpierw OCR, potem TTS), ale sama synteza mowy nie tworzy tekstu edytowalnego z grafiki.
- "OBR" nie jest powszechnie rozpoznawalną nazwą standardowej technologii konwersji obrazu na tekst w tym kontekście. Nawet jeśli skrót bywa używany w innych znaczeniach, nie odpowiada opisowi procesu rozpoznawania znaków z obrazu w typowym ujęciu egzaminacyjnym.
Wskazówka egzaminacyjna: jeśli w treści pojawia się wymóg uzyskania tekstu edytowalnego z pliku graficznego, najczęściej chodzi o OCR. Jeśli mowa o odczytywaniu interfejsu i elementów na ekranie, wtedy chodzi o czytnik ekranu. Jeśli o zamianie tekstu na głos — o syntezę mowy.