KWALIFIKACJA INF10 - STYCZEŃ 2020

PYTANIE NR 4.
Aplikacja, która umożliwia automatyczne przekształcanie tekstu na mowę o naturalnym brzmieniu, to
A.
B.
C.
D.
Wyjaśnienie poprawnej odpowiedzi:
Ivona to rozwiązanie kojarzone z syntezą mowy (TTS), czyli automatycznym zamienianiem tekstu na mowę. Pozostałe propozycje dotyczą innych zastosowań: Recognita i FineReader są związane z OCR (rozpoznawaniem tekstu), a PowerPoint służy do prezentacji, nie do TTS.

Pełne wyjaśnienie:

Pytanie dotyczy aplikacji umożliwiającej automatyczne przekształcanie tekstu na mowę o naturalnym brzmieniu, czyli technologii TTS (text-to-speech). W praktyce tyfloinformatyki TTS jest kluczowym elementem wspierającym osoby z niepełnosprawnością wzrokową: może działać samodzielnie lub jako komponent czytnika ekranu, odczytując treści interfejsu, dokumentów oraz stron internetowych.

Odpowiedź "Ivona." jest właściwa, ponieważ nazwa ta jest powszechnie łączona z syntezą mowy i "naturalnie brzmiącymi" głosami lektorskimi. Tego typu rozwiązania przetwarzają tekst (ciąg znaków) na sygnał mowy, często oferując różne głosy, języki i ustawienia tempa czy intonacji.

Pozostałe odpowiedzi nie pasują do definicji TTS:

  • "Recognita." jest kojarzona przede wszystkim z OCR, czyli rozpoznawaniem znaków z obrazu (np. ze skanu). OCR zamienia obraz tekstu na tekst edytowalny, ale nie jest to syntezator mowy.
  • "FineReader." (ABBYY FineReader) również należy do narzędzi OCR. Służy do rozpoznawania tekstu, konwersji skanów/PDF do postaci edytowalnej i pracy z dokumentami, a nie do generowania mowy jako głównej funkcji.
  • "PowerPoint." to program do tworzenia prezentacji multimedialnych. Może zawierać multimedia, ale jego podstawowym przeznaczeniem nie jest automatyczna synteza mowy z tekstu.

Wskazówka egzaminacyjna: jeśli w treści pojawiają się sformułowania "tekst na mowę", "lektor", "syntezator", "czytanie na głos" – szukaj rozwiązań TTS. Jeśli mowa o "skanach", "rozpoznawaniu znaków", "konwersji PDF" – to zwykle OCR. To szybki sposób na uniknięcie mylenia kategorii narzędzi.

Dodatkowe pytania

Dodatkowe pytania (FAQ):
Synteza mowy (TTS) to technologia zamieniająca tekst na dźwięk mowy. W tyfloinformatyce służy m.in. do odczytywania treści ekranu, dokumentów i stron WWW, wspiera naukę i pracę oraz umożliwia obsługę komputera bez wzroku (często razem z czytnikiem ekranu).
TTS odpowiada na potrzebę "czytania na głos" i generuje mowę z tekstu. OCR dotyczy "rozpoznawania" znaków ze skanu/obrazu i zamienia obraz tekstu na tekst edytowalny. Jeśli w odpowiedziach są nazwy narzędzi do skanów i PDF, to zwykle OCR, nie TTS.
FineReader jest przede wszystkim narzędziem OCR: rozpoznaje tekst z obrazów i dokumentów (np. skanów, PDF), porządkuje układ i umożliwia eksport do edytowalnych formatów. Syntezator mowy ma inną funkcję główną: generuje dźwięk mowy z tekstu, a nie "wydobywa" tekst z obrazu.
Nie. PowerPoint służy do tworzenia i prezentowania slajdów. Osoba niewidoma korzysta zwykle z czytnika ekranu i syntezatora mowy, aby odczytać interfejs i treść slajdów. Sam program prezentacyjny nie pełni roli TTS jako narzędzia dostępności.
TTS wykorzystuje się do konfiguracji i testów czytników ekranu, odsłuchu dokumentów, sprawdzania dostępności aplikacji oraz wsparcia użytkownika w doborze głosów, języków i ustawień mowy. To także pomoc w edukacji: czytanie książek, materiałów i komunikatów systemowych.
OCR oznacza optyczne rozpoznawanie znaków. W dostępności pomaga wtedy, gdy użytkownik ma skan lub zdjęcie dokumentu: OCR zamienia go na tekst, który dopiero potem może zostać odczytany przez TTS lub czytnik ekranu. OCR i TTS często współpracują, ale to różne technologie.
"Naturalne brzmienie" sugeruje jakość głosu syntezatora: mniej "robotyczną" wymowę, lepszą intonację i płynność. Na egzaminie to wskazówka, że chodzi o generowanie mowy, a nie o rozpoznawanie tekstu czy edycję dokumentów. Wciąż jednak liczy się identyfikacja typu narzędzia.
Częsty błąd to wybór programu OCR, gdy pytanie mówi o "tekście", bo oba obszary dotyczą dokumentów. Inny błąd to sugerowanie się rozpoznawalnością nazwy (np. aplikacja biurowa) zamiast funkcją. Pomaga nawyk: najpierw ustal, czy zadanie dotyczy "mówienia" czy "rozpoznawania ze skanu".
TTS wystarczy, gdy masz już tekst w formie cyfrowej (np. strona WWW, dokument edytowalny). OCR jest potrzebne, gdy tekst jest "w obrazie" (skan, zdjęcie, nieedytowalny PDF). Po OCR uzyskany tekst może zostać odczytany przez TTS, co tworzy pełny proces udostępniania treści.
Ułóż listę kategorii narzędzi: czytniki ekranu, TTS, OCR, powiększalniki, narzędzia brajlowskie. Ucz się rozpoznawania nazw i ich głównej funkcji. Trenuj na przykładach: "czyta na głos" → TTS, "rozpoznaje tekst ze skanu" → OCR. To skraca czas odpowiedzi na egzaminie.
info

Około 57% zdających odpowiada poprawnie na to pytanie. średnie

Eksperci podkreślają: "Ivona to rozwiązanie kojarzone z syntezą mowy (TTS), czyli automatycznym zamienianiem tekstu na mowę."

Źródła:

  • Wikipedia: "IVONA" (opis jako synteza mowy/TTS) – https://pl.wikipedia.org/wiki/IVONA – dostęp: 2026-03-02
  • Wikipedia: "ABBYY FineReader" (opis jako oprogramowanie OCR) – https://pl.wikipedia.org/wiki/ABBYY_FineReader – dostęp: 2026-03-02
  • Microsoft Support: "PowerPoint – informacje o programie" (opis zastosowania: prezentacje) – https://support.microsoft.com/pl-pl/office/powerpoint-video-szkolenia-40e8c930-cb0b-40d8-82c4-bd53d3398787 – dostęp: 2026-03-02

Materiały:

  • Dokumentacje i poradniki dotyczące technologii TTS oraz czytników ekranu
  • Materiały dydaktyczne o różnicach TTS vs OCR w tyfloinformatyce
  • Instrukcje obsługi narzędzi dostępności w systemach operacyjnych

Aktualizacja pytania: 31.03.2026



Aktualizacja pytania: 31.03.2026
📡 Brak połączenia internetowego