KWALIFIKACJA AUD9 - CZERWIEC 2015

PYTANIE NR 17.
Z którego z wymienionych zjawisk psychoakustycznych korzystają algorytmy kompresji stratnej?
A.
B.
C.
D.
Wyjaśnienie poprawnej odpowiedzi:
Kompresja stratna audio wykorzystuje psychoakustyczne maskowanie: silniejszy składnik widma utrudnia słyszenie słabszych w pobliżu. Kodek może więc pominąć lub zgrubnie opisać te "zamaskowane" składowe, ograniczając ilość danych przy mało zauważalnym spadku jakości.

Pełne wyjaśnienie:

Kompresja stratna dźwięku (np. kodeki z rodziny MPEG) nie "ściska" sygnału jak procesor dynamiki ani nie dodaje efektów. Jej kluczową ideą jest kodowanie perceptualne: usuwa się lub upraszcza te informacje, których słuchacz i tak zwykle nie usłyszy.

Najważniejszym zjawiskiem, na którym opiera się to podejście, jest maskowanie częstotliwościowe (oraz w praktyce także maskowanie czasowe). Gdy w sygnale występuje silny składnik w danym paśmie, to podnosi on efektywny próg słyszalności dla słabszych składowych w sąsiednich częstotliwościach. Model psychoakustyczny szacuje, które fragmenty widma będą "schowane" pod progiem percepcji i pozwala przeznaczyć na nie mniej bitów albo je pominąć.

Odpowiedź "Maskowanie jednych częstotliwości przez drugie." jest więc poprawna, bo opisuje mechanizm, który realnie pozwala zmniejszyć strumień danych bez proporcjonalnego pogorszenia wrażeń słuchowych.

  • "Fizjologiczna korekta częstotliwości." sugeruje korekcję barwy (EQ) lub kompensację charakterystyki słuchu. Kodek nie wykonuje korekcji jako celu samego w sobie; co najwyżej uwzględnia czułość ucha w modelu progów i maskowania.
  • "Zwiększenie kompresji dynamiki." dotyczy przetwarzania dynamicznego (kompresor/limiter), które zmienia relacje poziomów w czasie. To inny proces niż kompresja danych; może być używany w produkcji, ale nie jest psychoakustyczną podstawą kodeków stratnych.
  • "Dodanie sygnału opóźnionego." opisuje efekt opóźnienia/echo lub elementy pogłosu. Kodeki stratne nie polegają na dodawaniu opóźnionych kopii sygnału, tylko na analizie widmowo-czasowej i redukcji informacji.

W praktyce realizator powinien pamiętać: im trudniejszy materiał (transjenty, talerze perkusyjne, gęste miksowanie), tym łatwiej usłyszeć skutki niedoszacowania maskowania przy zbyt niskim bitrate. To pomaga świadomie dobierać format i parametry kodowania w nagraniach i transmisjach.

Dodatkowe pytania

Dodatkowe pytania (FAQ):
Maskowanie to zjawisko, w którym silniejszy dźwięk utrudnia usłyszenie słabszego w pobliżu (np. w sąsiednich częstotliwościach). W praktyce podnosi to efektywny próg słyszalności dla części składowych sygnału, przez co mogą być "mniej ważne" percepcyjnie.
Ponieważ celem jest zmniejszenie ilości danych przy możliwie małej utracie jakości odczuwanej przez człowieka. Psychoakustyka opisuje, co ucho realnie słyszy, więc kodek może pominąć lub uprościć elementy, które są zwykle niesłyszalne z powodu maskowania i progów percepcji.
Najczęściej wskazuje się maskowanie (zwłaszcza częstotliwościowe), czyli "chowanie" słabszych składowych pod silniejszymi. Kodek analizuje widmo i ocenia, gdzie można zastosować większą redukcję danych bez wyraźnej zmiany wrażeń słuchowych.
Nie. Kompresja stratna zmniejsza ilość danych w zapisie/strumieniu audio, wykorzystując ograniczenia słuchu. Kompresja dynamiki (kompresor, limiter) zmienia poziomy głośności w czasie. To różne procesy, choć oba bywają nazywane "kompresją".
Typowe objawy to "szeleszczenie" w wysokich częstotliwościach, rozmycie transjentów (np. talerze), metaliczne brzmienie lub "pompowanie" szumu tła. Często wynikają z tego, że model maskowania i przydział bitów nie nadążają za trudnym materiałem przy zbyt niskim bitrate.
Gdy materiał jest odtwarzany w trudnych warunkach (duże systemy, wysoka głośność, dużo wysokich tonów) lub gdy jest wielokrotnie konwertowany. Niższy bitrate zwiększa ryzyko artefaktów. W praktyce lepiej unikać wielokrotnego kodowania stratnego i używać wyższej jakości źródeł.
Najczęstsze pomyłki to: utożsamianie kompresji danych z kompresją dynamiki, mylenie maskowania z korekcją barwy oraz kojarzenie kodeków z efektami (opóźnienie, pogłos). Warto pamiętać: kodek głównie usuwa informacje uznane za niesłyszalne, a nie dodaje przetwarzanie efektowe.
Opóźnienie może mieć znaczenie w percepcji przestrzeni i lokalizacji, ale nie jest typową "podstawą" działania kodeków stratnych w sensie redukcji danych. W kompresji perceptualnej kluczowe są progi słyszalności i maskowanie, a nie celowe dodawanie opóźnionych kopii sygnału.
Najprościej: maskowanie = ograniczenie słyszenia jednego dźwięku przez inny (percepcja). Korekcja = zmiana barwy przez wzmocnienie/ścięcie pasm (EQ). Kompresja dynamiki = zmiana głośności w czasie zależnie od progu/ratio. Kodek stratny bazuje głównie na maskowaniu.
Opanuj definicje: kompresja stratna vs bezstratna, pojęcie progów słyszalności oraz maskowanie. Pomaga też krótka praktyka: porównaj ten sam utwór w wysokim i niskim bitrate i spróbuj usłyszeć, gdzie pojawiają się artefakty (szczególnie talerze, sybilanty, pogłosy).
info

Statystycznie 52% uczniów zna prawidłową odpowiedź. trudne

Specjaliści zwracają uwagę: "Kompresja stratna audio wykorzystuje psychoakustyczne maskowanie: silniejszy składnik widma utrudnia słyszenie słabszych w pobliżu."

Źródła:

  • ISO/IEC 11172-3:1993, Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s — Part 3: Audio (MPEG-1 Audio) — opis modelu psychoakustycznego i kodowania warstwowego
  • Bosi, M.; Goldberg, R. E., "Introduction to Digital Audio Coding and Standards", Springer, 2003 (rozdziały o kodowaniu perceptualnym i maskowaniu)
  • Zwicker, E.; Fastl, H., "Psychoacoustics: Facts and Models", 3rd edition, Springer, 2007 (rozdziały o maskowaniu i progach słyszalności)

Materiały:

  • Podręczniki z psychoakustyki (maskowanie, progi słyszalności, krzywe równogłośności)
  • Wprowadzenia do kodowania dźwięku (modele psychoakustyczne w MP3/AAC)
  • Materiały AES o kodowaniu perceptualnym i typowych artefaktach kompresji stratnej

Aktualizacja pytania: 31.03.2026



Aktualizacja pytania: 31.03.2026
📡 Brak połączenia internetowego