KWALIFIKACJA AUD9 - CZERWIEC 2018

PYTANIE NR 15.
Algorytmy stratnej kompresji dźwięku wykorzystują psychoakustyczne zjawisko
A.
B.
C.
D.
Wyjaśnienie poprawnej odpowiedzi:
Kompresja stratna usuwa te składowe sygnału, które dla słuchacza są najmniej istotne. Wykorzystuje zjawisko maskowania słuchowego: silniejszy dźwięk może ukrywać (maskować) słabszy w bliskim czasie lub paśmie częstotliwości. Dlatego prawidłowa jest odpowiedź: maskowanie dźwięków.

Pełne wyjaśnienie:

Algorytmy kompresji stratnej (np. MP3, AAC) nie próbują zachować sygnału "bit w bit", tylko dążą do tego, aby po dekompresji dźwięk był subiektywnie podobny do oryginału. Kluczowym narzędziem jest tu model psychoakustyczny, czyli opis tego, jak działa słuch i kiedy pewne elementy sygnału stają się dla człowieka praktycznie niesłyszalne.

Najważniejsze zjawisko wykorzystywane w tym celu to maskowanie (maskowanie słuchowe). W skrócie: jeżeli w danym paśmie częstotliwości występuje silny składnik (np. głośny ton lub fragment o dużej energii), to podnosi on próg słyszenia dla słabszych składowych w pobliżu. Podobnie w czasie: silny dźwięk może utrudniać usłyszenie cichszych detali tuż przed nim lub tuż po nim. Kodek może więc przydzielić mniej bitów (albo w ogóle pominąć) te elementy, które i tak zostałyby "schowane" przez silniejsze składniki.

  • Dlaczego nie korelacja fazowa? Korelacja fazowa dotyczy relacji faz między sygnałami (np. w stereo, przy sumowaniu do mono), a nie podstawowego mechanizmu psychoakustycznego decydującego o tym, co jest słyszalne. Może wpływać na obraz stereo, ale nie jest główną zasadą redukcji danych w kodekach stratnych.
  • Dlaczego nie interferencja addytywna/subtraktywna? Interferencja to zjawisko falowe wynikające z nakładania się fal (wzmocnienie lub wygaszenie). Jest fizycznym opisem superpozycji sygnałów, a nie zjawiskiem percepcyjnym w uchu i mózgu. Kodeki nie opierają się na "wygaszaniu" fal, tylko na przewidywaniu, co człowiek usłyszy.

W praktyce warto pamiętać, że wielokrotne kodowanie stratne (np. MP3->MP3) może akumulować zniekształcenia, bo każda kolejna kompresja znowu usuwa informacje uznane za "maskowane".

Dodatkowe pytania

Dodatkowe pytania (FAQ):
Maskowanie słuchowe to zjawisko, w którym silniejszy dźwięk utrudnia usłyszenie słabszego dźwięku w pobliżu częstotliwości lub w krótkim odstępie czasu. Ucho ma ograniczoną "rozdzielczość" i w obecności głośnych składowych nie rejestruje niektórych detali.
Ponieważ pozwala to zmniejszyć ilość danych bez dużej utraty jakości odsłuchowej. Kodek identyfikuje fragmenty sygnału, które i tak byłyby niesłyszalne z powodu maskowania, i zapisuje je z mniejszą dokładnością lub je pomija. Dzięki temu plik jest mniejszy.
Kluczowe jest maskowanie słuchowe (czasowe i częstotliwościowe). To ono uzasadnia, dlaczego pewne składowe można zakodować "gorzej" bez wyraźnego pogorszenia wrażeń odsłuchowych. Inne zjawiska (np. faza) są zwykle drugorzędne.
Interferencja (addytywna lub subtraktywna) opisuje fizyczne nakładanie się fal i może wystąpić przy sumowaniu sygnałów. Jednak mechanizm redukcji danych w MP3/AAC nie polega na wywoływaniu interferencji, tylko na modelowaniu percepcji słuchu i wykorzystaniu maskowania.
Zjawiska psychoakustyczne dotyczą tego, co człowiek słyszy (próg słyszenia, maskowanie, głośność). Zjawiska falowe opisują fizykę sygnału (interferencja, faza, superpozycja). Kodeki stratne opierają się głównie na psychoakustyce.
To znaczy, że po zakodowaniu i dekodowaniu nie da się odzyskać identycznego sygnału jak przed kompresją. Część informacji jest usuwana lub upraszczana. Robi się to tak, aby straty były jak najmniej słyszalne, m.in. dzięki wykorzystaniu zjawiska maskowania.
Gdy materiał będzie dalej obrabiany, miksowany lub wielokrotnie eksportowany, lepiej użyć formatu bezstratnego (WAV/FLAC). Unikasz wtedy kumulowania artefaktów. MP3/AAC sprawdza się bardziej do dystrybucji, gdzie liczy się rozmiar pliku i szybki transfer.
Typowe są: "szeleszczenie", metaliczność, utrata przestrzenności, zniekształcenia transjentów (ataku), a czasem "pompowanie" tła. Wynikają one z tego, że model psychoakustyczny lub przydział bitów nie wystarcza do ukrycia strat pod maskowaniem.
Korelacja fazowa opisuje zależności fazowe między kanałami i bywa istotna np. przy sumowaniu do mono lub ocenie zgodności stereo. W kompresji stratnej kluczowe jest to, co jest słyszalne w obecności innych dźwięków, czyli maskowanie, a nie sama korelacja faz.
Opanuj podstawowe definicje: kompresja stratna i bezstratna, maskowanie słuchowe, bitrate, artefakty. Wykonaj krótkie ćwiczenia odsłuchowe (porównanie WAV vs MP3/AAC) i naucz się rozpoznawać, które pojęcia są psychoakustyczne, a które opisują czystą fizykę fali.
info

To pytanie poprawnie rozwiązuje 45% zdających egzamin. trudne

Według specjalistów z branży: "Kompresja stratna usuwa te składowe sygnału, które dla słuchacza są najmniej istotne."

Źródła:

  • Zwicker, E.; Fastl, H., "Psychoacoustics: Facts and Models" (Springer), rozdziały dot. maskowania słuchowego (masking)
  • ISO/IEC 11172-3, "Information technology — Coding of moving pictures and associated audio for digital storage media" (MPEG-1 Audio), opis modelu psychoakustycznego i maskowania
  • ISO/IEC 13818-3, "Information technology — Generic coding of moving pictures and associated audio information" (MPEG-2 Audio), opis wykorzystania zjawisk psychoakustycznych (maskowanie)

Materiały:

  • Podręczniki i rozdziały o psychoakustyce oraz maskowaniu słuchowym
  • Opracowania o kodowaniu stratnym MP3/AAC i roli modeli psychoakustycznych
  • Ćwiczenia odsłuchowe porównujące WAV/FLAC z MP3/AAC przy różnych bitrate

Aktualizacja pytania: 31.03.2026



Aktualizacja pytania: 31.03.2026
📡 Brak połączenia internetowego