KWALIFIKACJA AUD9 - CZERWIEC 2018

Q: Co to jest maskowanie słuchowe w psychoakustyce?

Maskowanie słuchowe to zjawisko, w którym silniejszy dźwięk utrudnia usłyszenie słabszego dźwięku w pobliżu częstotliwości lub w krótkim odstępie czasu. Ucho ma ograniczoną "rozdzielczość" i w obecności głośnych składowych nie rejestruje niektórych detali.

Q: Jakie zjawisko psychoakustyczne jest kluczowe dla kompresji stratnej?

Kluczowe jest maskowanie słuchowe (czasowe i częstotliwościowe). To ono uzasadnia, dlaczego pewne składowe można zakodować "gorzej" bez wyraźnego pogorszenia wrażeń odsłuchowych. Inne zjawiska (np. faza) są zwykle drugorzędne.

Q: Jak odróżnić zjawisko psychoakustyczne od zjawiska falowego w pytaniach testowych?

Zjawiska psychoakustyczne dotyczą tego, co człowiek słyszy (próg słyszenia, maskowanie, głośność). Zjawiska falowe opisują fizykę sygnału (interferencja, faza, superpozycja). Kodeki stratne opierają się głównie na psychoakustyce.

PYTANIE NR 15.

Algorytmy stratnej kompresji dźwięku wykorzystują psychoakustyczne zjawisko

A.	korelacji fazowej.
B.	maskowania dźwięków.
C.	interferencji addytywnej.
D.	interferencji subtraktywnej.
	Zostaw bez odpowiedzi

Wyjaśnienie poprawnej odpowiedzi:
Kompresja stratna usuwa te składowe sygnału, które dla słuchacza są najmniej istotne. Wykorzystuje zjawisko maskowania słuchowego: silniejszy dźwięk może ukrywać (maskować) słabszy w bliskim czasie lub paśmie częstotliwości. Dlatego prawidłowa jest odpowiedź: maskowanie dźwięków.

Pełne wyjaśnienie:

Algorytmy kompresji stratnej (np. MP3, AAC) nie próbują zachować sygnału "bit w bit", tylko dążą do tego, aby po dekompresji dźwięk był subiektywnie podobny do oryginału. Kluczowym narzędziem jest tu model psychoakustyczny, czyli opis tego, jak działa słuch i kiedy pewne elementy sygnału stają się dla człowieka praktycznie niesłyszalne.
Najważniejsze zjawisko wykorzystywane w tym celu to maskowanie (maskowanie słuchowe). W skrócie: jeżeli w danym paśmie częstotliwości występuje silny składnik (np. głośny ton lub fragment o dużej energii), to podnosi on próg słyszenia dla słabszych składowych w pobliżu. Podobnie w czasie: silny dźwięk może utrudniać usłyszenie cichszych detali tuż przed nim lub tuż po nim. Kodek może więc przydzielić mniej bitów (albo w ogóle pominąć) te elementy, które i tak zostałyby "schowane" przez silniejsze składniki.
Dlaczego nie korelacja fazowa? Korelacja fazowa dotyczy relacji faz między sygnałami (np. w stereo, przy sumowaniu do mono), a nie podstawowego mechanizmu psychoakustycznego decydującego o tym, co jest słyszalne. Może wpływać na obraz stereo, ale nie jest główną zasadą redukcji danych w kodekach stratnych.
Dlaczego nie interferencja addytywna/subtraktywna? Interferencja to zjawisko falowe wynikające z nakładania się fal (wzmocnienie lub wygaszenie). Jest fizycznym opisem superpozycji sygnałów, a nie zjawiskiem percepcyjnym w uchu i mózgu. Kodeki nie opierają się na "wygaszaniu" fal, tylko na przewidywaniu, co człowiek usłyszy.
W praktyce warto pamiętać, że wielokrotne kodowanie stratne (np. MP3->MP3) może akumulować zniekształcenia, bo każda kolejna kompresja znowu usuwa informacje uznane za "maskowane".

Dodatkowe pytania

Dodatkowe pytania (FAQ):

Co to jest maskowanie słuchowe w psychoakustyce?

Maskowanie słuchowe to zjawisko, w którym silniejszy dźwięk utrudnia usłyszenie słabszego dźwięku w pobliżu częstotliwości lub w krótkim odstępie czasu. Ucho ma ograniczoną "rozdzielczość" i w obecności głośnych składowych nie rejestruje niektórych detali.

Dlaczego MP3 i AAC wykorzystują maskowanie dźwięków?

Ponieważ pozwala to zmniejszyć ilość danych bez dużej utraty jakości odsłuchowej. Kodek identyfikuje fragmenty sygnału, które i tak byłyby niesłyszalne z powodu maskowania, i zapisuje je z mniejszą dokładnością lub je pomija. Dzięki temu plik jest mniejszy.

Jakie zjawisko psychoakustyczne jest kluczowe dla kompresji stratnej?

Kluczowe jest maskowanie słuchowe (czasowe i częstotliwościowe). To ono uzasadnia, dlaczego pewne składowe można zakodować "gorzej" bez wyraźnego pogorszenia wrażeń odsłuchowych. Inne zjawiska (np. faza) są zwykle drugorzędne.

Czy interferencja fal ma związek z kompresją MP3?

Interferencja (addytywna lub subtraktywna) opisuje fizyczne nakładanie się fal i może wystąpić przy sumowaniu sygnałów. Jednak mechanizm redukcji danych w MP3/AAC nie polega na wywoływaniu interferencji, tylko na modelowaniu percepcji słuchu i wykorzystaniu maskowania.

Jak odróżnić zjawisko psychoakustyczne od zjawiska falowego w pytaniach testowych?

Zjawiska psychoakustyczne dotyczą tego, co człowiek słyszy (próg słyszenia, maskowanie, głośność). Zjawiska falowe opisują fizykę sygnału (interferencja, faza, superpozycja). Kodeki stratne opierają się głównie na psychoakustyce.

Co oznacza, że kompresja jest stratna w audio?

To znaczy, że po zakodowaniu i dekodowaniu nie da się odzyskać identycznego sygnału jak przed kompresją. Część informacji jest usuwana lub upraszczana. Robi się to tak, aby straty były jak najmniej słyszalne, m.in. dzięki wykorzystaniu zjawiska maskowania.

Kiedy na scenie lepiej użyć WAV/FLAC zamiast MP3?

Gdy materiał będzie dalej obrabiany, miksowany lub wielokrotnie eksportowany, lepiej użyć formatu bezstratnego (WAV/FLAC). Unikasz wtedy kumulowania artefaktów. MP3/AAC sprawdza się bardziej do dystrybucji, gdzie liczy się rozmiar pliku i szybki transfer.

Jakie artefakty mogą się pojawić przy zbyt mocnej kompresji stratnej?

Typowe są: "szeleszczenie", metaliczność, utrata przestrzenności, zniekształcenia transjentów (ataku), a czasem "pompowanie" tła. Wynikają one z tego, że model psychoakustyczny lub przydział bitów nie wystarcza do ukrycia strat pod maskowaniem.

Dlaczego odpowiedź o korelacji fazowej nie pasuje do psychoakustyki kompresji?

Korelacja fazowa opisuje zależności fazowe między kanałami i bywa istotna np. przy sumowaniu do mono lub ocenie zgodności stereo. W kompresji stratnej kluczowe jest to, co jest słyszalne w obecności innych dźwięków, czyli maskowanie, a nie sama korelacja faz.

Jak przygotować się do pytań o kompresję dźwięku na egzamin?

Opanuj podstawowe definicje: kompresja stratna i bezstratna, maskowanie słuchowe, bitrate, artefakty. Wykonaj krótkie ćwiczenia odsłuchowe (porównanie WAV vs MP3/AAC) i naucz się rozpoznawać, które pojęcia są psychoakustyczne, a które opisują czystą fizykę fali.

info

To pytanie poprawnie rozwiązuje 45% zdających egzamin. trudne

Według specjalistów z branży: "Kompresja stratna usuwa te składowe sygnału, które dla słuchacza są najmniej istotne."

Źródła:

Zwicker, E.; Fastl, H., "Psychoacoustics: Facts and Models" (Springer), rozdziały dot. maskowania słuchowego (masking)
ISO/IEC 11172-3, "Information technology — Coding of moving pictures and associated audio for digital storage media" (MPEG-1 Audio), opis modelu psychoakustycznego i maskowania
ISO/IEC 13818-3, "Information technology — Generic coding of moving pictures and associated audio information" (MPEG-2 Audio), opis wykorzystania zjawisk psychoakustycznych (maskowanie)

Materiały:

Podręczniki i rozdziały o psychoakustyce oraz maskowaniu słuchowym
Opracowania o kodowaniu stratnym MP3/AAC i roli modeli psychoakustycznych
Ćwiczenia odsłuchowe porównujące WAV/FLAC z MP3/AAC przy różnych bitrate

Aktualizacja pytania: 31.03.2026

LOGOWANIE

KWALIFIKACJA AUD9 - CZERWIEC 2018

Dodatkowe pytania

Dodatkowe pytania (FAQ):

Zobacz też: