Algorytmy kompresji stratnej (np. MP3, AAC) nie próbują zachować sygnału "bit w bit", tylko dążą do tego, aby po dekompresji dźwięk był subiektywnie podobny do oryginału. Kluczowym narzędziem jest tu model psychoakustyczny, czyli opis tego, jak działa słuch i kiedy pewne elementy sygnału stają się dla człowieka praktycznie niesłyszalne.
Najważniejsze zjawisko wykorzystywane w tym celu to maskowanie (maskowanie słuchowe). W skrócie: jeżeli w danym paśmie częstotliwości występuje silny składnik (np. głośny ton lub fragment o dużej energii), to podnosi on próg słyszenia dla słabszych składowych w pobliżu. Podobnie w czasie: silny dźwięk może utrudniać usłyszenie cichszych detali tuż przed nim lub tuż po nim. Kodek może więc przydzielić mniej bitów (albo w ogóle pominąć) te elementy, które i tak zostałyby "schowane" przez silniejsze składniki.
- Dlaczego nie korelacja fazowa? Korelacja fazowa dotyczy relacji faz między sygnałami (np. w stereo, przy sumowaniu do mono), a nie podstawowego mechanizmu psychoakustycznego decydującego o tym, co jest słyszalne. Może wpływać na obraz stereo, ale nie jest główną zasadą redukcji danych w kodekach stratnych.
- Dlaczego nie interferencja addytywna/subtraktywna? Interferencja to zjawisko falowe wynikające z nakładania się fal (wzmocnienie lub wygaszenie). Jest fizycznym opisem superpozycji sygnałów, a nie zjawiskiem percepcyjnym w uchu i mózgu. Kodeki nie opierają się na "wygaszaniu" fal, tylko na przewidywaniu, co człowiek usłyszy.
W praktyce warto pamiętać, że wielokrotne kodowanie stratne (np. MP3->MP3) może akumulować zniekształcenia, bo każda kolejna kompresja znowu usuwa informacje uznane za "maskowane".