Kompresja stratna dźwięku (np. kodeki z rodziny MPEG) nie "ściska" sygnału jak procesor dynamiki ani nie dodaje efektów. Jej kluczową ideą jest kodowanie perceptualne: usuwa się lub upraszcza te informacje, których słuchacz i tak zwykle nie usłyszy.
Najważniejszym zjawiskiem, na którym opiera się to podejście, jest maskowanie częstotliwościowe (oraz w praktyce także maskowanie czasowe). Gdy w sygnale występuje silny składnik w danym paśmie, to podnosi on efektywny próg słyszalności dla słabszych składowych w sąsiednich częstotliwościach. Model psychoakustyczny szacuje, które fragmenty widma będą "schowane" pod progiem percepcji i pozwala przeznaczyć na nie mniej bitów albo je pominąć.
Odpowiedź "Maskowanie jednych częstotliwości przez drugie." jest więc poprawna, bo opisuje mechanizm, który realnie pozwala zmniejszyć strumień danych bez proporcjonalnego pogorszenia wrażeń słuchowych.
- "Fizjologiczna korekta częstotliwości." sugeruje korekcję barwy (EQ) lub kompensację charakterystyki słuchu. Kodek nie wykonuje korekcji jako celu samego w sobie; co najwyżej uwzględnia czułość ucha w modelu progów i maskowania.
- "Zwiększenie kompresji dynamiki." dotyczy przetwarzania dynamicznego (kompresor/limiter), które zmienia relacje poziomów w czasie. To inny proces niż kompresja danych; może być używany w produkcji, ale nie jest psychoakustyczną podstawą kodeków stratnych.
- "Dodanie sygnału opóźnionego." opisuje efekt opóźnienia/echo lub elementy pogłosu. Kodeki stratne nie polegają na dodawaniu opóźnionych kopii sygnału, tylko na analizie widmowo-czasowej i redukcji informacji.
W praktyce realizator powinien pamiętać: im trudniejszy materiał (transjenty, talerze perkusyjne, gęste miksowanie), tym łatwiej usłyszeć skutki niedoszacowania maskowania przy zbyt niskim bitrate. To pomaga świadomie dobierać format i parametry kodowania w nagraniach i transmisjach.