W telefonii VoIP trzeba rozróżnić sygnalizację połączenia od przesyłania właściwego dźwięku. Za transmisję strumienia głosu (mediów) odpowiada RTP, czyli protokół zaprojektowany do przenoszenia danych czasu rzeczywistego, takich jak audio i wideo. To właśnie w pakietach RTP "jedzie" zakodowany głos z kodeka (np. w ramach strumienia audio), a kluczowe stają się parametry jakościowe: opóźnienie, jitter i utrata pakietów.
Odpowiedź "SIP" jest niepoprawna, ponieważ SIP służy głównie do sygnalizacji: inicjowania połączenia, negocjacji parametrów sesji, modyfikacji i zakończenia rozmowy. SIP jest więc "sterowaniem połączeniem", a nie nośnikiem samego dźwięku.
Odpowiedź "TCP" kusi, bo to popularny protokół warstwy transportowej, ale w kontekście VoIP nie jest to protokół "przeznaczony do transmisji głosu" jako taki. TCP zapewnia niezawodność i kontrolę kolejności, co bywa korzystne dla plików, lecz dla mediów czasu rzeczywistego kluczowa jest terminowość, a nie retransmisje.
Odpowiedź "FTP" jest błędna, bo FTP to protokół aplikacyjny do przesyłania plików (upload/download), a nie do prowadzenia rozmów i przesyłania strumieni audio w czasie rzeczywistym.
Na egzaminie warto zapamiętać prosty podział: SIP = sygnalizacja, RTP = media (głos/wideo). Dzięki temu łatwo wyeliminować odpowiedzi związane z innym przeznaczeniem (FTP) lub zbyt ogólną warstwą transportu (TCP).