Retencja danych to parametr polityki przechowywania, który mówi jak długo zarchiwizowane dane mają pozostać w repozytorium (archiwum, systemie backupu, magazynie logów). Po upływie tego czasu dane są zwykle usuwane, przenoszone do innej klasy składowania albo nadpisywane nowszymi kopiami – zależnie od przyjętej polityki.
Dlatego poprawne jest wskazanie "czasu przechowywania zarchiwizowanych danych, po którym zostaną usunięte", bo dokładnie opisuje istotę retencji jako okresu przechowywania.
Pozostałe propozycje dotyczą innych, często spotykanych parametrów, ale nie są definicją retencji:
- "rodzaj danych podlegających archiwizowaniu" – to opis zakresu lub kryteriów doboru danych do archiwum (co archiwizujemy), a nie czasu ich trzymania.
- "możliwość modyfikowania zarchiwizowanych danych" – to cecha niezmienności (np. archiwum WORM, blokady, uprawnienia), czyli kwestia integralności, a nie okresu retencji.
- "okres jaki będzie podlegał archiwizacji" – to sformułowanie dotyczy raczej tego, z jakiego przedziału czasu pochodzą dane (np. archiwum rozmów z ostatnich 30 dni), a nie tego, jak długo będą przechowywane od momentu archiwizacji. To częsta pułapka: mylenie "okna danych" z "czasem retencji".
W praktyce (również w środowiskach telekomunikacyjnych) retencję ustala się m.in. dla logów urządzeń, danych eksploatacyjnych i kopii konfiguracji, aby z jednej strony mieć możliwość odtworzenia informacji, a z drugiej nie gromadzić danych bez końca i kontrolować zajętość zasobów.