W pytaniu chodzi o wybór miary, która najlepiej opisuje rozproszenie (zmienność) danych, czyli to, jak duże są różnice między obserwacjami w zbiorze.
"Wariancja" jest poprawna, ponieważ jest klasyczną miarą rozproszenia: opiera się na odchyleniach wartości od średniej i informuje, czy dane są skupione blisko średniej, czy mocno "rozrzucone". Im większa wariancja, tym większa zmienność danych. W praktyce często spotyka się też odchylenie standardowe (pierwiastek z wariancji), które ma tę samą jednostkę co dane, ale wśród podanych odpowiedzi to wariancja spełnia wymóg miary rozproszenia.
Pozostałe odpowiedzi są niepoprawne, bo opisują położenie (wartość centralną/typową), a nie rozrzut:
- "Mediana" wskazuje wartość środkową po uporządkowaniu danych. Jest odporna na wartości odstające, ale nie mówi wprost, czy dane są szeroko rozrzucone.
- "Moda" (dominanta) wskazuje najczęściej występującą wartość. Może pomóc opisać typową pozycję, ale zupełnie nie opisuje zmienności całego zbioru (możliwe są zbiory o tej samej modzie, lecz bardzo różnym rozproszeniu).
- "Średnia arytmetyczna" jest miarą przeciętnego poziomu. Sama średnia nie informuje o tym, czy wartości są blisko niej, czy mocno się od niej różnią.
Wskazówka egzaminacyjna: jeśli w treści pojawiają się słowa "rozproszenie", "zmienność", "rozrzut", zwykle właściwymi kandydatami są wariancja, odchylenie standardowe, rozstęp lub kwartyle. Jeśli mowa o "typowej wartości" lub "środku" – wtedy średnia/mediana/moda.