Miary tendencji centralnej
Średnia
Średnia zbioru danych jest również znana jako wartość średnia. Oblicza się ją dzieląc sumę wszystkich wartości w zbiorze danych przez liczbę wartości.
Więc w zbiorze danych składającym się z 1, 2, 3, 4, 5, obliczylibyśmy średnią dodając wartości (1+2+3+4+5) i dzieląc przez całkowitą liczbę wartości (5). Naszą średnią jest więc 15/5, czyli 3.
Wadą średniej jako miary tendencji centralnej jest to, że jest ona bardzo podatna na wartości odstające (obserwacje, które są znacznie oddalone od większości obserwacji w zbiorze danych), oraz że nie jest odpowiednia do stosowania, gdy dane są skośne, a nie mają rozkładu normalnego.
Mediana
Mediana zbioru danych to wartość, która znajduje się w środku zbioru danych ułożonego od najmniejszej do największej.
W zbiorze danych 1, 2, 3, 4, 5 mediana wynosi 3.
W zbiorze danych z parzystą liczbą obserwacji, medianę oblicza się dzieląc sumę dwóch środkowych wartości przez dwa. Zatem w: 1, 2, 3, 4, 5, 6, mediana wynosi (3+4)/2, co równa się 3,5.
Mediana jest odpowiednia do stosowania ze zmiennymi porządkowymi, oraz ze zmiennymi przedziałowymi o rozkładzie skośnym.
Mode
Modus to najczęstsza obserwacja zbioru danych, lub wartość w zbiorze danych, która występuje najczęściej.
Modus ma kilka wad. Możliwe jest wystąpienie dwóch trybów w jednym zbiorze danych (np. w: 1, 2, 2, 3, 4, 5, 5, zarówno 2 jak i 5 są trybami).
Tryb jest odpowiednią miarą do użycia z danymi kategorycznymi.
Źródła
-
Designing and Conducting Health Systems Research Projects: Moduł 22 (strona 28) tego przewodnika WHO zawiera instrukcje dotyczące stosowania miar tendencji centralnej.
- Miary tendencji centralnej: Ta strona internetowa zawiera zwięzłe i łatwe do prześledzenia wyjaśnienie różnic pomiędzy miarami tendencji centralnej oraz tego, kiedy każda z nich jest odpowiednia do zastosowania. Obejmuje ona średnią, medianę i tryb.