Misure di tendenza centrale
Media
La media di una serie di dati è anche conosciuta come il valore medio. Si calcola dividendo la somma di tutti i valori in un insieme di dati per il numero di valori.
Quindi in un insieme di dati di 1, 2, 3, 4, 5, calcoleremo la media sommando i valori (1+2+3+4+5) e dividendo per il numero totale di valori (5). La nostra media è quindi 15/5, che è uguale a 3.
Gli svantaggi della media come misura della tendenza centrale sono che è altamente suscettibile agli outliers (osservazioni che sono marcatamente distanti dalla maggior parte delle osservazioni in un set di dati), e che non è appropriato usarla quando i dati sono distorti, piuttosto che essere di una distribuzione normale.
Mediana
La mediana di un insieme di dati è il valore che si trova al centro di un insieme di dati disposti dal più piccolo al più grande.
Nell’insieme di dati 1, 2, 3, 4, 5, la mediana è 3.
In un insieme di dati con un numero pari di osservazioni, la mediana è calcolata dividendo la somma dei due valori centrali per due. Quindi in: 1, 2, 3, 4, 5, 6, la mediana è (3+4)/2, che equivale a 3.5.
La mediana è appropriata da usare con variabili ordinali, e con variabili intervallari con una distribuzione asimmetrica.
Modalità
La modalità è l’osservazione più comune di un insieme di dati, o il valore nell’insieme di dati che si verifica più frequentemente.
La modalità ha diversi svantaggi. E’ possibile che due modalità appaiano in una serie di dati (ad esempio: 1, 2, 2, 3, 4, 5, 5, sia 2 che 5 sono le modalità).
La modalità è una misura appropriata da usare con dati categorici.
Risorse
-
Designing and Conducting Health Systems Research Projects: Il modulo 22 (pagina 28) di questa guida dell’OMS fornisce istruzioni sull’uso delle misure di tendenza centrale.
- Misure di tendenza centrale: Questa pagina web fornisce una spiegazione concisa e facile da seguire delle differenze tra le misure di tendenza centrale, e quando ciascuna è appropriata da usare. Copre la media, la mediana e la modalità.