Il misure di variabilità, Chiamate anche misure di dispersione, sono indicatori statistici che indicano quanto i dati siano vicini o lontani dalla loro media aritmetica. Se i dati sono vicini alla media, la distribuzione è concentrata e se sono lontani, si tratta di una distribuzione sparsa..
Esistono molte misure di variabilità, tra le più note sono:
Queste misure completano le misure di tendenza centrale e sono necessarie per comprendere la distribuzione dei dati ottenuti ed estrarne quante più informazioni possibili..
L'intervallo o intervallo misura l'ampiezza di un set di dati. Per determinarne il valore, la differenza tra i dati con il valore più alto xmax e quello con il valore più basso xmin:
R = xmax - Xmin
Se i dati non sono sciolti ma raggruppati per intervallo, l'intervallo viene calcolato dalla differenza tra il limite superiore dell'ultimo intervallo e il limite inferiore del primo intervallo.
Quando l'intervallo è un valore piccolo significa che tutti i dati sono abbastanza vicini tra loro, ma un intervallo ampio indica che c'è molta variabilità. È chiaro che, a parte il limite superiore e il limite inferiore dei dati, l'intervallo non tiene conto dei valori tra loro, quindi è sconsigliato utilizzarlo quando il numero di dati è elevato.
Tuttavia, è una misura immediata da calcolare e ha le stesse unità di dati, quindi è facile da interpretare.
Di seguito l'elenco con il numero di gol segnati durante il weekend, nei campionati di calcio di nove nazioni:
40, 32, 35, 36, 37, 31, 37, 29, 39
Questo è un set di dati non raggruppato. Per trovare l'intervallo, procediamo ad ordinarli dal più basso al più alto:
29, 31, 32, 35, 36, 37, 37, 39, 40
Il dato con il valore più alto è 40 goal e quello con il valore più basso è 29 goal, quindi l'intervallo è:
R = 40−29 = 11 goal.
Si può considerare che l'intervallo è piccolo rispetto ai dati del valore minimo, che è di 29 obiettivi, quindi si può presumere che i dati non abbiano una grande variabilità.
Questa misura di variabilità viene calcolata attraverso la media dei valori assoluti degli scostamenti rispetto alla media.. Indicare la deviazione media come DM, Per i dati non raggruppati, la deviazione media viene calcolata utilizzando la seguente formula:
Dove n è il numero di dati disponibili, xio rappresenta ogni dato e x̄ è la media, che è determinata sommando tutti i dati e dividendo per n:
La deviazione media permette di sapere, mediamente, in quante unità il dato si discosta dalla media aritmetica e ha il vantaggio di avere le stesse unità dei dati con cui stiamo lavorando.
In base ai dati dell'esempio di intervallo, il numero di gol segnati è:
40, 32, 35, 36, 37, 31, 37, 29, 39
Se vuoi trovare la deviazione media DM Da questi dati, è necessario prima calcolare la media aritmetica x̄:
E ora che il valore di x̄ è noto, procediamo a trovare la deviazione media DM:
= 2,99 ≈ 3 gol
Pertanto, si può affermare che, in media, il dato è di circa 3 goal di distanza dalla media, che è di 35 goal, e come notato, è una misura molto più precisa rispetto all'intervallo..
La deviazione media è una misura di variabilità molto più fine rispetto all'intervallo, ma poiché è calcolata attraverso il valore assoluto delle differenze tra ogni dato e la media, non offre una maggiore versatilità da un punto di vista algebrico..
Per questo motivo si preferisce la varianza, che corrisponde alla media della differenza quadratica di ogni dato con la media ed è calcolata utilizzando la formula:
In questa espressione, sDue denota la varianza e come sempre xio rappresenta ciascuno dei dati, x̄ è la media en è il totale dei dati.
Quando si lavora con un campione anziché con la popolazione, è preferibile calcolare la varianza in questo modo:
In ogni caso, la varianza si caratterizza per essere sempre una quantità positiva, ma poiché è la media delle differenze quadratiche, è importante notare che non ha le stesse unità di quelle dei dati..
Per calcolare la varianza dei dati negli esempi di intervallo e deviazione media, si procede a sostituire i valori corrispondenti ed eseguire la somma indicata. In questo caso, scegliamo di dividere per n-1:
= 13,86
La varianza non ha la stessa unità di quella della variabile in esame, ad esempio, se i dati sono in metri, la varianza risulta in metri quadrati. O nell'esempio degli obiettivi sarebbe in gol al quadrato, il che non ha senso.
Pertanto, viene definita la deviazione standard, chiamata anche deviazione tipica, come radice quadrata della varianza:
s = √sDue
In questo modo, si ottiene una misura della variabilità dei dati nelle stesse unità di questi, e più basso è il valore di s, più i dati sono raggruppati attorno alla media..
Sia la varianza che la deviazione standard sono le misure di variabilità da scegliere quando la media aritmetica è la misura della tendenza centrale che meglio descrive il comportamento dei dati..
Ed è che la deviazione standard ha una proprietà importante, nota come teorema di Chebyshev: almeno il 75% delle osservazioni si trova nell'intervallo definito da X ± 2 s. In altre parole, il 75% dei dati si trova al massimo a 2 secondi dalla media..
Allo stesso modo, almeno l'89% dei valori si trova a una distanza di 3s dalla media, percentuale che può essere ampliata, purché siano disponibili molti dati e seguano una distribuzione normale..
Figura 2.- Se i dati seguono una distribuzione normale, 95,4 di loro sono entro due deviazioni standard su entrambi i lati della media. Fonte: Wikimedia Commons.
La deviazione standard dei dati presentati negli esempi precedenti è:
s = √sDue = √13,86 = 3,7 ≈ 4 gol
Nessun utente ha ancora commentato questo articolo.