Cos'è il rango nelle statistiche? (Con esempi)

1105
Simon Doyle

Il rango, distanza o ampiezza, nelle statistiche, è la differenza (sottrazione) tra il valore massimo e il valore minimo di un insieme di dati da un campione o da una popolazione. Se l'intervallo è rappresentato dalla lettera R e i dati da X, la formula per la gamma è semplicemente:

R = xmax - Xmin

 Dove xmax è il valore massimo dei dati e xmin è il minimo.

Figura 1. Gamma di dati corrispondenti alla popolazione di Cadice negli ultimi due secoli. Fonte: Wikimedia Commons.

Il concetto è molto utile come semplice misura della dispersione per apprezzare rapidamente la variabilità dei dati, poiché indica l'estensione o la lunghezza dell'intervallo in cui questi si trovano..

Ad esempio, si supponga di misurare l'altezza di un gruppo di 25 studenti maschi del primo anno di ingegneria in un'università. Lo studente più alto del gruppo è 1,93 me il più corto 1,67 m. Questi sono i valori estremi dei dati del campione, quindi il loro percorso è:

R = 1,93 - 1,67 m = 0,26 mo 26 cm.

L'altezza degli studenti in questo gruppo è distribuita lungo questo intervallo.

Indice articolo

  • 1 Vantaggi e svantaggi
    • 1.1 Svantaggi della portata come misura della dispersione
  • 2 Gamma interquartile, quartili ed esempio lavorato
    • 2.1 - Calcolo dei quartili
  • 3 Esempio lavorato
  • 4 Riferimenti

Vantaggi e svantaggi

L'intervallo è, come abbiamo detto prima, una misura di quanto siano distribuiti i dati. Un piccolo intervallo indica che i dati sono più o meno vicini e c'è poca diffusione. D'altra parte, un intervallo più ampio indica che i dati sono più dispersi..

I vantaggi del calcolo della portata sono evidenti: è molto semplice e veloce da trovare, in quanto è una semplice differenza.

Ha anche le stesse unità dei dati con cui funziona e il concetto è molto facile da interpretare per qualsiasi osservatore..

Nell'esempio dell'altezza degli studenti di ingegneria, se la distanza fosse stata di 5 cm, diremmo che gli studenti hanno approssimativamente la stessa taglia. Ma con un raggio di 26 cm, assumiamo immediatamente che ci siano studenti di tutte le altezze intermedie nel campione. Questa ipotesi è sempre corretta?

Svantaggi della portata come misura della dispersione

Se guardiamo attentamente, può essere che nel nostro campione di 25 studenti di ingegneria, solo uno di loro misura 1,93 e i restanti 24 hanno altezze vicine a 1,67 m.

Eppure la portata rimane la stessa, anche se è perfettamente possibile il contrario: che l'altezza della maggioranza è di circa 1,90 me solo uno è di 1,67 m.

In entrambi i casi, la distribuzione dei dati è abbastanza diversa.

Gli svantaggi dell'intervallo come misura della dispersione sono perché utilizza solo valori estremi e ignora tutti gli altri. Poiché la maggior parte delle informazioni viene persa, non hai idea di come vengono distribuiti i dati di esempio.

Un'altra caratteristica importante è che la gamma del campione non diminuisce mai. Se aggiungiamo più informazioni, cioè consideriamo più dati, l'intervallo aumenta o rimane lo stesso.

E in ogni caso, è utile solo quando si lavora con piccoli campioni, il suo unico utilizzo come misura della dispersione in campioni di grandi dimensioni è sconsigliato..

Quello che devi fare è completare con il calcolo di altre misure di dispersione che tengono conto delle informazioni fornite dai dati totali: percorso interquartile, varianza, deviazione standard e coefficiente di variazione.

Gamma interquartile, quartili ed esempio lavorato

Ci siamo resi conto che la debolezza dell'intervallo come misura della dispersione è che utilizza solo i valori estremi della distribuzione dei dati, omettendo gli altri..

Per evitare questo inconveniente, il quartili: tre valori noti come misurazioni della posizione.

Distribuiscono i dati non raggruppati in quattro parti (altre misure di posizione ampiamente utilizzate sono decili e il percentili). Queste sono le sue caratteristiche:

-Il primo quartile Q1 è il valore dei dati tale che il 25% di tutti è inferiore a Q1.

-Il secondo quartile QDue è il mediano della distribuzione, il che significa che la metà (50%) dei dati è inferiore a quel valore.

-Infine il terzo quartile Q3 sottolinea che il 75% dei dati è inferiore a Q3.

Quindi, l'intervallo interquartile o l'intervallo interquartile è definito come la differenza tra il terzo quartile Q3 e il primo quartile Q1 dei dati:

Intervallo interquartile = RQ = Q3 - Q1

In questo modo, il valore del range RQ non è così influenzato da valori estremi. Per questo motivo, è consigliabile utilizzarlo quando si ha a che fare con distribuzioni distorte, come quelle di studenti molto alti o molto bassi descritti sopra..

- Calcolo dei quartili

Esistono diversi modi per calcolarli, qui ne proponiamo uno, ma in ogni caso è necessario conoscere il file numero di ordine "No", Che è il posto che occupa il rispettivo quartile nella distribuzione.

Cioè, se, ad esempio, il termine che corrisponde a Q1 è il secondo, il terzo o il quarto e così via della distribuzione.

Primo quartile

No (Q1) = (N + 1) / 4

Secondo quartile o mediana

No (QDue) = (N + 1) / 2

Terzo quartile

No (Q3) = 3 (N + 1) / 4

Dove N è il numero di dati.

La mediana è il valore che si trova proprio al centro della distribuzione. Se il numero di dati è dispari non c'è problema a trovarlo, ma se è pari, i due valori centrali vengono mediati per diventare uno.

Una volta calcolato il numero d'ordine, viene seguita una di queste tre regole:

-Se non ha decimali, viene cercato il dato indicato nella distribuzione e questo sarà il quartile cercato.

-Quando il numero d'ordine è a metà tra due, i dati indicati dalla parte intera vengono mediati con i seguenti dati e il risultato è il quartile corrispondente.

-In ogni altro caso, viene arrotondato al numero intero più vicino e quella sarà la posizione del quartile.

Esempio funzionante

Su una scala da 0 a 20, un gruppo di 16 studenti di matematica I ha ottenuto i seguenti voti (punti) in un esame intermedio:

16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14

Trova:

a) L'intervallo o l'intervallo dei dati.

b) I valori dei quartili Q1 e Q3

c) La gamma interquartile.

Figura 2. I punteggi di questo test di matematica hanno così tanta variabilità? Fonte: Pixabay.

Soluzione a

La prima cosa da fare per trovare il percorso è ordinare i dati in ordine crescente o decrescente. Ad esempio in ordine crescente hai:

1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20

Usando la formula data all'inizio: R = xmax - Xmin

R = 20-1 punti = 19 punti.

Secondo il risultato, queste qualifiche hanno una grande dispersione.

Soluzione b

N = 16

No (Q1) = (N + 1) / 4 = (16 + 1) / 4 = 17/4 = 4,25

È un numero con decimali, la cui parte intera è 4. Quindi andiamo alla distribuzione, cerchiamo il dato che occupa la quarta posizione e il suo valore è mediato con quello della quinta posizione. Dato che sono entrambi 9, anche la media è 9 e quindi:

Q1 = 9

Ora ripetiamo la procedura per trovare Q3:

No (Q3) = 3 (N + 1) / 4 = 3 (16 +1) / 4 = 12,75

Anche in questo caso è un decimale, ma poiché non è a metà, viene arrotondato a 13. Il quartile che stiamo cercando occupa la tredicesima posizione ed è:

Q3 = 16

Soluzione c

RQ = Q3 - Q1 = 16-9 = 7 punti.

Che, come si vede, è molto più piccolo dell'intervallo di dati calcolato nella sezione a), perché il punteggio minimo era di 1 punto, un valore molto più lontano dal resto..

Riferimenti

  1. Berenson, M. 1985. Statistiche per la gestione e l'economia. Interamericana S.A.
  2. Canavos, G. 1988. Probabilità e statistica: applicazioni e metodi. Mcgraw hill.
  3. Devore, J. 2012. Probabilità e statistica per l'ingegneria e la scienza. 8 °. Edizione. Cengage.
  4. Esempi di quartili. Estratto da: matematicas10.net.
  5. Levin, R. 1988. Statistics for Administrators. 2 °. Edizione. Prentice Hall.
  6. Walpole, R. 2007. Probabilità e statistica per l'ingegneria e le scienze. Pearson.

Nessun utente ha ancora commentato questo articolo.