Spiegazione, applicazioni ed esempi della regola di Sturges

4168
Philip Kelley

Il regola gli sturges è un criterio utilizzato per determinare il numero di classi o intervalli necessari per rappresentare graficamente un insieme di dati statistici. Questa regola fu enunciata nel 1926 dal matematico tedesco Herbert Sturges.

Sturges ha proposto un metodo semplice, basato sul numero di campioni x che ci avrebbe permesso di trovare il numero di classi e la loro ampiezza di intervallo. La regola di Sturges è ampiamente utilizzata, soprattutto nell'area della statistica, in particolare per costruire istogrammi di frequenza..

Indice articolo

  • 1 Spiegazione
  • 2 Applicazioni
  • 3 Esempio
  • 4 Riferimenti

Spiegazione

La regola di Sturges è un metodo empirico ampiamente utilizzato nelle statistiche descrittive per determinare il numero di classi che devono esistere in un istogramma di frequenza, al fine di classificare un insieme di dati che rappresentano un campione o una popolazione..

Fondamentalmente, questa regola determina la larghezza dei contenitori grafici, degli istogrammi di frequenza.

Per stabilire la sua regola Herbert Sturges considerò un diagramma di frequenza ideale, costituito da intervalli K, in cui l'intervallo i-esimo contiene un certo numero di campioni (i = 0,… k - 1), rappresentati come:

Quel numero di campioni è dato dal numero di modi in cui un sottoinsieme di un insieme può essere estratto; cioè dal coefficiente binomiale, espresso come segue:

Per semplificare l'espressione, ha applicato le proprietà dei logaritmi a entrambe le parti dell'equazione:

Pertanto, Sturges ha stabilito che il numero ottimale di intervalli k è dato dall'espressione:

Può anche essere espresso come:

In questa espressione:

- k è il numero di classi.

- N è il numero totale di osservazioni nel campione.

- Log è il logaritmo comune in base 10.

Ad esempio, per costruire un istogramma di frequenza che esprima un campione casuale dell'altezza di 142 bambini, il numero di intervalli o classi che la distribuzione avrà è:

k = 1 + 3.322 * log10 (N)

k = 1 + 3.322* legno (142)

k = 1 + 3.322* 2.1523

k = 8,14 ≈ 8

Pertanto, la distribuzione sarà in 8 intervalli.

Il numero di intervalli deve essere sempre rappresentato da numeri interi. Nei casi in cui il valore è decimale, è necessario effettuare un'approssimazione al numero intero più vicino.

Applicazioni

La regola di Sturges trova applicazione principalmente in statistica, poiché permette di effettuare una distribuzione di frequenza attraverso il calcolo del numero di classi (k), oltre che della lunghezza di ciascuna di queste, detta anche ampiezza..

L'ampiezza è la differenza del limite superiore e inferiore della classe, divisa per il numero di classi, ed è espressa:

Ci sono molte regole pratiche che ti permettono di fare una distribuzione di frequenza. Tuttavia, la regola di Sturges è comunemente usata perché approssima il numero di classi, che generalmente varia da 5 a 15..

Considera quindi un valore che rappresenti adeguatamente un campione o una popolazione; ovvero, l'approssimazione non rappresenta raggruppamenti estremi, né funziona con un numero eccessivo di classi che non consentono di riassumere il campione..

Esempio

È necessario creare un istogramma di frequenza in base ai dati forniti, che corrispondono alle età ottenute in un sondaggio di uomini che si esercitano in una palestra locale..

Per determinare gli intervalli, è necessario conoscere la dimensione del campione o il numero di osservazioni; in questo caso, ne hai 30.

Quindi si applica la regola di Sturges:

k = 1 + 3.322 * log10 (N)

k = 1 + 3.322* legno (30)

k = 1 + 3.322* 1.4771

k = 5,90 ≈ 6 intervalli.

Dal numero di intervalli si può calcolare l'ampiezza che avranno questi; ovvero la larghezza di ciascuna barra rappresentata nell'istogramma della frequenza:

Il limite inferiore è considerato il valore più piccolo dei dati e il limite superiore è il valore più grande. La differenza tra i limiti superiore e inferiore è chiamata intervallo o intervallo della variabile (R).

Dalla tabella abbiamo che il limite superiore è 46 e il limite inferiore è 13; in questo modo, l'ampiezza di ogni classe sarà:

Gli intervalli saranno costituiti da un limite superiore e inferiore. Per determinare questi intervalli, iniziamo contando dal limite inferiore, aggiungendo a questo l'ampiezza determinata dalla regola (6), come segue:

Quindi viene calcolata la frequenza assoluta per determinare il numero di uomini corrispondenti a ciascun intervallo; in questo caso è:

- Intervallo 1:13 - 18 = 9

- Intervallo 2:19 - 24 = 9

- Intervallo 3:25 - 30 = 5

- Intervallo 4:31 - 36 = 2

- Intervallo 5:37 - 42 = 2

- Intervallo 6:43 - 48 = 3

Quando si aggiunge la frequenza assoluta di ogni classe, questa deve essere uguale al numero totale del campione; in questo caso, 30.

Successivamente, viene calcolata la frequenza relativa di ciascun intervallo, dividendo la sua frequenza assoluta per il numero totale di osservazioni:

- Intervallo 1: fi = 9 ÷ 30 = 0,30

- Intervallo 2: fi = 9 ÷ 30 = 0,30

- Intervallo 3: fi = 5 ÷ 30 = 0,1666

- Intervallo 4: fi = 2 ÷ 30 = 0,0666

- Intervallo 5: fi = 2 ÷ 30 = 0,0666

- Intervallo 4: fi = 3 ÷ 30 = 0.10

Quindi puoi creare una tabella che rifletta i dati, e anche il diagramma dalla frequenza relativa in relazione agli intervalli ottenuti, come si può vedere nelle immagini seguenti:

In questo modo, la regola di Sturges consente di determinare il numero di classi o intervalli in cui un campione può essere suddiviso, in modo da riassumere un campione di dati attraverso l'elaborazione di tabelle e grafici..

Riferimenti

  1. Alfonso Urquía, M. V. (2013). Modellazione e simulazione di eventi discreti. UNED,.
  2. Altman Naomi, M. K. (2015). "Regressione lineare semplice". Metodi della natura .
  3. Antúnez, R. J. (2014). Statistiche nell'istruzione. UNITÀ digitale.
  4. Fox, J. (1997.). Analisi di regressione applicata, modelli lineari e metodi correlati. Pubblicazioni SAGE.
  5. Humberto Llinás Solano, C. R. (2005). Statistiche descrittive e distribuzioni di probabilità. università del nord.
  6. Panteleeva, O. V. (2005). Fondamenti di probabilità e statistica.
  7. O. Kuehl, M. O. (2001). Progettazione di esperimenti: principi statistici di progettazione e analisi della ricerca. Thomson Editors.

Nessun utente ha ancora commentato questo articolo.