Misure di tendenza centrale per formule di dati raggruppati, esercizi

3420
David Holt
Misure di tendenza centrale per formule di dati raggruppati, esercizi

Il misure di tendenza centrale indicano il valore attorno al quale si trovano i dati di una distribuzione. La più nota è la media o media aritmetica, che consiste nell'aggiungere tutti i valori e dividere il risultato per il numero totale di dati.

Tuttavia, se la distribuzione è composta da un numero elevato di valori e questi non sono presentati in modo ordinato, non è facile eseguire i calcoli necessari per estrarre le preziose informazioni che contengono..

Figura 1. Le misure di tendenza centrale per i dati raggruppati sono una buona indicazione del comportamento generale dei dati

Questo è il motivo per cui sono raggruppati in classi o categorie, per sviluppare un file distribuzione di frequenze. Eseguendo questo precedente ordinamento dei dati, è quindi più facile calcolare le misure di tendenza centrale, tra cui:

-Metà

-Mediano

-moda

-Media geometrica

-Media armonica

Formule

Ecco le formule per le misure di tendenza centrale per i dati raggruppati:

Media aritmetica

La media è la più utilizzata per caratterizzare i dati quantitativi (valori numerici), sebbene sia abbastanza sensibile ai valori estremi della distribuzione. Viene calcolato da:

Con:

-X: media o media aritmetica

-Fio: frequenza della classe

-mio: il voto di classe

-g: numero di classi

-n: dati totali

Mediano

Per calcolarla è necessario trovare l'intervallo che contiene l'osservazione n / 2 e interpolare per determinare il valore numerico di detta osservazione, utilizzando la seguente formula:

Dove:

-c: larghezza dell'intervallo a cui appartiene la mediana

-BM: limite inferiore di detto intervallo

-Fm: numero di osservazioni contenute nell'intervallo

-n / 2: dati totali divisi per 2.

-FBM: numero di osservazioni prima dell'intervallo contenente la mediana.

Pertanto, la mediana è una misura della posizione, ovvero divide il set di dati in due parti. Possono anche essere definiti quartili, decili Y percentili, che dividono la distribuzione rispettivamente in quattro, dieci e cento parti.

moda

Nei dati raggruppati, viene cercata la classe o la categoria che contiene il maggior numero di osservazioni. Questo è il classe modale. Una distribuzione può avere due o più modalità, nel qual caso viene chiamata bimodale Y multimodale, rispettivamente.

È inoltre possibile calcolare la modalità in dati raggruppati seguendo l'equazione:

Con:

-L1: limite inferiore della classe in cui si trova la modalità

1: sottrarre tra la frequenza della classe modale e la frequenza della classe che la precede.

Due: sottrarre tra la frequenza della classe modale e la frequenza della classe successiva.

-c: larghezza dell'intervallo contenente la modalità

Media armonica

La media armonica è indicata da H. Quando hai un insieme di n x valori1, XDue, X3..., La media armonica è l'inverso o il reciproco della media aritmetica degli inversi dei valori.

È più facile vederlo attraverso la formula:

E avendo a disposizione i dati raggruppati, l'espressione diventa:

Dove:

-H: media armonica

-Fio: frequenza della classe

-mio: voto di classe

-g: numero di classi

-N = f1 + FDue + F3 +...

Media geometrica

Se l'hanno fatto n numeri positivi x1, XDue, X3..., la sua media geometrica G è calcolata dall'ennesima radice del prodotto di tutti i numeri:

Nel caso di dati raggruppati, si può dimostrare che il logaritmo decimale della media geometrica log G è dato da:

Dove:

-G: media geometrica

-Fio: frequenza della classe

-mio: il voto di classe

-g: numero di classi

-N = f1 + FDue + F3 +...

Relazione tra H, G e X

È sempre vero che:

H ≤ G ≤ X

Definizioni più utilizzate

Le seguenti definizioni sono necessarie per trovare i valori descritti nelle formule precedenti:

Frequenza

La frequenza è definita come il numero di volte in cui un dato viene ripetuto.

Rango

È la differenza tra i valori più alti e quelli più bassi, presenti nella distribuzione.

Numero di classi

Per sapere in quante classi raggruppiamo i dati, utilizziamo alcuni criteri, ad esempio il seguente:

Limiti

Vengono chiamati i valori estremi di ogni classe o intervallo limiti e ogni classe può avere limiti ben definiti, nel qual caso ha un limite inferiore e uno superiore. Oppure può avere limiti aperti, quando viene fornito un intervallo, ad esempio di valori maggiori o minori di un certo numero.

Marchio di classe

Consiste semplicemente nel punto medio dell'intervallo ed è calcolato facendo la media del limite superiore e del limite inferiore.

Larghezza della fessura

I dati possono essere raggruppati in classi di dimensioni uguali o diverse, questa è la larghezza o la larghezza. La prima opzione è la più utilizzata, in quanto semplifica notevolmente i calcoli, anche se in alcuni casi è imperativo che le classi abbiano larghezze diverse.

La larghezza c L'intervallo può essere determinato dalla seguente formula:

c = Intervallo / Nc

Dovec è il numero di classi.

Esercizio risolto

Di seguito abbiamo una serie di misure di velocità in km / h, prese con radar, che corrispondono a 50 auto che hanno attraversato una strada in una certa città:

Figura 2. Tabella per l'esercizio risolto. Fonte: F. Zapata.

Soluzione

I dati presentati in questo modo non sono organizzati, quindi il primo passo è raggrupparli in classi.

Passaggi per raggruppare i dati e costruire la tabella

Passo 1

Trova la gamma R:

R = (52 - 16) km / h = 36 km / h

Passo 2

Seleziona il numero di classi Nc, secondo i criteri dati. Poiché ci sono 50 dati, possiamo scegliere Nc = 6.

Passaggio 3

Calcola la larghezza c dell'intervallo:

c = Intervallo / Nc = 36/6 = 6

Passaggio 4

Formare classi e dati di gruppo come segue: per la prima classe si sceglie come limite inferiore un valore leggermente inferiore al valore più basso presente in tabella, quindi a tale valore si somma il valore di c = 6, calcolato in precedenza, ottiene il limite massimo della prima classe.

Procediamo allo stesso modo per costruire il resto delle classi, come mostrato nella tabella seguente:

Ogni frequenza corrisponde ad un colore in figura 2, in questo modo si garantisce che nessun valore sfugga al conteggio..

Calcolo della media

X = (5 x 18,5 +25 x 25,0 + 10 x 31,5 + 6 x 38,0 + 2 x 44,5 + 2 x 51,0) ÷ 50 = 29,03 km / h

Calcolo della mediana

La mediana è nella classe 2 della tabella, poiché ci sono i primi 30 dati della distribuzione.

-Larghezza dell'intervallo a cui appartiene la mediana: c = 6

-Limite inferiore dell'intervallo in cui la mediana è: BM = 22,0 km / h

-Numero di osservazioni contenute nell'intervallo fm = 25

-Dati totali divisi per 2: 50/2 = 25

-Numero di osservazioni disponibili prima dell'intervallo contenente la mediana: fBM = 5

E l'operazione è:

Mediana = 22,0 + [(25-5) ÷ 25] × 6 = 26,80 km / h

Calcolo della moda

La moda è anche in classe 2:

-Larghezza intervallo: c = 6

-Limite inferiore della classe in cui si trova la modalità: L1 = 22,0

-Sottrai tra la frequenza della classe modale e la frequenza della classe che la precede: Δ1 = 25-5 = 20

-Sottrai tra la frequenza della classe modale e la frequenza della classe che segue: ΔDue = 25-10 = 15

Con questi dati l'operazione è:

Modalità = 22,0 + [20 ÷ (20 + 15)] x6 = 25,4 km / h

Calcolo della media geometrica

N = f1 + FDue + F3 +… = 50

log G = (5 x log 18,5 + 25 x log 25 + 10 x log 31,5 + 6 x log 38 + 2 × log 44,5 + 2 x log 51) / 50 =

log G = 1,44916053

G = 28,13 km / h

Calcolo della media armonica

1 / H = (1/50) x [(5 / 18,5) + (25/25) + (10 / 31,5) + (6/38) + (2 / 44,5) + (2/51)] = 0,0366

H = 27,32 km / h

Riepilogo delle misure di tendenza centrale

Le unità delle variabili sono km / h:

-Media: 29.03

-Mediana: 26,80

-Moda: 25.40

-Media geometrica: 28.13

-Media armonica: 27,32

Riferimenti

  1. Berenson, M. 1985. Statistiche per la gestione e l'economia. Interamericana S.A.
  2. Canavos, G. 1988. Probabilità e statistica: applicazioni e metodi. Mcgraw hill.
  3. Devore, J. 2012. Probabilità e statistica per l'ingegneria e la scienza. 8 °. Edizione. Cengage.
  4. Levin, R. 1988. Statistics for Administrators. 2 °. Edizione. Prentice Hall.
  5. Spiegel, M. 2009. Statistiche. Serie Schaum. 4 ° Edizione. Mcgraw hill.
  6. Trattamento dei dati raggruppati. Estratto da: itchihuahua.edu.mx.
  7. Walpole, R. 2007. Probabilità e statistica per l'ingegneria e le scienze. Pearson.

Nessun utente ha ancora commentato questo articolo.