Il misure di tendenza centrale indicano il valore attorno al quale si trovano i dati di una distribuzione. La più nota è la media o media aritmetica, che consiste nell'aggiungere tutti i valori e dividere il risultato per il numero totale di dati.
Tuttavia, se la distribuzione è composta da un numero elevato di valori e questi non sono presentati in modo ordinato, non è facile eseguire i calcoli necessari per estrarre le preziose informazioni che contengono..
Questo è il motivo per cui sono raggruppati in classi o categorie, per sviluppare un file distribuzione di frequenze. Eseguendo questo precedente ordinamento dei dati, è quindi più facile calcolare le misure di tendenza centrale, tra cui:
-Metà
-Mediano
-moda
-Media geometrica
-Media armonica
Ecco le formule per le misure di tendenza centrale per i dati raggruppati:
La media è la più utilizzata per caratterizzare i dati quantitativi (valori numerici), sebbene sia abbastanza sensibile ai valori estremi della distribuzione. Viene calcolato da:
Con:
-X: media o media aritmetica
-Fio: frequenza della classe
-mio: il voto di classe
-g: numero di classi
-n: dati totali
Per calcolarla è necessario trovare l'intervallo che contiene l'osservazione n / 2 e interpolare per determinare il valore numerico di detta osservazione, utilizzando la seguente formula:
Dove:
-c: larghezza dell'intervallo a cui appartiene la mediana
-BM: limite inferiore di detto intervallo
-Fm: numero di osservazioni contenute nell'intervallo
-n / 2: dati totali divisi per 2.
-FBM: numero di osservazioni prima dell'intervallo contenente la mediana.
Pertanto, la mediana è una misura della posizione, ovvero divide il set di dati in due parti. Possono anche essere definiti quartili, decili Y percentili, che dividono la distribuzione rispettivamente in quattro, dieci e cento parti.
Nei dati raggruppati, viene cercata la classe o la categoria che contiene il maggior numero di osservazioni. Questo è il classe modale. Una distribuzione può avere due o più modalità, nel qual caso viene chiamata bimodale Y multimodale, rispettivamente.
È inoltre possibile calcolare la modalità in dati raggruppati seguendo l'equazione:
Con:
-L1: limite inferiore della classe in cui si trova la modalità
-Δ1: sottrarre tra la frequenza della classe modale e la frequenza della classe che la precede.
-ΔDue: sottrarre tra la frequenza della classe modale e la frequenza della classe successiva.
-c: larghezza dell'intervallo contenente la modalità
La media armonica è indicata da H. Quando hai un insieme di n x valori1, XDue, X3..., La media armonica è l'inverso o il reciproco della media aritmetica degli inversi dei valori.
È più facile vederlo attraverso la formula:
E avendo a disposizione i dati raggruppati, l'espressione diventa:
Dove:
-H: media armonica
-Fio: frequenza della classe
-mio: voto di classe
-g: numero di classi
-N = f1 + FDue + F3 +...
Se l'hanno fatto n numeri positivi x1, XDue, X3..., la sua media geometrica G è calcolata dall'ennesima radice del prodotto di tutti i numeri:
Nel caso di dati raggruppati, si può dimostrare che il logaritmo decimale della media geometrica log G è dato da:
Dove:
-G: media geometrica
-Fio: frequenza della classe
-mio: il voto di classe
-g: numero di classi
-N = f1 + FDue + F3 +...
È sempre vero che:
H ≤ G ≤ X
Le seguenti definizioni sono necessarie per trovare i valori descritti nelle formule precedenti:
La frequenza è definita come il numero di volte in cui un dato viene ripetuto.
È la differenza tra i valori più alti e quelli più bassi, presenti nella distribuzione.
Per sapere in quante classi raggruppiamo i dati, utilizziamo alcuni criteri, ad esempio il seguente:
Vengono chiamati i valori estremi di ogni classe o intervallo limiti e ogni classe può avere limiti ben definiti, nel qual caso ha un limite inferiore e uno superiore. Oppure può avere limiti aperti, quando viene fornito un intervallo, ad esempio di valori maggiori o minori di un certo numero.
Consiste semplicemente nel punto medio dell'intervallo ed è calcolato facendo la media del limite superiore e del limite inferiore.
I dati possono essere raggruppati in classi di dimensioni uguali o diverse, questa è la larghezza o la larghezza. La prima opzione è la più utilizzata, in quanto semplifica notevolmente i calcoli, anche se in alcuni casi è imperativo che le classi abbiano larghezze diverse.
La larghezza c L'intervallo può essere determinato dalla seguente formula:
c = Intervallo / Nc
Dovec è il numero di classi.
Di seguito abbiamo una serie di misure di velocità in km / h, prese con radar, che corrispondono a 50 auto che hanno attraversato una strada in una certa città:
I dati presentati in questo modo non sono organizzati, quindi il primo passo è raggrupparli in classi.
Trova la gamma R:
R = (52 - 16) km / h = 36 km / h
Seleziona il numero di classi Nc, secondo i criteri dati. Poiché ci sono 50 dati, possiamo scegliere Nc = 6.
Calcola la larghezza c dell'intervallo:
c = Intervallo / Nc = 36/6 = 6
Formare classi e dati di gruppo come segue: per la prima classe si sceglie come limite inferiore un valore leggermente inferiore al valore più basso presente in tabella, quindi a tale valore si somma il valore di c = 6, calcolato in precedenza, ottiene il limite massimo della prima classe.
Procediamo allo stesso modo per costruire il resto delle classi, come mostrato nella tabella seguente:
Ogni frequenza corrisponde ad un colore in figura 2, in questo modo si garantisce che nessun valore sfugga al conteggio..
X = (5 x 18,5 +25 x 25,0 + 10 x 31,5 + 6 x 38,0 + 2 x 44,5 + 2 x 51,0) ÷ 50 = 29,03 km / h
La mediana è nella classe 2 della tabella, poiché ci sono i primi 30 dati della distribuzione.
-Larghezza dell'intervallo a cui appartiene la mediana: c = 6
-Limite inferiore dell'intervallo in cui la mediana è: BM = 22,0 km / h
-Numero di osservazioni contenute nell'intervallo fm = 25
-Dati totali divisi per 2: 50/2 = 25
-Numero di osservazioni disponibili prima dell'intervallo contenente la mediana: fBM = 5
E l'operazione è:
Mediana = 22,0 + [(25-5) ÷ 25] × 6 = 26,80 km / h
La moda è anche in classe 2:
-Larghezza intervallo: c = 6
-Limite inferiore della classe in cui si trova la modalità: L1 = 22,0
-Sottrai tra la frequenza della classe modale e la frequenza della classe che la precede: Δ1 = 25-5 = 20
-Sottrai tra la frequenza della classe modale e la frequenza della classe che segue: ΔDue = 25-10 = 15
Con questi dati l'operazione è:
Modalità = 22,0 + [20 ÷ (20 + 15)] x6 = 25,4 km / h
N = f1 + FDue + F3 +… = 50
log G = (5 x log 18,5 + 25 x log 25 + 10 x log 31,5 + 6 x log 38 + 2 × log 44,5 + 2 x log 51) / 50 =
log G = 1,44916053
G = 28,13 km / h
1 / H = (1/50) x [(5 / 18,5) + (25/25) + (10 / 31,5) + (6/38) + (2 / 44,5) + (2/51)] = 0,0366
H = 27,32 km / h
Le unità delle variabili sono km / h:
-Media: 29.03
-Mediana: 26,80
-Moda: 25.40
-Media geometrica: 28.13
-Media armonica: 27,32
Nessun utente ha ancora commentato questo articolo.