Il test di Tukey in cosa consiste, caso esemplificativo, esercizio risolto

3043
Alexander Pearson

Il test di tukey è un metodo che mira a confrontare le singole medie da un'analisi della varianza di più campioni sottoposti a diversi trattamenti.

Il test, presentato nel 1949 da John.W. Tukey, ci permette di discernere se i risultati ottenuti sono significativamente diversi o meno. È anche conosciuto come Test di differenza onestamente significativo di Tukey (Test HSD di Tukey per il suo acronimo in inglese).

Figura 1. Il test di Tukey ci permette di discernere se le differenze nei risultati tra tre o più trattamenti differenti applicati a tre o più gruppi con le stesse caratteristiche hanno valori medi significativamente e onestamente differenti..

Negli esperimenti in cui vengono confrontati tre o più trattamenti diversi applicati allo stesso numero di campioni, è necessario discernere se i risultati sono significativamente diversi o meno..

Si dice che un esperimento sia bilanciato quando la dimensione di tutti i campioni statistici è uguale in ogni trattamento. Quando la dimensione dei campioni è diversa per ogni trattamento, si verifica un esperimento sbilanciato.

A volte non è sufficiente con un'analisi della varianza (ANOVA) sapere se nel confronto di diversi trattamenti (o esperimenti) applicati a più campioni soddisfano l'ipotesi nulla (Ho: "tutti i trattamenti sono uguali") oppure, soddisfa l'alternativa ipotesi (Ha: "almeno uno dei trattamenti è diverso").

Il test di Tukey non è unico, ci sono molti altri test per confrontare le medie del campione, ma questo è uno dei più conosciuti e applicati.

Indice articolo

  • 1 Comparatore e tabella Tukey
    • 1.1 Esperimenti sbilanciati
  • 2 Caso di esempio
  • 3 Esercizio risolto
  • 4 Riferimenti

Comparatore e tabella di Tukey

Nell'applicazione di questo test viene calcolato un valore w chiamato il Comparatore di Tukey la cui definizione è la seguente:

w = q √ (MSE / r)

Dove il fattore che cosa è ottenuto da una tabella (Tabella di Tukey), composta da righe di valori che cosa per diverso numero di trattamenti o esperimenti. Le colonne indicano il valore del fattore che cosa per diversi gradi di libertà. Di solito le tabelle disponibili hanno un significato relativo di 0,05 e 0,01.

In questa formula, all'interno della radice quadrata compare il fattore MSE (Mean Square of Error) diviso per r, che indica il numero di ripetizioni. Il MSE è un numero che normalmente si ottiene da un'analisi delle varianze (ANOVA).

Quando la differenza tra due valori medi supera il valore w (Comparatore di Tukey), si conclude che sono medie diverse, ma se la differenza è inferiore al numero di Tukey, si tratta di due campioni con valore medio statisticamente identico.

Il numero w è anche noto come numero HSD (Differenza onestamente significativa).

Questo numero unico comparativo può essere applicato se il numero di campioni applicati per il test di ciascun trattamento è lo stesso in ciascuno di essi..

Esperimenti sbilanciati

Quando per qualche motivo la dimensione dei campioni è diversa in ogni trattamento da confrontare, la procedura sopra descritta differisce leggermente ed è nota come Test di Tukey-Kramer.

Ora ottieni un numero w comparatore per ogni coppia di trattamenti io, j:

w (i, j) = q √ (½ MSE / (ri + rj))

In questa formula, il fattore q è ottenuto dalla tabella di Tukey. Questo fattore q dipende dal numero di trattamenti e dai gradi di libertà dell'errore. rio è il numero di ripetizioni nel trattamento i, mentre rj è il numero di ripetizioni nel trattamento j.

Caso di esempio

Un allevatore di conigli desidera condurre uno studio statistico affidabile che gli indichi quale delle quattro marche di alimenti da ingrasso per conigli è la più efficace. Per lo studio, forma quattro gruppi con sei conigli di un mese e mezzo che fino a quel momento avevano le stesse condizioni di alimentazione.

Le ragioni erano che nei gruppi A1 e A4 i decessi avvenivano per cause non imputabili al cibo, poiché uno dei conigli era stato morso da un insetto e nell'altro caso la morte era probabilmente la causa di un difetto congenito. In modo che i gruppi siano sbilanciati e quindi è necessario applicare il test di Tukey-Kramer.

Esercizio risolto

Per non allungare troppo i calcoli, un caso di esperimento equilibrato sarà considerato un esercizio risolto. Saranno presi come dati:

In questo caso ci sono quattro gruppi corrispondenti a quattro diversi trattamenti. Tuttavia, osserviamo che tutti i gruppi hanno lo stesso numero di dati, quindi è un caso equilibrato.

Per eseguire l'analisi ANOVA, lo strumento che è incorporato nel foglio di calcolo di Libreoffice. Altri fogli di calcolo come Eccellere hanno incorporato questo strumento per l'analisi dei dati. Di seguito una tabella riassuntiva risultante dopo aver eseguito l'analisi della varianza (ANOVA):

Dall'analisi della varianza, abbiamo anche il valore P, che per l'esempio è 2,24E-6 ben al di sotto del livello di significatività 0,05, che porta direttamente a rifiutare l'ipotesi nulla: tutti i trattamenti sono uguali. 

Cioè, tra i trattamenti, alcuni hanno valori medi diversi, ma è necessario sapere quali sono i significativamente e onestamente diversi (HSD) dal punto di vista statistico utilizzando il test di Tukey..

Per trovare il numero w o come è noto anche il numero HSD, dobbiamo trovare il quadrato medio dell'errore MSE. Dall'analisi ANOVA si ottiene che la somma dei quadrati all'interno dei gruppi è SS = 0,2; e il numero di gradi di libertà all'interno dei gruppi è df = 16 con questi dati possiamo trovare MSE:

MSE = SS / df = 0,2 / 16 = 0,0125

È inoltre necessario trovare il fattore che cosa di Tukey, usando il tavolo. La colonna 4, che corrisponde ai 4 gruppi o trattamenti da confrontare, e la riga 16 vengono cercate, poiché l'analisi ANOVA ha prodotto 16 gradi di libertà all'interno dei gruppi. Questo porta ad un valore di q uguale a: q = 4,33 corrispondente a 0,05 di significatività o al 95% di affidabilità. Infine si trova il valore per la "differenza onestamente significativa":

w = HSD = q √ (MSE / r) = 4,33 √ (0,0125 / 5) = 0,2165

Per sapere quali sono i gruppi o trattamenti onestamente diversi, devi conoscere i valori medi di ogni trattamento:

È inoltre necessario conoscere le differenze tra i valori medi delle coppie di trattamenti, che è riportato nella tabella seguente:

Si conclude che i trattamenti migliori, in termini di massimizzazione del risultato, sono T1 o T3, che sono indifferenti dal punto di vista statistico. Per scegliere tra T1 e T3, bisognerebbe cercare altri fattori al di fuori dell'analisi qui presentata. Ad esempio, prezzo, disponibilità, ecc..

Riferimenti

  1. Cochran William e Cox Gertrude. 1974. Disegni sperimentali. Trebbiatura. Messico. Terza ristampa. 661p.
  2. Snedecor, G.W. e Cochran, W.G. 1980. Metodi statistici. Settimo Ed. Iowa, The Iowa State University Press. 507p.
  3. Acciaio, R.G.D. e Torrie, J.H. 1980. Principi e procedure di statistica: un approccio biometrico (2a ed.). McGraw-Hill, New York. 629p.
  4. Tukey, J. W. 1949. Confronto delle medie individuali nell'analisi della varianza. Biometria, 5: 99-114.
  5. Wikipedia. Il test di Tukey. Estratto da: en.wikipedia.com

Nessun utente ha ancora commentato questo articolo.