Il campionamento stratificato, o stratificazione, è un metodo di campionamento che prevede la divisione di una popolazione in sottogruppi più piccoli, noti come strati. A loro volta, questi strati si formano sulla base degli attributi o delle caratteristiche condivise dei membri, come il reddito o il livello di istruzione..
Viene utilizzato per evidenziare le differenze tra i gruppi in una popolazione, a differenza del semplice campionamento, che tratta tutti i membri di una popolazione come uguali, con la stessa probabilità di essere campionati.
L'obiettivo è migliorare la precisione del campione riducendo l'errore di campionamento. Può produrre una media ponderata con minore variabilità rispetto alla media aritmetica di un semplice campione della popolazione.
La stratificazione è il processo di frammentazione dei membri di una popolazione in sottoinsiemi omogenei prima del campionamento. Attraverso gli strati viene definita una distribuzione della popolazione.
Cioè, deve essere collettivamente esaustivo e mutuamente esclusivo, quindi un singolo strato deve essere assegnato a ciascun elemento della popolazione. Quindi un campionamento sistematico o semplice viene applicato all'interno di ogni strato.
Indice articolo
È importante notare che gli strati non devono essere giustapposti. Avere sottogruppi sovrapposti darà ad alcune persone maggiori possibilità di essere selezionate come soggetti. Ciò ostacola totalmente la nozione di campionamento stratificato come prototipo di campionamento..
È altrettanto importante che il ricercatore utilizzi un semplice campionamento all'interno dei diversi strati..
Gli strati più comuni utilizzati nel campionamento stratificato sono età, sesso, stato socioeconomico, religione, nazionalità e livello di istruzione..
Quando si completa l'analisi su un gruppo di entità con caratteristiche simili, un investigatore può scoprire che la dimensione della popolazione è troppo grande per completare l'indagine..
Per risparmiare tempo e denaro, è possibile adottare una prospettiva più fattibile selezionando un piccolo gruppo dalla popolazione. Questo piccolo gruppo è chiamato dimensione del campione, che è un sottoinsieme della popolazione utilizzata per rappresentare l'intera popolazione..
È possibile selezionare un campione da una popolazione in diversi modi, uno dei quali è il campionamento stratificato. Ciò comporta la divisione della popolazione totale in gruppi omogenei chiamati strati. Quindi campioni casuali vengono selezionati da ogni strato.
- Dividi la popolazione in sottogruppi o strati più piccoli, in base agli attributi e alle caratteristiche condivise dai membri.
- Prendi un campione casuale da ogni strato in un numero proporzionale alla dimensione dello strato.
- Raggruppa sottoinsiemi di strati per formare un campione casuale.
- Eseguire l'analisi.
Ad esempio, si consideri un ricercatore che vorrebbe conoscere il numero di studenti di economia che hanno ricevuto un'offerta di lavoro entro tre mesi dalla laurea nel 2018. Scopriranno presto che c'erano quasi 200.000 laureati in economia quell'anno..
Potresti decidere di prendere semplicemente un campione casuale di 5.000 laureati e condurre il sondaggio. Meglio ancora, potresti dividere la popolazione in strati e prelevare un campione casuale su quegli strati..
Per fare ciò, creeresti gruppi di popolazione basati su età, razza, nazionalità o background professionale..
Un campione casuale verrebbe prelevato da ogni strato, in proporzione alla dimensione dello strato rispetto alla popolazione totale. Questi sottoinsiemi verrebbero raggruppati per formare un campione.
In questo tipo, la dimensione del campione per ogni strato è proporzionale alla dimensione della popolazione dello strato rispetto alla popolazione totale. Ciò significa che ogni strato ha la stessa proporzione di campionamento.
Quando una caratteristica degli individui viene selezionata per definire gli strati, i sottogruppi risultanti sono spesso di dimensioni diverse..
Ad esempio, si vuole studiare la percentuale della popolazione messicana che fuma, e si decide che l'età sarebbe un buon criterio da stratificare perché si ritiene che le abitudini al fumo possano variare sensibilmente a seconda dell'età. Sono definiti tre strati:
- Meno di 20 anni.
- Tra 20 e 44.
- Più di 44 anni.
Quando la popolazione del Messico è divisa in questi tre strati, i tre gruppi non dovrebbero avere le stesse dimensioni. In effetti, i dati effettivi lo confermano:
- Stratum 1: 42,4 milioni (41,0%).
- Stratum 2: 37,6 milioni (36,3%).
- Stratum 3: 23,5 milioni (22,7%).
Se viene utilizzato il campionamento stratificato proporzionale, il campione dovrebbe essere costituito da strati che mantengono le stesse proporzioni della popolazione. Se vuoi creare un campione di 1.000 individui, i campioni devono avere le seguenti dimensioni:
È molto simile a raccogliere una popolazione più piccola, determinata dalle proporzioni relative degli strati all'interno della popolazione..
In questo tipo, la stessa dimensione del campione è assegnata a tutti gli strati definiti, indipendentemente dal peso di questi strati all'interno della popolazione..
Un campionamento stratificato uniforme che prenda l'esempio precedente produrrebbe il seguente campione per ogni strato:
Questo metodo favorisce gli strati che hanno meno peso nella popolazione, dando loro lo stesso livello di importanza degli strati più rilevanti.
Ciò riduce l'efficacia complessiva del campione, ma consente di studiare con maggiore precisione le caratteristiche individuali di ogni strato..
Nell'esempio, se si desidera fare un'affermazione specifica sulla popolazione dello strato 3 (oltre 44), è possibile ridurre gli errori di campionamento utilizzando un campione di 333 unità, invece di un campione di 227 unità, come ottenuto dalla stratificazione proporzionale campionamento.
Il campionamento stratificato funziona bene per le popolazioni che hanno una varietà di attributi, ma altrimenti non sarà efficace se i sottogruppi non possono essere formati..
Il vantaggio principale del campionamento stratificato è che raccoglie le caratteristiche chiave della popolazione del campione..
Simile a una media ponderata, questo metodo di campionamento produce caratteristiche nel campione proporzionali alla popolazione totale..
La stratificazione fornisce un errore di stima inferiore rispetto al metodo di campionamento semplice. Maggiore è la differenza tra gli strati, maggiore è il guadagno di precisione..
Ha una maggiore precisione statistica rispetto al semplice campionamento. Ciò è dovuto al fatto che all'interno dei sottogruppi la variabilità è inferiore, se confrontata con le variazioni che si verificano con la popolazione totale..
Poiché questa tecnica ha un'elevata precisione statistica, significa anche che richiede una dimensione del campione più piccola, il che può far risparmiare ai ricercatori molti sforzi, denaro e tempo..
Sfortunatamente, questo metodo di ricerca non può essere utilizzato in tutti gli studi. Lo svantaggio del metodo è che devono essere soddisfatte diverse condizioni affinché possa essere utilizzato correttamente.
Il principale svantaggio è che può essere difficile identificare gli strati appropriati per uno studio. Inoltre, trovare un elenco esaustivo e definitivo di un'intera popolazione può essere una sfida..
Un secondo svantaggio è che è più complesso organizzare e analizzare i risultati rispetto al semplice campionamento..
I ricercatori devono identificare ogni membro di una popolazione di studio e classificarlo in una sola sottopopolazione. Di conseguenza, il campionamento stratificato è svantaggioso quando i ricercatori non possono classificare con sicurezza ogni membro della popolazione in un sottogruppo..
La giustapposizione può essere un problema se ci sono soggetti che rientrano in più sottogruppi. Quando viene eseguito un campionamento semplice, è più probabile che vengano scelti quelli in più sottogruppi. Il risultato potrebbe essere una falsa dichiarazione o un riflesso impreciso della popolazione.
Esempi come studenti universitari, laureati, uomini e donne, lo rendono facile in quanto sono gruppi chiaramente definiti.
Tuttavia, in altre situazioni potrebbe essere molto più difficile. Puoi immaginare di incorporare caratteristiche come razza, etnia o religione. Il processo di classificazione diventerebbe più difficile, rendendo il campionamento stratificato un metodo inefficace..
Supponiamo che un gruppo di ricerca voglia determinare la media dei voti degli studenti universitari negli Stati Uniti.
Il team di ricerca ha evidenti difficoltà nel raccogliere questi dati dai 21 milioni di studenti universitari. Decidi quindi di prelevare un campione dalla popolazione, utilizzando solo 4.000 studenti..
Il team osserva i diversi attributi dei partecipanti al campione e chiede se c'è qualche differenza tra la media dei voti e la specializzazione degli studenti..
Nel campione risulta che 560 studenti sono studenti inglesi, 1.135 di scienze, 800 di informatica, 1.090 di ingegneria e 415 di matematica.
Il team desidera utilizzare il campionamento stratificato proporzionale, in cui gli strati del campione sono proporzionali al campione di popolazione.
Per fare ciò, il team indaga sulle statistiche degli studenti universitari negli Stati Uniti e trova la percentuale ufficiale di studenti specializzati: 12% in inglese, 28% in scienze, 24% in informatica, 21% in ingegneria e 15% in matematica.
Pertanto, cinque strati vengono creati dal processo di campionamento stratificato. Il team deve confermare che lo strato della popolazione è proporzionale allo strato del campione. Tuttavia, scopre che le proporzioni non sono uguali..
Pertanto, il team deve ricampionare la popolazione di 4.000 studenti, ma questa volta selezionando casualmente 480 (12%) studenti di inglese, 1.120 (28%) scienze, 960 (24%) informatica, 840 (21%) ingegneria e 600 ( 15%) matematica.
Con questo, abbiamo un campione stratificato proporzionale di studenti universitari, che fornisce una migliore rappresentazione degli studenti universitari negli Stati Uniti..
I ricercatori saranno in grado di evidenziare uno strato specifico, osservare i vari studi degli studenti universitari statunitensi e osservare le diverse medie dei voti..
Nessun utente ha ancora commentato questo articolo.