Formule di distribuzione ipergeometrica, equazioni, modello

3450
Egbert Haynes

Il distribuzione ipergeometrica è una funzione statistica discreta, adatta per calcolare la probabilità in esperimenti randomizzati con due possibili esiti. La condizione richiesta per applicarlo è che si tratti di popolazioni piccole, in cui le estrazioni non vengono sostituite e le probabilità non sono costanti.. 

Pertanto, quando un elemento della popolazione viene scelto per conoscere il risultato (vero o falso) di una certa caratteristica, quello stesso elemento non può essere scelto di nuovo..

Figura 1. In una popolazione di bulloni come questa, ci sono sicuramente campioni difettosi. Fonte: Pixabay.

Certamente, è quindi più probabile che l'elemento successivo scelto ottenga un risultato vero, se l'elemento precedente ha avuto un risultato negativo. Ciò significa che la probabilità varia man mano che gli elementi vengono estratti dal campione..

Le principali applicazioni della distribuzione ipergeometrica sono: il controllo di qualità nei processi con poca popolazione e il calcolo delle probabilità nei giochi d'azzardo.

Per quanto riguarda la funzione matematica che definisce la distribuzione ipergeometrica, si compone di tre parametri, che sono:

- Numero di elementi della popolazione (N)

- Dimensione del campione (m) 

- Numero di eventi nell'intera popolazione con un risultato favorevole (o sfavorevole) della caratteristica studiata (n).

Indice articolo

  • 1 Formule ed equazioni
    • 1.1 Importanti variabili statistiche
  • 2 Modello e proprietà 
    • 2.1 Principali proprietà della distribuzione ipergeometrica
    • 2.2 Approssimazione per distribuzione binomiale
  • 3 esempi
    • 3.1 Esempio 1
    • 3.2 Esempio 2
  • 4 Esercizi risolti
    • 4.1 Esercizio 1
    • 4.2 Esercizio 2
    • 4.3 Esercizio 3
  • 5 Riferimenti

Formule ed equazioni

La formula per la distribuzione ipergeometrica fornisce la probabilità P riguardo a cosa X si verificano casi favorevoli di una certa caratteristica. Il modo per scriverlo matematicamente, basato sui numeri combinatori è:

Nell'espressione sopra N, n Y m sono parametri e X la variabile stessa. 

-La popolazione totale è N.

-Il numero di risultati positivi di una certa caratteristica binaria rispetto alla popolazione totale è n.

-La quantità di articoli campione è m.

In questo caso, X è una variabile casuale che assume il valore X P (x) indica la probabilità di occorrenza di X casi favorevoli della caratteristica studiata.

Importanti variabili statistiche

Altre variabili statistiche per la distribuzione ipergeometrica sono:

- Metà μ = m * n / N

- Varianza σ ^ 2 = m * (n / N) * (1-n / N) * (N-m) / (N-1)

- Deviazione tipica σ che è la radice quadrata della varianza.

Modello e proprietà 

Per arrivare al modello della distribuzione ipergeometrica, partiamo dalla probabilità di ottenere X casi favorevoli in una dimensione del campione m. Detto campione contiene elementi conformi all'immobile oggetto di studio ed elementi non conformi.

Ricordati che n rappresenta il numero di casi favorevoli nella popolazione totale di N elementi. Quindi la probabilità sarebbe calcolata in questo modo:

P (x) = (numero di modi per ottenere x numero di modi non riusciti) / (numero totale di modi per selezionare)

Esprimendo quanto sopra sotto forma di numeri combinatori, arriviamo al seguente modello di distribuzione di probabilità:

Principali proprietà della distribuzione ipergeometrica

Sono i seguenti:

- Il campione deve essere sempre piccolo, anche se la popolazione è numerosa.

- Gli elementi del campione vengono estratti uno per uno, senza incorporarli nuovamente nella popolazione.

- La proprietà da studiare è binaria, cioè può assumere solo due valori: 1 o 0, Oh bene certo o falso.

In ogni fase di estrazione degli elementi, la probabilità cambia a seconda dei risultati precedenti.

Approssimazione utilizzando la distribuzione binomiale

Un'altra proprietà della distribuzione ipergeometrica è che può essere approssimata dalla distribuzione binomiale, indicata con Bi, fintanto che la popolazione N è grande e almeno 10 volte più grande del campione m. In questo caso sarebbe simile a questo:

P (N, n, m; x) = Bi (m, n / N, x)           

Applicabile fintanto che N è grande e N> 10 m

Esempi

Esempio 1

Supponiamo che una macchina che produce viti e che i dati accumulati indichino che l'1% esce con dei difetti. Quindi in una scatola di N = 500 viti il ​​numero di difettosi sarà:

n = 500 * 1/100 = 5

Probabilità utilizzando la distribuzione ipergeometrica

Supponiamo che da quella scatola (cioè da quella popolazione) prendiamo un campione di m = 60 bulloni.

La probabilità che nessuna vite (x = 0) nel campione sia difettosa è del 52,63%. Questo risultato si ottiene utilizzando la funzione di distribuzione ipergeometrica:

P (500, 5, 60, 0) = 0,5263

La probabilità che x = 3 viti nel campione siano difettose è: P (500, 5, 60, 3) = 0,0129.

D'altra parte, la probabilità che x = 4 viti delle sessanta del campione siano difettose è: P (500, 5, 60; 4) = 0.0008.

Infine, la probabilità che x = 5 viti in quel campione siano difettose è: P (500, 5, 60; 5) = 0.

Ma se vuoi conoscere la probabilità che in quel campione ci siano più di 3 viti difettose, allora devi ottenere la probabilità cumulativa, aggiungendo:

P (3) + P (4) + P (5) = 0,0129 + 0,0008 + 0 = 0,0137.

Questo esempio è illustrato nella figura 2, ottenuta utilizzando GeoGebra un software gratuito ampiamente utilizzato nelle scuole, istituti e università.

Figura 2. Esempio di distribuzione ipergeometrica. Preparato da F. Zapata con GeoGebra.

Esempio 2

Un mazzo spagnolo ha 40 carte, di cui 10 hanno l'oro e le restanti 30 no. Supponiamo che 7 carte vengano pescate a caso da quel mazzo, che non vengono reincorporate nel mazzo.

Se X è il numero di ori presenti nelle 7 carte estratte, la probabilità che ci siano x ori in un'estrazione di 7 carte è data dalla distribuzione ipergeometrica P (40,10,7; x).

Vediamo così: per calcolare la probabilità di avere 4 ori in un'estrazione di 7 carte usiamo la formula della distribuzione ipergeometrica con i seguenti valori:

E il risultato è: 4,57% di probabilità.

Ma se vuoi conoscere la probabilità di ottenere più di 4 carte, devi aggiungere:

P (4) + P (5) + P (6) + P (7) = 5,20%

Esercizi risolti

Il seguente insieme di esercizi ha lo scopo di illustrare e assimilare i concetti che sono stati presentati in questo articolo. È importante che il lettore cerchi di risolverli da solo, prima di guardare alla soluzione.

Esercizio 1

Una fabbrica di preservativi ha scoperto che su 1.000 preservativi prodotti da una determinata macchina, 5 risultano difettosi. Per il controllo di qualità, vengono prelevati 100 preservativi a caso e il lotto viene scartato se ne risulta almeno uno o più difettosi. Risposta:

a) Qual è la possibilità che un lotto di 100 venga scartato?

b) Questo criterio di controllo della qualità è efficiente??

Soluzione

In questo caso, appariranno numeri combinatori molto grandi. Il calcolo è difficile a meno che non sia disponibile un pacchetto software adatto.

Ma poiché si tratta di una popolazione ampia e il campione è dieci volte più piccolo della popolazione totale, è possibile utilizzare l'approssimazione della distribuzione ipergeometrica mediante la distribuzione binomiale:

P (1000,5,100; x) = Bi (100, 5/1000, x) = Bi (100, 0,005, x) = C (100, x) * 0,005 ^ x (1-0,005) ^ (100-x)

Nell'espressione sopra C (100, x) è un numero combinatorio. Quindi la probabilità che ci sia più di un difetto verrà calcolata in questo modo:

P (x> = 1) = 1 - Bi (0) = 1- 0,6058 = 0,3942

È un'ottima approssimazione, se confrontata con il valore ottenuto applicando la distribuzione ipergeometrica: 0.4102

Si può dire che, con una probabilità del 40%, un lotto di 100 profilattici dovrebbe essere scartato, il che non è molto efficiente..

Tuttavia, essendo un po 'meno impegnativo nel processo di controllo qualità e scarteremmo il lotto di 100 solo se ci sono due o più difetti, allora la probabilità di scartare il lotto scenderà a solo l'8%..

Esercizio 2

Una macchina per tappi in plastica funziona in modo tale che su 10 pezzi uno esce deformato. In un campione di 5 pezzi, quanto è probabile che solo un pezzo sia difettoso?.

Soluzione

Popolazione: N = 10

Numero n di difetti per ogni N: n = 1

Taglia in foto: m = 5

P (10, 1, 5; 1) = C (1,1) * C (9,4) / C (10,5) = 1 * 126/252 = 0,5

Quindi c'è una probabilità del 50% che in un campione di 5, una stecca risulti deformata.

Esercizio 3

In una riunione di giovani diplomati delle scuole superiori ci sono 7 signore e 6 signori. Tra le ragazze, 4 studiano scienze umane e 3 scienze. Nel gruppo dei ragazzi, 1 studia scienze umane e 5 scienze. Calcola quanto segue:

a) Scegliere tre ragazze a caso: qual è la probabilità che tutte studino materie umanistiche?.

b) Se tre partecipanti alla riunione degli amici vengono scelti a caso: qual è la possibilità che tre di loro, indipendentemente dal sesso, studino scienze tutte e tre, o scienze umane anche tutte e tre?.

c) Ora seleziona due amici a caso e chiama X alla variabile casuale "numero di coloro che studiano materie umanistiche". Tra i due scelti, determinare il valore medio o atteso di X e la varianza σ ^ 2.

Soluzione a 

La popolazione è il numero totale di ragazze: N = 7. Quelli che studiano discipline umanistiche sono n = 4, del totale. Il campione casuale di ragazze sarà m = 3.

In questo caso, la probabilità che tutti e tre siano studenti di scienze umane è data dalla funzione ipergeometrica:

P (N = 7, n = 4, m = 3, x = 3) = C (4, 3) C (3, 0) / C (7, 3) = 0,1143

Quindi c'è una probabilità dell'11,4% che tre ragazze scelte a caso studino materie umanistiche..

Soluzione b

I valori da utilizzare ora sono:

-Popolazione: N = 14

-La quantità che studia le lettere è: n = 6 e il

-Taglia in foto: m = 3.

-Numero di amici che studiano discipline umanistiche: x

Secondo questo, x = 3 significa che tutti e tre studiano discipline umanistiche, ma x = 0 significa che nessuno studia discipline umanistiche. La probabilità che tutti e tre studino lo stesso è data dalla somma:

P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0,0560 + 0,1539 = 0,2099

Quindi, abbiamo una probabilità del 21% che tre partecipanti alla riunione, scelti a caso, studieranno la stessa cosa.

Soluzione c

Qui abbiamo i seguenti valori:

N = 14 popolazione totale di amici, n = 6 numero totale nella popolazione che studia materie umanistiche, la dimensione del campione è m = 2.

La speranza è:

E (x) = m * (n / N) = 2 * (6/14) = 0,8572

E la varianza:

σ (x) ^ 2 =  m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * (14-2) / (14 -1) =

= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / (13 )  = 0,4521

Riferimenti

  1. Distribuzioni di probabilità discrete. Recupero da: biplot.usal.es
  2. Statistica e probabilità. Distribuzione ipergeometrica. Recupero da: projectdescartes.org
  3. CDPYE-UGR. Distribuzione ipergeometrica. Recupero da: ugr.es
  4. Geogebra. Geogebra classica, calcolo delle probabilità. Recuperato da geogebra.org
  5. Prova facile. Risolti problemi di distribuzione ipergeometrica. Estratto da: probafacil.com
  6. Minitab. Distribuzione ipergeometrica. Recupero da: support.minitab.com
  7. Università di Vigo. Principali distribuzioni discrete. Estratto da: anapg.webs.uvigo.es
  8. Vitutor. Statistica e calcolo combinatorio. Estratto da: vitutor.net
  9. Weisstein, Eric W. Distribuzione ipergeometrica. Estratto da: mathworld.wolfram.com
  10. Wikipedia. Distribuzione ipergeometrica. Estratto da: es.wikipedia.com

Nessun utente ha ancora commentato questo articolo.