Il distribuzione normale o La distribuzione gaussiana è la distribuzione di probabilità in una variabile continua, in cui la funzione di densità di probabilità è descritta da una funzione esponenziale di argomento quadratico e negativo, che dà origine a una forma a campana.
Il nome di distribuzione normale deriva dal fatto che questa distribuzione è quella che si applica al maggior numero di situazioni in cui qualche variabile casuale continua è coinvolta in un dato gruppo o popolazione..
Esempi in cui viene applicata la distribuzione normale sono: l'altezza di uomini o donne, variazioni nella misura di una certa grandezza fisica o in tratti psicologici o sociologici misurabili come il quoziente intellettuale o le abitudini di consumo di un determinato prodotto.
D'altra parte, è chiamata distribuzione gaussiana o campana gaussiana, perché è questo genio matematico tedesco che è accreditato della sua scoperta per l'uso che ne fece per descrivere l'errore statistico delle misurazioni astronomiche nell'anno 1800..
Tuttavia, si afferma che questa distribuzione statistica era stata precedentemente pubblicata da un altro grande matematico di origine francese, come Abraham de Moivre, nell'anno 1733.
Indice articolo
Alla funzione di distribuzione normale nella variabile continua X, con parametri μ Y σ è denotato da:
N (x; μ, σ)
ed è scritto esplicitamente in questo modo:
N (x; μ, σ) = ∫-∞X f (s; μ, σ) ds
dove f (u; μ, σ) è la funzione di densità di probabilità:
f (s; μ, σ) = (1 / (σ√ (2π)) Exp (- sDue/ (2σDue))
La costante che moltiplica la funzione esponenziale nella funzione di densità di probabilità è chiamata costante di normalizzazione ed è stata scelta in modo tale che:
N (+ ∞, μ, σ) = 1
L'espressione precedente garantisce che la probabilità che la variabile casuale X è compreso tra -∞ e + ∞ è 1, ovvero 100% di probabilità.
Parametro μ è la media aritmetica della variabile casuale continua x y σ la deviazione standard o radice quadrata della varianza della stessa variabile. Nel caso in cui μ = 0 Y σ = 1 abbiamo quindi la distribuzione normale standard o la distribuzione normale tipica:
N (x; μ = 0, σ = 1)
1- Se una variabile statistica casuale segue una distribuzione normale della densità di probabilità f (s; μ, σ), la maggior parte dei dati è raggruppata attorno al valore medio μ e sono sparsi intorno ad esso in modo tale che solo poco più di ⅔ dei dati siano tra μ - σ Y μ + σ.
2- La deviazione standard σ è sempre positivo.
3- La forma della funzione di densità F assomiglia a quella di una campana, motivo per cui questa funzione è spesso chiamata campana gaussiana o funzione gaussiana.
4- In una distribuzione gaussiana la media, la mediana e il modo coincidono.
5- I punti di flesso della funzione di densità di probabilità si trovano esattamente in μ - σ Y μ + σ.
6- La funzione f è simmetrica rispetto ad un asse che passa per il suo valore medio μ y ha asintoticamente zero per x ⟶ + ∞ e x ⟶ -∞.
7- Maggiore è il valore di σ maggiore dispersione, rumore o distanza dei dati attorno al valore medio. Vale a dire a maggiore σ la forma a campana è più aperta. Anziché σ piccolo indica che i dadi sono stretti al centro e la forma della campana è più chiusa o appuntita.
8- La funzione di distribuzione N (x; μ, σ) indica la probabilità che la variabile casuale sia minore o uguale a X. Ad esempio, nella Figura 1 (sopra) la probabilità P che la variabile X è minore o uguale a 1,5 è 84% e corrisponde all'area sotto la funzione di densità di probabilità f (x; μ, σ) da -∞ a X.
9- Se i dati seguono una distribuzione normale, il 68,26% di questi è compreso tra μ - σ Y μ + σ.
Si trova tra il 10 e il 95,44% dei dati che seguono una distribuzione normale μ - 2σ Y μ + 2σ.
L'11- 99,74% dei dati che seguono una distribuzione normale sono compresi tra μ - 3σ Y μ + 3σ.
12- Se una variabile casuale X seguire una distribuzione N (x; μ, σ), poi la variabile
z = (x - μ) / σ segue la distribuzione normale standard N (z, 0,1).
Il cambiamento della variabile X per z Si chiama standardizzazione o tipizzazione ed è molto utile quando si applicano le tabelle della distribuzione standard ai dati che seguono una distribuzione normale non standard..
Per applicare la distribuzione normale è necessario passare attraverso il calcolo dell'integrale della densità di probabilità, che dal punto di vista analitico non è facile e non sempre esiste un programma per computer che ne consenta il calcolo numerico. A tale scopo vengono utilizzate le tabelle dei valori normalizzati o standardizzati, che non è altro che la distribuzione normale nel caso μ = 0 e σ = 1.
Va notato che queste tabelle non includono valori negativi. Tuttavia, utilizzando le proprietà di simmetria della funzione di densità di probabilità gaussiana è possibile ottenere i valori corrispondenti. Nell'esercizio risolto di seguito riportato, è indicato l'utilizzo della tabella in questi casi.
Supponiamo di avere un insieme di dati casuali x che seguono una distribuzione normale di media 10 e deviazione standard 2. Ti viene chiesto di trovare la probabilità che:
a) La variabile casuale x è minore o uguale a 8.
b) È minore o uguale a 10.
c) Che la variabile x sia inferiore a 12.
d) La probabilità che un valore x sia compreso tra 8 e 12.
Soluzione:
a) Per rispondere alla prima domanda devi semplicemente calcolare:
N (x; μ, σ)
Con x = 8, μ = 10 Y σ = 2. Ci rendiamo conto che è un integrale che non ha una soluzione analitica in funzioni elementari, ma la soluzione è espressa in funzione della funzione di errore erf (x).
D'altra parte, c'è la possibilità di risolvere l'integrale in forma numerica, che è ciò che fanno molte calcolatrici, fogli di calcolo e programmi per computer come GeoGebra. La figura seguente mostra la soluzione numerica corrispondente al primo caso:
e la risposta è che la probabilità che x sia inferiore a 8 è:
P (x ≤ 8) = N (x = 8; μ = 10, σ = 2) = 0,1587
b) In questo caso, proviamo a trovare la probabilità che la variabile casuale x sia inferiore alla media, che in questo caso vale 10. La risposta non richiede alcun calcolo, poiché sappiamo che metà dei dati è inferiore alla media e l'altra metà sopra la media. Pertanto, la risposta è:
P (x ≤ 10) = N (x = 10; μ = 10, σ = 2) = 0,5
c) Per rispondere a questa domanda devi calcolare N (x = 12; μ = 10, σ = 2), Questo può essere fatto con una calcolatrice dotata di funzioni statistiche o tramite software come GeoGebra:
La risposta alla parte c può essere vista nella figura 3 ed è:
P (x ≤ 12) = N (x = 12; μ = 10, σ = 2) = 0,8413.
d) Per trovare la probabilità che la variabile casuale x sia compresa tra 8 e 12 possiamo usare i risultati delle parti a e c come segue:
P (8 ≤ x ≤ 12) = P (x ≤ 12) - P (x ≤ 8) = 0,8413 - 0,1587 = 0,6826 = 68,26%.
Il prezzo medio delle azioni di una società è di $ 25 con una deviazione standard di $ 4. Determina la probabilità che:
a) Un'azione ha un costo inferiore a $ 20.
b) Che ha un costo superiore a $ 30.
c) Il prezzo è compreso tra $ 20 e $ 30.
Utilizzare tabelle di distribuzione normale standard per trovare le risposte.
Soluzione:
Per poter utilizzare le tabelle è necessario passare alla variabile z normalizzata o tipizzata:
$ 20 nella variabile normalizzata è uguale a z = ($ 20 - $ 25) / $ 4 = -5/4 = -1,25 e
$ 30 nella variabile normalizzata è uguale a z = ($ 30 - $ 25) / $ 4 = +5/4 = +1,25.
a) $ 20 è uguale a -1,25 nella variabile normalizzata, ma la tabella non ha valori negativi, quindi inseriamo il valore +1,25 che restituisce il valore di 0,8944.
Se 0,5 viene sottratto da questo valore, il risultato sarà l'area tra 0 e 1,25 che, tra l'altro, è identica (per simmetria) all'area tra -1,25 e 0. Il risultato della sottrazione è 0,8944 - 0,5 = 0,3944 che è l'area tra -1,25 e 0.
Ma l'area da -∞ a -1,25 è di interesse, che sarà 0,5 - 0,3944 = 0,1056. Si conclude quindi che la probabilità che un'azione sia inferiore a $ 20 è del 10,56%.
b) $ 30 nella variabile tipizzata z è 1,25. Per questo valore, nella tabella compare il numero 0,8944, che corrisponde all'area da -∞ a +1,25. L'area tra +1,25 e + ∞ è (1 - 0,8944) = 0,1056. Cioè, la probabilità che una quota costi più di $ 30 è del 10,56%.
c) La probabilità che un'azione abbia un costo compreso tra $ 20 e $ 30 sarà calcolata come segue:
100% -10,56% - 10,56% = 78,88%
Nessun utente ha ancora commentato questo articolo.