12 Distribuzioni di Probabilità (prima parte)

Distribuzione di probabilità

Distribuzione di probabilità

Una DISTRIBUZIONE DI PROBABILITÀ è definita da tutti i possibili risultati di un esperimento e le corrispondenti probabilità

Distribuzione binomiale

Quando ciascun evento semplice può avere soltanto due possibili risultati mutuamente escludentisi (per es. testa o croce; vero o falso; ecc.) dalla loro combinazione (ripetendo le prove) si ottengono eventi composti indipendenti ai quali è possibile associare la probabilità del loro verificarsi.

La distribuzione teorica di probabilità assume una forma ben precisa che si chiama BINOMIALE con equazione:

con:

p(k) = probabilità associata a $k$ eventi favorevoli in $n$ prove
$n$ = numero delle prove
k = numero degli eventi favorevoli (successi) che va da 0 a n
$p$ = probabilità associata al successo, singolo evento
$q$ = probabilità associata all’insuccesso
$\binom{n}{k}$ = coefficiente binomiale

dove n! è n fattoriale, ovvero il prodotto degli interi positivi da n a 1. Per il calcolo, occorre moltiplicare $n$ n per tutti i numeri interi che lo precedono:

Esempio

Se a k si fanno assumere tutti i valori da 0 a n, allora le probabilità associate sono

Per esempio se a k si fanno assumere tutti i valori da 0 a 10, allora le probabilità associate sono

La somma di tutte le probabilità ottenute con 0 <= k <= 10 è uguale a 1. Inoltre le probabilità così calcolate definiscono una distribuzione di probabilità binomiale che ha la caratteristica di essere discreta e simmetrica (intorno al valore massimo).

Le distribuzioni binomiali sono già tabulate, cioè vengono fornite le probabilità di verificarsi di evento/i per determinati p e n.

Vediamo alcune proprietà

Se p = q = 0.50 la distribuzione è simmetrica
Se p ≠ q ≠ 0.50 la distribuzione è asimmetrica:
- Se p < 0.50 è asimmetrica positiva.
- Se p > 0.50 è asimmetrica negativa.

Aumentando n (il numero delle prove) la distribuzione tende alla simmetria qualsiasi sia p ≠ 0.50.

Esempio

Un test è composto da 10 domande con risposta vero/falso/non so. Quali sono le probabilità associate ai possibili risultati? Quindi ho

n = 10 eventi possibili.
k = 0 … 10 eventi favorevoli.
n−k = 0 … 10 eventi non favorevoli.
p=1/3 probabilità di successo.
q=2/3 probabilità di insuccesso.

Se a k si fanno assumere tutti i valori da 0 a 10 si calcolano le relative probabilità:

La somma di tutte le probabilità al variare di k da 0 a 10 è uguale a 1.

Relazione tra binomiale e normale

Facciamo l’esempio del lancio della moneta. k = “risultato testa” con
p = .05. Aumentando i lanci abbiamo che la distribuzione assume una forma simmetrica

Distribuzione binomiale proprietà

La distribuzione di probabilità binomiale ha una media, una varianza e una devianza standard:

μ=np (media )
σ²=npq (varianza)
σ (deviazione standard)

Faciamo qualche esempio

Distribuzione normale (Ripetizione ????)

La distribuzione normale è importante poichè molti dei fenomi che si possono studiare si assimilano alla normale, tendono ad avere una forma normale. La distribuzione normale è rappresentata da una curva continua a forma di campana (gaussiana).

È definita dalla seguente equazione

Soddisfa le seguenti caratteristiche:

INFINITA: va da -∞ a +∞
SIMMETRICA rispetto alla $Y$ massima ( $f(x)$ punto più alto se $x = \mu$ )
UNIMODALE: ( $\mu = Mo = Me$ ) media moda e mediana si equivalgono
ASINTOTICA: si avvicina all’asse delle $X$ senza mai toccarlo, se non ai valori di ascissa -∞ e +∞ che non sono rappresentabili.
CRESCENTE per -∞ < $x$ < $\mu$ e DECRESCENTE per $\mu$ < $x$ < +∞ → due punti di flesso a ± $\sigma$ da $\mu$ .

La curva normale è interamente definita dai parametri $\mu$ (media) e $\sigma$ (deviazione standard). Di seguito qualche esempio di famiglia di distribuzioni normali con medie e deviazioni standard diverse.

Inoltre sappiamo anche che qualsiasi siano i parametri $\mu$ e $\sigma$ , l’area sottesa dall’intera curva è = 1. Il valore 1 è un simbolo che rappresenta il fatto che sotto la curva si trova il 100% degli individui (frequenze) rappresentati dalla variabile.

La porzione di curva delimitata dalla media (come ascissa) e un’ordinata espressa in termini di deviazioni standard è costante:

$\mu + 3\sigma$ = 49.86% della distribuzione
$\mu + \sigma$ = 34.13% della distribuzione
$\mu + 2\sigma$ = 47.73% della distribuzione

Conoscendo $\mu$ e $\sigma$ , possiamo stimare $f(x)$ e l’area compresa tra due qualsiasi valori di $x$ .

Poiché la curva è simmetrica, l’area compresa tra -∞ e $\mu$ è uguale a 0.50 come quella compresa tra $\mu$ e +∞. In altre parole, sopra la media ci sono il 50% dei casi, come sotto la media.

Qualunque siano i valori di $\mu$ e $\sigma$ , l’area corrispondente a intervalli definiti è sempre la stessa → Porzioni della distribuzione compresse tra ± 1, 2, 3 $\sigma$ da $\mu$ (in %).

L’uso pratico di questa distribuzione è rappresentata dall’utilizzo della distribuzione normale stardardizzata. In pratica si tratta di convertire i punteggi di x in punteggi z.

E attraverso le tavole Z possiamo andare a conoscere determinate aree riferiti a specifici valori Z.

12 Distribuzioni di Probabilità (prima parte)

Table of Contents

Distribuzione di probabilità

Distribuzione binomiale

Relazione tra binomiale e normale

Distribuzione binomiale proprietà

Distribuzione normale (Ripetizione ????)

More posts

25 Stima dell’attendibilità

24 Relazione tra variabili: la verifica delle ipotesi sul coefficiente di regressione lineare

23 Relazioni tra variabili: La verifica delle ipotesi sui coefficienti di correlazione non parametrici

22 Relazioni tra variabili: La verifica delle ipotesi sul coefficiente di correlazione R di Pearson