12 Distribuzioni di Probabilità (prima parte)

Table of Contents

Distribuzione di probabilità

Una DISTRIBUZIONE DI PROBABILITÀ è definita da tutti i possibili risultati di un esperimento e le corrispondenti probabilità

Distribuzione binomiale

Quando ciascun evento semplice può avere soltanto due possibili risultati mutuamente escludentisi (per es. testa o croce; vero o falso; ecc.) dalla loro combinazione (ripetendo le prove) si ottengono eventi composti indipendenti ai quali è possibile associare la probabilità del loro verificarsi.

La distribuzione teorica di probabilità assume una forma ben precisa che si chiama BINOMIALE con equazione:

con:

  • p(k) = probabilità associata a kk eventi favorevoli in nn prove
  • nn = numero delle prove
  • k = numero degli eventi favorevoli (successi) che va da 0 a n
  • pp = probabilità associata al successo, singolo evento
  • qq = probabilità associata all’insuccesso
  • (nk)\binom{n}{k} = coefficiente binomiale

dove n! è n fattoriale, ovvero il prodotto degli interi positivi da n a 1. Per il calcolo, occorre moltiplicare nnn per tutti i numeri interi che lo precedono:

Esempio

Se a k si fanno assumere tutti i valori da 0 a n, allora le probabilità associate sono

Per esempio se a k si fanno assumere tutti i valori da 0 a 10, allora le probabilità associate sono

La somma di tutte le probabilità ottenute con 0 <= k <= 10 è uguale a 1. Inoltre le probabilità così calcolate definiscono una distribuzione di probabilità binomiale che ha la caratteristica di essere discreta e simmetrica (intorno al valore massimo).

Le distribuzioni binomiali sono già tabulate, cioè vengono fornite le probabilità di verificarsi di evento/i per determinati p e n.

Vediamo alcune proprietà

  • Se p = q = 0.50 la distribuzione è simmetrica
  • Se p ≠ q ≠ 0.50 la distribuzione è asimmetrica:
    • Se p < 0.50 è asimmetrica positiva.
    • Se p > 0.50 è asimmetrica negativa.

Aumentando n (il numero delle prove) la distribuzione tende alla simmetria qualsiasi sia p ≠ 0.50.

Esempio

Un test è composto da 10 domande con risposta vero/falso/non so. Quali sono le probabilità associate ai possibili risultati? Quindi ho

  • n = 10 eventi possibili.
  • k = 0 … 10 eventi favorevoli.
  • n−k = 0 … 10 eventi non favorevoli.
  • p=1/3 probabilità di successo.
  • q=2/3 probabilità di insuccesso.

Se a k si fanno assumere tutti i valori da 0 a 10 si calcolano le relative probabilità:

La somma di tutte le probabilità al variare di k da 0 a 10 è uguale a 1.

Relazione tra binomiale e normale

Facciamo l’esempio del lancio della moneta. k = “risultato testa” con
p = .05. Aumentando i lanci abbiamo che la distribuzione assume una forma simmetrica

Distribuzione binomiale proprietà

La distribuzione di probabilità binomiale ha una media, una varianza e una devianza standard:

  • μ=np (media )
  • σ2=npq (varianza)
  • σ (deviazione standard)

Faciamo qualche esempio

Distribuzione normale (Ripetizione ????)

La distribuzione normale è importante poichè molti dei fenomi che si possono studiare si assimilano alla normale, tendono ad avere una forma normale. La distribuzione normale è rappresentata da una curva continua a forma di campana (gaussiana).

È definita dalla seguente equazione

Soddisfa le seguenti caratteristiche:

  • INFINITA: va da -∞ a +∞
  • SIMMETRICA rispetto alla YY massima (f(x)f(x) punto più alto se x=μx = \mu)
  • UNIMODALE: (μ=Mo=Me\mu = Mo = Me) media moda e mediana si equivalgono
  • ASINTOTICA: si avvicina all’asse delle XX senza mai toccarlo, se non ai valori di ascissa -∞ e +∞ che non sono rappresentabili.
  • CRESCENTE per -∞ < xx < μ\mu e DECRESCENTE per μ\mu < xx < +∞ → due punti di flesso a ± σ\sigma da μ\mu.

La curva normale è interamente definita dai parametri μ\mu (media) e σ\sigma (deviazione standard). Di seguito qualche esempio di famiglia di distribuzioni normali con medie e deviazioni standard diverse.

Inoltre sappiamo anche che qualsiasi siano i parametri μ\mu e σ\sigma, l’area sottesa dall’intera curva è = 1. Il valore 1 è un simbolo che rappresenta il fatto che sotto la curva si trova il 100% degli individui (frequenze) rappresentati dalla variabile.

La porzione di curva delimitata dalla media (come ascissa) e un’ordinata espressa in termini di deviazioni standard è costante:

  • μ+3σ\mu + 3\sigma = 49.86% della distribuzione
  • μ+σ\mu + \sigma = 34.13% della distribuzione
  • μ+2σ\mu + 2\sigma = 47.73% della distribuzione

Conoscendo μ\mu e σ\sigma, possiamo stimare f(x)f(x) e l’area compresa tra due qualsiasi valori di xx.

Poiché la curva è simmetrica, l’area compresa tra -∞ e μ\mu è uguale a 0.50 come quella compresa tra μ\mu e +∞. In altre parole, sopra la media ci sono il 50% dei casi, come sotto la media.

Qualunque siano i valori di μ\mu e σ\sigma, l’area corrispondente a intervalli definiti è sempre la stessa → Porzioni della distribuzione compresse tra ± 1, 2, 3 σ\sigma da μ\mu (in %).

L’uso pratico di questa distribuzione è rappresentata dall’utilizzo della distribuzione normale stardardizzata. In pratica si tratta di convertire i punteggi di x in punteggi z.

E attraverso le tavole Z possiamo andare a conoscere determinate aree riferiti a specifici valori Z.