04 Tabelle di frequenza e rappresentazioni grafiche

Table of Contents

Le tabelle di frequenza

Le tabelle di frequenza consentono di raccogliere i dati derivanti dal calcolo delle distribuzioni di frequenza. Possono essere:

  • TABELLE SEMPLICI
  • TABELLE A DOPPIA ENTRATA O DI CONTINGENZA
  • TABELLE A ENTRATA MULTIPLA

Tabelle semplici

Nelle tabelle semplici i dati sono classificati secondo una singola variabile.

Ad esempio, potremmo essere interessati a raggruppare i partecipanti in funzione di diverse fasce di età.

Otterremo dunque una tabella che riporta le modalità assunte dalla variabile X=età e la relativa distribuzione di frequenza

Tabelle a doppia entrata o di contigenza

Questa viene usata nello studio congiunto di due variabili. I valori sono raggruppati in classi. Ci interessa analizzare come si distribuiscono le frequenze (esempio come il titolo di studio è distribuito in funzione del genere).

A questo scopo occorre costruire la tabella di classificazione a doppia entrata, o tabella di contingenza, composta da

  • r righe (sono le categorie o classi della prima variabile)
  • c colonne (sono le categorie o classi della seconda variabile).

All’interno di questa tabella, in ogni cella si trova il valore detto frequenza interne.

Le frequenze totali

  • sommando i valori per riga sono detti frequenze marginali per riga
  • sommando i valori in colonna sono detti frequenze marginali per colonna

Esempio:

Ho 10 partecipanti (5 maschi e 5 femmine) (prima variabile = GENERE con due categorie M e F), l’opinione circa il divieto di vendere alcolici in discoteca, classificata in FAVOREVOLE, CONTRARIO, NON SO (seconda variabile = OPINIONE con tre categorie FA, CO, NS).

Avremmo dunque il seguente file dati:

Per vedere come si distribuiscono le opinioni secondo il genere si costruisce una tabella a doppia entrata (2 righe × 3 colonne), dove per riga si mettono le categorie della variabile GENERE (M e F) e per colonna le categorie della variabile OPINIONE (FA, CO e NS).

Nelle 6 celle della tabella si inseriscono le frequenze interne f₁, f₂, f₃, f₄, f₅, f₆

Otteniamo quindi

Indicando con n₁ e n₂ le frequenze marginali per riga, con m₁, m₂, m₃ le frequenze marginali per colonna, e con N il totale generale, possiamo controllare che i «conti» tornino.

l risultato finale è la tabella di contingenza o a doppia entrata:

Naturalmente, è possibile costruire l’analoga tabella (3 × 2), sempre composta da 6 celle, invertendo righe e colonne.

In alcuni casi, le tabelle a doppia entrata consentono di risalire a frequenze ignote (cioè, numero di partecipanti in una data classe) partendo da altre frequenze già note.

Esempio: Supponiamo di voler studiare come si distribuiscono 140 donne intervistate mettendo in relazione

  • TITOLO DI STUDIO (3 categorie: A = licenza media; B = diploma; C = laurea)
  • OCCUPAZIONE (2 categorie: casalinghe, lavoratrici).

Sappiamo che, delle 140 donne, 85 sono casalinghe, di cui 40 con titolo di studio A e 25 con titolo di studio B. Tra le lavoratrici 30 sono laureate. Sappiamo inoltre che il totale di donne con titolo di studio B è 40.

Attraverso queste informazioni siamo in grado di costruire la nostra tabella di contingenza (2 × 3).

Attraverso semplici operazioni algebriche, risulta facile andare a completare la tabella inserendo le frequenze mancanti.

In una tabella a doppia entrata, la frequenza interna di ogni cella può essere trasformata in frequenza percentuale per riga, per colonna o totale. La trasformazione da frequenza assoluta (f) a frequenza percentuale (f%) è:

f% = (f × 100) / n

Esempio: prendiamo come esempio la tabella precedente 2 × 3 (occupazione per titolo di studio)

Possiamo calcolare le frequenze percentuali per riga, ottenendo la percentuale di laureate, diplomate e con licenza media tra casalinghe (n = 85), lavoratrici (n = 55) e sul totale del campione (n = 140).

Possiamo anche calcolare le frequenze percentuali per colonna,

Infine possiamo calcolare le frequenze percentuali sul totale

Tabelle a entrata multipla

In questo caso i dati sono classificati secondo 3 o più variabili. Le frequenze sono calcolate tenendo presente delle molteplici combinazioni delle modalità delle variabili.

Per esempio aggiungendo il genere (Uomini e donne) all’esempio “Titolo di studio” per occupazione, otterremmo una tabella 3x2x2.

Le rappresentazioni grafiche

Le distribuzioni di frequenza possono essere rappresentate graficamente in vari modi.

Istogramma

L’ISTOGRAMMA è una rappresentazione grafica su due assi cartesiani nella quale si riportano le frequenze in colonne affiancate.

Per quanto riguarda le ORDINATE, posso avere:

  • Variabili continue con classi di uguale ampiezza: allora
    ordinata = frequenze → frequenze direttamente proporzionali all’altezza dell’istogramma.
  • Variabili continue con classi di ampiezza diversa: allora
    ordinata ≠ frequenze → è necessario calcolare l’altezza del rettangolo attraverso la formula: ordinata = frequenza / ampiezza.

Di seguito esempio con variabile continua e classi di ampiezza unitaria.

Nel caso in cui invece ho una variabile continua con classi di ampiezza diversa allora:

  • Ascissa: valori della variabile raggruppati in classi di ampiezza diversa. Questa è la base del rettangolo. In soldoni è l’ampiezza della classe.
  • Ordinata: altezza di ciascun rettangolo ottenuta con la formula frequenza/ampiezza (f/a)
  • La frequenza è uguale all’area del rettangolo.

Nel caso di VARIABILI NOMINALI sull’asse delle ASCISSE vengono riportate le MODALITÀ che la variabile può assumere.

Le basi dei rettangoli dell’istogramma sono per convenzione di UGUALE AMPIEZZA E NON ADIACENTI. Per quanto riguarda l’asse delle ORDINATE, avremo dunque le FREQUENZE.

Diagramma a torta

Permette di rappresentare le frequenze in termini percentuali. Quindi abbiamo

Si ottiene il seguente diagramma a torta

Poligono di frequenza

Il poligono di frequenza è una rappresentazione grafica su due assi cartesiani di una linea spezzata che rappresenta l’andamento delle frequenze.

Sull’asse delle ascisse si riporta il valore medio di ciascuna classe (cioè il limite reale superiore meno il limite reale inferiore, diviso 2)

Sull’asse delle ordinate si riportano le frequenze.

e questo è il grafico

Ogiva

L’ogiva permette di ottenere una rappresentazione grafica delle frequenze cumulate.

Sull’asse delle ascisse si riporta i valori assunti da una variabile, generalmente continua

Sull’asse delle ordinate si riportano le frequenze cumulate.

Poniamo il caso di aver misurato i punteggi ottenuti su un test di abilità verbali di 26 bambini di un asilo nido. Otteniamo la seguente distribuzione di frequenze.