Test F (F-Test)¶

La Domanda¶

Hai due macchine che producono viti. La macchina A sembra costante. La macchina B sembra andare un po' ovunque. Come provi che la macchina B è significativamente più variabile della macchina A?

Oppure, stai conducendo un esperimento con 3 gruppi diversi (A, B, C). Vuoi sapere se uno qualsiasi di essi è diverso. Potresti fare t-test per A vs B, B vs C, A vs C... ma questo aumenta la probabilità di un falso allarme. Come li testi tutti in una volta?

La risposta a entrambe le domande è confrontare le varianze.

La Formula¶

La statistica F è semplicemente un rapporto tra due varianze:

\[ F = \frac{\text{Varianza 1}}{\text{Varianza 2}} = \frac{s_1^2}{s_2^2} \]

Nel contesto dell'ANOVA (Analisi della Varianza):

\[ F = \frac{\text{Varianza Tra i Gruppi}}{\text{Varianza All'Interno dei Gruppi}} \]

La Storia: Fisher e l'Agricoltura¶

Il test F prende il nome da Sir Ronald A. Fisher, il padre della statistica moderna (la "F" sta per Fisher). Negli anni '20, lavorava alla Stazione Sperimentale di Rothamsted, analizzando dati agricoli.

Aveva a che fare con dati sui raccolti molto disordinati. Alcuni campi ricevevano il fertilizzante A, altri il B, altri il C. Voleva sapere se il fertilizzante contava. Ma i raccolti variano naturalmente (sole, pioggia, qualità del suolo).

Fisher capì che poteva scomporre la variazione totale in due parti: 1. Variazione Spiegata: Le differenze causate dal fertilizzante (Tra i Gruppi). 2. Variazione Non Spiegata: Il rumore casuale all'interno di ogni campo (All'Interno dei Gruppi).

Se la parte "Spiegata" era molto più grande della parte "Non Spiegata", il fertilizzante funzionava. Aveva bisogno di un modo per confrontare queste due fonti di variazione. Da qui, il rapporto F.

L'Intuizione¶

La Battaglia delle Varianze¶

Pensa al test F come a un incontro di wrestling tra due fonti di rumore.

Sopra (Numeratore): La varianza che ti interessa (es. la differenza tra i tuoi trattamenti).
Sotto (Denominatore): La varianza di cui non ti importa (errore casuale, rumore di fondo).

Se \(F = 1\), significa che i tuoi trattamenti non aggiungono più variazione di quella che ti aspetteresti dal rumore casuale. Se \(F = 10\), significa che la variazione tra i tuoi gruppi è 10 volte più grande del rumore di fondo. Sta succedendo qualcosa.

Perché i Quadrati?¶

Perché dividiamo le varianze (\(s^2\)) e non le deviazioni standard (\(s\))? Perché le varianze hanno bellissime proprietà matematiche. Le varianze sono additive (per variabili indipendenti). Le deviazioni standard no. Fisher costruì il suo intero sistema (ANOVA) sull'idea che puoi sommare le fonti di varianza per ottenere la varianza totale.

Derivazione: Rapporto di Chi-Quadrato¶

La distribuzione F nasce naturalmente quando dividi una variabile Chi-quadrato per un'altra.

La Varianza è Chi-Quadrato: Ricorda che la varianza campionaria \(s^2\) è legata alla distribuzione Chi-quadrato (\(\chi^2\)):

\[ s^2 \sim \frac{\chi^2}{df} \]

(Parlando in generale. Tecnicamente $(n-1)s^2/\sigma^2 \sim \chi^2$).

Il Rapporto: Se abbiamo due campioni indipendenti con varianze \(s_1^2\) e \(s_2^2\), e assumiamo che le varianze della popolazione siano uguali (\(\sigma_1^2 = \sigma_2^2\)), allora il loro rapporto è:

\[ F = \frac{s_1^2}{s_2^2} \]

Poiché ogni $s^2$ è una variabile Chi-quadrato "scalata", la statistica F è:

\[ F = \frac{\chi_1^2 / df_1}{\chi_2^2 / df_2} \]

La Distribuzione F: Questo rapporto specifico — un Chi-quadrato diviso per i suoi gradi di libertà, su un altro Chi-quadrato diviso per i suoi gradi di libertà — definisce la distribuzione F. Ha due parametri: gradi di libertà per il numeratore (\(df_1\)) e gradi di libertà per il denominatore (\(df_2\)).

Errori Comuni¶

Coda Singola vs Doppia Coda: I test F nell'ANOVA sono quasi sempre a coda singola. Ci interessa solo se il numeratore è più grande del denominatore. Se il numeratore è più piccolo (\(F < 1\)), di solito non ci interessa (significa che il trattamento ha fatto meno del rumore casuale, il che è semplicemente... nessun effetto).
Assumere la Normalità: Come il t-test, il test F assume che i dati sottostanti seguano una distribuzione normale. È in realtà piuttosto sensibile agli outlier (non normalità).
Confondere F con R-quadro: Nella regressione, F ti dice se l'intero modello è significativo. \(R^2\) ti dice quanta varianza è spiegata. Sono correlati, ma rispondono a domande diverse.

Concetti Correlati¶

Distribuzione Chi-Quadrato — Il mattone fondamentale del test F.
ANOVA — L'applicazione principale del test F.
Varianza — Cosa stiamo confrontando.