Test t di Student¶
La Domanda¶
Hai due gruppi di dati (diciamo, le altezze delle piante trattate con il fertilizzante A contro quelle col fertilizzante B). La media del gruppo A è più alta. Ma è davvero più alta, o è solo fortuna casuale?
Se avessi migliaia di piante, potresti fidarti della media (grazie al Teorema del Limite Centrale). Ma non le hai. Hai 10 piante.
Come prendi una decisione quando il tuo campione è piccolo e non conosci la vera variabilità del mondo?
La Formula¶
Per un t-test a un campione (confrontare una media campionaria \(\bar{x}\) con un valore target \(\mu_0\)):
Per un t-test a due campioni indipendenti (confrontare due gruppi):
Una volta calcolato \(t\), lo cerchi in una tabella t (o chiedi a un computer) per trovare il p-value.
La Storia: Birra e Orzo¶
Questo test esiste grazie alla birra. Nello specifico, la Guinness.
Nei primi del 1900, William Sealy Gosset era un chimico alla Guinness a Dublino. Il suo lavoro era testare lotti di orzo per garantire la qualità della birra. Non poteva testare ogni singolo chicco (ci sarebbe voluto un'eternità e avrebbe distrutto la fornitura), quindi doveva affidarsi a piccoli campioni.
La statistica standard dell'epoca (usando la distribuzione normale / Z-test) assumeva di avere abbastanza dati da conoscere la vera deviazione standard (\(\sigma\)) perfettamente. Gosset non l'aveva. Usava la deviazione standard campionaria (\(s\)), che è essa stessa una stima e quindi soggetta a errore.
Notò che usare il normale Z-test su piccoli campioni portava a troppi "falsi positivi" — scartava lotti buoni o accettava lotti cattivi più spesso di quanto la matematica prevedesse. La curva normale era troppo stretta; non teneva conto dell'incertezza extra del non conoscere \(\sigma\).
Poiché la Guinness proibiva ai dipendenti di pubblicare segreti commerciali, Gosset pubblicò il suo lavoro sotto lo pseudonimo "Student". Da qui, "t-test di Student".
L'Intuizione¶
Segnale vs Rumore¶
La statistica t è semplicemente un Rapporto Segnale-Rumore.
- Segnale: La differenza tra la media del tuo campione e l'ipotesi nulla (\(\\bar{x} - \\mu_0\)). Quanto è "fuori" il tuo risultato?
- Rumore: L'Errore Standard (\(s / \sqrt{n}\)). Quanto ti aspetteresti che la media rimbalzi solo per caso?
Se \(t = 3\), significa che il tuo risultato è 3 volte più grande del rumore casuale previsto. È una prova forte. Se \(t = 0.5\), il tuo segnale è sepolto nel rumore.
Perché Non Usare Semplicemente Z?¶
La statistica Z sembra identica:
La differenza è nel denominatore. * Z-test: Usa \(\sigma\) (la Verità). Assume che tu conosca esattamente la dispersione della popolazione. * t-test: Usa \(s\) (una Stima).
Quando \(n\) è piccolo, \(s\) potrebbe essere molto diverso da \(\sigma\). Potrebbe essere molto più piccolo solo per fortuna. Se \(s\) è troppo piccolo, il denominatore è troppo piccolo, rendendo \(t\) enorme. Questo ti farebbe pensare di aver trovato un risultato significativo quando in realtà non è così.
La distribuzione t di Gosset corregge questo. È più "grassa" nelle code rispetto alla distribuzione normale. Questo significa che i valori estremi sono più comuni per caso, quindi hai bisogno di un valore t più grande per rimanere impressionato. Alza l'asticella per tenere conto della tua ignoranza su \(\sigma\).
Derivazione: La Logica¶
Non abbiamo bisogno di derivare l'intera PDF qui (vedi la pagina Distribuzione t di Student per quello), ma possiamo derivare la struttura della statistica del test.
- Standardizzare la Media: Sappiamo che la media campionaria \(\\bar{x}\) è approssimativamente normale (TLC):
Quindi possiamo convertirla in una variabile normale standard $Z$:
- Il Problema: Non conosciamo \(\sigma\). Sostituiamo \(s\).
-
Analizzare i Componenti: Questo \(t\) è in realtà un rapporto di due variabili casuali:
- Numeratore: Una variabile normale standard (\(Z\)).
- Denominatore: correlato alla distribuzione Chi-quadrato (poiché \(s^2\) è una somma di errori al quadrato).
Nello specifico, Gosset mostrò che:
Dove $Z$ è normale standard, $V$ è Chi-quadrato con $k$ gradi di libertà, e sono indipendenti.
- Il Risultato: Il rapporto tra una Normale e la radice quadrata di un Chi-quadrato segue la distribuzione t di Student. Questa distribuzione dipende da \(k\) (dimensione del campione - 1). Quando \(k \to \infty\), l'incertezza su \(s\) svanisce e la distribuzione t diventa la distribuzione Normale.
Errori Comuni¶
- Pensare che "t" stia per "Test": Non è così. Gosset originariamente la chiamò \(z\), poi la cambiò in \(t\). È solo il nome di una variabile.
- Ignorare le assunzioni: Il t-test assume che i tuoi dati siano distribuiti normalmente (o che il tuo campione sia abbastanza grande per il TLC). Se i tuoi dati sono fortemente asimmetrici e \(n=5\), il t-test dà risultati spazzatura.
- La trappola "p > 0.05": Un p-value alto non prova che i gruppi siano uguali. Significa solo che non avevi abbastanza dati per provare che sono diversi.
Concetti Correlati¶
- Distribuzione t di Student — La curva stessa.
- Errore Standard — Il denominatore del t-test.
- p-value — Come interpretiamo la statistica t.