Che cos'è una statistica Chi-quadrato?
Un chi-quadrato ( χ 2) la statistica è un test che misura il modo in cui le aspettative si confrontano con i dati effettivamente osservati (o i risultati del modello). I dati utilizzati nel calcolo di una statistica chi-quadro devono essere casuali, grezzi, reciprocamente esclusivi, estratti da variabili indipendenti e ricavati da un campione sufficientemente ampio. Ad esempio, i risultati del lancio di una moneta 100 volte soddisfano questi criteri.
I test del chi-quadro sono spesso utilizzati nel test delle ipotesi.
La formula per Chi-Square è
χc2 = ∑ (Oi − Ei) 2 Ovunque: c = gradi di libertàO = valore / i osservato / i E = valore / i atteso / i \ inizio {allineato} & \ chi ^ 2_c = \ sum \ frac {(O_i - E_i) ^ 2} {E_i} \ & \ textbf {dove:} \ & c = \ text {gradi di libertà} \ & O = \ text {valori osservati} \ & E = \ text {valori attesi } \ \ end {allineato} χc2 = ∑Ei (Oi −Ei) 2 dove: c = gradi di libertàO = valore / i osservato / i E = valore / i atteso / i
Cosa ti dice una statistica Chi-quadrato?
Esistono due tipi principali di test chi-quadrati: il test di indipendenza, che pone una domanda di relazione, come ad esempio "Esiste una relazione tra genere e punteggi SAT?"; e il test di bontà di adattamento, che chiede qualcosa del tipo "Se una moneta viene lanciata 100 volte, verrà fuori testa 50 volte e croce 50 volte?"
Per questi test, i gradi di libertà vengono utilizzati per determinare se una determinata ipotesi nulla può essere respinta in base al numero totale di variabili e campioni all'interno dell'esperimento.
Ad esempio, quando si considerano gli studenti e la scelta del corso, una dimensione del campione di 30 o 40 studenti non è probabilmente abbastanza grande da generare dati significativi. Ottenere gli stessi risultati o simili da uno studio utilizzando una dimensione del campione di 400 o 500 studenti è più valido.
In un altro esempio, considera di lanciare una moneta 100 volte. Il risultato atteso dal lancio di una moneta equa 100 volte è che le teste saliranno 50 volte e le code saliranno 50 volte. Il risultato reale potrebbe essere che la testa sale 45 volte e la coda sale 55 volte. La statistica chi-quadro mostra eventuali discrepanze tra i risultati attesi e quelli effettivi.
Esempio di test Chi-quadrato
Immagina che un sondaggio casuale sia stato condotto su 2000 diversi elettori, sia maschi che femmine. Le persone che hanno risposto sono state classificate in base al loro genere e se erano repubblicane, democratiche o indipendenti. Immagina una griglia con le colonne etichettate repubblicana, democratica e indipendente e due file etichettate maschio e femmina. Supponiamo che i dati dei 2000 intervistati siano i seguenti:
Il primo passo per calcolare la statistica chi quadrato è trovare le frequenze previste. Questi sono calcolati per ogni "cella" nella griglia. Poiché ci sono due categorie di genere e tre categorie di visione politica, ci sono sei frequenze totali previste. La formula per la frequenza prevista è:
E (r, c) = n (r) × c (r) nwhere: r = riga nella domanda c = colonna nella domanda n = totale corrispondente \ inizio {allineato} & E (r, c) = \ frac {n (r) volte c (r)} {n} \ & \ textbf {dove:} \ & r = \ text {riga in questione} \ & c = \ text {colonna in questione} \ & n = \ text {totale corrispondente} \ \ end {allineato} E (r, c) = nn (r) × c (r) dove: r = riga in questionc = colonna in questionn = totale corrispondente
In questo esempio, le frequenze previste sono:
- E (1, 1) = (900 x 800) / 2.000 = 360E (1, 2) = (900 x 800) / 2.000 = 360E (1, 3) = (200 x 800) / 2.000 = 80E (2, 1) = (900 x 1.200) / 2.000 = 540E (2, 2) = (900 x 1.200) / 2.000 = 540E (2, 3) = (200 x 1.200) / 2.000 = 120
Successivamente, vengono utilizzati i valori per calcolare la statistica chi quadrato utilizzando la seguente formula:
Chi-quadrato = ∑2E (r, c) dove: O (r, c) = dati osservati per la riga e la colonna specificate \ begin {allineato} & \ text {Chi-quadrato} = \ sum \ frac {^ 2} {E (r, c)} \ & \ textbf {dove:} \ & O (r, c) = \ text {dati osservati per la riga e la colonna specificate} \ \ end {align} Chi-squared = ∑E (r, c) 2 dove: O (r, c) = dati osservati per la riga e la colonna specificate
In questo esempio, l'espressione per ciascun valore osservato è:
- O (1, 1) = (400 - 360) 2/360 = 4.44O (1, 2) = (300 - 360) 2/360 = 10O (1, 3) = (100 - 80) 2/80 = 5O (2, 1) = (500-540) 2/540 = 2, 96O (2, 2) = (600-540) 2/540 = 6, 67O (2, 3) = (100-120) 2/120 = 3, 33
La statistica chi-quadrato equivale quindi alla somma di questi valori, o 32, 41. Possiamo quindi guardare una tabella statistica chi-quadrata per vedere, dati i gradi di libertà nel nostro set-up, se il risultato è statisticamente significativo o meno.
