Che cos'è l'intervallo di confidenza?
Un intervallo di confidenza, nelle statistiche, si riferisce alla probabilità che un parametro di popolazione cada tra due valori impostati per una determinata proporzione di volte. Gli intervalli di confidenza misurano il grado di incertezza o certezza in un metodo di campionamento. Un intervallo di confidenza può richiedere un numero qualsiasi di probabilità, con il più comune un livello di confidenza del 95% o 99%.
L' intervallo di confidenza e il livello di confidenza sono correlati ma non sono esattamente gli stessi.
Comprensione dell'intervallo di confidenza
Gli statistici utilizzano gli intervalli di confidenza per misurare l'incertezza. Ad esempio, un ricercatore seleziona casualmente campioni diversi dalla stessa popolazione e calcola un intervallo di confidenza per ciascun campione. I set di dati risultanti sono tutti diversi; alcuni intervalli includono il parametro popolazione reale e altri no.
Un intervallo di confidenza è un intervallo di valori che probabilmente conterrebbero un parametro di popolazione sconosciuto. Il livello di confidenza si riferisce alla percentuale di probabilità, o certezza, che l'intervallo di confidenza conterrebbe il parametro di popolazione reale quando si disegna un campione casuale più volte. O, in volgare, "Siamo certi al 99% ( livello di confidenza) che la maggior parte di questi set di dati (intervalli di confidenza) contengono il vero parametro di popolazione".
Key Takeaways
- Un intervallo di confidenza calcola la probabilità che un parametro di popolazione rientri tra due valori impostati. Gli intervalli di confidenza misurano il grado di incertezza o certezza in un metodo di campionamento. Nella maggior parte dei casi, gli intervalli di confidenza riflettono livelli di confidenza del 95% o del 99%.
Calcolo di un intervallo di confidenza
Supponiamo che un gruppo di ricercatori stia studiando le altezze dei giocatori di basket delle scuole superiori. I ricercatori prendono un campione casuale dalla popolazione e stabiliscono un'altezza media di 74 pollici. La media di 74 pollici è una stima puntuale della media della popolazione. Una stima puntuale di per sé è di utilità limitata perché non rivela l'incertezza associata alla stima; non hai una buona idea di quanto questa media del campione da 74 pollici potrebbe essere lontana dalla media della popolazione. Ciò che manca è il grado di incertezza in questo singolo campione.
Gli intervalli di confidenza forniscono più informazioni rispetto alle stime puntuali. Stabilendo un intervallo di confidenza al 95% usando la media e la deviazione standard del campione e ipotizzando una distribuzione normale come rappresentata dalla curva della campana, i ricercatori arrivano a un limite superiore e inferiore che contiene la media reale del 95% delle volte. Supponiamo che l'intervallo sia compreso tra 72 pollici e 76 pollici. Se i ricercatori prelevano 100 campioni casuali dalla popolazione dei giocatori di basket delle scuole superiori nel loro insieme, la media dovrebbe cadere tra 72 e 76 pollici in 95 di questi campioni.
Se i ricercatori desiderano una sicurezza ancora maggiore, possono estendere l'intervallo al 99% di confidenza. In questo modo invariabilmente si crea una gamma più ampia, in quanto fa spazio a un numero maggiore di mezzi campione. Se stabiliscono un intervallo di confidenza del 99% compreso tra 70 pollici e 78 pollici, possono aspettarsi che 99 su 100 campioni valutati contengano un valore medio tra questi numeri. Un livello di confidenza del 90% significa che ci aspetteremmo che il 90% delle stime dell'intervallo includa il parametro di popolazione. Allo stesso modo, un livello di confidenza del 99% significa che il 95% degli intervalli includerebbe il parametro.
Idee sbagliate comuni sull'intervallo di confidenza
Il più grande malinteso riguardo agli intervalli di confidenza è che rappresentano la percentuale di dati di un dato campione che rientra tra i limiti superiore e inferiore. Ad esempio, si potrebbe interpretare erroneamente il suddetto intervallo di confidenza del 99% da 70 a 78 pollici, indicando che il 99% dei dati in un campione casuale rientra tra questi numeri. Ciò non è corretto, sebbene esista un metodo separato di analisi statistica per effettuare tale determinazione. Ciò comporta l'identificazione della media e della deviazione standard del campione e la rappresentazione di queste cifre su una curva a campana.
