Che cos'è l'omoschedastico?
L'omoschedastico (anche scritto "omoscedastico") si riferisce a una condizione in cui la varianza del termine residuo, o termine di errore, in un modello di regressione è costante. Cioè, il termine di errore non varia molto al variare del valore della variabile predittore. Tuttavia, la mancanza di omoschedasticità potrebbe suggerire che il modello di regressione potrebbe dover includere ulteriori variabili predittive per spiegare le prestazioni della variabile dipendente.
Key Takeaways
- L'omoschedasticità si verifica quando la varianza del termine di errore in un modello di regressione è costante. Se la varianza del termine di errore è omoschedastica, il modello era ben definito. Se c'è troppa varianza, il modello potrebbe non essere definito bene. L'aggiunta di ulteriori variabili predittive può aiutare a spiegare le prestazioni della variabile dipendente. Al contrario, l'eteroschedasticità si verifica quando la varianza del termine di errore non è costante.
Come funziona l'omoschedastico
L'omoschedasticità è un presupposto della modellizzazione della regressione lineare. Se la varianza degli errori attorno alla linea di regressione varia molto, il modello di regressione potrebbe essere mal definito. L'opposto dell'omoschedasticità è l'eteroschedasticità proprio come l'opposto di "omogeneo" è "eterogeneo". L'eteroschedasticità (anche detta "eteroscedasticità") si riferisce a una condizione in cui la varianza del termine di errore in un'equazione di regressione non è costante.
Quando si considera che la varianza è la differenza misurata tra il risultato previsto e il risultato effettivo di una determinata situazione, determinare l'omoschedasticità può aiutare a determinare quali fattori devono essere regolati per la precisione.
considerazioni speciali
Un semplice modello di regressione, o equazione, è costituito da quattro termini. Sul lato sinistro è la variabile dipendente. Rappresenta il fenomeno che il modello cerca di "spiegare". Sul lato destro sono presenti una costante, una variabile predittiva e un termine residuo o errore. Il termine di errore indica la quantità di variabilità nella variabile dipendente che non è spiegata dalla variabile predittore.
Esempio di omoschedastico
Ad esempio, supponiamo che tu voglia spiegare i punteggi dei test degli studenti utilizzando la quantità di tempo che ciascuno studente ha trascorso a studiare. In questo caso, i punteggi del test sarebbero la variabile dipendente e il tempo trascorso a studiare sarebbe la variabile predittore.
Il termine di errore mostrerebbe la quantità di varianza nei punteggi dei test che non è stata spiegata dalla quantità di tempo studiata. Se tale varianza è uniforme o omoschedastica, ciò suggerirebbe che il modello potrebbe essere una spiegazione adeguata per le prestazioni del test, spiegandolo in termini di tempo trascorso a studiare.
Ma la varianza può essere eteroschedastica. Un diagramma dei dati del termine di errore può mostrare che una grande quantità di tempo di studio corrispondeva molto da vicino a punteggi di test elevati ma che i punteggi dei test di tempi di studio bassi variavano ampiamente e includevano persino punteggi molto alti. Quindi la varianza dei punteggi non sarebbe ben spiegata semplicemente da una variabile predittore: la quantità di tempo studiata. In questo caso, probabilmente è in atto qualche altro fattore e potrebbe essere necessario migliorare il modello per identificarlo. Ulteriori indagini potrebbero rivelare che alcuni studenti avevano visto le risposte al test in anticipo o che avevano precedentemente svolto un test simile e quindi non avevano bisogno di studiare per questo particolare test.
Per migliorare il modello di regressione, il ricercatore dovrebbe quindi aggiungere un'altra variabile esplicativa che indichi se uno studente aveva visto le risposte prima del test. Il modello di regressione avrebbe quindi due variabili esplicative: il tempo di studio e se lo studente aveva una conoscenza preliminare delle risposte. Con queste due variabili, si spiegherebbe più della varianza dei punteggi dei test e la varianza del termine di errore potrebbe quindi essere omoschedastica, suggerendo che il modello era ben definito.
