Che cos'è la multicollinearità?
La multicollinearità è il verificarsi di elevate intercorrelazioni tra variabili indipendenti in un modello di regressione multipla. La multicollinearità può portare a risultati distorti o fuorvianti quando un ricercatore o un analista tenta di determinare in che modo ciascuna variabile indipendente può essere utilizzata nel modo più efficace per prevedere o comprendere la variabile dipendente in un modello statistico. In generale, la multicollinearità può portare a intervalli di confidenza più ampi e valori di probabilità meno affidabili per le variabili indipendenti. Cioè, le inferenze statistiche da un modello con multicollinearità potrebbero non essere affidabili.
Comprensione della multicinearità
Gli analisti statistici utilizzano più modelli di regressione per prevedere il valore di una variabile dipendente specificata in base ai valori di due o più variabili indipendenti. La variabile dipendente viene talvolta definita variabile di risultato, obiettivo o criterio. Un esempio è un modello di regressione multivariata che tenta di anticipare i rendimenti azionari sulla base di elementi quali rapporti prezzo / utili, capitalizzazione di mercato, performance passate o altri dati. Il rendimento dello stock è la variabile dipendente e i vari bit di dati finanziari sono le variabili indipendenti.
Key Takeaways
- La multicollinearità è un concetto statistico in cui le variabili indipendenti in un modello sono correlate. La multicollinearità tra variabili indipendenti comporterà inferenze statistiche meno affidabili. È meglio utilizzare variabili indipendenti che non sono correlate o ripetitive quando si creano più modelli di regressione che utilizzano due o più variabili.
La multicollinearità in un modello di regressione multipla indica che le variabili indipendenti collineari sono in qualche modo correlate, sebbene la relazione possa essere o meno casuale. Ad esempio, le performance passate potrebbero essere correlate alla capitalizzazione di mercato, poiché le azioni che hanno ottenuto buoni risultati in passato avranno valori di mercato in aumento. In altre parole, la multicollinearità può esistere quando due variabili indipendenti sono altamente correlate. Può accadere anche se una variabile indipendente viene calcolata da altre variabili nel set di dati o se due variabili indipendenti forniscono risultati simili e ripetitivi.
Uno dei modi più comuni per eliminare il problema della multicollinearità è innanzitutto identificare variabili collineari indipendenti e quindi rimuovere tutte tranne una. È anche possibile eliminare la multicollinearità combinando due o più variabili collineari in una singola variabile. È quindi possibile condurre analisi statistiche per studiare la relazione tra la variabile dipendente specificata e solo una singola variabile indipendente.
Esempio di multicollinearità
Per gli investimenti, la multicollinearità è una considerazione comune quando si eseguono analisi tecniche per prevedere i probabili futuri movimenti dei prezzi di un titolo, come un titolo o un futuro di materie prime. Gli analisti di mercato vogliono evitare di utilizzare indicatori tecnici collineari in quanto basati su input molto simili o correlati; tendono a rivelare previsioni simili per quanto riguarda la variabile dipendente del movimento dei prezzi. Invece, l'analisi del mercato deve basarsi su variabili indipendenti marcatamente diverse per garantire che analizzino il mercato da diversi punti di vista analitici indipendenti.
Il noto analista tecnico John Bollinger, creatore dell'indicatore Bollinger Bands, osserva che "una regola cardinale per un uso efficace dell'analisi tecnica richiede di evitare la multicollinearità tra gli indicatori".
Per risolvere il problema, gli analisti evitano di utilizzare due o più indicatori tecnici dello stesso tipo. Al contrario, analizzano una sicurezza utilizzando un tipo di indicatore, come un indicatore di momentum, quindi eseguono analisi separate utilizzando un diverso tipo di indicatore, come un indicatore di tendenza.
Un esempio di un potenziale problema di multicollinearità è l'esecuzione di analisi tecniche utilizzando solo diversi indicatori simili, come lo stocastico, l'indice di forza relativa (RSI) e Williams% R, che sono tutti indicatori di momentum che si basano su input simili e probabilmente producono simili risultati. In questo caso, è meglio rimuovere tutti gli indicatori tranne uno o trovare un modo per unire alcuni di essi in un solo indicatore, aggiungendo anche un indicatore di tendenza che non è probabile che sia altamente correlato con l'indicatore del momento.
