Che cos'è il bias di selezione del campione?
Il bias di selezione del campione è un tipo di bias causato dalla scelta di dati non casuali per l'analisi statistica. Il bias esiste a causa di un difetto nel processo di selezione del campione, in cui un sottoinsieme dei dati viene sistematicamente escluso a causa di un attributo particolare. L'esclusione del sottoinsieme può influenzare il significato statistico del test o produrre risultati distorti.
Comprensione del bias di selezione del campione
Il bias di sopravvivenza è un tipo comune di bias di selezione del campione. Ad esempio, quando si esegue il backtesting di una strategia di investimento su un ampio gruppo di azioni, può essere conveniente cercare titoli che contengono dati per l'intero periodo di campionamento. Se avessimo testato la strategia in base a dati sulle scorte per 15 anni, potremmo essere inclini a cercare scorte con informazioni complete per l'intero periodo di 15 anni. Tuttavia, l'eliminazione di uno stock che ha interrotto la negoziazione o che ha lasciato il mercato a breve, introdurrebbe un pregiudizio nel nostro campione di dati. Dal momento che includiamo solo titoli che sono durati per il periodo di 15 anni, i nostri risultati finali sarebbero imperfetti, poiché questi hanno funzionato abbastanza bene per sopravvivere sul mercato.
Gli indici di performance degli hedge fund sono un esempio di orientamento alla selezione del campione soggetto a orientamento alla sopravvivenza. Poiché gli hedge fund che non sopravvivono smettono di segnalare la propria performance agli aggregatori di indici, gli indici risultanti sono naturalmente inclini ai fondi e alle strategie che rimangono, quindi "sopravvivono". Questo può essere un problema anche con i servizi di rendicontazione di fondi comuni di investimento popolari.
Gli analisti possono adattarsi per tenere conto di questi pregiudizi, ma possono introdurre nel processo pregiudizi di notizie.
