Qual è la media Winsorized?
La media winsorized è un metodo di media che inizialmente sostituisce i valori più piccoli e più grandi con le osservazioni più vicine a loro. Questo viene fatto per limitare l'effetto di valori estremi anomali, o valori anomali, sul calcolo. Dopo aver sostituito i valori, viene quindi utilizzata la formula media aritmetica per calcolare la media vittorizzata.
La formula per la media Winsorized è
Media Winsorized = Nxn… xn + 1 + xn + 2… xn dove: n = Il numero di punti dati più grandi e più piccoli che devono essere sostituiti dall'osservazione
I mezzi peggiorati sono espressi in due modi. Una media vittorizzata "k n " si riferisce alla sostituzione delle osservazioni più piccole e più grandi di "k", dove "k" è un numero intero. Una media vincolata "X%" implica la sostituzione di una determinata percentuale di valori da entrambe le estremità dei dati.
Come calcolare la media Winsorized
La media vittorizzata viene calcolata sostituendo i punti dati più piccoli e più grandi, quindi sommando tutti i punti dati e dividendo la somma per il numero totale di punti dati.
Cosa ti dice la media malvagia?
La media vittorizzata è meno sensibile ai valori anomali perché può sostituirli con valori meno estremi. Cioè, è meno suscettibile ai contorni rispetto alla media. Tuttavia, se una distribuzione ha code grasse, l'effetto della rimozione dei valori più alti e più bassi nella distribuzione avrà poca influenza a causa dell'elevato numero di variabilità nelle cifre della distribuzione.
Key Takeaways
- Un metodo di calcolo della media che include la sostituzione dei valori più piccoli e più grandi con le osservazioni più vicine a loro. Meno sensibile ai valori anomali perché può sostituirli con valori meno estremi. È diverso dalla media ritagliata, che comporta la rimozione di punti dati, sebbene il risultato dei due tende ad essere vicino.
Esempio di come utilizzare la media Winsorized
Si può calcolare la media Worsorized per il seguente set di dati: 1, 5, 7, 8, 9, 10, 14. In questo esempio, supponiamo che la media Worsorized sia nel primo ordine, sostituiamo i valori più piccoli e più grandi con i loro osservazioni più vicine.
Il set di dati ora appare come segue: 5, 5, 7, 8, 9, 10, 10. Prendere una media aritmetica del nuovo set produce una media vittorizzata di 7, 7 o (5 + 5 + 7 + 8 + 9 + 10 + 10) diviso per 7.
Oppure considera una media vittorizzata del 20% che prende il 10% superiore e il 10% inferiore e li sostituisce con il prossimo valore più vicino. Vogliamo ridimensionare il seguente set di dati: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. I due i punti dati più piccoli e più grandi, o il 10%, saranno sostituiti con il loro prossimo valore più vicino. Pertanto, il nuovo set di dati è: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Il vincitore la media è 33.9 o il totale dei dati (678) diviso per il numero totale di punti dati (20).
La differenza tra media Winsorized e media troncata
La media vincolata include la modifica dei punti dati, mentre la media ritagliata comporta la rimozione di punti dati. È comune che la media vittorizzata e la media tagliata siano vicine.
Limitazioni dell'utilizzo della media Winsorized
Un importante svantaggio per i mezzi vincolati è che introducono distorsioni nel set di dati. Concesso, il set di dati è idealmente meno distorto dopo la modifica rispetto a se fossero rimasti degli outlier.
Ulteriori informazioni sulla media Winsorized
Per informazioni correlate, sulle differenze tra i calcoli della media chiave.
