Винзоризованное среднее

Винсоризованное среднее представляет собой винсоризованную статистическую меру центральной тенденции как некую конволюцию среднего арифметического и усеченного среднего.

Расчет винсоризованного среднего сводится к тому, что k% наибольших и k% наименьших значений (обычно от 5% до 25%) заменяется наименьшими и наибольшими значениями из оставшегося массива данных, после чего рассчитывается среднее арифметическое.

Преимущества

Винсоризованное среднее менее чувствительна к "выбросам" (аутлайерам) чем простое среднее арифметическое при этом оставаясь приемлемой оценкой в ряде статистических моделей. Относится к разряду устойчивых (робастных) мер центральной тенденции.

Недостатки

Применимость винсоризованного среднего (как и усеченного среднего) весьма сомнительна в случаях с небольшим количеством наблюдений. Кроме того, замена одних значений другими не всегда содержательно обоснована.

Пример

Пусть имеется набор данных (отсортированных по возрастанию): 2, 3, 4, 5, 7, 9, 10, 12, 14, 30

Расчет 20% винсоризованного среднего в нашем примере предполагает перед вычислением среднего арифметического замену первых двух и последних двух значений в ряду данных (2, 3 и 14, 30): 4, 4, 4, 5, 7, 9, 10, 12, 12, 12.

После замены и расчета среднего результат = 7,9.

Ссылки

  • Wilcox, R.R.; Keselman, H.J. (2003). "Modern robust data analysis methods: Measures of central tendency". Psychological Methods 8 (3): 254–274. doi:10.1037/1082-989X.8.3.254.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.