Критерий Граббса

Критерий Граббса — статистический тест, используемый для определения выбросов в одномерном наборе данных, подчиняющихся нормальному закону распределения. Был предложен в 1950 году Франком Граббсом[1].

Определение

Критерий Граббса основан на предположении о нормальном распределении. Таким образом, перед расчётом критерия Граббса необходимо проверить данные на нормальное распределение[2].

Критерий Граббса определяет один выброс за одну итерацию. Этот выброс исключается из набора данных и тест повторяется до тех пор, пока не будут обнаружены все выбросы. Тем не менее, множественные итерации изменяют вероятность определения и критерий не следует применять при 3 или менее значениях, так как в такой ситуации часто большинство точек оказываются идентифицированы как выбросы.

Критерий Граббса определён для гипотез:

H0: В наборе данных нет выбросов
Ha: В наборе данных присутствует как минимум один выброс

Критерий Граббса рассчитывается как:

где и означают выборочное среднее и среднеквадратичное отклонение соответственно. Значение критерия Граббса показывает максимальное абсолютное отклонение от выборочного среднего в единицах среднеквадратичного отклонения.

Этот способ расчёта относится к двусторонней версии теста. Критерий Граббса также может быть определён как односторонний тест. Для определения того, является ли минимальное значение выбросом, рассчитывается критерий:

где Ymin означает минимальное значение. Для определения того, является ли максимальное значение выбросом, рассчитывается критерий:

где Ymax означает максимальное значение.

Для двустороннего теста гипотеза об отсутствии выбросов отклоняется с уровнем значимости α, если:

где tα/(2N),N−2 означает максимальное критическое значение распределения Стьюдента с N − 2 степенями свободы и уровнем значимости α/(2N). Для одностороннего критерия α/(2N) следует заменить на α/N.

Сопутствующие методики

Некоторые статистические графики могут и должны использоваться для определения выбросов. Простой график выполняемой последовательности, диаграмма размаха или гистограмма отображают очевидные выбросы. График нормального распределения также может быть полезен.

См. также

Примечания

  1. Grubbs, Frank E. Sample criteria for testing outlying observations (неопр.) // Annals of Mathematical Statistics. — 1950. Т. 21, № 1. С. 27—58. doi:10.1214/aoms/1177729885. (англ.)
  2. Engineering and Statistics Handbook, paragraph 1.3.5.17, http://www.itl.nist.gov/div898/handbook/eda/section3/eda35h.htm (англ.)

Ссылки

  • Grubbs, Frank. Procedures for Detecting Outlying Observations in Samples (англ.) // Technometrics : journal. — Technometrics, Vol. 11, No. 1, 1969. — February (vol. 11, no. 1). P. 1—21. doi:10.2307/1266761. — . (англ.)
  • Stefansky, W. Rejecting Outliers in Factorial Designs (англ.) // Technometrics : journal. — Technometrics, Vol. 14, No. 2, 1972. Vol. 14, no. 2. P. 469—479. doi:10.2307/1267436. — . (англ.)
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.