Квартет Энскомба

Квартет Энскомба — четыре набора числовых данных, у которых простые статистические свойства идентичны, но их графики существенно отличаются. Каждый набор состоит из 11 пар чисел. Квартет был составлен в 1973 году английским математиком Ф. Дж. Энскомбом для иллюстрации важности применения графиков для статистического анализа и влияния выбросов значений на свойства всего набора данных.

Все наборы обладают такими свойствами:

Характеристика Значение
Среднее значение переменной 9.0
Дисперсия переменной 10,0
Среднее значение переменной 7,5
Дисперсия переменной 3,75
Корреляция между переменными и 0,816
Прямая линейной регрессии
Коэффициент детерминации линейной регрессии 0,67

Сами последовательности приведены ниже. Значение одинаковы для первых трёх последовательностей.

Четыре набора данных имеют идентичные статистические характеристики, но их графики существенно различаются.
Квартет Энскомба
I II III IV
x y x y x y x y
10,08,0410,09,1410,07,468,06,58
8,06,958,08,148,06,778,05,76
13,07,5813,08,7413,012,748,07,71
9,08,819,08,779,07,118,08,84
11,08,3311,09,2611,07,818,08,47
14,09,9614,08,1014,08,848,07,04
6,07,246,06,136,06,088,05,25
4,04,264,03,104,05,3919,012,50
12,010,8412,09,1312,08,158,05,56
7,04,827,07,267,06,428,07,91
5,05,685,04,745,05,738,06,89

См. также

Ссылки

  • F.J. Anscombe, "Graphs in Statistical Analysis", American Statistician, 27 (February 1973), 17-21.
  • Tufte, Edward R. (2001). The Visual Display of Quantitative Information, 2nd Edition, Cheshire, CT: Graphics Press. ISBN 0961392142
  • Sangit Chatterjee and Aykut Firat (2007). «Generating Data with Identical Statistics but Dissimilar Graphics: A Follow up to the Anscombe Dataset», American Statistician, 61(3), 248—254. doi:10.1198/000313007X220057
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.