Блог им. Sergey_Sergaev

Для любителей статистического анализа (квартет Энскомба)

Статистика - это такой инструмент… Очень страшный в неумелых руках.
В умелых руках и того страшнее — способен разорвать мозг на куски.
Вот есть наборы данных (с двумя переменными x и y) I, II, III и IV, про которые известны следующие их свойства:
Для любителей статистического анализа (квартет Энскомба)
Квартет Энскомба — четыре набора числовых данных, у которых простые статистические свойства идентичны, но их графики существенно отличаются. Каждый набор состоит из 11 пар чисел. Квартет был составлен в 1973 году английским математиком Ф. Дж. Энскомбом.
Сами последовательности приведены ниже. Значение x одинаковы для первых трёх последовательностей.
Для любителей статистического анализа (квартет Энскомба)
 
А теперь смотрим на эти графики глазами:
Для любителей статистического анализа (квартет Энскомба)

Энскомб утверждал: Большинство статистических вычислений строятся на предположениях относительно поведения данных. Эти предположения могут оказаться неверными, и тогда результаты вычислений тоже будут содержать ошибку. Всегда следует пытаться проверять, являются ли предположения верными. А если они ошибочны, мы должны быть способны понять, что с ними не так. В этом весьма полезны графики.
 
Применение графиков для визуализации и изучения данных получило название разведочного анализа данных. Наибольшую известность он приобрел благодаря продвижению американским математиком Джоном Тьюки в книге Exploratory Data Analysis (Pearson), опубликованной в 1977 году. При правильном подходе графики помогают видеть более масштабную картину, а также отмечать очевидные или необычные закономерности.

★5
3 комментария
Отличный пост для вечера пятницы! 
avatar
где тут деньги?
avatar
какие милые оранжевые кругляши...




теги блога Сергей Сергаев

....все тэги



UPDONW
Новый дизайн