Блог им. asskorobogatov

"Средняя температура по больнице" – почему эта аналогия обычно хромает?

Аналогия полезна для понимания сущности вещей, скрытых за статистикой, когда используется по назначению. Но ею часто злоупотребляют, из-за чего она легко превращается в демагогический прием.

Несколько соображений по этому поводу.

Начнем со сферы ее полезного применения. Здесь проще всего отталкиваться от самого этого медицинского показателя. У него имеется всем известное значение, используемое как критерий здорового состояния, – 36.6. Отклонение от него в обе стороны говорит о проблемах со здоровьем. Этим объясняется нецелесообразность использования глобальных средних для этого показателя. Ведь больные могут быть с температурой и выше, и ниже нормы, и усреднение их температур легко может дать близкое к норме значение, введя в заблуждение о среднем состоянии здоровья пациентов больницы.

Даже если среднее отличается от уровня здоровья, оно все равно будет вводить в заблуждение, давая заниженную оценку температуры тех, у кого она высокая, за счет низких значений у больных с температурой ниже нормы. То же самое верно и в отношении последних, только наоборот.

Однако это не означает, что среднее вообще не годится как описательная статистика для температуры тела. Его вполне можно использовать, чтобы составить общее представление о состоянии тех больных, недуг которых порождает отклонение температуры от нормы в одну и ту же сторону. Напр., можно выделить в отдельную группу больных ГРИППом с повышенной температурой. Среднее для этой группы уже сгодится как статистика, дающая общую картину протекания болезни. Такое среднее можно будет сравнивать между больницами или между сезонами. Разница в средней температуре всех больных в двух больницах ни о чем не говорит, а та же разница в отношении лишь страдающих конкретной болезнью позволяет увидеть, в которой из больниц пациентам этой категории хуже.

Теперь можно перейти к экономическим показателям в том же контексте. Самый распространенный показатель экономического здоровья – уровень доходов. Его ключевое отличие от температуры тела в том, что здесь «много не бывает». Хотя к доходам и применяют пороговые значения типа прожиточного минимума, в этой случае нет нормы, такой, что отклонение от нее в обе стороны указывало бы на проблемы.

Поскольку в случае дохода обычно исходят из допущения «чем больше, тем лучше», то среднее вполне применимо как статистика, дающая общую картину благосостояния. И если разница в средней температуре между двумя больницами ничего не говорит о том, где состояние больных лучше, разница в средней зарплате персонала этих больниц позволяет судить о различии в благосостоянии между ними.

Когда ссылаются на «среднюю температуру» в контексте экономических показателей, нередко имеют в виду что-то правильное, но неудачно выраженное с помощью неподходящей аналогии. В случае доходов указывают на большой разброс, при котором большие средние значения могут выходить за счет сверхдоходов небольшой кучки богатых. Если, допустим, в коллективе из ста человек все получают по 10 тыс., кроме начальника, получающего миллион, средний доход выйдет ок. 20 тыс. Рядовой член коллектива, увидев эту цифру, может в ней усомниться, поскольку она вдвое выше зарплаты, которую получает он и его коллеги.

Вместо среднего можно использовать другой показатель благосостояния, лишенный этого изъяна, медиану – величину, которая делит выборку пополам. В нашем примере, ее значение будет равно 10 тыс., и оно как раз точно отразит уровень дохода, на который может рассчитывать рядовой член коллектива. Но у этого показателя имеются свои недостатки. Будучи хорош для характеристики середины, он ничего не говорит о том, что происходит на краях, а они тоже имеют значение.

Если с коллективом из примера выше мы сравним другой коллектив из ста человек, в котором все получают по 10 тыс., ни среднее, ни медиана не дадут полного представления о разнице в доходах между ними. Если отталкиваться от среднего, мы можем ошибочно подумать, что в первом коллективе получают вдвое больше, а если будем отталкиваться от медианы, то, опять же, ошибочно решим, что эти коллективы одинаково бесперспективны в плане потенциального роста доходов.

Но отсюда следует не бесполезность статистики, как некоторые заключают, а лишь недостаточность любого отдельно взятого показателя как характеристики благосостояния. Конкретный показатель – это штрих к портрету, но не сам портрет, для прорисовки которого требуется множество штрихов в совокупности.

Резюмирую: статистика как «худшая ложь» может выступать лишь в неумелых руках, но этим она не отличается от всех прочих сфер человеческой деятельности, будь то лечение людей, управление государством или игра на гитаре.

Мой Телеграм-канал
8 комментариев
есть еще модальный доход
avatar
Иван Иванов, поясните?
Александр Скоробогатов, края можно смотреть
  Но у этого показателя имеются свои недостатки. Будучи хорош для характеристики середины, он ничего не говорит о том, что происходит на краях, а они тоже имеют значение.
avatar
Кстати в больницах так и происходит, запрплата медсестры 30 т, а зарплата главврача 1 млн р.
avatar
Атласов Михаил, и не только в больницах.
Отличный текст, плюсую. 
Хомячкам, с чёрно-белым миром, не зайдет. 
avatar
Sergey_Sergeevich, спасибо на добром слове. Заходите еще :-)
Для расслоения доходов есть специальный коэффициент Джини, а Росстат каждые 2 года публикует статбюллетень с описанием распределения процентов работников по группам доходов в разных разрезах (регионы, отрасли...) — очень интересная и подробная штука.
avatar

теги блога Александр Скоробогатов

....все тэги



UPDONW
Новый дизайн