Andrey Morozov
Andrey Morozov личный блог
11 июля 2016, 15:22

Закон малых чисел (интересный копипаст)

neveev.ru/Mind%20traps/cognitive%20biases/law%20of%20small%20numbers/
Александр Невеев кандидат психологических наук

     Термин «закон малых чисел» (law of small numbers), введенный в научный обиход нобелевским лауреатом и психологом Даниэлем Канеманом, как и исходный термин «закон больших чисел» (law of large numbers), условны, и их не стоит трактовать буквально.

Что же это за закон такой — закон малых чисел?

Чтобы ответить на этот вопрос, нам нужно ненадолго сосредоточиться на законе чисел больших.

А закон больших чисел, говоря предельно упрощенно, касается вот чего.

Допустим у нас есть огромный мешок с российскими монетами достоинством 1 рубль, 2 рубля, 5 рублей и 10 рублей. В мешке этих монет бесконечно много, причем монет каждого достоинства поровну. Предположим, что эти монеты не отличаются по размеру и весу. К мешку по очереди подходят люди и вынимают каждый по одной монете. Это происходит снова и снова: огромное количество людей получают свои монеты.

Наша задача — угадать, сколько денег получит каждый подошедший в среднем.

Закон больших чисел утверждает, что чем больше к мешку подойдет людей, тем больше среднее количество полученных ими денег будет приближаться к (1+2+5+10)/4=4,5 руб. т.е. к среднему арифметическому. И закон больших чисел, поверьте, истинен.

А вот закон малых чисел был бы истинным, если бы уже на основе подсчета среднего количества денег, полученных первыми несколькими людьми, мы получили бы результат 4,5 руб. А такой результат весьма маловероятен. Например, первые несколько человек вполне могут получить каждый по 10 рублей.

Таким образом, в отличие от закона больших чисел закон малых чисел ошибочен.

Напомню, что термины «закон больших чисел» и «закон малых чисел» — это условные термины, которые не стоит трактовать буквально.

Применительно к более реальным исследовательским задачам, чем приведенная выше условная задача с монетами, ошибочность закона малых чисел проявляется в том, что чемменьше выборка, тем менее точно она отражает свойства генеральной совокупности, т.е. темменее она репрезентативна. И наоборот: чем больше выборка, тем более точно она отражает свойства генеральной совокупности, т.е. тем в большей степени она репрезентативна (при условии рандомизации, естественно, но, как говорится, это уже совсем другая история). Соответственно, если человек делает выводы о генеральной совокупности по слишком малой выборке, то он как бы верит в закон малых чисел, как бы не понимает его ложности.

Вот еще одна пояснительная иллюстрация. Когда я учился в школе, в кабинете математики у нас висел, среди прочих, небольшой плакат, на котором было написано:

Статистика. Верно, когда много.

В принципе, хотя замысел автора плаката мне не известен, можно утверждать, что этот плакат как раз касался закона больших чисел и репрезентативности выборок...

Но нас интересует не сам по себе закон малых чисел, а то, как люди действуют (проводят исследования, формулируют выводы), если, условно говоря, верят в этот закон.

В этом смысле имеет место следующее. Вера в закон малых чисел (а такая вера, как правило, не осознается) порождает так называемое «скороспелое обобщение» (hasty generalization).  Скороспелым является такое обобщение, при котором человек на основании всего лишь нескольких своих наблюдений за определенными объектами или явлениями делает однозначный вывод о свойствах всех таких объектов или явлений. Например, у девушки было трое парней, и каждый из них оказался козлом, из этого девушка заключает, что вообще все мужчины козлы. Конечно, такой вывод неверен, лежащее в его основе обобщение — скороспелое, а девушка как бы верит в то, что троих мужчин достаточно, чтобы судить обо все мужчинах, т.е. верит в закон малых чисел.

Другими словами, человек, верящий в закон малых чисел, преувеличивает репрезентативность малой выборки. Именно поэтому, кстати, веру в закон малых чисел  Даниэль Канеман относил к эвристике репрезентативности.

Чтобы лучше понять ошибочность закона малых чисел давайте решим небольшую задачу.

На столе стоит корзина. В ней находятся шары, причем 2/3 шаров одного цвета и 1/3 шаров другого цвета. К корзине подошли два гинеколога: молодой и старый. Каждый из них засовывает в корзину руку и, не видя шаров, вынимает их из корзины.

Молодой гинеколог вытащил 5 шаров. Причем 4 из них оказались красными и один — белым.

Старый гинеколог вытащил 20 шаров, причем 12 из них оказались красными и 8 — белыми.

Кто из гинекологов — молодой или старый — может с большей уверенностью заявить, что в корзине 2/3 красных шаров и 1/3 белых, а не наоборот?

Обычно люди (причем независимо от их пола) выбирают молодого гинеколога. Рассуждают они примерно так: у молодого гинеколога 80% шаров (4/5*100%) оказались красными, а у старого — только 60% шаров (12/20*100%), значит более уверен должен быть молодой гинеколог. Но такое рассуждение ошибочно и является примером веры в закон малых чисел: человек считает, что выборка в 5 шаров может быть более репрезентативной, чем выборка в 20 шаров. А это, конечно, не так.

Вера в закон малых чисел и идущее с ней рука об руку скороспелое обобщение распространены достаточно широко.

Для начала давайте обратим внимание на то, что вера в закон малых чисел и скороспелое обобщение могут быть присущи психологам-исследователям, которые, хотя и обучены математико-статистическим методам, все равно, например, выводят закономерность, исследовав всего 30 испытуемых. (Да-да, исследования Д. Канемана показывают, что даже обученные статистике люди могут верить в закон малых чисел).

Присущи вера в закон малых чисел и скороспелое обобщение и психоаналитикам, которые считают, условно говоря, что семи пациенток было достаточно Фрейду для формулировки основных положений психоанализа.

Влияет закон малых чисел и на повседневные выводы, которые формулируются обывателями и присущи житейскому уровню познания. Например, в следующих утверждениях, относящихся к житейскому уровню познания, легко заметить скороспелые обобщение: все блондинки — глупы, все русские — алкоголики, все москвичи — зазнавшиеся и т.д. и т.п.

Еще один отличный пример бытовой, повседневной веры в закон малых чисел можно увидеть в отечественном кинофильме «Статский советник». Помните эпизод, в котором Пожарский, выражая восхищение даром Фандорина всегда выигрывать, предлагает ему сыграть в карты — угадывать, красная или черная масть будет у вытянутой из колоды карты? Когда два раза выпало черное, Фандорин снова говорит «черное», Пожарский не соглашается с ним («помилуйте, три раза „черное“?!.»), выбирает «красное» и проигрывает.

В данном случае Пожарский как бы верит в закон малых чисел, т.е. считает, что уже выборка всего лишь из трех карт продемонстрирует закон больших чисел, под действием которого возникает последовательность карт, в которой чередование красных и черных мастей является равномерным. Но такая последовательность возникнет только в достаточно множественной серии игр и тасовок, причем чем больше будет игр, тем больше будет равномерность. (Конечно, если пренебречь износом карт и особенностями тасовки).

Этот пример, кстати, иллюстрирует не только веру в закон малых чисел, но и один из видов когнитивных искажений (cognitive biases) под названием «ошибка азартного игрока» (gambler's fallasy).

Верит в закон малых чисел и игрок в «Дурака», который, видя, что у него на руках одни черные масти заявляет, что колода плохо перетасована.

И конечно, вера в  закон малых чисел и скороспелое обобщение лежат в основе всяческихлженаук и, в частности, различных лжепсихологий. Например, именно в режиме скороспелого обобщения сформулированы все соционические описания типов людей и соционических функций.

В заключение я бы хотел отметить, что вера в закон малых чисел — это всего лишь одно из множества когнитивных искажений (cognitive biases), присущих человеку. Причем в условиях научного исследования это искажение можно сравнительно легко скомпенсировать, применяя современные математико-статистические методы и надлежащим образом обеспечивая репрезентативность выборки.

ЛИТЕРАТУРА

Канеман Д., Словик П., Тверски А. Принятие решений в неопределенности: Правила и предубеждения. – Харьков: Издательство Институт прикладной психологии «Гуманитарный Центр», 2005. – 632 с.

 

17 Комментариев
  • Геннадий Кузнецов
    11 июля 2016, 15:47
    «На столе стоит корзина. В ней находятся шары, причем 2/3 шаров одного цвета и 1/3 шаров другого цвета. К корзине подошли два гинеколога: молодой и старый. Каждый из них засовывает в корзину руку и, не видя шаров, вынимает их из корзины.»

    Эксперимент будет более точен, если использовать не гинекологов, а ухогорлоносов.
    • Wasiliew Wasilij
      11 июля 2016, 15:57
      Геннадий Кузнецов, «у кого чего болит»…
  • sortarray sortarray
    11 июля 2016, 16:08
    То есть, можно сократить до: «чем больше выборка, тем она репрезентативней» Это Вы хотели сказать, или я что-то не понял(недочитал)? О чем вообще эта простыня?
  • Курсовик пишем?
  • DarkElf96
    11 июля 2016, 16:41
    Как можно судить о репрезентативности взяв для примера всего двух гинекологов???
  • прикольно что канеман вообще выдумал свою теорию, опросив три с половиной человека. да в жизни по отношениям с тремя мужчинами можно судить о мужчинах. в принципе по матери можно судить о всех женщинах))
  • AndreyLv
    11 июля 2016, 17:12
    Интересная и слабо изученная тема в современном мире. Но гораздо глубже отражена в трудах Нассима Талеба. Очень рекомендую к прочтению и неторопливому обдумыванию его книг — Одураченные случайностью, Черный лебедь и Антихрупкость.
  • К.О'Тяра
    11 июля 2016, 18:21
    а нафиг было заблуждению собственное имя давать? да еще 'закон'…
  • owl-ural
    11 июля 2016, 18:30


  • Сам себе Трейдер
    11 июля 2016, 23:48
    Закон малых чисел работает. 4 сделки в минус, ждем очередного слива.
  • mustafaev chingiz
    09 апреля 2022, 11:04
    «закон малых чисел» не работает в основном при однородности изучаемого процесса. если процесс неоднороден, то есть в нем присутствуют аномальные значения, то  по сути эти аномалии будут бифуркационными точками влияющими на весь процесс сразу, и в таком случае нет никакой необходимости в большой выборке, необходимо только найти эти самые аномалии и все.

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн