Блог им. MrVincent

Ответы на задачу Монти Холла

Итак, комрады.

прочитал все ваши ответы.
очень удивился, что на 2ую задачу были вполне здравые мысли, а вот на первую, очень простую, так и не увидел.
Итак задача 1. 
У нас есть 100000 бросков кости и мы хотим прикинуть сколько выпадет каждой грани. Ответы — «каждая грань выпадет с такой то вероятностью»  правильны с точки зрения математики,  скучны и неинтересны, так как большинство людей не смогут их интерпретировать правильно, как показывается практика. 
Самый частый ответ такой — «100000/6 в среднем».    Люди слабо представляют, что такое «среднее» или мат.ожидание. И вот почему. Согласно закону больших чисел, результат стремится  к среднему только на очень больших числах экспериментов. Что такое большое число? 100000 это много? Для людей да, но в окружающем мире большие числа это миллиарды и триллионы. Поэтому, число выпадений каждой грани совсем не будет равным на 100000.  Кроме того, игральная кость это физический объект, следовательно у неё есть погрешности. Скорей всего, какая то грань окажется тяжелее и будет падать чаще, кроме того, влияют и влажность и температура и множество других факторов, которые вносят возмущение в нашу идеальную модель задачи. На таком количестве бросков всё еще возможно существенное расхождение от среднего.  Задачка была взята из книги " Игра случая. Математика и философия совпадения". Автор Дзожеф Мазур. Там куча других задач посложнее, так что рекомендую.

Задача 2.
Все вы, конечно в курсе Парадкса Монти Холла, тысячи роликов на Youtube. Но нас интересует реальный случай.
Я тоже как и вы свято верил что нужно менять дверь.  Вот что пишет профессор Герд Гигеренцер в книге "Понимая риски. Как выбрать правильный курс".

Неопределенность: будет ли изменение первоначального выбора двери наилучшим решением в реальном игровом шоу?
Задача Монти Холла, сформулированная Мэрилин Савант и другими исследователями, имеет отношение к миру риска, а не к миру неопределенности. Теория вероятностей дает наилучший ответ, только когда правила игры четко определены, когда все альтернативные варианты, последствия и вероятности известны или могут быть рассчитаны. Так будет ли изменение первоначального варианта выбора наилучшим решением в реальном игровом шоу?
И тут встает очень важный вопрос: всегда ли Монти предоставлял своим гостям возможность поменять начальный выбор? (Об этом обстоятельстве не упоминалось в исходной задаче Мэрилин, но здесь речь идет о другом.) Например, если бы Монти был по натуре вредным человеком, он мог бы делать такое предложение, только когда участники выбирали дверь, за которой стоял главный приз. Изменение первоначального выбора означало бы, что участники гарантированно получат козу, что позволило бы NBC сохранить «кадиллак» для следующей передачи. Но предоставлял ли Монти каждому участнику возможность изменить свой выбор?
Барри Нейлбаф одним из первых написал о задаче Монти Холла. Он вспоминал, что видел, как Монти предлагал изменять выбор. Но он не мог вспомнить, «действительно ли Монти предоставлял такую возможность каждый раз, и вообще было ли его предложение связано с тем, правильно ли участник выбрал дверь или нет». Кэрол Эндрюс, многолетняя помощница Монти, напротив, утверждала, что Монти никогда не предоставлял участникам возможность изменить первоначальный выбор. Сам Монти Холл вспоминал, что он редко это предлагал, и не мог вспомнить, как часто его предложение принималось. О том, что происходило в действительности, мы можем никогда не узнать. Из-за судебной тяжбы по поводу прав на передачу немногие записи остаются доступными широкой публике.
Источником неопределенности является не только несовершенная память Монти и его коллег. Реальное игровое шоу непосредственно зависело от характера Монти Холла, который время от времени принимал спонтанные решения, а не строго следовал заданному сценарию. Другими словами, интрига в игре поддерживалась неуверенностью участников в мотивах действий ведущего, и эта интрига исчезла бы, если бы в каждой передаче он действовал по одним и тем же правилам. «Где написано, что я должен позволять вам менять ваш выбор каждый раз? В этом шоу я сам себе хозяин». Монти дал ясно понять, что правила, подразумеваемые задачей Монти Холла, неприменимы лично к нему. «Если ведущий обязан каждый раз открывать дверь и предлагать вам изменить ваш выбор, то вы вынуждены принимать решение. Но если он имеет право предлагать или не предлагать вам такую возможность, то берегитесь. Caveat emptor. Все зависит от настроения ведущего».
Останется ли наилучшее решение в условиях известного риска наилучшим в реальном шоу? Как объяснял сам Монти, оно может оказаться наихудшим. Однажды, после того как один участник выбрал дверь 1, Монти открыл дверь 3, за которой была коза. В то время как участник размышлял над предложением отказаться от начального выбора и выбрать дверь 2, Монти предложил ему 3 тыс. долларов наличными за то, что тот сохранит свой первоначальный выбор.
«Я бы изменил свой выбор», – настаивал участник.
«Три тысячи долларов, – повторил Монти Холл. – Наличными. Живыми деньгами. Там может быть машина, но там может быть и коза. Четыре тысячи».
Участник устоял и перед этим искушением: «Я хочу выбрать дверь 2».
«Четыре тысячи пятьсот. Четыре тысячи семьсот. Четыре тысячи восемьсот. Мое последнее предложение: пять тысяч долларов».
«Давайте откроем дверь», – настаивал участник, вновь отвергая предложение Монти.
«Тогда вы получаете козу, – сказал Монти Холл, открывая дверь. Затем он воскликнул: – Теперь вы видите, что случилось! Чем больше денег я предлагал, тем сильнее вы были уверены в том, что за дверью 2 находится машина. Я хотел убедить вас отказаться от начального выбора, так как знал, что машина стоит за дверью 1. Я делаю такие штуки, когда имею возможность контролировать ход игры».
В реальной игре знания одной теории вероятности недостаточно. Необходима также хорошая интуиция, обрести которую бывает труднее, чем выполнить расчеты. Один из способов уменьшить неопределенность заключается в том, чтобы больше полагаться на простые практические правила. Например, правило минимакса гласит:
Выбирайте альтернативный вариант, исключающий получение худшего результата.
Получить в итоге козу и добровольно отказаться от денег – это худший из всех результатов. Он возможен только в том случае, если участник изменит свой выбор. Поэтому правило минимакса советует брать деньги и держаться первоначального выбора двери 1. Оно называется так потому, что нацелено на минимизацию ваших потерь в случае реализации максимально неблагополучного сценария (в данном случае открывания двери, за которой стоит коза). Это простое правило обезопасило бы участника от психологических инсинуаций Монти и позволило бы получить деньги – и машину в придачу.
Интуитивные правила не защищают от случайных ошибок, но от них не защищают и расчеты. Второй способ уменьшить неопределенность состоит в том, чтобы разгадать мотивацию Монти. А это довольно трудно сделать, особенно когда нервничающий участник стоит в свете прожекторов перед телекамерой. Этот способ требует умения поставить себя на место ведущего. Монти, по-видимому, предлагал менять начальный выбор, так как знал, что участник выбрал дверь, за которой стоит машина. Психологический анализ ситуации поможет вам сохранить верность начальному выбору двери, как и применение правила минимакса. Фактически сам Монти предлагал версию минимакса: «Если вы сможете убедить меня предложить вам 5 тыс. долларов за то, чтобы не открывать дверь, забирайте деньги и ступайте домой».

Размышляя в неопределенном мире об известных рисках, вы можете получить козу
Задача Монти Холла иллюстрирует три темы, затрагиваемые в этой книге: как понимать риск, как иметь дело с неопределенностью и, что самое важное, как не путать эти два понятия. Многие люди недооценивают свои шансы на выигрыш в задаче Монти. Однако существует простое средство решить эту проблему: надо преобразовать вероятности в естественную частоту, чтобы увидеть, какой вариант действий является наилучшим. Эта частота называется «естественной», потому что отражает способ получения информации людьми и животными на протяжении своей истории – до изобретения книг и теории вероятности. И тогда станет легче размышлять. Не менее важное значение имеет различие между миром риска (задача Монти Холла) и миром неопределенности (реальная телепередача «Давайте заключим сделку»). Действие лучшее в мире риска не обязательно будет лучшим в реальном игровом шоу. В реальной жизненной ситуации применение теории вероятностей к неопределенному миру может оставить вас с козой – еще один вариант иллюзорной убежденности индюка в том, что риски могут быть рассчитаны.
Тем не менее в большинстве статей, посвященных задаче Монти Холла, различие между риском и неопределенностью практически полностью игнорируется.



★2
15 комментариев
Вы явно не знаете, что делает прикладная  статистика. Если выпадет половина шестерок, значит либо  кость «кривая», либо бросали «криво». Вот какой вывод сделает нормальная  статистика.  Потому что если этого не было, то при равновероятном бросании правильной кости вероятность выпадения половины шестерок 6*10^-12777. Извините, но возраст вселенной в секундах гораздо меньше.
avatar
А. Г., вы совершенно правы, в правильной не может, а в казино может, например если кость примагничевается по нажатию кнопки в казино, бывало и  такое. А к «правильным» вещам мы только стремимся. Половина, это конечно много. 10% расхождение от среднего было бы менее заметно. Пример был показательный, чтобы сопоставить реальность и моделирование. А по  поводу возраста вселенной, Джоан Гинтер выйграла 4 раза крупные суммы в лотерею, 5.4 -2- 3-10млн всего около 20.4 млн$ за 18 лет. Каковы шансы  у одного человека на такую удачу?
avatar
Vincent Demidoff, ход мыслей правильный

Просто Вам надо было написать бросаем 6 раз. Ну или бросаем 100 раз.
При 100000 бросках уже очень много чего нивелируется.

С уважением
avatar
Мальчик Buybuy,  смотря как «бросать». Например, бросили 10 раз, выпала 1 шестёрка, на следующих 10-ти, 1 раз бросаем и если не 6, то 9 раз  с помощью «невидимой руки» делаем шестёрку. И так для любой триады цифр для 20 «бросаний». Точно получим половину шестерок на любом числе испытаний кратном 20. В том то и дело, что изучение моделей нам нужно, чтобы делать объективные выводы о случайности, стоящей за наблюдениями. И как следствие для решения задачи оптимального поведения, потому что при известном законе случайности последняя задача решается тривиально. 
avatar
Vincent Demidoff, для нее персонально — практически 0

Однако, если лотерея проводится раз в неделю (а реально раз в неделю разыгрывается несколько выпусков) на протяжении 18 лет, и в нее играют, скажем, 20,000,000 человек, то шанс появления четырехкратного призера вполне себе неплохой.

Встречный вопрос (на интуицию): в классе учится 30 человек. Какова вероятность, что 2 из них родились в один день одного месяца? (возможно, разного года)

С уважением
avatar
Мальчик Buybuy, >50%, это задачка от дне рождения, тоже известная.
avatar
Vincent Demidoff, ага

Это сейчас она известная. А когда мне ее в 8-м классе задали — я весь вечер над ней просидел… И калькуляторов тогда удобных не было, чтобы просто посчитать...

С уважением

P.S. Там критическое число (для 50%) — 26 человек вроде. На 30 точно больше будет.
avatar
Vincent Demidoff,  по поводу удачи надо знать как она играла. А что касается матстатистики, основой которой является теория вероятностей, то одной из двух главных её задач как раз и является различение гипотез относительно случайности, стоящей за наблюдениями. А если мы не знаем, что получится при разных гипотезах, то как можем различить?  Я давал Вам ссылку прошлый раз про баночки и шарик, где наглядно показано как отличить один из двух способов обретения шариком цвета по результатам игры. Хотя сами наблюдения это только зелёные и красные шарики, т. е. одно и то же.
avatar
Задачу не назвали бы парадоксом, если бы ее решение было однозначным и нечувствительным к несущественному изменению начальных условий.

Пусть ведущий может молчать и говорить (предлагать сменить дверь). Право сменить дверь у игрока никто не отнимает. Очевидно, что оптимальная стратегия для игрока остается прежней.

Теперь рассмотрим варианты:
1. Ведущий открывает дверь и предлагает игроку сменить дверь, если он выбрал дверь с призом. В противном случае молчит. Действуя по оптимальной стратегии, игрок всегда проиграет.
2. Ведущий открывает дверь и предлагает игроку сменить дверь, если он выбрал дверь без приза. В противном случае молчит. Действуя по оптимальной стратегии, игрок всегда выиграет.

Допустим, игрок знает, что ведущий может как молчать, так и говорить.
Ведущий открывает дверь и молчит. Какова оптимальная стратегия у игрока? Каково матожидание выигрыша?

Поскольку мы не знаем, какая стратегия у ведущего, вероятность 1/2, а дверь можно и не менять.

Дальше — хуже. Ведущий открывает пустую дверь и предлагает игроку сменить выбор. Поскольку мы не знаем, какая стратегия у ведущего, вероятность 1/2, а дверь можно и не менять.

Вопрос — как полнота лексикона ведущего может повлиять на стратегию игрока?
В этом и парадокс.
Фраза «ведущий убеждает игрока сменить выбор» не имеет смысла вне понимания стратегии ведущего.
avatar
А вот в «парадоксе Монти-Холла» случайности нет, потому что тот, кто расставлял машину и коз за двери, мог дать точный прогноз. А это противоречит определению случайности.
avatar
Потроллим? Потроллим.
Вопросы.
1. Сколько лет даст судья ведущему за незаконный отлов снежной козы, находящейся за дверью?
2. Какой налог заплатит игрок за машину — 13 или 40 процентов?
3. Стоит ли битая девятка пяти тысяч долларов?
4. Сколько платят остальным участникам шоу? Всем одинаково? Почасовая оплата или фиксированная?
5. Транслируется ли шоу по телевизору? Каждый день одно и то же? Проводится на (в) Украине?
6. Какое время затратит исследователь на проведение 100000 бросков кости с фиксацией результатов и их последующей обработкой? А сколько ему заплатят за эксперимент?
> Правильный ответ: на таком количестве бросков всё еще возможно существенное расхождение от среднего. Вполне может выпасть половина шестерек. Такой результат вполне вероятен.

Правильный ответ — на 100 ТЫСЯЧАХ бросков вероятность значительных отклонений выпадения стороны от 1/6 мизерная. Вероятность же того, что какая-то из сторон выпадет половину раз из 100 тысяч — непредставимо мала, уходя за много сигм нормального распределения.
avatar
Ив Ив, верно.Половина это конечно, чушь. Вероятность значительных отклонений выпадения стороны от 1/6 мизерная только в компьютерных симуляторах, где посторонних факторов нет совсем. В реальности, сто тысяч не такое большое число чтобы приближаться к идеальной модели распределения. Закон больших чисел тут не работает и кроме того, присутствует огромное количество посторонних факторов физического мира, которые еще и со временем будут меняться. Поэтому отклонения будут случаться, и не мизерные. И если на компьютере такая вероятность 1 к 27 септиллионам, то в реальности гораздо выше. А для проверки вам нужно провести такой эксперимент — сделать замеры 100т бросков огромное количество раз в разных местах.
avatar
ничему школоту счас не учат… гуманитарии накуй с рынка
avatar

теги блога Vincent Demidoff

....все тэги



UPDONW