Блог им. Fox27

Парадокс двух конвертов и оптимальная финансовая стратегия

    • 18 июня 2012, 02:45
    • |
    • Fox27
  • Еще
Я бы стал бы публиковать этот пост, мне больше нравится наблюдать за дискуссией, но эта тема вызвала очень много откликов тем более она связана с рынком и я не удержался. По мотивам комментов...http://smart-lab.ru/blog/60902.php
Двое исследователей из Австралии нашли перспективный подход к 80-летней загадке, объяснение которой может иметь последствия для массы теоретических и прикладных областей: от наглядного понимания некоторых парадоксов термодинамики и оптимизации работы технических систем до улучшения электронных схем и составления победной стратегии игры на фондовом рынке.
Называется эта загадка «Парадокс (проблема) двух конвертов» (Two envelopes problem).  В различных вариациях и формулировках она известна математикам с 1930 года, хотя именно в облике двух конвертов была описана только в конце 1980-х.
Итак, играем. Вам предлагаются два конверта с деньгами (взвешивать, ощупывать и просвечивать их, понятно, нельзя). Вы знаете только, что в одном из них содержится сумма ровно вдвое большая, чем во втором, но в каком и какие именно суммы — совершенно неизвестно. Вам позволено открыть любой конверт на выбор и взглянуть на деньги в нём. После чего вы должны выбрать — взять себе этот конверт или обменять его на второй (уже не глядя).
Вопрос — как вам поступить, чтобы выиграть (то есть получить большую сумму денег)? Кажется, что шанс на выигрыш и проигрыш всегда одинаков (50%) вне зависимости от того, оставите ли вы себе открытый конверт или возьмёте вместо него второй. Ведь вероятность нахождения большей суммы в конверте A изначально такая же, как вероятность, что более внушительные деньги лежат в конверте B. И открытие одного из конвертов (A) ничего не говорит вам о том — видите вы наибольшую или наименьшую сумму из двух предложенных. Однако вычисление средней ожидаемой «стоимости» второго конверта говорит об ином.
В идеале конверты должны быть одинаковыми, дабы исключить отвлекающие от сути проблемы рассуждения игрока о том, в какой из двух конвертов ведущий захотел бы положить большую сумму, а в какой – меньшую
Допустим, вы увидели $10. Стало быть, в другом конверте лежат либо $5, либо $20 с вероятностью 50 х 50. По теории вероятности средневзвешенная сумма в конверте B равна: 0,5 х $5 + 0,5 х $20 = $12,5. Разумеется, открыв альтернативный конверт, вы увидите не эту сумму, а либо 20, либо 5 долларов, просто по условиям игры. Но 12,5 — такова (по вычислениям), как кажется, будет средняя сумма выигрыша на кон при проведении достаточно большого числа раундов, если вы всегда будете менять конверты.
И этот результат не зависит от первоначальной суммы денег. Ведь в разных раундах могут использоваться разные пары (10 и 20, 120 и 60, 20 и 40, 120 и 240 и так далее). То есть в общем виде, если в конверте А лежит сумма С, то статистически ожидаемая сумма в конверте B составит 0,5 х С/2 + 0,5 х 2С = 5/4 С.
Таким образом, теория говорит, всегда выгодно менять первоначальный свой выбор (12,5 больше 10), хотя в отдельных раундах вы будете проигрывать. Но против такого вывода восстаёт интуиция, которая просто кричит о принципиальном равенстве конвертов. Ведь поменяв их вы можете начать все рассуждения сначала (не открывая второй) и поменять снова.
На разрешение данного парадокса не один раз претендовали различные учёные. Более того, идут даже споры о том, как понимать — в чём тут заключается сам парадокс. Но математическое сообщество до сих пор не пришло к консенсусу, так что задача осталась открытой.
Теперь же свою разгадку (вернее, подход вплотную к её окончательному разрешению) и своё видение подводных камней данной проблемы предложили Марк Макдоннел (Mark McDonnell) из университета Южной Австралии (University of South Australia) и Дерек Эбботт (Derek Abbott) из университета Аделаиды (University of Adelaide). Не расставив ещё всех точек над i, эти исследователи, как они считают, поняли, в чём заключалась принципиальная ошибка предшественников.
Сам Дерек (ключевая фигура в данном деле) признаёт, что первый намёк на решение парадокса возник не у него, а у профессора из Стэнфорда Томаса Ковера (Thomas M. Cover), признанного специалиста по теории информации и статистике. В 2003 году Эбботт работал в Британии (кстати, на своей родине). И вот как-то, обедая вместе с Ковером, он обсуждал с ним загадку двух конвертов. Томас и предложил оригинальную стратегию выигрыша, превосходящую в эффективности даже правило «всегда меняй конверты».
 Парадокс двух конвертов и оптимальная финансовая стратегия
Томас Ковер занимается теорией информации 35 лет. Неудивительно, что некоторые противоинтуитивные, казалось бы, вещи становятся для него просто понятными и очевидными.
Заключается она в следующем. Нужно менять или не менять конверты в каждом заходе случайным образом, но с вероятностью, которая зависит от суммы, увиденной в первом конверте. То есть чем меньше сумма в конверте А, тем с большей вероятностью следует сменить конверт и наоборот, несколько большая сумма в А говорит о том, что скорее следует оставить первый конверт себе.
Тогда, в 2003-м, Дерек посчитал идею своего коллеги бредом и отказался продумывать такую стратегию. И учёного можно понять: рассудите сами, увиденная сумма не говорит человеку ровным счётом ничего о намерении, условно, ведущего (который раскладывает деньги), ведь игрок не знает — в каком вообще диапазоне играет его оппонент. Может быть, от 10 центов до 100 долларов, а может, от 5 долларов до ста миллионов. И увиденные, к примеру, однажды $25 равнозначно могут (в рамках всей партии) оказаться и сущей мелочью, и самой большой поставленной на кон суммой. И оттого неясно — стоит ли менять конверт в данном раунде игры или нет.
Однако, раскинув мозгами, Эбботт увидел за «стратегией Ковера» (так австралийские математики и назвали данный приём) глубокий философский и даже физический смысл. «Видимый парадокс возник потому, что нельзя избавиться от ощущения, что открытие конверта и наблюдение $10 на самом деле ещё не говорит вам ничего. И поэтому казалось странным, что ожидаемое значение вашего выигрыша в случае смены конверта составляет $12,5, — пояснил Эбботт. — Но мы объясняем этот казус с точки зрения нарушения симметрии. До открытия конвертов ситуация является симметричной, поэтому не имеет значения, будете вы менять потом конверт или нет. Однако после того как вы открываете конверт и используете стратегию Ковера, вы нарушаете симметрию (сразу после открытия конверта А оба конверта уже не равноценны), а затем обмен конвертов позволяет вам получить выгоду в долгосрочном плане (при большом числе заходов)».
Всё это напоминает ситуацию с «редукцией» кота Шрёдингера к одному из двух состояний (мёртв или жив), хотя до открытия коробки с ядом он находится в суперпозиции возможных состояний. Это проблема влияния наблюдателя на результат наблюдения. Чувствуете, что мы подбираемся к неким основам Природы?
Ныне свыше 20 миллионов компьютерных симуляций, проведённых Макдоннелом и Эбботтом, показали, что стратегия Ковера позволяет получить больше денег в игре с конвертами, чем простой обмен. А ещё, открыли австралийские учёные, предопределённый обмен, когда игрок выбирает альтернативный конверт только в том случае, если увиденная в первом сумма меньше заранее и наугад выбранного им самим (игроком) значения, тоже работает. И это так же противоинтуитивно, поскольку о минимальной планке «переключения» знает игрок, но не те, кто кладёт деньги в конверты.
Чтобы досконально понять, как это так получается, можно посмотреть статью авторов исследования в Proceedings of the Royal Society A. Для нас же важно общее объяснение тайны этой игры. И здесь нам потребуется обратиться к аналогиям из мира физики и не только.
Первая — «Броуновский храповик» (Brownian ratchet), придуманный знаменитым физиком Ричардом Фейнманом. Это мысленное устройство, являющее собой частный случай не менее знаменитого Демона Максвелла, отряжённого злостно нарушать второе начало термодинамики, то есть производить полезную работу без разности температур двух источников, а лишь за счёт внутренней (тепловой) энергии единственного объекта (сосуда с газом).

 
Устройство броуновского храповика
Устроен и действует фейнмановский храповик так. Имеются две камеры (ящика) с молекулами газа (они показаны красными кружками). Камеры соединяет миниатюрный вал (работающий без трения), на одном конце которого имеется колесо с лопастями (слева), а на противоположном — шестерёнка с храповым механизмом (справа). Между ними на валу — груз на верёвочке.
Парадокс двух конвертов и оптимальная финансовая стратегия
Храповик разрешает валу вертеться в одном направлении, но запрещает проворачиваться в другом. Броуновское движение молекул в левой камере приводит к хаотичным ударам их по лопастям, но поскольку двигаться лопасти могут только в одну сторону, эти удары постепенно сдвигают колесо, производя работу по поднятию груза за счёт только одной тепловой энергии молекул в первой камере.
«Хитрость с броуновским храповиком заключается в том, что он опять-таки использует идею разрушения симметрии», — говорит Эбботт. Данное устройство извлекает (вроде бы) полезную работу из броуновского движения, так же, как игрок «извлекает» повышение своего благосостояния из случайного обмена конвертов с нарушенной симметрией (по принципу Ковера). Неравноценная ситуация с вероятностями выигрыша и проигрыша в парадоксе конвертов — аналог храповика Фейнмана.
Правда, физически такой храповик не может существовать, даже если бы умелые нанотехнологи его смогли бы построить. Почему так — объяснил сам Фейнман. Защёлка храпового механизма должна быть сама достаточно небольшой, чтобы двигаться в ответ на удары отдельных молекул по лопастям «мельницы». А потому защёлка будет не менее хорошо колебаться и от собственного броуновского движения, время от времени раскрываясь и позволяя валу сдавать назад.
Фейнман высчитал, что если температуры (Т1 и Т2) в камерах равны — средняя сумма движений вперёд будет уравновешена средней суммой движений назад, так что сумма будет равна нулю. Если же T2 будет меньше Т1, то действительно можно было бы наблюдать движение данных колёс вперёд. Но в этом случае энергия будет добываться из градиента температур, в согласии с законами физики.
С деньгами всё несколько проще. Но броуновский храповик помогает нам понять принцип работы новой стратегии «обмана» envelopes problem. Ещё интереснее аналогия парадокса двух конвертов с другим математическим феноменом — парадоксом Паррондо (Parrondo’s paradox).
Парадокс двух конвертов и оптимальная финансовая стратегия
 
Дерек Эбботт считается ведущим исследователем парадокса Паррондо.
Звучит он так: «Взяв две (основанные на случае) игры, каждая из которых имеет более высокую вероятность проигрыша, чем победы, можно построить выигрышную стратегию, играя в эти игры поочерёдно».
Пример тут таков. Допустим, у нас есть начальный капитал. Далее мы пошагово прибавляем к нему $1 или вычитаем $1 в зависимости от результата бросания монеток (орёл-решка, угадали или нет). Но монетки не обычные, а ассиметричные, так что вероятность выпадения одной из сторон отлична от 50%.
Далее, у нас в игре с капиталом имеется на самом деле две игры — А и В. Причём в игре А используется монета 1 с вероятностью нашего выигрыша 0,5 — e, где е — чуть больше нуля. Понятно, что при большом числе бросков игра А — всегда проигрышна для нас.
В игре B имеются две (тоже несимметричные) монеты (2 и 3), существенно отличные по вероятности нашего выигрыша друг от друга: например (1/10) — е и (3/4) — е. Кроме того, заранее вводится наугад выбранное число М. И правило: если текущий капитал кратен М — в данном раунде бросаем монету 2, если не кратен — монету 3.
Всё тот же Эбботт ранее показал, что при М = 3 и е = 0,005 игра В — проигрышна так же, как и А. Ещё анализ говорит о том, что вероятность применения в очередном раунде «плохой» монеты округлённо составляет 0,6 против 0,4 для «хорошей», отсюда и проигрыш в сумме многих попыток. Но вот парадокс: чередование игр А и В позволяет нарастить капитал, несмотря на проигрышность обеих! Да, вовсе не любое чередование ведёт к победе. А только некоторые комбинации, к примеру, такая — ABBABB и так далее.
Для рассеивания иллюзии парадокса (а он таков только для наших поверхностных суждений, на деле же — закономерный итог теории вероятности, что показали модели с применением сложных принципов анализа) следует понимать, что в комбинации двух игр обе становятся связанными. Эту почти мистическую связь организует как раз число М. Ведь с его введением ход игры В начинает быть зависимым и от хода игры А. Если бы связи не было — любая комбинация игр всё равно приводила бы к проигрышу.
Тут и начинает брезжить свет в проблеме конвертов. Отдельные две игры с монетками являются проигрышными только при статистическом распределении результатов всех бросков партии, отличном от того, который формируется, когда объединяются эти две игры. Введение числа М и связи выбора монеты с капиталом (который, один-единственный, уменьшается и увеличивается как в игре А, так и в игре В) смещает вероятность распределения всех бросков в состояние, при котором появляется положительное ожидание (результата). А «конверты» и «Паррондо» — суть родственные парадоксы. Сам Дерек называет решение проблемы двух конвертов прорывом в области анализа парадокса Паррондо (имеющего массу проявлений в жизни). А главная ошибка ряда предшественников Дерека – высчитывание вероятности определённых событий с независимыми исходными переменными, которые независимыми на деле не являются.
И здесь пора перейти к третьей аналогии — из области финансов. «Volatility pumping» — «Накачка волатильности». Это не мифическая «золотая» программа для игры на бирже, но упрощённая модель, показывающая некоторые полезные особенности выигрышной стратегии игры с акциями (товарами, облигациями и прочим).
Понятно, что если игрок располагает информацией о приобретаемых финансовых инструментах (состояние компании, судебные дела против её менеджеров, урожай апельсинов в этом году или открытие нового месторождения нефти), он может составлять свой портфель осознанно. Но если ему не известно ничего, кроме текущей цены акции (или иного приобретения), и того, куда цена сейчас движется? Ни того, будет ли цена ещё падать, или позже начнётся рост? Ни того — является ли нынешняя цена максимальной, минимальной или позже будет огромный провал.
Как это похоже на выбор из двух конвертов: больше во втором сумма, чем та, что вы держите в руках, или меньше? «Насос волатильности» предполагает достаточно хаотичную куплю-продажу активов с небольшим лагом (купили дешевле — продали дороже), без всякого беспокойства о том, получили ли вы в данный момент самую большую выгоду от сделки или упустили шанс стать ещё богаче. И это очень похоже на случайную смену конвертов с некоторым «градиентом» в зависимости от величины наблюдаемой суммы (опять стратегия Ковера).
 Парадокс двух конвертов и оптимальная финансовая стратегия
Марк Макдоннел (на снимке), как и его напарник по исследованию Эбботт, полагает, что открытые в ходе «раскалывания» парадокса двух конвертов закономерности позволят многие любопытные процессы объяснить на единой математической основе, а это даст толчок к новым исследованиям в различных сферах – от математики и теории информации непосредственно до физики и техники
И это также похоже на принцип работы броуновского храповика. И этот же принцип схож с ситуацией, когда требуется улучшить работу технической системы при неполных данных об условиях её работы. «Вызывает удивление то, что наш анализ показывает — всегда можно увеличить полученный (в игре с конвертами) капитал, используя метод Ковера, ничего не зная о допустимом пределе суммы в раундах, равно как о статистическом распределении купюр по раундам», — говорит Дерек.
Но можно ли, допустим, применить следствие из парадокса Паррондо (или объяснения феномена конвертов) к фондовому рынку, то есть получить доход, комбинируя акции вроде игры АВВАВВ? Увы, парадокс требует, чтобы доходность по меньшей мере от одного инструмента зависела от величины текущего суммарного капитала (как выбор монеты от кратности уже выигранной суммы числу М), а это фикция. Или нет?
Умение разглядеть истинные связи между явлениями там, где связей, казалось бы, нет — очень ценное свойство учёного. Оно помогает объяснить процессы, выглядящие для поверхностного наблюдателя как невероятные. Так от пресловутой игры с двумя конвертами ниточка тянется ко множеству других областей, в которых проявляется взаимодействие объектов с асимметрией случайности, не важно, порождается ли такая асимметрия храповым механизмом, открытием конверта А или законами рынка.
 Материалы взяты с сайта: http://www.membrana.ru
  • Ключевые слова:
  • Bro
★13
7 комментариев
Спасибо, интересно. А мое решение, значит, неверное? странно, я думал что парадокс разрешаем, как и все парадоксы

У меня тоже возникла идея про кота Шредингера.
avatar
Из Вики

«Итак, исходное предположение парадокса (равновероятность Х/2 и 2Х) нереализуемо»

я за несколько часов пришел примерно к тому же выводу и далее
avatar
Sergei789, по идее первоначально они равновероятны пока не открываешь конверт и на основе этого не принимаешь решение менять конверт или нет. С точки зрения здавого смысла в этом и заключается парадокс. Вероятности не безусловные, а условные. В этом заключается коллизия. Интересно практическое применение этого эффекта для выработки оптимальной стратегии в том числе и на финансовом рынке. Поэтому это шутка и не посто пищя для ума, она имеет практический смысл один из примеров — универсальный портфель Корна. Кстати вот ссылка на работу авторов публикации Дерека Эбботта и Марка Макдоннела если с инглишом в порядке то:
rspa.royalsocietypublishing.org/content/early/2009/07/31/rspa.2009.0312.abstract в журнале Proceedings of the Royal Society A
avatar
Fox27, с вашей стороны было безжалостно эту тему поднимать в три часа ночи %) я и так голову несколько часов ломал, а уже спать хочется и нет сил головоломку решать :)

еще раз — спасибо — завтра с утра займусь этой задачкой и сопутствующими, с инглишем порядок, конечно
avatar
Sergei789, согласен тема эта очень серьезная и лучше на чистую голову. Утро вечера мудреней. Спокойной ночи.
avatar
Прочел комментарии и подумал про комментаторов: «И у этих людей я пытаюсь выиграть денег?»
avatar
Говно вопрос. Для трейдера. Если вы, поменяв конверт, можете вместо 10 баксов увидеть или 5 баксов или 20 баксов, это означает, что вы можете потенциально или потерять 5 баксов или приобрести 10 баксов. А запутка в то, что вроде бы и там и там — сумма отличается от первоначальной — в два раза. А в деньгах — на разные суммы.

Почему говно-вопрос для трейдера. Потому что первое, что мы понимаем, что, сложив счёт на 50%, нужно заработать 100%, чтобы его отбить.
И второе, что без наращивания позы по ходу движения лонг выгоднее, чем шорт. Так как без пирамидинга при движении в два раза заработать от лонга можно в два раза больше, чем от шорта.

теги блога Fox27

....все тэги



UPDONW
Новый дизайн