Блог им. Elwood

Теория Игр, дилемма заключенного и куда их пришить...

    • 24 ноября 2023, 14:26
    • |
    • spebe
  • Еще
    Вот прям так конкретно, с результатом в виде точки входа))) — никак. Теория игр это, несмотря на заявленную миссию в виде «количественной оценки действий других игроков путем непрерывного взвешивания вариантов их выбора», все же, больше о том, чтобы поговорить. Она расскажет нам о том, как должны или могут, по идее, действовать наши контрагенты, но никак не гарантирует, что именно так они себя и поведут. И, значит, владение теорией никак не устраняет неопределeнности, в которой действует трейдер. И, значит, ему потребуются добавочные усилия и знания из других областей и, по-прежнему — твердость и дисциплина в применении таких знаний и умений.

    Помните «Дилемму заключенного» из Теории Игр? «Чтобы помнить, нужно знать»,- скажут некоторые. И то верно.

    Если вкратце, то она сводится к следующему: предать или сотрудничать. Такой существует выбор у двух заключенных, обвиняемых в тяжком преступлении и помещенных для допроса в разные камеры. Каждому из них предлагается донести на подельника. О показаниях друг друга они не знают. Результат этого доноса зависит от того, донес или не донес другой подельник: освобождение из заключения 0, маленький срок -1, средний срок -5 и большой срок -10. Комбинация вариантов их поведения дает следующую так называемую матрицу выигрышей: 

Теория Игр, дилемма заключенного и куда их пришить...



    Если сознаются оба, то получают по одинаковому сроку 5 лет, если оба молчат, то получают по году, если один доносит, а второй молчит, то тот, кто донес, идет на свободу, а тот, кто молчал, получает 10 лет.

    Если предположить, что их не связывают дружеские или родственные узы, и нет никаких предварительных договоренностей о том, как себя вести в СИЗО, то каждому из них есть над чем подумать перед допросом. Если процесс раздумья дело для них привычное, то они должны были бы прийти к одной и той же стратегии — “предать”. Эта стратегия рациональна в том смысле, что стратегия подельника, как бы тот ни решил, не может ухудшить их ситуацию, а только улучшить (если, вдруг, подельник решит молчать). Хотя для обоих, как для группы, оптимальным вариантом было бы отрицать вину, т.к. в таком случае группа получает два года на двоих. Получить оптимальный результат мешает им неопределенность и невозможность кооперировать.

Эх, хорошо бы заранее знать, что сказал подельник! Учтем ваши пожелания)))

    “Что-то мне подсказывает, что сейчас за трейдинг пойдет разговор”, — подумал читатель. Точно!))) В то время как долгосрочные тренды являются следствием глобальных экономических процессов, краткосрочная ценовая динамика самых разных активов является иллюстрацией описываемой дилеммы. Образование зон поддержки и сопротивления, зарождение и развитие трендов на малых ТФ, волнообразное изменение цен, описываемое волновыми принципами Эллиотта, есть отражение того факта, что трейдинг есть некооперативная игра, в которой участники принимают рациональные решения, не приводящие, как в дилемме заключенного, к оптимальному для них результату.

    Возьмем, к примеру, одну из распространенных стратегий торговли — войти в сделку на выходе цены из некого диапазона (который интерпретируется как область накопления/распределения). Если, в простейшем случае, уровень ограничения убытка очевиден (другая граница диапазона), то что касается прибыли, перед игроками всегда стоит вопрос — сколько высиживать позицию. Ответ на него зависит от того, как поведет себя другой игрок, использующий ту же стратегию. Ведь если он решит зафиксировать прибыль сразу как только цена покинет диапазон, то он или затормозит цену, или, хуже того, двинет ее туда, где первый игрок уже окажется в убыточной зоне. Точно также рассуждает и первый игрок. И поскольку оба они не уверены в планах другого, то рациональной стратегией для них будет зафиксировать прибыль, точно как в дилемме заключенного. Причинив себе тем самым ущерб, которого они могли бы избежать, если бы стали кооперировать. Очевидно, что в их интересах — отпустить цену как можно дальше от границы диапазона.

    Перепишем матрицу выигрышей для теперь уже „дилеммы трэйдера“ 
Теория Игр, дилемма заключенного и куда их пришить...



    Если оба решают не препятствовать движению цены, они потенциально могут получить большую прибыль (+10), если оба решат зафиксить — то не получат ничего или даже небольшой минус, с учетом комиссии и проскальзывания, если предположить фиксинг по рынку. Если одни фиксит, а другой нет, то фиксирующий получает небольшую прибыль (+1), а второй вынужден сидеть до конца розыгрыша, который может закончится тем, что цену затащут на уровень стопа (-10). Если игроков больше чем два (а у нас их сильно больше чем два), то неопределенность только увеличивается, а возможность кооперации стремится к нулю. И в таком случае доминирующая стратегия у игроков должна быть «предать». Из чего следует, что играть выход из диапазона сразу после пробития его границы, который мы назовем «основная стратегия» (подчеркиваю — в простейшем случае) — не лучший вариант.

    Можно ли как-нибудь улучшить стратегию — эту и многие другие? Что если дать возможность подельнику сделать ход первым… Если он предаст, то и ты предай. Если он выберет сотрудничать, то ты предай. Вот, казалось бы, и решение. Он получает 10 лет, а ты на свободе. И эта идея — дать игрокам сделать первый ход — не такая уж и сложная, чтобы не прийти в голову многим и многим игрокам, которые точно также будут ждать, чем кончится авантюра их конкурентов. Для последних худшим сценарием будет уход цены за противоположную границу диапазона, где их ждут стопы, а их конкурентов — возможность войти в сделку в противоположную сторону. Такая стратегия известна, как «торговля ложного пробоя». Но дело во том, что в силу несложности такой стратегии, у нее будет и есть много сторонников, что делает ее очередной «основной стратегией» с вытекающими отсюда проблемами и все той же дилеммой — предать или сотрудничать.

    Трудно не заметить, что почти все диапазоны не имеют ровных краев.

Теория Игр, дилемма заключенного и куда их пришить...


    И трудно не понять, что является тому причиной — базовая стратегия в условиях некооперативных игр с нулевой суммой «предать».

    Чтобы воспользоваться описанной выше, весьма логичной на первом этапе, тактикой торговли, нужно для начала воздерживаться от сделок в, скажем так, «ключевых ситуациях". Одну из ключевых ситуаций я только что описал. Таких ситуаций еще дюжина. Представляю читателю самому решить, что это за ключевые ситуации. Наверняка, некоторые читатели, если не торгуют рандомно, хорошо себе представляют, что это за ситуации, потому что они являются частью их торговых решений. А вот на втором этапе нужно понимать, как устроены по своей сути (а не по внешнему виду), как я их называю, “спекулятивные циклы”. Волновые Принципы Эллиотта — есть частный случай таких циклов. Проблема в том, что эти принципы представлены именно в виде постулатов, начиная с последовательноси 1-2-3-4-5 A-B-C, и кончая пропорциями волн. Гораздо большую пользу можно извлечь из понимания того, какие механизмы лежат в основе формирования таких последовательностей. То есть, сформулировать общую идею, лежащую в основе частного, описанного Эллиоттом, случая. В следующей статье я сформулирую эту общую идею.
★7
39 комментариев
я бы проверил зеркальную задачу… т.е задачу противоположную дилемме заключенного… но мне лениво
avatar
ves2010, А как мне то было лениво писать статью — пару месяцев откладывал)))

И все же, интересно, как выглядит постановка зеркальной задачи?
avatar
spebe, чарт гпт пишет 

Да, у дилеммы заключенного есть обратная задача, которая называется «обратная дилемма заключенного» или «дилемма полиции». В этом случае несколько заключенных могут выбирать, сотрудничать ли с полицией или нет, и полиция может выбирать, как поощрять или наказывать их сотрудничество.

Представим ситуацию, в которой у полиции есть несколько заключенных, обвиняемых в совершении преступления. Полиция имеет следующие варианты действий:

  1. Если все заключенные сотрудничают, то полиция может предоставить им мягкие приговоры за сотрудничество.
  2. Если некоторые сотрудничают, а некоторые нет, полиция может наказать тех, кто не сотрудничает, предоставив им более строгие приговоры, а тем, кто сотрудничает, — более мягкие.
  3. Если все отказываются сотрудничать, полиция может предоставить им средние приговоры за отсутствие сотрудничества.
  4. Если полиция выбирает стратегию наказания независимо от сотрудничества заключенных, все заключенные получают строгие приговоры.

Эта обратная дилемма заключенного также исследует вопросы взаимодействия, координации и влияния стратегий на конечный результат.

avatar
ves2010, Зеркальная задача, по крайней мере, в такой постановке, не практична, ибо полиция не имеет жизненно важного интереса — на сколько и кого засадить. Однако, если на место полиции поставить кукла, то он для реализации своих интересов должен просто зеркалить поведение двух и более заключенных.
avatar
spebe, дилемма заключенного исключает психологию.
Тот, кто отсидит 10 лет, выйдет и прирежет напарника или так его покалечит, что тому жить не захочется.
А так всего через 5 лет у них была бы команда.
avatar
DrManhattan, 

В дилемме заключенного этот момент учитывается, и делается предположение, что бандиты не связаны между собой никакими узами, и в будущем не будет давления ни с одной из сторон. И в этом смысле применительно к трейдингу такой мысленный эксперимент чище, ибо предполагает отсутствие подобной связи между игроками как в настоящем, так и в будущем.
В любом случае, психология не исключается, т.к. мыслительный процесс, в результате которого заключенные делают рациональный в данных обстоятельствах выбор, и есть суть психология.

avatar
spebe, психология — это не рациональный выбор, а архетипы, неврозы и комплексы, которые мы не контролируем, но они оказывают существенное влияние на наш выбор.   
avatar
DrManhattan, Ну, если бы я сам это придумал, то, по меньшей мере, не спорил бы. Однако начитавшись всякого разного, имею информацию, что эмоции и прочие неврозы — есть лишь малая часть психологии. Такая же ее часть — просцесс мышления.
avatar
spebe, оставим эту психологию Герчику.
Непонятно, какая может быть дилемма заключенного для мелкого спекулянта.
Он в любой момент может закрыть позицию, перевернуться, добавиться и разбавиться.
У него большой выбор вариантов в ответ на неблагоприятное развитие событий.
Причем результат он все время видит в терминале.
avatar
Волновые Принципы Эллиотта
энто выражение сильно настораживает....

avatar
wistopus, А я вот, сколько ни слышу его, остаюсь невозмутимым.)))
avatar
spebe, некоторые на графике видят чашки, ручки, головы, плечи...
английские дети в камине видят тоже много чего...


avatar
wistopus, Вот именно! Нам важно не то, есть ли там на самом деле Пин Бар или Чашка с Ручкой. Нам важно, чтоб это видели «дети».
avatar
Для трейдеров неправильная постановка задачи:
1) у вас с одной стороны действия одного трейдера противоположно влияют на другого;
2) с другой стороны в матрице результатов они могут одновременно выиграть или проиграть

Все же нужно определиться — это игра с нулевой суммой (и матрица результатов будет другой), или внешние условия оказывают более существенное влияние, чем тот или иной выбор этих игроков (и тогда матрица результатов тоже будет другой)
avatar
Brill, Действия одного могут быть как противоположны интересам другого, так и совпадать. ТИ говорит о том, что в отсутствии кооперации, нужно ожидать враждебные действия по отношению друг к другу, как наиболее рациональную стратегию. Матрица выигрышей говорит о возможности оптимального решения для обоих, если бы они поступали нерационально или сговорившись.
с другой стороны в матрице результатов они могут одновременно выиграть или проиграть

Матрица показывает возможные ис ходы для кооперативного/некооперативного поведения в одном игровом моменте — выход из диапазона, и, как Вы абсолютно правильно заметили, не имеет долгосрочного эффекта, как, например, при часто упоминаемом в ТИ кейсе с двумя государствами, решающими участвовать или не участвовать в гонке вооружений.
Поскольку это действительно игра с нулевой суммой, то рано или поздно мы встретим третью, проигравшую сторону, которая будет продавать актив в тот момент, когда двое будут фиксировать прибыль +10.

avatar
Так без углубления в ТИ известно, что играть нужно против толпы. При наличии кооперации между членами толпы каждый заберет в лучшем случае столько, сколько внес (потому что больше и забирать нечего).
avatar
Brill, Так углубления и не предполагалось. Но возникает вопрос, знаем ли на самом деле, как действует толпа. В примере с диапазоном мы уже имеем дело с «новой толпой», а из нее рано или поздно выделится еще одна «новая толпа». В результате трейдинг превращается в сложную стратегическую игру, в которой ТИ отводится скромная, но важная роль — смазать ржавые мозги.
avatar
spebe, второй шаг цены ( 3я волна импульса= середина тренда) обогащает кукла, тк цену двигают неудачники(толпа), закрывающие свои убыточные позы открытые в предыдущем, противном тренде. Сигнал в ВА — это начало 3й волны… типа поглощение 5й волны от С волны во 2й волне. Для этого надо научиться читать график по каждой свече.
avatar
ezomm, Да, в примитивных стратегиях так дело и обстоит, и, к счастью, для многих ВА на этом заканчивается))
avatar
spebe, я еще раз хочу сказать, что изначально имеется принципиальное различие в благополучных исходах в задаче про заключенного и в задаче про трейдинг:
1) в задаче про заключенного сотрудничество принесет минимальный суммарный срок, и почти минимальный индивидуальный, что хорошо для обоих заключенных
2) в задаче про трейдинг минимальный суммарный выигрыш и минимальный индивидуальный будет восприниматься как неудача, а также означает то, что основной банк забрала третья сторона.
Если в результате кооперации два игрока получили максимальный групповой выигрыш, значит они просто забрали своё, что тоже является неэффективным, так как цель трейдинга — заработать больше, чем вложил.
Таким образом получаем вывод, что сам по себе трейдинг — это как наи пать другого.

То, что вы вводите новые поколения трейдеров, каналы и т.п. никак не влияет на полученные выводы, и лишь дает возможность сделать следующую ставку в надежде отыграться в следующий раз.

Если вы рассматриваете сотрудничество как некие локальные действия двух сторон по обыгрыванию всех остальных, то это делает эти две стороны одной стороной. Без доступа к новой информации (внешней к эти двум позициям) и без увеличения совместного ресурса влиять на котировки, сотрудничество не повышает шансы на выигрыш
avatar
Brill, 
Таким образом получаем вывод, что сам по себе трейдинг — это как наи пать другого.

Или, выражаясь литературно, =0 сумма.))) 
а также означает то, что основной банк забрала третья сторона
  ... Некая третья сторона, естественно, присутствует, но большую часть времени игроки сами себе — третья сторона. И хорошо тому,  кто это осознает. Большинство же полагает, что это действия кукла. И я  тоже еще раз хочу сказать))), что ТИ прямо указывает на то, что отсутствие прибыли в примитивных краткосрочных стратегиях — есть наиболее вероятный результат, как следствие рациональных стратегий в условиях невозможности сотрудничества.

Невозможность сотрудничества и неизменно малая прибыль приводит к пресловутой ассиметрии в принятии риска (когда наученные горьким опытом игроки забирают минимальную прибыль, а если с этим не повезет, пересиживают огромные убытки), которая, в свою очередь, ведет к известной статистике 95/5.
avatar
Brill, 
То, что вы начинаете вводить новое поколения трейдеров, каналы и т.п. никак не влияет на полученные выводы, и лишь подталкивает сделать следующую ставку в надежде отыграться в следующий раз.

Канал здесь — просто иллюстративный пример примитивной стратегии. Новое поколение трейдеров, разумеется, будет делать те же ошибки, если больше из главного вывода из дилеммы ничего не вынесет. В таком случае мы действительно вправе сделать те же выводы.
avatar
Первое что мы должны установить для себя:
Что есть «тренд», «свечи», «уровни», «волны», итд. Дать точное определение. Или забыть.
Понять скрыт ли за данными OHLC;vol, какой то реальный язык, точный диагноз, конкретный рисунок, и можно ли ему обучиться?
Единственное что нам достоверно известно — на долгосроке кол-во проигравших стремится к 99%. Из 100 внутридневных треидеров, к концу дня, с большой вероятностью, закроются в минус >50 трейдеров. А вот это уже можно использовать!
avatar
22022022, 
Что есть «тренд», «свечи», «уровни», «волны»

тут однообразия не получится. Я, по крайней мере, своих дефиниций не выдам))) 
avatar
22022022, Я обучился танцу цены 3-2 к 2010г за 15 лет.В основе графика 3 шага вперед и 2 назад. График Хейкен Аши… и в нем все свечи это маленькие тренды. Японцы уточняют, что 3 шага можно разбить на 8-10 новых перемен… типа 3 атаки трех солдат. Про ворон есть забава на всю жизнь. Это изучение Сложных Коррекций. СК -это сочетание флагов, брильянтов, и зигзагов. Самое трудное- убегающие сложные коррекции. Книга Глен Нили- Мастерство анализа волн Эллиота открывает глаза на многое.
avatar
Предать и торговать против всех.
avatar
В теории  — кукловедение — главный закон такой.Чем более твой актив, тем больший тайм ты контролируешь. Самый сильный кукл — это хозяин актива (мажор). Далее сила кукла падает в 2 раза за 4 тайма… типа дневной кукл в 2 раза слабее недельного, а недельный в 2 раза слабее помесячного. Мажор контролирует годовой тайм тк он формирует годовой баланс для инвесторов .
Проблемы более у мажора тк ивесторы чаще не ставят стоп лоссы. Мелким куклам проще — увидел уровень и толкай цену за него. Снял стопы и толкай за противный уровень. Мораль — волны Эллиота прямо работают для снятия стопов, а не для обогащения участников. У  теории VSA это называется — манипуляция. Сила тренда и есть глубина перекрытия уровней. Чем меньше перекрытия, тем сильнее тренд. Формула перекрытия  для тренда вверх 
L- ref( H ,-2).
avatar
ezomm, Доподлинно известно, что у многих крупных фондов есть отдел скальперских операций, то есть совсем не крупный ТФ.
avatar
spebe,  кукл контролирующий тайм типа 15мин входит в конце тайма и корректирует цену закрытия тайма под свой план рисования графика.В основе всех правильных систем торговли  — размер свечи тайма… ее размах.Размах прямо зависит от объема тайма. Это теория VSA. На Смарте это Сергей Болдырев. Объем, Спред, Анализ  свечи или фрактала типа Билла Вильямса.После VSA надо учить ВА Эллиота про все свечи графика.
1 свеча тайма 1 час около 0.2% от цены .4х час 0.4% .1 день 1% .1 неделя 2-3% и тд.
avatar
ezomm, 
кукл контролирующий тайм типа 15мин входит в конце тайма и корректирует цену закрытия тайма под свой план рисования графика

Действительно может, и делает, и не только 15 мин. Я уже во многих давнишних коментариях отмечался с инфо о т.н. кодексе поведения на бирже, контроль закрытия временных периодов в котором есть запрещенный и противозаконный прием.

avatar
Tуземец, 

это был бы спор немного другого уровня))) То есть, что главное, а что второстепенное. Это видно даже по комментам в этой ветке.
Что касается пришить ТИ- эту тему я много раз читал и слышал в разных источниках, включая СЛ, но ни разу не видел, как именно ТИ применяется для успешной торговли. Потому что почти никак))) Кроме описанного)))

avatar

Tуземец, Опиум для народа нужен, чтоб, по возможности, избежать таких шортов. )))

 



avatar
spebe, Туземец правильно поставил сигнал шорт. Заходная (в сделку) волна это конец 2й или В волны. Дьявол прячется в деталях? да.Он прячется в размере участия и стоп лоссе. В таких точках можно брать бабочку, те покупать края в опционах.Это точки баланса, а перевес тут виден в объеме.
avatar
Главная ошибка — мы торгуем не с трейдерами, а с экосистемой.
Это единый организм. 
Мы с ним один на один.
Не важно кто что там думает или делает. 
Важно, что делает ОН, рынок. А это вы видите на графике. 
Есть шторм, а есть ветер, волны, глубины и рельеф берега. 
Так вот — шторм — это совокупность всего этого. 
Вы сражаетесь с совокупностью .
И поэтому — частности и участники — не имеют значения. 
Важно само явление — шторм.  
Так, что ваши философские мысли в неправильном направлении. 
 кроме того 
 теория игр не подходит для рынка
ибо она основана на неизменности правил игры. 
На этом же основан и ТЕОРВЕР, и стат.анализ. 
Если правила меняются — то надо знать законы, по которым они меняются. 
А это невозможно. 
Вывод
Это неприменимо для рынка. 
Я уж молчу, что мало того, что правила и расклады  постоянно меняются, но и вес этих изменений тоже разный. те похожие изменения приносят разный вред\пользу в разных случаях.
Вообщем — аут !

Трейдинг это торговля против ММ, алгоритм считающий позы всех игроков и объемы сделок. Соответственно не имея всех данных невозможно вести рациональную игру против соперника, в то время как соперник имея большие ресурсы и данные пользуется своим преимуществом.
Главком Главком, нет
Мы торгуем против друг друга, ММ, фондов, хеджеров, бенчмарков и тд. 
ММ это просто более продвинутый, но все равно — просто участник. 
И он теряет еще как. Плюс их бывает несколько. 
Но все это создает экосистему. 
Ее смысл — что сражаясь друг с другом все против всех — создается некая цена в моменте. 
Вот против нее вы и торгуете.
Как в миксере. Отдельного уже ничего не разобрать, только общая масса. 
Против ММ это было бы слишком просто. Это рай. А мы в аду.

Автор, как и многие, просто хочет, чтобы был некий ключ. НО его нет и быть не может. 
Есть только способность нашего разума выискивать закономерности и их использовать. 
У каждого своя. 
И чем больше будет умных игроков, тем сложней будет игра. 
НО процент выигравших не изменится. 
Это кстати — из теории игр. 
Мы торгуем сами с собой. Достаточно перевернуть все свои сделки(где покупал там продать, где продавал там купить). И вуаля. Мы в дамках. Проблема в наших качествах. Нужно меняться.Жадность это первое.
А мож зеркало перед монитором?
avatar

теги блога spebe

....все тэги



UPDONW
Новый дизайн