Swan
Swan личный блог
04 мая 2013, 12:26

Модели для ценовых приращений

Дисклаймер:  Это большой занудный пост с очень простым и довольно очевидным выводом. Поставил тег «опционы»  - не очень в тему, но всё же.

Модели для ценовых приращений
Простейшая задача (которую кстати, нужно решать чуть-ли не ежедневно) — оценить где и с какой вероятностью будет цена актива через заданное время при сохранении на рынке текущей динамики. Задачка посложнее — какова справедливая цена опциона для текущей динамики?



Решать эти задачи, да и другие, связанные с динамикой рынка очень удобно если известно распределение приращений цен. Но точное распределение приращений разумеется неизвестно — надо использовать какую-то модель.

Какие у нас вообще есть варианты:
* Эмпирическое распределение — для конкретного актива мы вычисляем что было на истории и используем это как модель для будущего.
* Нормальное (Гаусса) распределение (или лог-нормальное).
* Другие непрерывные распределения: Коши, Лапласса, Гамма (на картинке — это оно), Вейбула (в нём аж 3 параметра) и т.д.


Вариантов много — что выбрать? Критерии выбора такие:

* Распределение должно хорошо аппроксимировать реальное, то есть у модели должны быть такое параметры, чтобы «покрутив» их мы всегда бы могли получить что-то близкое к реальному
* Хорошо бы, чтобы распределение было бесконечено делимым (что это такое —  ссылка в конце поста).
* Вычисления желательно чтобы были попроще (на уровне Excel). Или, если они окажутся сложными, то чтобы овчинка стоила выделки.

На первый взгляд самое лучшее — это эмпирическое. Но! У него такие минусы:
* Сложно считать. Если мы имеем дело с 1 активом, то ещё можно посчитать, но если мы ежедневно скриним 100 активов и выбираем кажыдй раз разыне, то считать для них распределения — это целый программный комплекс должен быть.
* Это не делимое рапределение. Ну ладно, если нам нужен горизонт в Н дней, то мы можем и историю смотреть в Н дней.
* Очевидно, что если мы в ситуации с заданной ценой и волатильностью, то и эмпирику надо смотреть на тех же условиях, что практически невозможно.
* Самый большой минус — нет никаких гарантий, что будущее повторит историю! Запросто может случиться так — мы взяли, всё аккуратно посичтали, потратили кучу времени и сил, а оно возми и стрельни по волатильности процентов на 10 и все рассчёты можно выбросить.

Из других, «сложных» распределений — можно смотреть какое больше подходит и его использовать. Например, для RTS больше подходит Лапласса, но оно не делимое, то есть сразу вычисления на порядок сложнее.

И наконец, распределение Гаусса (нормальное или лог-нормальное).
Да, оно плоховато совпадает с реальным, на RTS реальное в центре явно выше и уже, а хвосты заметно толще, чем у нормального.
Зато у нормального распределения есть очень много плюсов:
* рапределение бесконечно делимо.
* все рассчёты очень простые, можно считать хоть для 1000 активов сразу — всё в рамках Excel.
* распределение хорошо изучено и для него всё известно, например тот же размер выборки для заданного доверительного интервала.

Итого, резюме.
Хотя распределение Гаусса не очень хорошо аппроксимирует реальное распределение приращений, но оно настолько удобно в использовании, что это компенсирует недостатки.
GAUSS — RULES!

 
Полный оригинал тут: swantrade.livejournal.com/41075.html
(там ещё немного занудства и ссылок по терминам, в принципе можно и не смотреть)
71 Комментарий
  • agat50
    04 мая 2013, 12:44
    Распределение хрень, можно подобрать, тем более тут зависит от задачи, мб и нормального хватит в большинстве. Вот вы скажите что делать с тем, что ЦПТ не работает? Условие «ни одно из слагаемых не доминирует, не вносит в сумму определяющего вклада» не выполняется явно. В смысле какие есть модели чтобы моделировать, например, 10 минутки по известному распределению минутов, если учитывать этот момент.
      • agat50
        04 мая 2013, 12:57
        Swan, «Распределение Коши бесконечно делимо.» Не то. Но спасибо за полнятие темы делимости, надо глянуть видимо неделимые распределения, хотя это уже не «распределения» видимо, а модели типа garcha.
  • karapuz
    04 мая 2013, 12:51
    «Очевидно, что если мы в ситуации с заданной ценой и волатильностью, то и эмпирику надо смотреть на тех же условиях, что практически невозможно.» — нет.
    я уже на примере показывал, практическом.
    это неправильно вводить волатильность как отдельный параметр рынка, тем более как константу. волатильность сама является характеристикой распределения.
      • karapuz
        04 мая 2013, 12:55
        Swan, не разные. у тебя есть распределение относительных приращений цен актива за период N. всё, больше ничего нет.
          • karapuz
            04 мая 2013, 13:05
            Swan, простая как репа на самом деле. просто N разные. короче это примерно как сделать модель описывающую движение автомобиля, которым управляет условно-сумасшедший гонщик.
  • karapuz
    04 мая 2013, 12:59
    строй фазовое пространство
      • karapuz
        04 мая 2013, 13:13
        Swan, ну приращение за N период — это что? это 1-я производная — скорость. волатильность — 2-я производная — ускорение. vol of vol — третий момент (рывок)
        • Андрей Палий
          04 мая 2013, 17:15
          karapuz, это все конечно хорошо, только одно непонятно — нафига оно надо? — это типа спекулятивная археология — узнать как все было )))))))
  • Стас Бржозовский
    04 мая 2013, 13:32
    С эмпирическим большой вопрос по выбору глубины исторических данных — сильно влияет на форму, а так из него получается неплохой доп инструмент для принятия решений
  • Стас Бржозовский
    04 мая 2013, 13:43
    Есть книжка занятная, авторы цудикман израйлевич лежит в инетах, они там по этому поводу много понаписали и посулили в след книжке обсосать вопрос по выбору глубины истории, но надули), больше не издавали ничего
  • А. Г.
    04 мая 2013, 14:48
    Советую еще посмотреть обобщенное гиперболическое распределение. А вообще имеет смысл искать такие текущие характеристики рынка,
    при которых будущие условные распределения отличаются. Потому что совпадение условных и безусловных распределений означает, что купил и держи только лонг не превзойдет.
      • А. Г.
        04 мая 2013, 16:02
        Swan,

        Это просто общее определение статистической зависимости будущего от прошлого (условное распределение будущего по известному прошлому отличается от безусловного). Если её нет, то чисто теоретически и нет смысла «огород городить». Поэтому я и посоветовал искать те известные характеристики (часть прошлой информации), когда бы полученные распределения отличались, так как эффективную стратегию можно строить только на этих отличиях.
          • А. Г.
            04 мая 2013, 16:31
            Swan,

            Да я тоже думаю, что все распределение знать нет необходимости, но этот вопрос подняли Вы в корневом топике. В банковском мире для оценки риска используется только одна характеристика распределения CVAR, а вид не столь уж и важен.
            А вот начиная со слов «точки цены» Вы де-факто и ведёте речь об отличии условного распределения от безусловного.
  • Андрей Кучумов
    05 мая 2013, 13:11
    Кто считал распределения, тот знает, что форма их
    отчасти напоминает нормальное, но «левая» половина
    (ближе к 0) у него резкая, а правая пологая (собственно
    как и показано на рисунке).
    Однако там такая широкая сигма, что реально использовать
    можно лишь от обратного: чем больше рынок стоит,
    тем выше вероятность движения. Чем больше «размер
    прыжка», тем дальше будет его сигма.
    Соответсвенно по длительности стояния можно определить
    наиболее вероятный «размер прыжка», однако без
    указания его направления.
    • Стас Бржозовский
      05 мая 2013, 20:01
      Андрей Кучумов, вот тут интересно было бы поподробнее)) у эмпирических далеко не всегда «левая половина» резкая, иногда получается и наоборот (в зависимости от окна). А больше всего меня интересует вот это:«чем больше рынок стоит,
      тем выше вероятность движения. Чем больше «размер
      прыжка», тем дальше будет его сигма.
      Соответсвенно по длительности стояния можно определить
      наиболее вероятный «размер прыжка», однако без
      указания его направления.» Как Вы предполагаете определять «вероятный размер прыжка»?
      • Андрей Кучумов
        06 мая 2013, 10:17
        dolgo, скажем так:
        — движения в 20 пунктов реализуются (3сигмы) в 99%
        от минуты до скажем 20 минут (пишу теоретически)
        — движение в 40 пунктов реализуются от 2-х минут
        до 50 минут.
        И так далее.
        Если рынок стоял в диапазоне шириной 10 пунктов
        более 50 минут, то веротность прыжка в 30 пуктов
        не так принципиально меньше, чем 20 пунктов.
        Остаётся только поймать такой момент и выбрать
        направление. :)
        • Андрей Кучумов
          06 мая 2013, 10:18
          Андрей Кучумов, описка не 30, а 40 конечно.
        • Стас Бржозовский
          08 мая 2013, 19:14
          Андрей Кучумов, вот тут совсем нет уверенности, а момент действительно важный. Т.е. вы считаете, что если 49 мин рынок стоял в диапазоне 10 п, то вероятность «оставшегося» движения в «оставшеюся» минуту существенно выше чем в любую другую «рядовую» минуту? Почему?
          • Андрей Кучумов
            11 мая 2013, 00:30
            dolgo, если, согласно распределению 99% «прыжков»
            выбранной величины происходят за меньшее время, значит
            Вы можете поставить против 1%, что дальше цена сделает
            такой прыжок вниз от самой верхней цены в консолидации,
            либо вверх от самой нижней цены в консолидаци.
          • Андрей Кучумов
            11 мая 2013, 00:40
            dolgo, вопрос какой % выбрать за пороговый.
            Понятно, что чем меньше, тем больше сигналов, но
            при этом больше ошибочных.
      • Андрей Кучумов
        08 мая 2013, 09:45
        dolgo, но по-большому счёту лень попробовать сделать
        полноценный on-line индикатор вероятностей рядом
        со шкалой цены, где каждому ценнику будет
        соответствовать вероятность достижения указанной цены
        через Х интервалов торгов, 2Х, 3Х и т.д.
        Во-первых по ощущениям будет сизифов труд.
        Во-вторых таблица распределний до 300 пунктов цены
        занимает в Excel 156 мегов для фьюча Сбера,
        при этом всего для диапазона 2-х часов.
        Соответственно, если считать индикатор ± 300
        от текущей цены нужно брать ближайшие экстремумы
        по всем значениям ± 300 и пересчитывать
        вероятности для каждой сделки. А такой объём
        вычислений вряд ли потянет on-line даже очень
        мощный комп.
        • Citizen
          08 мая 2013, 10:59
          Андрей Кучумов, а зачем таблица? аналитической формулой нельзя задать?
          • Андрей Кучумов
            08 мая 2013, 11:56
            Citizen, перебор быстрее работает. А поскольку задача
            ещё и интегрирования в конечных пределах потребует,
            то это ещё дополнительная нагрузка. Поскольку
            с памятью сейчас особых проблем нет, то лучше
            минимизировать мгновенную вычислительную нагрузку.
            Тогда если прогнозную модель упростить дискриетизацией,
            например, по 5 пунктов цены и задав скажем 10-минутный
            интервал, то пересчёт прогноза возможно будет делать
            для каждой сделки в актуальном времени.
            Вот только сомнительно получить значимый выхлоп.
            Возможно ситуаций будет очень мало, когда вероятности
            будут интересные для значимых движений.
            • Citizen
              08 мая 2013, 12:45
              Андрей Кучумов, оу. как все сложно) ну Вам виднее) кажется, есть простой аналог того, что Вы имеете в виду — ленты Боллинджера. Они сужаются и расширяются.
              • Андрей Кучумов
                08 мая 2013, 12:59
                Citizen, если честно я не все индикаторы теханализа знаю. :)
                • Citizen
                  08 мая 2013, 13:06
                  Андрей Кучумов, это один из самых важны и популярных индикаторов ТА)
          • Андрей Кучумов
            08 мая 2013, 12:28
            Citizen, у распределений есть следствие — совпадение
            с теорией Эллиотта, поскольку такая форма распределения
            даёт бОльшую вероятность движения по тренду, чем против.
            А у Эллиотта это есть, что волны не должны заходить
            за более ранние.
            • Citizen
              08 мая 2013, 12:47
              Андрей Кучумов, что-то мне кажется, тут легко запутаться. Тренд в распределении — это его матожидание, а волатильность — дисперсия. Как связано это с вероятностью, и при чем тут Эллиот — не могли бы пояснить?
              • Андрей Кучумов
                08 мая 2013, 12:56
                Citizen, у тренда разные параметры есть. В данном
                случае используется то, что у растущего тренда
                начало — экстремум внизу, а у падающего вверху.
                Следовательно чем дольше длится тренд, например
                вверх, тем больший «ценовой прыжок» вверх
                по вероятности выходит за 3сигмы и то, что он
                не случится всё меньше, т.к. дальняя точка у нас
                внизу и «прыжок» мы считаем от неё.
                • Citizen
                  08 мая 2013, 13:05
                  Андрей Кучумов, возможно, вы немного запутали публику, меня по крайней мере) Распределение приращений за фиксированное время и распределение длины трендов — это «две большие разницы». В статье шла речь о первом (и оно наиболее часто встречается на практике и в статьях). А вот второе я даже не строил. Как его получить из первого?
                  • Андрей Кучумов
                    08 мая 2013, 13:28
                    Citizen, не поняли друг друга. Второе я тоже
                    не строил, речь лишь первом. Просто увеличьте
                    фиксированное время до года и у Вас появятся
                    статистически хорошие распределения приращений
                    в 5%, которых не будет, если взять время в 20 минут.
                    • Citizen
                      08 мая 2013, 13:38
                      Андрей Кучумов, Есть t — время приращения, есть T — глубина выборки. Чем больше T/t, тем, с одной стороны, статистически более значимые результаты, с другой — получим среднюю температуру по больнице, т.к. в нее будут включаться очень много разных рыночных движений.
                      • Citizen
                        08 мая 2013, 13:39
                        Citizen, и из этого следует одна из основных проблем опционных трейдеров — как считать волатильность)
                      • Андрей Кучумов
                        08 мая 2013, 13:49
                        Citizen, понял, я считал другое: сколько нужно
                        ждать движения в 1,2,...,100,...,N пунктов цены.
                        Соответственно на каждый размер приращения своё
                        распределение. Можно также отдельно посчитать
                        для роста и для падения, поскольку динамика
                        различается.
                        А Эллиотта пожалуй действительно спорно, т.к.
                        тут может быть как курица с яйцом — одно следствие
                        другого.
                        • Citizen
                          08 мая 2013, 14:00
                          Андрей Кучумов, это, кстати, действительно интересно посчитать. Оно должно быть как-то неочевидным образом связано с распределением приращений. Из этого можно получить какие-то идеи для торговли. Но здесь еще другая сложность: автокорреляция волатильности, что затруднит точное построение такого распределения. Грубо говоря, когда рынок стоит — он стоит, а когда движется — то движется, и в эти моменты совершенна разная вероятность движений разной силы.
                          • Андрей Кучумов
                            08 мая 2013, 14:09
                            Citizen, посчитать-то не сложно, компьютер считает. :)
                            Важно понимать физический смысл расчёта и границы
                            использования результата.
                            А форма у них такая же, как на рисунке.
                            Чем меньше приращение — тем выраженней пик с характерной
                            асимметрией вершины.
                            Единственно в связи с падением ликвидности у фьюча SBER
                            для приращений в районе 20 пунктов у меня появлось
                            размытие вершины, т.к. я брал статистику за 2 года.
                          • Андрей Кучумов
                            08 мая 2013, 14:14
                            Citizen, если автокорреляция постоянна, то ей можно
                            пренебречь, как константой дающей постоянный сдвиг.
                            Проблема, что заведомо не известно постоянна ли она
                            или как-то распределена по тренду.
                            • Стас Бржозовский
                              08 мая 2013, 19:21
                              Андрей Кучумов, Citizen, тема сильно заинтересовала)) Я считал чуть другую штуку, а именно: распределение экстремальных отклонений цены от начала (вверх или вниз все равно) на фиксированном временном окне. Форма такой штуки, есс-но, похожа на картинки вверху). Подобная вещь сильно помогает в работе от покупки гаммы. Есть отдельные проблемы с интерпретацией результатов, если готовы — можно обсудить)
                              • Citizen
                                08 мая 2013, 19:35
                                dolgo, мне интересно, готов поучаствовать
                                • Стас Бржозовский
                                  08 мая 2013, 20:01
                                  Citizen, не нашел как картинку присобачить(( идея в следующем: немножко утрируя, предполагаем, что страйки у нас есть на каждом пункте ртс))Тогда по текущим волатильностям центральная связка июньских опцев на фртс стоит 7200. Берем все дневные данные по фьючу за какой то период (напр с начала 2010) и рассматриваем окна из 28ми раб дней — столько осталось до экспирации сейчас. У каждого окна есть цена открытия, мин и макс. Смотрим по всем окнам величины Vi=макс((максi-openi);(openi-минi)) где i-номер
                                  «окна». Понятно, что если при «почти всех i» Vi>7200, то связку сейчас можно покупать (есс-но, предполагаем что рынок ведет себя как «в среднем»+- за период с начала 10го, мгновенную волатильность не учитываем). В данный момент, например, соотношение Vi>7200 выполняется в 99% случаев. Совокупность Vi можно рассматривать как случайную величину, строить распредеоение и т.д. — получается достаточно ровненько и интересно. Остается вопрос по практическому управлению позицией. Например: купить связку сейчас и ждать когда она выйдет в безубыток (с 99%й вероятностью))) или делать что то раньше? Что и при каких условиях? Как это распределение связано с эмпирическим распределением логарифмов приращений и т.д. и т.п.))) Есть картинка частотная по этой штуке, но не знаю как вставить
                                  • Андрей Кучумов
                                    08 мая 2013, 20:27
                                    dolgo, но если полученная величина не менее 7200,
                                    то получается имеет смысл искать вход, пока этот
                                    «размах» ещё не достигнут.
                                  • Андрей Кучумов
                                    08 мая 2013, 20:30
                                    dolgo, или имеется ввиду цена пары?
                                    • Стас Бржозовский
                                      08 мая 2013, 20:40
                                      Андрей Кучумов, давайте еще раз попробуем, а то возможно о разных вещах говорим)) Есть страйк 143270, цена пут+колл на нем 7160 (это на сейчас) Если в какой то момент до мы выходим на 143270-7160=136110 или на 143270+7160=150430 (а вероятность одного из этих событий оч высока), то купленная связка выходит в безубыток — там разбираемся отдельно что делать. Этот момент может настать через час, может 17го июня, прибыль так или иначе будет какая то. Надо ли ждать выхода (почти «гарантированного») в безубыток (срежеща зубами от кусачей тэты))) или что то предпринимать раньше при каких то условиях? При каких? (мы можем посчитать эти «выбеги» и оценить их вероятности на любое временное окно) Я обычно торгуя часто выравниваю дельту — хочется от этого отодвинуться)
                                      • Андрей Кучумов
                                        08 мая 2013, 21:02
                                        dolgo, но ведь в текущем окне цена достигла этой
                                        статистической закономерности, только входить нужно
                                        было, когда фьюч торговался на 130000…
                                        Разве нет?
                                        • Стас Бржозовский
                                          09 мая 2013, 01:32
                                          Андрей Кучумов, входить надо было в начале того окна (м.б. Ценник был и 130) при условии, что тогда центральная связка стоила достаточно дешево (опять таки не помню но думаю что она была не дорога) еще момент- вообще то я вел речь про цену связки полную — до экспирации, а 28 дней назад до эксп оставалось 56 дней и цена была, понятно, выше. Собственно в том и часть вопроса — мы заняли позицию и ожидаемую прибыль получили задолго до экспиры, что делаем? Тут в принципе ответ ясен — все кроем и заново анализируем ситуевину- сводим задачу к первоначальной. Второй вопрос противнее — поза открыта и полсрока до экспы сидим в жестком минусе. Каковы наши действия- по прежнему рассчитывать на выбег (а половина времени отведенного для его реализации прошла) или постоянно мониторить только оставшийся временной срок на привлеательность открыти новой позы, и как только перспективы перестануть быть радужными, крыться независимо от текущего результата?
                                          • Андрей Кучумов
                                            09 мая 2013, 15:04
                                            dolgo, если строить стратегию, то профит брать
                                            однозначно, поскольку просчитано только достижение
                                            уровня, а всё остальное неизвестно.
                                            Вопрос из-за чего может быть жестокий минус?
                                            Консолидация вроде августа 2012 в Сбере 92-95?
                                            • Стас Бржозовский
                                              09 мая 2013, 16:21
                                              Андрей Кучумов, просто угрюмый стояк базового актива неделю-две, ломающий предыдущую статистику)) очеь я тэту минусовую не люблю)
                                              • Андрей Кучумов
                                                09 мая 2013, 17:57
                                                dolgo, поскольку окно ограниченного размера, то такой
                                                вариант не исключен, но пока есть только одна «находка»,
                                                значит нужно верить только ей.
                                              • Андрей Кучумов
                                                09 мая 2013, 18:07
                                                dolgo, можно конечно ещё один вариант проверить.
                                                Если совсем серьёзная просадка имеет ли смысл
                                                переоткрыть равнозначную позицию в контрактах
                                                следующего месяца, а в текущем закрыть.
                                                Хотя под закрытие движухи бывают.
                                                • Стас Бржозовский
                                                  09 мая 2013, 18:33
                                                  Андрей Кучумов, Андрей Кучумов, да, вариантов масса, систематизировать как то в голове нужно) и еще оч интересный момент. На больших «окнах» корреляция этих выбегов с волатильностью нулевая, на маленьких есть но небольшая. Получается, что большие «шипы» вполне себе присутствуют на низковолатильных рынках и дают возможность работать от покупки гаммы
                                                  • Андрей Кучумов
                                                    09 мая 2013, 19:07
                                                    dolgo, это да, возможно именно ограченное время приводит
                                                    к появлению «шипов».
                                    • Стас Бржозовский
                                      08 мая 2013, 20:41
                                      Андрей Кучумов, да, пары колл+пут на центре
                                  • Citizen
                                    08 мая 2013, 20:40
                                    dolgo, с картинкой более наглядно будет, я вроде понял, о чем вы, хотя не сразу переварил. Мне кажется, управление позицией в этом случае — это тема целой диссертации, как и вообще для темы рехеджа гаммы. Наверное, нужно ровнять дельту на сильных уровнях консолидации.)
                                    Тут еще такая особенность: уважаемый А.Г. как-то рисовал график [дневной] волатильности (не помню каким образом полученный), и смысл его таков, что сама волатильность на нашем рынке не стационарна, более того, монотонно убывает, и постепенно приходит на уровень волатильности рынка Америки. Тухнет наш рынок, иначе говоря) с этой точки зрения можно сильно обломаться с покупкой гаммы, если принимать решение о входе на основании такого тестирования исторических данных (т.е. на основе представления о том, что есть «дешевая» связка опционов, а что — «дорогая»). Это все надо очень много и хорошо считать. Стоит оно того? хз) наверное)

                                    Ну и я думаю, это распределение связано с распр-ем логарифмов приращений опосредовано. По идее, они должны обладать схожими характеристиками, типа асимметрии, эксцесса и тп
                                    • Citizen
                                      08 мая 2013, 20:42
                                      Citizen, наверное, глядя на картинку с распределением, можно визуально прикинуть, при какой цене связки выгоден вход, и насколько. Но еще лучше это посчитать.
                                    • Стас Бржозовский
                                      08 мая 2013, 20:51
                                      Citizen, я, на самом деле, в этом месте вовсе от понятия волатильности пытаюсь уйти. Больно штука гуманитарная. Диссертация уже 20 лет назад была, больше не хочу)), обломаться конечно можно. Занятно вот что — форма распределения этих «отклонений» не сильно зависит (вроде бы) от глубины рассматриваемой истории (в отличии от эмпирических распределений). Там связь распределений есть, но какая то очень неочевидная
                                      • Citizen
                                        08 мая 2013, 21:01
                                        dolgo, я, честно говоря, тоже не умею картинки в комментарии вставлять, так что не могу вам подсказать, как это сделать. А посмотреть хочется. Может, вам отдельный пост написать?..
  • Стас Бржозовский
    08 мая 2013, 21:05
    лень)) можно в аську stasbrg, там проще)
  • Стас Бржозовский
    08 мая 2013, 21:05
    в скайп))

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн