Блог им. AlexSwan

Модели для ценовых приращений

    • 04 мая 2013, 12:26
    • |
    • Swan
  • Еще
Дисклаймер:  Это большой занудный пост с очень простым и довольно очевидным выводом. Поставил тег «опционы»  - не очень в тему, но всё же.

Модели для ценовых приращений
Простейшая задача (которую кстати, нужно решать чуть-ли не ежедневно) — оценить где и с какой вероятностью будет цена актива через заданное время при сохранении на рынке текущей динамики. Задачка посложнее — какова справедливая цена опциона для текущей динамики?



Решать эти задачи, да и другие, связанные с динамикой рынка очень удобно если известно распределение приращений цен. Но точное распределение приращений разумеется неизвестно — надо использовать какую-то модель.

Какие у нас вообще есть варианты:
* Эмпирическое распределение — для конкретного актива мы вычисляем что было на истории и используем это как модель для будущего.
* Нормальное (Гаусса) распределение (или лог-нормальное).
* Другие непрерывные распределения: Коши, Лапласса, Гамма (на картинке — это оно), Вейбула (в нём аж 3 параметра) и т.д.


Вариантов много — что выбрать? Критерии выбора такие:

* Распределение должно хорошо аппроксимировать реальное, то есть у модели должны быть такое параметры, чтобы «покрутив» их мы всегда бы могли получить что-то близкое к реальному
* Хорошо бы, чтобы распределение было бесконечено делимым (что это такое —  ссылка в конце поста).
* Вычисления желательно чтобы были попроще (на уровне Excel). Или, если они окажутся сложными, то чтобы овчинка стоила выделки.

На первый взгляд самое лучшее — это эмпирическое. Но! У него такие минусы:
* Сложно считать. Если мы имеем дело с 1 активом, то ещё можно посчитать, но если мы ежедневно скриним 100 активов и выбираем кажыдй раз разыне, то считать для них распределения — это целый программный комплекс должен быть.
* Это не делимое рапределение. Ну ладно, если нам нужен горизонт в Н дней, то мы можем и историю смотреть в Н дней.
* Очевидно, что если мы в ситуации с заданной ценой и волатильностью, то и эмпирику надо смотреть на тех же условиях, что практически невозможно.
* Самый большой минус — нет никаких гарантий, что будущее повторит историю! Запросто может случиться так — мы взяли, всё аккуратно посичтали, потратили кучу времени и сил, а оно возми и стрельни по волатильности процентов на 10 и все рассчёты можно выбросить.

Из других, «сложных» распределений — можно смотреть какое больше подходит и его использовать. Например, для RTS больше подходит Лапласса, но оно не делимое, то есть сразу вычисления на порядок сложнее.

И наконец, распределение Гаусса (нормальное или лог-нормальное).
Да, оно плоховато совпадает с реальным, на RTS реальное в центре явно выше и уже, а хвосты заметно толще, чем у нормального.
Зато у нормального распределения есть очень много плюсов:
* рапределение бесконечно делимо.
* все рассчёты очень простые, можно считать хоть для 1000 активов сразу — всё в рамках Excel.
* распределение хорошо изучено и для него всё известно, например тот же размер выборки для заданного доверительного интервала.

Итого, резюме.
Хотя распределение Гаусса не очень хорошо аппроксимирует реальное распределение приращений, но оно настолько удобно в использовании, что это компенсирует недостатки.
GAUSS — RULES!

 
Полный оригинал тут: swantrade.livejournal.com/41075.html
(там ещё немного занудства и ссылок по терминам, в принципе можно и не смотреть)
★21
71 комментарий
Распределение хрень, можно подобрать, тем более тут зависит от задачи, мб и нормального хватит в большинстве. Вот вы скажите что делать с тем, что ЦПТ не работает? Условие «ни одно из слагаемых не доминирует, не вносит в сумму определяющего вклада» не выполняется явно. В смысле какие есть модели чтобы моделировать, например, 10 минутки по известному распределению минутов, если учитывать этот момент.
avatar
agat50, эээ… это как раз речь о делимости распределения. Тут кроме Гаусса есть например, Коши и Гамма — должно быть достаточно для всяких изысков.
avatar
Swan, «Распределение Коши бесконечно делимо.» Не то. Но спасибо за полнятие темы делимости, надо глянуть видимо неделимые распределения, хотя это уже не «распределения» видимо, а модели типа garcha.
avatar
agat50, ага
avatar
«Очевидно, что если мы в ситуации с заданной ценой и волатильностью, то и эмпирику надо смотреть на тех же условиях, что практически невозможно.» — нет.
я уже на примере показывал, практическом.
это неправильно вводить волатильность как отдельный параметр рынка, тем более как константу. волатильность сама является характеристикой распределения.
avatar
karapuz, хорошо… тогда оставим только саму цену. Очевидно, что распределения при цене 100 и при цене 1000 — это разные распределения, и это мешает собирать статистику по эмпирике
avatar
Swan, не разные. у тебя есть распределение относительных приращений цен актива за период N. всё, больше ничего нет.
avatar
karapuz, а, в таком смысле… я понял… честно говоря, не пробовал рассматривать настолько простую модель, хотя она и очевидна ))) Спасибо за идею!… может ещё посчитаю-посмотрю-помоделирую
avatar
Swan, простая как репа на самом деле. просто N разные. короче это примерно как сделать модель описывающую движение автомобиля, которым управляет условно-сумасшедший гонщик.
avatar
karapuz, а я понял, да. видимо из-за простоты и пропустил в своё время )))
avatar
строй фазовое пространство
avatar
karapuz, йо! это думаю уж слишком. Давно пробовал что-то похожее делать (нечто вроде траекторий в фазовом пространстве) — вообще ничего интересного не просматривалось, подумал, что переумничал и всё выбросил
avatar
Swan, ну приращение за N период — это что? это 1-я производная — скорость. волатильность — 2-я производная — ускорение. vol of vol — третий момент (рывок)
avatar
karapuz, хм… такие аналогии думаю, имеют смысл только если можно двинуться дальше — гамильтониан, эксремум действие и т.п. а это мне уже качется слишком притянутым… к тому же нет тут аналога гамильтониана ))) по крайней мере я не вижу и не встречал чтобы кто-то писал
avatar
karapuz, это все конечно хорошо, только одно непонятно — нафига оно надо? — это типа спекулятивная археология — узнать как все было )))))))
С эмпирическим большой вопрос по выбору глубины исторических данных — сильно влияет на форму, а так из него получается неплохой доп инструмент для принятия решений
dolgo, да, верно, это ещё один фактор у эмпирики
avatar
Есть книжка занятная, авторы цудикман израйлевич лежит в инетах, они там по этому поводу много понаписали и посулили в след книжке обсосать вопрос по выбору глубины истории, но надули), больше не издавали ничего
dolgo, спасибо! поищу…
avatar
Советую еще посмотреть обобщенное гиперболическое распределение. А вообще имеет смысл искать такие текущие характеристики рынка,
при которых будущие условные распределения отличаются. Потому что совпадение условных и безусловных распределений означает, что купил и держи только лонг не превзойдет.
avatar
А. Г.,
Александр, поясните, пожалуйста вот это место:
«А вообще имеет смысл искать такие текущие характеристики рынка, при которых будущие условные распределения отличаются. „

“Советую еще посмотреть обобщенное гиперболическое распределение»
— спасибо! посмотрю
avatar
Swan,

Это просто общее определение статистической зависимости будущего от прошлого (условное распределение будущего по известному прошлому отличается от безусловного). Если её нет, то чисто теоретически и нет смысла «огород городить». Поэтому я и посоветовал искать те известные характеристики (часть прошлой информации), когда бы полученные распределения отличались, так как эффективную стратегию можно строить только на этих отличиях.
avatar
А. Г., ммм… с одной стороны это очевидно, а с другой — не слишком ли это обобщённая задача? то есть нет ли здесь стрельбы по воробьям из пушки?

Ведь зачастую не нужно знать форму распределения, а достаточно знать только некоторые характеристики. Например, если я знаю точки цены при попадании в которые будет сильный рост волатильности одновременно с персистентностью, то выигрышная стратегия очевидна, и мне не нужно знать какое именно будет распределение приращений.

К чему это я — лично я использую распределения приращений не более чем для счёта рисков, а не для выбора выигрышной тактики… Возможно там и есть какие-то «неэффективности», но лично мне кажется что изловить их таким образом — через законы приращений — крайне сложно…
avatar
Swan,

Да я тоже думаю, что все распределение знать нет необходимости, но этот вопрос подняли Вы в корневом топике. В банковском мире для оценки риска используется только одна характеристика распределения CVAR, а вид не столь уж и важен.
А вот начиная со слов «точки цены» Вы де-факто и ведёте речь об отличии условного распределения от безусловного.
avatar
А. Г.,
в самом топике я как раз и резюмировал тем, что особой точности не надо и обычно гаусс (не смотря на все минусы) — лучший вариант.

По поводу особых точек — я не говорю о каких-то особых вариантов распределений… даже пожалуй, не смогу внятно сказать что именно я имею в виду, это скорее такая оговорка по Фрейду =) вызванная тем, чем я сейчас занимаюсь =)
avatar
Кто считал распределения, тот знает, что форма их
отчасти напоминает нормальное, но «левая» половина
(ближе к 0) у него резкая, а правая пологая (собственно
как и показано на рисунке).
Однако там такая широкая сигма, что реально использовать
можно лишь от обратного: чем больше рынок стоит,
тем выше вероятность движения. Чем больше «размер
прыжка», тем дальше будет его сигма.
Соответсвенно по длительности стояния можно определить
наиболее вероятный «размер прыжка», однако без
указания его направления.
Андрей Кучумов, вот тут интересно было бы поподробнее)) у эмпирических далеко не всегда «левая половина» резкая, иногда получается и наоборот (в зависимости от окна). А больше всего меня интересует вот это:«чем больше рынок стоит,
тем выше вероятность движения. Чем больше «размер
прыжка», тем дальше будет его сигма.
Соответсвенно по длительности стояния можно определить
наиболее вероятный «размер прыжка», однако без
указания его направления.» Как Вы предполагаете определять «вероятный размер прыжка»?
dolgo, скажем так:
— движения в 20 пунктов реализуются (3сигмы) в 99%
от минуты до скажем 20 минут (пишу теоретически)
— движение в 40 пунктов реализуются от 2-х минут
до 50 минут.
И так далее.
Если рынок стоял в диапазоне шириной 10 пунктов
более 50 минут, то веротность прыжка в 30 пуктов
не так принципиально меньше, чем 20 пунктов.
Остаётся только поймать такой момент и выбрать
направление. :)
Андрей Кучумов, описка не 30, а 40 конечно.
Андрей Кучумов, вот тут совсем нет уверенности, а момент действительно важный. Т.е. вы считаете, что если 49 мин рынок стоял в диапазоне 10 п, то вероятность «оставшегося» движения в «оставшеюся» минуту существенно выше чем в любую другую «рядовую» минуту? Почему?
dolgo, если, согласно распределению 99% «прыжков»
выбранной величины происходят за меньшее время, значит
Вы можете поставить против 1%, что дальше цена сделает
такой прыжок вниз от самой верхней цены в консолидации,
либо вверх от самой нижней цены в консолидаци.
dolgo, вопрос какой % выбрать за пороговый.
Понятно, что чем меньше, тем больше сигналов, но
при этом больше ошибочных.
dolgo, но по-большому счёту лень попробовать сделать
полноценный on-line индикатор вероятностей рядом
со шкалой цены, где каждому ценнику будет
соответствовать вероятность достижения указанной цены
через Х интервалов торгов, 2Х, 3Х и т.д.
Во-первых по ощущениям будет сизифов труд.
Во-вторых таблица распределний до 300 пунктов цены
занимает в Excel 156 мегов для фьюча Сбера,
при этом всего для диапазона 2-х часов.
Соответственно, если считать индикатор ± 300
от текущей цены нужно брать ближайшие экстремумы
по всем значениям ± 300 и пересчитывать
вероятности для каждой сделки. А такой объём
вычислений вряд ли потянет on-line даже очень
мощный комп.
Андрей Кучумов, а зачем таблица? аналитической формулой нельзя задать?
avatar
Citizen, перебор быстрее работает. А поскольку задача
ещё и интегрирования в конечных пределах потребует,
то это ещё дополнительная нагрузка. Поскольку
с памятью сейчас особых проблем нет, то лучше
минимизировать мгновенную вычислительную нагрузку.
Тогда если прогнозную модель упростить дискриетизацией,
например, по 5 пунктов цены и задав скажем 10-минутный
интервал, то пересчёт прогноза возможно будет делать
для каждой сделки в актуальном времени.
Вот только сомнительно получить значимый выхлоп.
Возможно ситуаций будет очень мало, когда вероятности
будут интересные для значимых движений.
Андрей Кучумов, оу. как все сложно) ну Вам виднее) кажется, есть простой аналог того, что Вы имеете в виду — ленты Боллинджера. Они сужаются и расширяются.
avatar
Citizen, если честно я не все индикаторы теханализа знаю. :)
Андрей Кучумов, это один из самых важны и популярных индикаторов ТА)
avatar
Citizen, у распределений есть следствие — совпадение
с теорией Эллиотта, поскольку такая форма распределения
даёт бОльшую вероятность движения по тренду, чем против.
А у Эллиотта это есть, что волны не должны заходить
за более ранние.
Андрей Кучумов, что-то мне кажется, тут легко запутаться. Тренд в распределении — это его матожидание, а волатильность — дисперсия. Как связано это с вероятностью, и при чем тут Эллиот — не могли бы пояснить?
avatar
Citizen, у тренда разные параметры есть. В данном
случае используется то, что у растущего тренда
начало — экстремум внизу, а у падающего вверху.
Следовательно чем дольше длится тренд, например
вверх, тем больший «ценовой прыжок» вверх
по вероятности выходит за 3сигмы и то, что он
не случится всё меньше, т.к. дальняя точка у нас
внизу и «прыжок» мы считаем от неё.
Андрей Кучумов, возможно, вы немного запутали публику, меня по крайней мере) Распределение приращений за фиксированное время и распределение длины трендов — это «две большие разницы». В статье шла речь о первом (и оно наиболее часто встречается на практике и в статьях). А вот второе я даже не строил. Как его получить из первого?
avatar
Citizen, не поняли друг друга. Второе я тоже
не строил, речь лишь первом. Просто увеличьте
фиксированное время до года и у Вас появятся
статистически хорошие распределения приращений
в 5%, которых не будет, если взять время в 20 минут.
Андрей Кучумов, Есть t — время приращения, есть T — глубина выборки. Чем больше T/t, тем, с одной стороны, статистически более значимые результаты, с другой — получим среднюю температуру по больнице, т.к. в нее будут включаться очень много разных рыночных движений.
avatar
Citizen, и из этого следует одна из основных проблем опционных трейдеров — как считать волатильность)
avatar
Citizen, понял, я считал другое: сколько нужно
ждать движения в 1,2,...,100,...,N пунктов цены.
Соответственно на каждый размер приращения своё
распределение. Можно также отдельно посчитать
для роста и для падения, поскольку динамика
различается.
А Эллиотта пожалуй действительно спорно, т.к.
тут может быть как курица с яйцом — одно следствие
другого.
Андрей Кучумов, это, кстати, действительно интересно посчитать. Оно должно быть как-то неочевидным образом связано с распределением приращений. Из этого можно получить какие-то идеи для торговли. Но здесь еще другая сложность: автокорреляция волатильности, что затруднит точное построение такого распределения. Грубо говоря, когда рынок стоит — он стоит, а когда движется — то движется, и в эти моменты совершенна разная вероятность движений разной силы.
avatar
Citizen, посчитать-то не сложно, компьютер считает. :)
Важно понимать физический смысл расчёта и границы
использования результата.
А форма у них такая же, как на рисунке.
Чем меньше приращение — тем выраженней пик с характерной
асимметрией вершины.
Единственно в связи с падением ликвидности у фьюча SBER
для приращений в районе 20 пунктов у меня появлось
размытие вершины, т.к. я брал статистику за 2 года.
Citizen, если автокорреляция постоянна, то ей можно
пренебречь, как константой дающей постоянный сдвиг.
Проблема, что заведомо не известно постоянна ли она
или как-то распределена по тренду.
Андрей Кучумов, Citizen, тема сильно заинтересовала)) Я считал чуть другую штуку, а именно: распределение экстремальных отклонений цены от начала (вверх или вниз все равно) на фиксированном временном окне. Форма такой штуки, есс-но, похожа на картинки вверху). Подобная вещь сильно помогает в работе от покупки гаммы. Есть отдельные проблемы с интерпретацией результатов, если готовы — можно обсудить)
dolgo, мне интересно, готов поучаствовать
avatar
Citizen, не нашел как картинку присобачить(( идея в следующем: немножко утрируя, предполагаем, что страйки у нас есть на каждом пункте ртс))Тогда по текущим волатильностям центральная связка июньских опцев на фртс стоит 7200. Берем все дневные данные по фьючу за какой то период (напр с начала 2010) и рассматриваем окна из 28ми раб дней — столько осталось до экспирации сейчас. У каждого окна есть цена открытия, мин и макс. Смотрим по всем окнам величины Vi=макс((максi-openi);(openi-минi)) где i-номер
«окна». Понятно, что если при «почти всех i» Vi>7200, то связку сейчас можно покупать (есс-но, предполагаем что рынок ведет себя как «в среднем»+- за период с начала 10го, мгновенную волатильность не учитываем). В данный момент, например, соотношение Vi>7200 выполняется в 99% случаев. Совокупность Vi можно рассматривать как случайную величину, строить распредеоение и т.д. — получается достаточно ровненько и интересно. Остается вопрос по практическому управлению позицией. Например: купить связку сейчас и ждать когда она выйдет в безубыток (с 99%й вероятностью))) или делать что то раньше? Что и при каких условиях? Как это распределение связано с эмпирическим распределением логарифмов приращений и т.д. и т.п.))) Есть картинка частотная по этой штуке, но не знаю как вставить
dolgo, но если полученная величина не менее 7200,
то получается имеет смысл искать вход, пока этот
«размах» ещё не достигнут.
dolgo, или имеется ввиду цена пары?
Андрей Кучумов, давайте еще раз попробуем, а то возможно о разных вещах говорим)) Есть страйк 143270, цена пут+колл на нем 7160 (это на сейчас) Если в какой то момент до мы выходим на 143270-7160=136110 или на 143270+7160=150430 (а вероятность одного из этих событий оч высока), то купленная связка выходит в безубыток — там разбираемся отдельно что делать. Этот момент может настать через час, может 17го июня, прибыль так или иначе будет какая то. Надо ли ждать выхода (почти «гарантированного») в безубыток (срежеща зубами от кусачей тэты))) или что то предпринимать раньше при каких то условиях? При каких? (мы можем посчитать эти «выбеги» и оценить их вероятности на любое временное окно) Я обычно торгуя часто выравниваю дельту — хочется от этого отодвинуться)
dolgo, но ведь в текущем окне цена достигла этой
статистической закономерности, только входить нужно
было, когда фьюч торговался на 130000…
Разве нет?
Андрей Кучумов, входить надо было в начале того окна (м.б. Ценник был и 130) при условии, что тогда центральная связка стоила достаточно дешево (опять таки не помню но думаю что она была не дорога) еще момент- вообще то я вел речь про цену связки полную — до экспирации, а 28 дней назад до эксп оставалось 56 дней и цена была, понятно, выше. Собственно в том и часть вопроса — мы заняли позицию и ожидаемую прибыль получили задолго до экспиры, что делаем? Тут в принципе ответ ясен — все кроем и заново анализируем ситуевину- сводим задачу к первоначальной. Второй вопрос противнее — поза открыта и полсрока до экспы сидим в жестком минусе. Каковы наши действия- по прежнему рассчитывать на выбег (а половина времени отведенного для его реализации прошла) или постоянно мониторить только оставшийся временной срок на привлеательность открыти новой позы, и как только перспективы перестануть быть радужными, крыться независимо от текущего результата?
dolgo, если строить стратегию, то профит брать
однозначно, поскольку просчитано только достижение
уровня, а всё остальное неизвестно.
Вопрос из-за чего может быть жестокий минус?
Консолидация вроде августа 2012 в Сбере 92-95?
Андрей Кучумов, просто угрюмый стояк базового актива неделю-две, ломающий предыдущую статистику)) очеь я тэту минусовую не люблю)
dolgo, поскольку окно ограниченного размера, то такой
вариант не исключен, но пока есть только одна «находка»,
значит нужно верить только ей.
dolgo, можно конечно ещё один вариант проверить.
Если совсем серьёзная просадка имеет ли смысл
переоткрыть равнозначную позицию в контрактах
следующего месяца, а в текущем закрыть.
Хотя под закрытие движухи бывают.
Андрей Кучумов, Андрей Кучумов, да, вариантов масса, систематизировать как то в голове нужно) и еще оч интересный момент. На больших «окнах» корреляция этих выбегов с волатильностью нулевая, на маленьких есть но небольшая. Получается, что большие «шипы» вполне себе присутствуют на низковолатильных рынках и дают возможность работать от покупки гаммы
dolgo, это да, возможно именно ограченное время приводит
к появлению «шипов».
Андрей Кучумов, да, пары колл+пут на центре
dolgo, с картинкой более наглядно будет, я вроде понял, о чем вы, хотя не сразу переварил. Мне кажется, управление позицией в этом случае — это тема целой диссертации, как и вообще для темы рехеджа гаммы. Наверное, нужно ровнять дельту на сильных уровнях консолидации.)
Тут еще такая особенность: уважаемый А.Г. как-то рисовал график [дневной] волатильности (не помню каким образом полученный), и смысл его таков, что сама волатильность на нашем рынке не стационарна, более того, монотонно убывает, и постепенно приходит на уровень волатильности рынка Америки. Тухнет наш рынок, иначе говоря) с этой точки зрения можно сильно обломаться с покупкой гаммы, если принимать решение о входе на основании такого тестирования исторических данных (т.е. на основе представления о том, что есть «дешевая» связка опционов, а что — «дорогая»). Это все надо очень много и хорошо считать. Стоит оно того? хз) наверное)

Ну и я думаю, это распределение связано с распр-ем логарифмов приращений опосредовано. По идее, они должны обладать схожими характеристиками, типа асимметрии, эксцесса и тп
avatar
Citizen, наверное, глядя на картинку с распределением, можно визуально прикинуть, при какой цене связки выгоден вход, и насколько. Но еще лучше это посчитать.
avatar
Citizen, я, на самом деле, в этом месте вовсе от понятия волатильности пытаюсь уйти. Больно штука гуманитарная. Диссертация уже 20 лет назад была, больше не хочу)), обломаться конечно можно. Занятно вот что — форма распределения этих «отклонений» не сильно зависит (вроде бы) от глубины рассматриваемой истории (в отличии от эмпирических распределений). Там связь распределений есть, но какая то очень неочевидная
dolgo, я, честно говоря, тоже не умею картинки в комментарии вставлять, так что не могу вам подсказать, как это сделать. А посмотреть хочется. Может, вам отдельный пост написать?..
avatar
лень)) можно в аську stasbrg, там проще)
в скайп))

теги блога Swan

....все тэги



UPDONW
Новый дизайн