Кирилл Браулов
Кирилл Браулов личный блог
10 января 2017, 23:01

Эмпирическое распределение

Интересную тему с эмпирическими распределениям подняли Дмитрий Новиков и Nonsense. Хотелось бы одну мысль по этому поводу озвучить. Насколько понимаю, эмпирическое распределение — это когда берут историю цен БА, нарезают неким окном, из каждого полученного отрезка получают приращение, и потом строят частотную диаграмму из этих приращений. Полученное распределение и называют эмпирическим. Nonsense пишет, что возникают две проблемы:
1. У полученного распределения мю может быть не ноль, и если считать по этому распределению справедливые цены, то не будет выполняться колл-пут паритет.
2. Выбор размера окна для нарезки.

Мне же кажется, что тут другая, более существенная, проблема. Предположим, у нас есть некий случайный процесс, с помощью которого мы можем сгенерировать кучу случайных траекторий цены:

Эмпирическое распределение

Построив частотную диаграмму финишных точек каждой траектории, мы получим как-бы распределение вероятностей — истинное для нашего случайного процесса. Теперь вопрос: если мы возьмем только одну траекторию и построим из нее эмпирическое распределение, будет ли оно совпадать с истинным распределением? Уверен, что нет.

Анализируя одну такую траекторию может быть и можно частично понять некоторые св-ва исходного случайного процесса (типа, рост волатильности при падении цены), но полностью его расшифровать — мне кажется, невозможно.

И еще соображение. Мы ведь говорим про вероятности. А что это? Так понимаю, есть два подхода: частотный и байесовский. И вроде бы второй подход гораздо точнее прогнозирует (например, тот кто прогнозирует будет сегодня дождь или нет на основе кол-ва дождливых дней в году проиграет тому, кто смотрит ясный сегодня день или пасмурный). Так вот, эмпирическое распределение соответствует частотной вероятности. А рыночное распределение (получаемое из текущих цен опционов на всех страйках) — байесовскому подходу. Например, выходит какая-то важная новость, рыночное распределение на это сразу реагирует и соответствующим образом изменится. А эмпирическое никак на эту новость не отреагирует.

В общем, использовать эмпирическое распределение (для прогноза где будет БА или для подсчета своих справедливых цен), имхо, дюже неправильно.

55 Комментариев
  • bstone
    10 января 2017, 23:18
    Имелось в виду эмпирическое распределение, построенное по ряду приращений цены.
  • bstone
    10 января 2017, 23:28
    Но стоит отметить, что такая вот нарезка «окон» является хорошей иллюстрацией свойства эргодичности процессов, описываемых случайным блужданием.
    • Дмитрий Новиков
      11 января 2017, 00:04
      Кирилл Браулов, так Каму тут надо движение БА
        • Дмитрий Новиков
          11 января 2017, 01:21
          Кирилл Браулов, ну как бы хорошо знать прикуп. Но тому же Коровину это не обязательно. Фактически распределение и показывает с какой вероятностью мы там окажемся. Дельту смотрим и переводим в проценты. 
            • Дмитрий Новиков
              11 января 2017, 15:57
              Кирилл Браулов, и он даже об этом не догадывается;)
                • Дмитрий Новиков
                  11 января 2017, 19:20
                  Кирилл Браулов, надо анализ его стратегий провести со всеми выкладками. Не созл, а справедливости ради
    • Дмитрий Новиков
      11 января 2017, 00:08
      Кирилл Браулов, это за какой период
        • Дмитрий Новиков
          11 января 2017, 00:45
          Кирилл Браулов, да ч заметил что это минутки. Что и требуется доказать. Улыбка всегда будет
            • Дмитрий Новиков
              11 января 2017, 01:07
              Кирилл Браулов, да я читал. Хороший анализ. Но с корреляцией Олега? А что перед эксперой корреляция пропадёте. тут всё-таки мат ожидание смещённое. Вот перед эксперой оно не оказывает влияния на улыбку
    • bstone
      11 января 2017, 09:48
      Кирилл Браулов, ну во-первых это действительно никому не нужно, а во-вторых, прогноз по распределению траекторий имеет точность плюс/минус депозит.
        • Дмитрий Новиков
          11 января 2017, 15:39
          Кирилл Браулов, правильно Маркович по распределениям и приращениям считал
        • bstone
          11 января 2017, 16:03
          Кирилл Браулов, нет, конечно не достаточно, т.к. этот прогноз основан на том, что в окно попал дрифт, который в любой момент может исчезнуть или повернуться в противоположную сторону.
            • bstone
              11 января 2017, 17:46
              Кирилл Браулов, нет, даже при этих условиях нельзя рассчитывать на положительное МО т.к. помимо вероятности оно зависит еще и от величины изменения цены, которую вы не оговариваете.
                • bstone
                  11 января 2017, 18:11
                  Кирилл Браулов, я говорил в контексте опционов, где это действительно не нужно, т.к. цена опциона не зависит от того, куда придет цена. Она зависит только от волатильности БА.
                    • bstone
                      11 января 2017, 18:53
                      Кирилл Браулов, я говорил про реальную стоимость опционов, а улыбка — это то, как эту стоимость видит Коровин. Если я буду весь день покупать на каких-то страйках — улыбка изменится, хотя ничего в поведении БА не менялось и я могу попасть на деньги, а у вас все вероятности пересчитаются ибо «улыбка»! Так что вы тоже в конечном счете из-за этого попадете на деньги. Пустое это… :)
    • robomakerr
      18 января 2017, 13:14
      Кирилл Браулов, 
      нормальное подбиралось по равенству дисперсии?
      А если ему уменьшить дисперсию, не станет ли оно более точно аппроксимировать гистограмму?
        • robomakerr
          18 января 2017, 20:40
          Кирилл Браулов, 
          я не знаю, как по науке сравнить типы распределений, поэтому и спросил :) в учебниках тоже этого вопроса не встречал (кажется).
          Интуитивно, я бы делал так: распределения различаются формой, поэтому для сравнения формы надо максимально аппроксимировать одну кривую к другой. Критерий любой, например МНК. Можно уменьшить веса хвостов, т.к. для них мало значений, и в этих областях точность аппроксимации ниже.

          «отличие в хвостах будет уже наверное на порядок.» — так это же хорошо (наверное), ведь это одно из главных различий, которые мы ищем.
          После аппроксимации я бы разделил гистограмму на подогнанную кривую, и тут хвосты визуально проявились бы во всей красе)))
  • Старый бес
    10 января 2017, 23:35
    Я с Кириллом скорее согласен. В том смысле, что эмпирическое распределение штука, зачастую, не просто бесполезная, но и опасная. Мне достаточно и тех двух причин о которых писал. А про Байесовскую вероятность первый раз слышу(( пойду повышать уровень знаний. Кирилл, спасибо
      • Старый бес
        11 января 2017, 00:04
        Кирилл Браулов, класс! Там на стр 126 автор печалится о неточности прогноза погоды более чем На 7 суток. А кучу лет назад я натолкнулкся на доказательство Арнольда принципиальной невозможности прогнозирования погоды на такой и более срок При любых вычислительных мощностях. Очень мне то доказательство понравилось (как и все у Арнольда) но потом я его забыл а сейчас не могу найти((
      • Старый бес
        11 января 2017, 00:12
        Кирилл Браулов, да все так (там по ссылке) конечно. Возможно я в дискуссии просто подменил понятия — безусловно допустимы распределения со смещением на реальном рынке. Но тогда, если не брать экзотику в виде двух горбов, деньги нажииь можно и без опционов — достаточно БА
      • Дмитрий Новиков
        11 января 2017, 00:19
        Кирилл Браулов, я тоже с Мю путаюсь. Оно может давать эффект разбалансирование только в моменте. Когда собирается и сглаживается вся плотность и она МО положительная это удешевит колы справа. По той простой логике что все знают что цена пойдёт вверх, но очень медленно и опЦИКи скорее всего сгорят
  • Бобровский Дмитрий
    10 января 2017, 23:46
    Кто сказал, что параметры Вашего случайного процесса не меняются со временем? По полученному графику — посмотрите в сторону Стьюдента. Далее, попробуйте пройтись скользящим окном в N свечек и посмотрите, при каком N распределение будет близким к нормальному. Насчёт байесовского подхода мне не совсем понятно — имеется ввиду наивный классификатор? http://www.machinelearning.ru/wiki/index.php?title=%D0%91%D0%B0%D0%B9%D0%B5%D1%81%D0%BE%D0%B2%D1%81%D0%BA%D0%B8%D0%B9_%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%82%D0%BE%D1%80  Минимаксный подход, насколько мне известно, лучше.
      • Бобровский Дмитрий
        11 января 2017, 09:47
        Кирилл Браулов, в отношении формулы Байеса — если у Вас события A и B независимы, то пересчитывайте или не пересчитывайте,  но P(A|B) = P(A). Если события связаны — другой вопрос, но вероятности AB и A в любом случае знать необходимо будет.
        В отношении восстановления случайного процесса по некоторой реализации — чисто чёрный ящик вы не восстановите никогда. Необходимо знать хотя бы что-то об исследуемом процессе. Под это дело обычно подбирается некоторая модель, а дальше MLE/QMLE, CSS и другие методы позволят по данным реализации получить оценки параметров модели. 
        С точки зрения построения прогнозов лучшим в смысле СКО является условное мат.ожидание Y_{t}.
    • Олег\_TkilA_/
      11 января 2017, 11:41
      Бобровский Дмитрий, я непонял Вашу мысль есть кривулька цена от времени к ней прикрутить еще время? Или имелось ввиду, что через год при одинаковых исходных будет другая кривулька?
      • Бобровский Дмитрий
        11 января 2017, 11:53
        Олег _TkilA_/, есть случайный процесс, определяющий динамику цен или, н-р, логарифм приращения цен. Мы имеем одну из возможных реализаций данного случайного процесса. Y_{t} — значения цен в соответствующие моменты времени. Далее, определяете модель (например, ARMA(p,q), вычисляете p, q и значения коэффициентов полиномов и т.п.).
        • Олег\_TkilA_/
          11 января 2017, 12:27
          Бобровский Дмитрий, понятно, волшебное слово коэффициент.
  • Дмитрий Новиков
    11 января 2017, 00:54
    Вот кто владеет мат аппаратом может быть разяснил мне метод <iframe width=«640» height=«360» src=«www.youtube.com/embed/yHzr9MWiC0Q» frameborder=«0» allowfullscreen></iframe><br><em><a href=«www.lektorium.tv/lecture/14232»>Посмотреть видео</a> на сайте <a href=«www.lektorium.tv»>Лекториума</a></em> с  сороковой минуты примерно. 
    • bstone
      11 января 2017, 09:39
      Дмитрий Новиков, так там и объясняется где-то на 44-й минуте суть метода: «шаманство» :)
  • Johnny_22
    11 января 2017, 09:47

    Прокомментирую.
    Когда вы сравниваете прогноз погоды 1) на основе частотного подхода и 2) байесовского, вы немного лукавите.
    Фактически вы сравниваете анализ приращений погоды и абсолютного значения погоды. А на самом деле оба прогноза будут исходить из текущей погоды (солнце за окном или дождь). Да, у абсолютного значения погоды есть инерция. Т.е. если сейчас солнце, то очень вероятно, что и через полчаса будет солнце. Но! Изменение погоды в течение этих получаса — вот о чем речь — как его вы будете анализировать байесовским подохдом? По идее, если бы были ставки на погоду, можно было бы вернуть вероятности из коэффициентов выплаты (по аналогии как вы делаете на опционах). Но фактически с рынком есть 2 большие разницы:

    1. на рынке сами ставки (на опционах) влияют на цены базовых активов. Погода же полностью живет по своим правилам.
    2. применение байесовского подхода подразумевает большую волатильность волатильности + значительную волатильность матожидания. Первый же подход основывается на статичности рядов.

    • Johnny_22
      11 января 2017, 09:48
      Johnny_22, «А на самом деле оба прогноза будут исходить из текущей погоды (солнце за окном или дождь).» — имел в виду, что отправной точкой анализа будет текущее значение погоды/цены
      • Johnny_22
        11 января 2017, 15:57
        Кирилл Браулов, ну не совсем же так. На температурах (1 переменная), чтобы не заморачиваться с дождями, молниями и солнышками:
        сейчас температура 10 градусов
        П1 посчитал, что из 1000 исходов на день из предыдущих периодов в это же время года, матожидание изменения темп-ры за день будет пол градуса, а СКО, скажем, 2.5%. При этом он не учел текущий тренд (для этого нужно было бы взять, скажем, только 20 последних исходов). Вот он и делает прогноз: 11 градусов, диапазон 8,5-13,5 градусов.
        П2 делает так: смотрит в окно и видит, что прошла бабуся, вся укутанная в шубу и из мерседеса вылез парень в ветровке и в футболке. Для примера берем малое количество инфы (что соответствует низкой ликвдности на опционах, все что не ри и не си). П2 все это усредняет и делает вывод, что температура будет х градусов. Т.е. второй аналитик основывается не на объективных данных, а на мнениях других индивидов, которые, очевидно, переработали большое количество информации, и рискуют своим здоровьем (деньгами в случае с опциями) в случае неправильной оценки.
        как то так
  • Johnny_22
    11 января 2017, 09:50
    непонятно получилось))
  • Дмитрий Новиков
    11 января 2017, 19:34
    Подкину новую идейку. Как говорил один, давайте посмотрим на мировую практику. По моему, уже давно перестали мудрить с распределениями. То есть крыльями улыбки там особо не машут. Но, начинают добавлять взвеси которые могут повлиять на распределения. Это и новости и обстоятельства и прочее. Причём особо не замарачиваясь колоколом. Просто волу ЦС поднимают. Там можно увидеть разрывы в 50% между HV и IV. И вообще там фигурами торгуют. 
    • bstone
      11 января 2017, 19:48
      Дмитрий Новиков, правильно, разум подсказывает, что толстые хвосты надо рассматривать как они есть — крэши и прочие черные лебеди, когда все не коррелирующее вмиг коррелирует и получается полная задница как ни крути. Это отдельный режим в процессе ценообразования, так что нечего его втулять куда ни попадя и портить нормальное распределение.
      • Дмитрий Новиков
        11 января 2017, 20:09
        bstone, ну вот у нас про запор, который в мерс въехал, ходили анекдоты. Потом все устаканилось. Заставили страховки покупать. Так и там. Не один уважющий себя трейдер не станет работать без купленного пута. Ему брокер не даст (утрирую конечно). Но там правила и подходы жёстче чтоли. Думаю, Герчик там лекции не читает не потому, что его не слушали бы. А потому, что могли посадить потом лет на 10;)

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн