Кирилл Браулов
Кирилл Браулов личный блог
27 июня 2015, 01:17

Точность прогноза

Допустим, есть две системы, которые выдают прогноз — где будет БА на экспирацию. Прогноз выдается в виде распределения вероятностей. Задача: оценить на истории — какая система выдает более точный прогноз.

Вот картинка для иллюстрации. Слева график цены БА, справа два графика плотности вероятности, синий для распределения P, зеленый для распределения Q. Красным кружочком отмечен уровень S, где реально оказалась прогнозируемая цена:
Точность прогноза 
Для оценки точности прогноза пробовал считать средний квадрат отклонения распределения от S (кажется, этот метод называется MSE). Для вышеприведенной картинки такое отклонение меньше у распределения P. Но, мне кажется, что распределение Q более точное: оно дает гораздо большую вероятность для красного кружочка.

Может кто подскажет — можно ли как-то по другому считать точность распределения-прогноза? 

40 Комментариев
  • Mr. Bean
    27 июня 2015, 01:54
    критерием отношения правдоподобия тут надо. у вас два теоретических распределения и одно фактическое.
      • Marco
        27 июня 2015, 11:04
        Кирилл Браулов, S — это случайная величина, которая имеет свое распределение. Можно найти фактическое распределение S методом бутстрэппинга и затем сравнивать его с теоретическими распределениями P и Q.
          • Mr. Bean
            27 июня 2015, 22:08
            Кирилл Браулов,

            -Разве мы сможем по ней одной восстановить распределение D?

            Это надо курить бутстреппинг:)) кстати, наверно несложно проверить: вначале генерируете по выбранной модели одну траекторию, а потом из неё бутстрепом пытаетесь восстановить первоначальную модель.
              • Mr. Bean
                28 июня 2015, 16:40
                Кирилл Браулов, логика верная, но я не понимаю что за распределение получится из улыбки. это же будет распределение к экспирации и оно будет каждый день меняться т.к. улыбка постепенно схлопывается. А где взять такую модель? Может есть смысл восстанавливать распределение с двух улыбок соседних экспираций по типу как деают для расчёта викса.

                Сам близко капаю)) Но я сравниваю только модели волатильности и вот думаю как раз над тем как сравнить с улыбкой или виксом из прогнозную силу.
                  • Mr. Bean
                    28 июня 2015, 21:39
                    Кирилл Браулов, ну а с другой стороны если текущая серия заканчивается через 3 дня а заседание ФРС будет только через 10 дней и рынок это будет учитывать, а истекающие опционы — нет. тогда сравнение получится некорректным.

                    когда мы берём две улыбки то не надо их нормировать на срок до экспирации можно просто брать фиксированное время, например 22 дня, а потом переводить это в однодневное распределение чтобы сравнить с рыночным распределением.
          • Marco
            28 июня 2015, 00:27
            Кирилл Браулов, да, так.

            У вас цена актива — случайная величина — кумулятивная сумма случайных пошаговых приращений цены. То, что в конечный момент времени цена оказалась равна S — тоже случайность — «одна из бесконечного количества траекторий». Вы не знаете, равно ли S матожиданию цены, или оно за 2-3 сигмы выходит. Оценивать по одному случайному значению S правильность ваших моделей как-то неправильно.

            Для того, чтобы восстановить по одной траектории распределение, как раз и используют bootstrapping.
              • Marco
                29 июня 2015, 14:15
                Кирилл Браулов, относительно эмпирического распределения. Проблема в том, что посчитать эмпирическое распределение напрямую нельзя (у нас эксперимент только один, с одной траекторией движения цены). Но есть ряд статистических методов, которые позволяют по одному эксперименту оценить полное распределение. Один их этих методов — bootstrapping, суть которого — генерация множества дополнительных выборок случайным выбором данных из одной имеющейся выборки.

                Можно ли на основании полученного распределения что-то прогнозировать — не факт, т.к. система у нас скорее всего нестационарная.
      • Mr. Bean
        27 июня 2015, 13:21
        Кирилл Браулов, да смесь ни при чём тут. вот это имел ввиду:

        en.wikipedia.org/wiki/Likelihood-ratio_test

        фактическое это реальные данные ваши. сравнивается для какого из двух ваших систем они более правдоподобны, т.е. более вероятны.
          • Mr. Bean
            27 июня 2015, 18:59
            Кирилл Браулов, совершенно верно по одной единственной реализации проверить нельзя. иначе можно было к вашим двум кривым пририсовать третью (эмпирическую) и посмотреть на какую из двух она больше похожа. поэтому вычисляются различные статистики и на их основе строятся критерии, проверяются гипотезы, т.е. как бы полученный результат проверяется на независимость от конкретной выпавшей реализации.
              • Mr. Bean
                27 июня 2015, 20:39
                Кирилл Браулов, можно ещё глянуть информационные критерии AIC, BIC. И вообще лучше сразу конкретные примеры искать иначе в теории можно зарыться на долго.

                Все эти критерии есть в R — можно гуглить сразу с примерами, но это лучше на английском делать.
      • Mr. Bean
        27 июня 2015, 13:27
        Кирилл Браулов, кроме того если ваши распределения отличаются только дисперсиями, то можно их и сравнивать, например через функции потерь на прокси (volatility proxy).
          • Mr. Bean
            27 июня 2015, 19:32
            Кирилл Браулов, возможно проще будет моменты по отдельности сравнивать, чем всю плотность.
    • Mr. Bean
      27 июня 2015, 13:40
      .Агрегатор., так мы и находимся в ситуации недостаточности данных))
  • ves2010
    27 июня 2015, 08:19
    я как то смотрел видос с профессором ВШЭ… он утверждал, что закрытие будет в том страйке, где картинка цены опциона максимально похожа на картинку цены БА… имхо он попутал причину со следствием… но могешь проверить… все таки профессор ВШЭ… хотя в LTCM слились нобелевские лауреаты
  • Макс
    27 июня 2015, 11:25
    Я б для начала не парил себе мозг и монтекарлил.
  • Игорь Рябушкин
    27 июня 2015, 11:45
    Критерий точности прогноза неясен, а скорее всего — отсутствует на данный момент. Что понимается под точностью прогноза?

    Вообще точность системы прогнозирования на единственном испытании оценить невозможно. Нужна серия испытаний.
  • Игорь Рябушкин
    27 июня 2015, 11:47
    Почему эти два прогноза вообще совпадают в точке максимального значения вероятности? Подозреваю, что это один и тот же прогноз. Отсюда и затруднения в понимании как их сравнивать.
    • Mr. Bean
      27 июня 2015, 13:39
      Игорь Рябушкин, потому что в моделях у автора МО предполагается равным нулю. вроде очевидно.
        • Mr. Bean
          27 июня 2015, 18:51
          Кирилл Браулов, эммм… так надо рассматривать распределение приращений а не самих цен…
  • Spekyl
    28 июня 2015, 10:11
    Точность прогноза надо вычислять в той величине, результат в которой можно будет реально использовать.
  • AlexeyTikhonov
    28 июня 2015, 23:48
    Выбирать модель можно по разному:
    если по критерию близости (прогнозной силе) к реальному значению (на тестовых выборках),
    то основных способов 3 (хотя их много, и т.к. здесь ряд, то возможно нужен MASE):
    1. средняя квадратичная ошибка (это Вы сделали)
    2. средняя ошибка по модулю
    3. средняя процентная ошибка
    Как мне кажется для цен лучше считать по 3 способу (или по MASE),
    но можно считать по всем 3-4 и думать дальше.
    Если просто выбирать модель, то можно попробовать смотреть на критерий Фишера и/или на информационные критерии AIC, BIC и т.д.,
    но это только в том случае, если в модели есть функция правдоподия, но и то это не совсем корректно для выбора лучшей модели.
      • AlexeyTikhonov
        29 июня 2015, 07:36
        Кирилл Браулов, отличный список, мне он тоже очень полезен, все в 1 месте;), но там нет одного критерия хорошего для временных рядов — MASE
        en.wikipedia.org/wiki/Mean_absolute_scaled_error

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн