Сегодня я не пожалел время и посмотрел, что можно сделать с HAR моделью.
HAR — это Heterogeneous Autoregressive Model for Realized Volatility (простите, перевести не могу, а если и переведу, то толку мне от этого не будет)
Суть модели в том, что она оценивает три периода, заданых параметрами и строит линейную модель зависимости волатильности на следующий день, подгоняя коэффициенты модели.
Подробное описание модели с формулами и прочим можно найти в описании библиотеки Highfrequency.
Приведу два графика:
Первый — работа модели на SPY с 2007, второй — 2014 год.
Что тут можно исследовать? Посмотрим, какие параметры для модели наиболее точно описывают поведение. Критерием оценки возьмем среднее квадратичное отклонение расчитаных и настоящих данных.
Для этого я просто перебрал в цикле три параметра и записал наименьший результат. Для долгого периода он был равен 2 3 и 4, а для 2014 года 2, 8 и 10.
Среднее квадратичное отклонение за долгий период рано 0.15, за 2014 год — 0.008
При этом картинка с этими параметрами выглядит примерно так:
То есть, примерно, это некая средняя волатильность за период в десять дней, и квадрат отклонения ее минимален, что может означать, что закладывая ее в наши алгоритмы, и торгуя их достаточно долго, сильно мы не ошибемся, хотя, по ощущению, ежедневно она меньше расчетной величины.
Для чистоты эксперимента я посмотрел зависимость волатильности от средней волатильности за три предыдущих дня. Среднеквадратичное отклонение с 2007 года было 0.21, в 2014 году 0.09. То есть, я вполне могу допускать, особенно если взять в расчет, что на большом интервале коэффициенты стремятся к минимуму своих значений, что модель, по сути своей, имеет право на жизнь, но немного усложнена, и использование средней волатильности или средней волатильности в сочетание с волатильностью последнего дня не сильно скажется на результатах.
Кстати, уж не знаю, что и как, но при работе с библиотекой очень помогают исходники, ссылку на репозиторий с которыми я нашел в гугле!
Я спросил, что конкретно хочет человек от оценки волатильности, а не какие существуют стратегии, использующие волатильность.
Потому что иметь несколько параметров для одной из составляющих системы, имхо, перебор.
dspace.mit.edu/bitstream/handle/1721.1/65805/750045091.pdf?sequence=1