Использование корелляции широко распространено в финансовой теории и практике, от создания портфелей до стратегий статистического арбитража.
Основная сложность в применении корелляции это ее изменчивость: активы, которые в один момент времени кажутся практически некоррелироваными для целей хеджирования, могут стать высококореллироваными в другие моменты времени, например, при высокой активности рынка. Напротив, акции, кажущиеся подходящими для парной торговли, в связи с высокой корелляцией их приращений цены, могут позднее показать разнонаправленную динамику, приводящую к значительным потерям.
Нестабильность уровня еще усугубляется эмпирическими выводами о том, что волатильность корреляции сама по себе зависит от времени: в одно время корреляция между активами может плавно меняться в узком диапазоне, в другое время мы можем наблюдать изменения знака коэффициента корелляции в течении нескольких дней.
Предлагаю вашему вниманию для разбора одну из самых распространенных пар на российском рынке.
Сегодня мы рассчитаем доходность парного тренинга, где будет торговаться Газпром против Роснефти
Для начало взглянем на графики фьючерсов на данные акции за 12 месяцев:
Конечно не все из этих пар будут приносить стабильный доход, но если применить фильтрацию и отобрать лучшие пары по показателям то торговать можно 10-20 разных торговых пар.
А теперь давайте предположим какое кол-во разных стратегий можно построить выбрав 10-20 пар с хорошей доходностью, перебирая такие параметры как шаг котирования, динамическая нулевая линия и шаг выхода, мы можем построить более 500 разных стратегий, сделки по которым пересекаться на будут.
Если кому необходим файл со спредами который был построен на основании 55 пар, вы можете писать в личку.
или самостоятельно можете скачать с сайта http://www.saturn-capital.info/#!about1/c1od




Линейная регрессия часто используется для вычисления пропорции хеджирования в парном трейдинге. В идеальной ситуации коэффициенты этой регрессии — наклон линии регрессии и свободный член (пересечение) остаются всегда постоянными. Однако в реальности все, конечно, не так радужно, и значения этих параметров постоянно меняются во времени. Как правильно вычислять коэффициенты регрессии, чтобы избежать подгонки к текущей ситуации, рассматривается в статье "Online Linear Regression using a Kalman Filter". Для этой цели в данной публикации используется фильтр Калмана.
Для тестирования берутся исторические цены закрытия двух биржевых фондов ETF — австралийского EWA и канадского EWC с 2010 по 2014 год. Динамика цен этих фондов показывает взаимосвязь, что продемонстрировано на диаграмме рассеивания в заглавии поста. Однако по этому же графику видно, что эту взаимосвязь невозможно описать с помощью линейной регрессии с постоянными коэффициентами.