Ксения Кузнецова
Ксения Кузнецова личный блог
22 февраля 2018, 15:01

Коинтегрированные пары: аналитика за 2017 год на Мосбирже

В данном блог-посте будут представлены результаты исследования за 2017 год коинтегрированных пар акций, которые торгуются на Московской бирже. Методика тестирования основана на тесте Энгла-Грэнджера, но для начала проясним некоторые моменты про стационарность, возникшие в предыдущем блог-посте.

Стационарность

У нас вышел спор насчёт того, стационарные ли приращения у акций или нет. ch5oh говорил, что очевидно, что на рынке у всех акций приращения стационарны. SergeyJu — что очевидно, что на рынке нет ни одной акции со стационарными приращениями, и что RW-модель, используемая для описания цены акции, неадекватна. Первый вопрос, который здесь возникает: а как по графику понять, стационарный ряд или нет?

Напомню, что если говорить про стационарность без каких-либо формул и сложных понятий, то смысл в том, что стационарный ряд не меняет со временем свои характеристики, такие как матожидание, дисперсия и ковариации.

Постоянное матожидание на графике приращений выявить относительно легко — он должен колебаться вокруг некоторого среднего значения — это и будет постоянным матожиданием, а вот что касается дисперсии… во-первых, это мера разброса, и её нельзя изобразить на графике ряда, во-вторых, она может быть постоянной даже с неровными зубьями на графике и, в-третьих, насколько я поняла, суть стационарности не в ровной высоте зубьев, а в возврате к среднему. То есть когда мы видим график, который колеблется вокруг некоего постоянного значения, удаляется от него, а затем возвращается обратно, то такой ряд вполне может быть стационарным. Именно это свойство возврата к среднему нам и ценно в AR(1)-моделях.

Замечу также, что помимо AR(1)-моделей ранее я исследовала ещё и GBM-модели, и там выяснилось, что логарифм цены также имеет стационарные приращения.

Благодаря ch5oh удалось обнаружить ошибку в результатах интерпретации ADF-теста. После перерасчёта получилось 277 акций со стационарными приращениями. Приведу для примера график изменения цены одной из таких акций, а также график её приращений.
Коинтегрированные пары: аналитика за 2017 год на Мосбирже
Коинтегрированные пары: аналитика за 2017 год на Мосбирже
На графике приращений видно, что зубья разной длины. Однако, ряд то и дело возвращается к среднему, поэтому можно согласиться с тем, что он стационарный.

Дальше встаёт вопрос: а зачем нам нужны акции со стационарными приращениями? Для того, чтобы составить из них коинтегрированные пары.

Коинтегрированные пары

Про метод тестирования на наличие коинтеграции я подробно писала в статье на хабре. Я бы с радостью продублировала всю информацию здесь, но тут сложно вставлять красивые формулы, поэтому я просто приведу результаты.

Всего было протестировано 32385 пар. В случае регрессии без свободного члена получилось 8287 коинтегрированных пар, но не все модели были хорошими. Я отфильтровала модели с коэффициентом детерминации не менее 50%, чтобы получить набор из приемлемых моделей. Получилось 3483 пары. Изобразим одну из них: (MSNG, MRSB).
Коинтегрированные пары: аналитика за 2017 год на Мосбирже
Разность цен акций MSNG и MRSB с коэффициентом бета, равным 4,7796:
Коинтегрированные пары: аналитика за 2017 год на Мосбирже
Затем я отфильтровала модели с коэффициентом детерминации не менее 80%, чтобы получить набор из достаточно хороших моделей. Получилось 102 пары. Изобразим одну из них. Цены акций MSNG и OGKB:
Коинтегрированные пары: аналитика за 2017 год на Мосбирже
Разность цен акций MSNG и OGKB с коэффициентом бета, равным 5,4827:
Коинтегрированные пары: аналитика за 2017 год на Мосбирже
Ну и дальше я отфильтровала модели с коэффициентом детерминации не менее 90%. Получилось 4 пары. Изобразим одну из них. Цены акций SBERP и MSTT:
Коинтегрированные пары: аналитика за 2017 год на Мосбирже
Разность цен акций SBERP и MSTT с коэффициентом бета, равным 1,1928:
Коинтегрированные пары: аналитика за 2017 год на Мосбирже
В следующем блог-посте я покажу результаты по доходности на бэктестах.
46 Комментариев
  • bstone
    22 февраля 2018, 15:28
    102 хороших пары из 32385 — это 0.3%. Я бы задумался, т.к. это серьезная претензия на статистический шум и подгонку под целевой критерий.
    • Осень
      22 февраля 2018, 15:45
      bstone, с коэффициентом 90% это нормально ) только работать эти пары будут редко и плохо.
      • bstone
        22 февраля 2018, 16:13
        Spooke67, ну если это нормально ))
        • Осень
          22 февраля 2018, 16:22
          bstone, ну у амеров к примеру было найдено всего 800 пар которые на периоде 1 год не убивали портфель в ноль не разрывались и не переворачивались, а это еще более меньший процент в соотношении общего кол-ва пар) так что да это скорее нормально чем нет))
          • bstone
            22 февраля 2018, 16:25
            Spooke67, ну фишка в том, что чем их меньше, тем меньше вероятность, что этого не случится в форварде на следующий год.
            • Осень
              22 февраля 2018, 16:41
              bstone, вы будете смеяться но приведение списка пар  происходит с периодичностью раз в неделю ) какой год вы что))
              • bstone
                22 февраля 2018, 16:48
                Spooke67, да хоть раз в день. Это никак не повлияет на вероятность разрыва бачка на следующий день :)
                • Осень
                  22 февраля 2018, 17:47
                  bstone, ну как раз на вероятность и повлияет ) на сам разрыв нет)

  • Осень
    22 февраля 2018, 15:41
    а насколько аджастные данные вы использовали где брали и как приводили их в аджаст если не секрет? но если вы работали с данными с сервера финама то извините всю вашу работу можно выкинуть не читая.
      • Осень
        22 февраля 2018, 15:51
        Ксения Кузнецова, так у вас цены клозы по пта или по реальным торгам? вы же понимаете что во время пта никаких действий с акциями вы делать не можете а разброс там составляет до 1-2%
          • Осень
            22 февраля 2018, 16:40
            Ксения Кузнецова, на америке все так и есть, но у нас если брать клозу по пта то все ваши коэффициенты слетают к чертям собачьим впрочем дело ваше.
            • SergeyJu
              22 февраля 2018, 18:47
              Spooke67, для академического исследования, может, и сойдет. Для практики подход автора неприменим.
              • Осень
                22 февраля 2018, 18:49
                SergeyJu, ну совершенно не согласен с вами, именно так и торгуются пары и никак иначе, другой вопрос что степень автоматизации этой торговли очень высокая и мощности необходимые для этого тоже не маленькие как и достаточность капитала.
                • SergeyJu
                  22 февраля 2018, 18:54
                  Spooke67, я про некорректные закрытия дня в данных финама. А Вы о чем?
                  • Осень
                    22 февраля 2018, 18:56
                    SergeyJu, ну это влияет только на корректность отбора да.
  • wrmngr
    22 февраля 2018, 15:53
    стационарности на рынке нет и быть не может даже в теории
    • Осень
      22 февраля 2018, 15:56
      wrmngr, конечно не может ) постоянной стационарности, а вот окна есть.
      • wrmngr
        22 февраля 2018, 15:57
        Spooke67, окна? какие такие окна?
    • Ну как бы
      22 февраля 2018, 17:17
      wrmngr, просто алгоритмисты, как правило, работают не с самой ценой, а с её приращениями, чтобы создать иллюзию стационарности рынка. 
      • wrmngr
        22 февраля 2018, 17:26
        Ну как бы, я в курсе. но сути это не меняет
        • Осень
          22 февраля 2018, 17:49
          wrmngr, суть как всегда лежит исключительно в области ограничения рисков)
          • SergeyJu
            22 февраля 2018, 18:35
            Spooke67, суть в предсказуемости. Если выбрать в один год пары наиболее подобных в каком-то смысле акций, пусть в смысле автора, насколько это свойство сохранится на следующий год. И насколько опасно несохранение этого свойства для торговой практики. 
            • Осень
              22 февраля 2018, 18:44
              SergeyJu, ну если вы понимаете что такое коинтеграция то смысл тут не в подобии а в частоте взаимных пересечений стационарных  временных рядов, но коллеги вот уверены в том что стационарности на рынке нет и быть не может) однако коэффициент дики фуллера говорит об обратном) я с коллегами согласен что постоянной стационарности на рынке нет, но вот фреймы когда временные ряды становятся стационарными присутствуют, но это уже другая тема) а врменной лаг в год не имеет значения совершенно, все это торгуется и хай фрегуенси тоже
              • SergeyJu
                22 февраля 2018, 18:51
                Spooke67, я немножко некорректно употребил слово подобие. Но это Вы поняли. Предположим, Ваша торговая система эксплуатирует некое свойство рынка. Предположим, Вы взяли пару, которая этим свойством обладала. Что Вы выиграете, если оно сохранится. Что Вы потеряете, если не сохранится и с какой вероятностью произойдет тот или иной вариант. В этом же вопрос, а не в абстрактной постановке автора.
                • Осень
                  22 февраля 2018, 18:55
                  SergeyJu, все как всегда имея инструмент — тобишь отобранные по достаточно сложной методике пары, мы с ним работаем а уж как вы с этим работаете зависит от вас. а стат арбитраж основан на том же постулате что и все системы на рынке — история повторяется))
                  • SergeyJu
                    22 февраля 2018, 19:07
                    Spooke67, поясню мысль. Есть (у Вас или еще кого) способ торговать пары акций. Вопрос состоит в том, чтобы отобрать те пары, которые выгодно будет торговать завтра и отсеять те, которые невыгодно. Автор начинает с отбора пар по некоторому критерию. Но этот критерий не тождественен финансовому результату. Заменим критерий финансовым результатом. Отбираем пары, которые более-менее стабильно дают плюс в течение квартала или года или какого другого временного окна. Мы получим возможность напрямую исследовать наследуемость (стационарность) того, что нам  нужно — доходности.
                    • Осень
                      22 февраля 2018, 19:09
                      SergeyJu, ну вы делаете такой вывод только потому что автор использует не полностью аджастные данные, но сам метод отбора именно такой и могу вас заверить отлично работает, у меня к автору есть замечания исключительно по качеству данных.
                      • SergeyJu
                        22 февраля 2018, 19:16
                        Spooke67, то, что автор использует кривые данные тут не при чем. Я пытался пояснить, что можно уйти от идеи оценки стационарности или коинтегрированности цен, переключившись на анализ финансовых результатов применения (модельного) торгового алгоритма ко всем парам, без отбора. А отбор основывать на расчетных финансовых результатах.
                        • Осень
                          22 февраля 2018, 19:23
                          SergeyJu, плохо представляю как это сделать, предложите действующую методику рассмотрим.
                          • SergeyJu
                            22 февраля 2018, 19:27
                            Spooke67, Вы же не руками пары торгуете?
                            • Осень
                              22 февраля 2018, 19:28
                              SergeyJu, нет не руками)
                              • SergeyJu
                                22 февраля 2018, 19:36
                                Spooke67, значит есть торговая система и можно её прогнать в тестовом режиме на любой паре. Получить для неё фининсовые результаты по всем дням. А потом поискать  способ выбора пар для торговли по прошлым результатам. Например — устйчивую положительность в течение предшествующего года.
                                • Осень
                                  22 февраля 2018, 20:02
                                  SergeyJu, ну если у вас есть собственный дата центр мжете этим заняться)) самое интересное что полученные пары в итоге будут те же самые )) но времени и ресурсов уйдет раз в сто больше) это называется удалять гланды через задний проход) в совдепии на уроках математики снижали оценки за усложнение решения задачи)
                                  • SergeyJu
                                    22 февраля 2018, 20:54
                                    Spooke67, Вы писали: «степень автоматизации этой торговли очень высокая и мощности необходимые для этого тоже не маленькие». 
                                    А теперь, выясняется, что и с данными у Вас и с вычислительными мощностями проблемы. Остается вопрос, а как Вам удалось узнать, что ценой бОльших затрат будет получен тот же ответ. Я вижу, что ценой некоторого усложнения расчетов получается гораздо более мощная и адекватная конструкция. 
                                    • Осень
                                      22 февраля 2018, 21:04
                                      SergeyJu, да не собираюсь с вами спорить на этот счет) если есть желание делайте так как считаете нужным, не мне же вам доказывать обратное)
                                      • SergeyJu
                                        24 февраля 2018, 13:20
                                        Spooke67, я так и делаю. Сначала система — потом фильтры.
              • wrmngr
                22 февраля 2018, 20:14
                Spooke67, Но хорошо, пойдем от противного (кем бы он ни был).
                Возьмём ГСЧ (хороший!) и сделаем им, ну допустим, 3000 заведомо независимых логнормальных синтетических рядов дневок за 10 лет. Ну матожидание положим ноль, сигма 20 годовых. Будем считать, что эмулируем рынок более-менее tradeble акций США.
                Далее выбираем некое разумное окно, скользким им, считаем гренджера, дики-фуллера и прочее. Все как полагается.
                И получаем какой то процент percent_synth локально коинтегрированных участков некоторых пар.
                Внимание, вопрос: будет ли percent_synth значимо отличаться от percent_real?
                • Осень
                  22 февраля 2018, 20:18
                  wrmngr, будет однозначно, поэтому и говорю что истина всегда в ограничении риска, ну и речь идет о портфеле, а не о каждой отдельно взятой паре, в итоге приходим к тому что полной автоматизации нет и быть не может, но не к тому что финрез будет стремится к нулю.
                  • wrmngr
                    22 февраля 2018, 20:37
                    Spooke67, ясно. Рисков тут конечно много разных. Кроме всего прочего я так понимаю приходится брать нехилое плечо чтобы вытянуть доходность
                    • SergeyJu
                      22 февраля 2018, 21:01
                      wrmngr, тема рисков при таком подходе вообще улетная. Например, мы знаем, что контртрендовая торговля даже на единичном активе (в данном случае — на одной паре) чревата черным лебедем. Если взять много пар, какие шансы получить синхронно целый их выводок? Я не против такого стиля вообще, но я не думаю, что такой стиль может иметь существенную долю в портфеле.
                      • wrmngr
                        22 февраля 2018, 21:41
                        SergeyJu, да, всё верно. Леверидж и mean-reversion дают взрывную смесь
                        • Осень
                          22 февраля 2018, 22:15
                          wrmngr, ну LTCM  это доказали еще в 1998г))
                    • Осень
                      22 февраля 2018, 21:02
                      wrmngr, в IB  маржин портфолио вполне достаточно

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн