Блог им. AdrenaLeen

Коинтегрированные пары: аналитика за 2017 год на Мосбирже

В данном блог-посте будут представлены результаты исследования за 2017 год коинтегрированных пар акций, которые торгуются на Московской бирже. Методика тестирования основана на тесте Энгла-Грэнджера, но для начала проясним некоторые моменты про стационарность, возникшие в предыдущем блог-посте.

Стационарность

У нас вышел спор насчёт того, стационарные ли приращения у акций или нет. ch5oh говорил, что очевидно, что на рынке у всех акций приращения стационарны. SergeyJu — что очевидно, что на рынке нет ни одной акции со стационарными приращениями, и что RW-модель, используемая для описания цены акции, неадекватна. Первый вопрос, который здесь возникает: а как по графику понять, стационарный ряд или нет?

Напомню, что если говорить про стационарность без каких-либо формул и сложных понятий, то смысл в том, что стационарный ряд не меняет со временем свои характеристики, такие как матожидание, дисперсия и ковариации.

Постоянное матожидание на графике приращений выявить относительно легко — он должен колебаться вокруг некоторого среднего значения — это и будет постоянным матожиданием, а вот что касается дисперсии… во-первых, это мера разброса, и её нельзя изобразить на графике ряда, во-вторых, она может быть постоянной даже с неровными зубьями на графике и, в-третьих, насколько я поняла, суть стационарности не в ровной высоте зубьев, а в возврате к среднему. То есть когда мы видим график, который колеблется вокруг некоего постоянного значения, удаляется от него, а затем возвращается обратно, то такой ряд вполне может быть стационарным. Именно это свойство возврата к среднему нам и ценно в AR(1)-моделях.

Замечу также, что помимо AR(1)-моделей ранее я исследовала ещё и GBM-модели, и там выяснилось, что логарифм цены также имеет стационарные приращения.

Благодаря ch5oh удалось обнаружить ошибку в результатах интерпретации ADF-теста. После перерасчёта получилось 277 акций со стационарными приращениями. Приведу для примера график изменения цены одной из таких акций, а также график её приращений.
Коинтегрированные пары: аналитика за 2017 год на Мосбирже
Коинтегрированные пары: аналитика за 2017 год на Мосбирже
На графике приращений видно, что зубья разной длины. Однако, ряд то и дело возвращается к среднему, поэтому можно согласиться с тем, что он стационарный.

Дальше встаёт вопрос: а зачем нам нужны акции со стационарными приращениями? Для того, чтобы составить из них коинтегрированные пары.

Коинтегрированные пары

Про метод тестирования на наличие коинтеграции я подробно писала в статье на хабре. Я бы с радостью продублировала всю информацию здесь, но тут сложно вставлять красивые формулы, поэтому я просто приведу результаты.

Всего было протестировано 32385 пар. В случае регрессии без свободного члена получилось 8287 коинтегрированных пар, но не все модели были хорошими. Я отфильтровала модели с коэффициентом детерминации не менее 50%, чтобы получить набор из приемлемых моделей. Получилось 3483 пары. Изобразим одну из них: (MSNG, MRSB).
Коинтегрированные пары: аналитика за 2017 год на Мосбирже
Разность цен акций MSNG и MRSB с коэффициентом бета, равным 4,7796:
Коинтегрированные пары: аналитика за 2017 год на Мосбирже
Затем я отфильтровала модели с коэффициентом детерминации не менее 80%, чтобы получить набор из достаточно хороших моделей. Получилось 102 пары. Изобразим одну из них. Цены акций MSNG и OGKB:
Коинтегрированные пары: аналитика за 2017 год на Мосбирже
Разность цен акций MSNG и OGKB с коэффициентом бета, равным 5,4827:
Коинтегрированные пары: аналитика за 2017 год на Мосбирже
Ну и дальше я отфильтровала модели с коэффициентом детерминации не менее 90%. Получилось 4 пары. Изобразим одну из них. Цены акций SBERP и MSTT:
Коинтегрированные пары: аналитика за 2017 год на Мосбирже
Разность цен акций SBERP и MSTT с коэффициентом бета, равным 1,1928:
Коинтегрированные пары: аналитика за 2017 год на Мосбирже
В следующем блог-посте я покажу результаты по доходности на бэктестах.
★3
46 комментариев
102 хороших пары из 32385 — это 0.3%. Я бы задумался, т.к. это серьезная претензия на статистический шум и подгонку под целевой критерий.
avatar
bstone, с коэффициентом 90% это нормально ) только работать эти пары будут редко и плохо.
avatar
Spooke67, ну если это нормально ))
avatar
bstone, ну у амеров к примеру было найдено всего 800 пар которые на периоде 1 год не убивали портфель в ноль не разрывались и не переворачивались, а это еще более меньший процент в соотношении общего кол-ва пар) так что да это скорее нормально чем нет))
avatar
Spooke67, ну фишка в том, что чем их меньше, тем меньше вероятность, что этого не случится в форварде на следующий год.
avatar
bstone, вы будете смеяться но приведение списка пар  происходит с периодичностью раз в неделю ) какой год вы что))
avatar
Spooke67, да хоть раз в день. Это никак не повлияет на вероятность разрыва бачка на следующий день :)
avatar
bstone, ну как раз на вероятность и повлияет ) на сам разрыв нет)

avatar
а насколько аджастные данные вы использовали где брали и как приводили их в аджаст если не секрет? но если вы работали с данными с сервера финама то извините всю вашу работу можно выкинуть не читая.
avatar
Spooke67, брала с сайта Московской биржи. Насколько я знаю, цены закрытия там уже скорректированные.
Ксения Кузнецова, так у вас цены клозы по пта или по реальным торгам? вы же понимаете что во время пта никаких действий с акциями вы делать не можете а разброс там составляет до 1-2%
avatar
Spooke67, обычно, когда говорят про скорректированные цены закрытия, имеют в виду цены, скорректированные по дивидендам.

На Московской бирже в качестве цены закрытия для акций используется цена аукциона закрытия. Я понимаю, что во время этого аукциона никаких действий с акциями я делать не могу, но нам и не нужно ничего делать с акциями во время ПТА.

Нам нужна цена закрытия, чтобы рассчитать коэффициент коинтеграции. Цена закрытия — это просто некий расчётный показатель, который нам нужен, чтобы оценить актив. А торговать мы будем внутри дня, причём не по цене закрытия.
Ксения Кузнецова, на америке все так и есть, но у нас если брать клозу по пта то все ваши коэффициенты слетают к чертям собачьим впрочем дело ваше.
avatar
Spooke67, для академического исследования, может, и сойдет. Для практики подход автора неприменим.
avatar
SergeyJu, ну совершенно не согласен с вами, именно так и торгуются пары и никак иначе, другой вопрос что степень автоматизации этой торговли очень высокая и мощности необходимые для этого тоже не маленькие как и достаточность капитала.
avatar
Spooke67, я про некорректные закрытия дня в данных финама. А Вы о чем?
avatar
SergeyJu, ну это влияет только на корректность отбора да.
avatar
стационарности на рынке нет и быть не может даже в теории
avatar
wrmngr, конечно не может ) постоянной стационарности, а вот окна есть.
avatar
Spooke67, окна? какие такие окна?
avatar
wrmngr, просто алгоритмисты, как правило, работают не с самой ценой, а с её приращениями, чтобы создать иллюзию стационарности рынка. 
avatar
Ну как бы, я в курсе. но сути это не меняет
avatar
wrmngr, суть как всегда лежит исключительно в области ограничения рисков)
avatar
Spooke67, суть в предсказуемости. Если выбрать в один год пары наиболее подобных в каком-то смысле акций, пусть в смысле автора, насколько это свойство сохранится на следующий год. И насколько опасно несохранение этого свойства для торговой практики. 
avatar
SergeyJu, ну если вы понимаете что такое коинтеграция то смысл тут не в подобии а в частоте взаимных пересечений стационарных  временных рядов, но коллеги вот уверены в том что стационарности на рынке нет и быть не может) однако коэффициент дики фуллера говорит об обратном) я с коллегами согласен что постоянной стационарности на рынке нет, но вот фреймы когда временные ряды становятся стационарными присутствуют, но это уже другая тема) а врменной лаг в год не имеет значения совершенно, все это торгуется и хай фрегуенси тоже
avatar
Spooke67, я немножко некорректно употребил слово подобие. Но это Вы поняли. Предположим, Ваша торговая система эксплуатирует некое свойство рынка. Предположим, Вы взяли пару, которая этим свойством обладала. Что Вы выиграете, если оно сохранится. Что Вы потеряете, если не сохранится и с какой вероятностью произойдет тот или иной вариант. В этом же вопрос, а не в абстрактной постановке автора.
avatar
SergeyJu, все как всегда имея инструмент — тобишь отобранные по достаточно сложной методике пары, мы с ним работаем а уж как вы с этим работаете зависит от вас. а стат арбитраж основан на том же постулате что и все системы на рынке — история повторяется))
avatar
Spooke67, поясню мысль. Есть (у Вас или еще кого) способ торговать пары акций. Вопрос состоит в том, чтобы отобрать те пары, которые выгодно будет торговать завтра и отсеять те, которые невыгодно. Автор начинает с отбора пар по некоторому критерию. Но этот критерий не тождественен финансовому результату. Заменим критерий финансовым результатом. Отбираем пары, которые более-менее стабильно дают плюс в течение квартала или года или какого другого временного окна. Мы получим возможность напрямую исследовать наследуемость (стационарность) того, что нам  нужно — доходности.
avatar
SergeyJu, ну вы делаете такой вывод только потому что автор использует не полностью аджастные данные, но сам метод отбора именно такой и могу вас заверить отлично работает, у меня к автору есть замечания исключительно по качеству данных.
avatar
Spooke67, то, что автор использует кривые данные тут не при чем. Я пытался пояснить, что можно уйти от идеи оценки стационарности или коинтегрированности цен, переключившись на анализ финансовых результатов применения (модельного) торгового алгоритма ко всем парам, без отбора. А отбор основывать на расчетных финансовых результатах.
avatar
SergeyJu, плохо представляю как это сделать, предложите действующую методику рассмотрим.
avatar
Spooke67, Вы же не руками пары торгуете?
avatar
SergeyJu, нет не руками)
avatar
Spooke67, значит есть торговая система и можно её прогнать в тестовом режиме на любой паре. Получить для неё фининсовые результаты по всем дням. А потом поискать  способ выбора пар для торговли по прошлым результатам. Например — устйчивую положительность в течение предшествующего года.
avatar
SergeyJu, ну если у вас есть собственный дата центр мжете этим заняться)) самое интересное что полученные пары в итоге будут те же самые )) но времени и ресурсов уйдет раз в сто больше) это называется удалять гланды через задний проход) в совдепии на уроках математики снижали оценки за усложнение решения задачи)
avatar
Spooke67, Вы писали: «степень автоматизации этой торговли очень высокая и мощности необходимые для этого тоже не маленькие». 
А теперь, выясняется, что и с данными у Вас и с вычислительными мощностями проблемы. Остается вопрос, а как Вам удалось узнать, что ценой бОльших затрат будет получен тот же ответ. Я вижу, что ценой некоторого усложнения расчетов получается гораздо более мощная и адекватная конструкция. 
avatar
SergeyJu, да не собираюсь с вами спорить на этот счет) если есть желание делайте так как считаете нужным, не мне же вам доказывать обратное)
avatar
Spooke67, я так и делаю. Сначала система — потом фильтры.
avatar
Spooke67, Но хорошо, пойдем от противного (кем бы он ни был).
Возьмём ГСЧ (хороший!) и сделаем им, ну допустим, 3000 заведомо независимых логнормальных синтетических рядов дневок за 10 лет. Ну матожидание положим ноль, сигма 20 годовых. Будем считать, что эмулируем рынок более-менее tradeble акций США.
Далее выбираем некое разумное окно, скользким им, считаем гренджера, дики-фуллера и прочее. Все как полагается.
И получаем какой то процент percent_synth локально коинтегрированных участков некоторых пар.
Внимание, вопрос: будет ли percent_synth значимо отличаться от percent_real?
avatar
wrmngr, будет однозначно, поэтому и говорю что истина всегда в ограничении риска, ну и речь идет о портфеле, а не о каждой отдельно взятой паре, в итоге приходим к тому что полной автоматизации нет и быть не может, но не к тому что финрез будет стремится к нулю.
avatar
Spooke67, ясно. Рисков тут конечно много разных. Кроме всего прочего я так понимаю приходится брать нехилое плечо чтобы вытянуть доходность
avatar
wrmngr, тема рисков при таком подходе вообще улетная. Например, мы знаем, что контртрендовая торговля даже на единичном активе (в данном случае — на одной паре) чревата черным лебедем. Если взять много пар, какие шансы получить синхронно целый их выводок? Я не против такого стиля вообще, но я не думаю, что такой стиль может иметь существенную долю в портфеле.
avatar
SergeyJu, да, всё верно. Леверидж и mean-reversion дают взрывную смесь
avatar
wrmngr, ну LTCM  это доказали еще в 1998г))
avatar
wrmngr, в IB  маржин портфолио вполне достаточно
avatar

теги блога Ксения Кузнецова

....все тэги



UPDONW
Новый дизайн