Друзья, представляю вашему вниманию базу коинтегрированных пар:
iqsignal.net/coint
На сайте выложена база данных, состоящая из 1 296 208 коинтегрированных пар (из 14 163 423 предварительно проанализированных пар) с 7 бирж (MOEX, NYSE, NASDAQ, AMEX, Poloniex, Binance, Kraken). Для того, чтобы этот проект появился, были написаны:
- 7 парсеров
- приложение для статистического анализа, которое использует матлаб для проверки коинтеграции и получения коэффициента авторегрессии коинтеграционного спреда
- бектестер, корректность которого была проверена сравнением сделок с бектестером метатрейдера
Ранее у меня была идея сделать сервис торговых сигналов по парному арбитражу. Однако после тщательных исследований стало понятно, что эта идея не подходит в качестве успешной бизнес-модели. Анализ рынка показал, что веб-приложение, связанное только с темой коинтеграции, способно захватить лишь очень узкий сегмент.
Сейчас мы сделали пивот. Однако база данных с коинтегрированными парами может быть полезна, если вы занимаетесь парным арбитражом.
И правильно ли понимаю, что вы работаете в этой теме с переменной интенсивностью около 5-7 лет? Интерес вызывает мотивация к столь долгосрочным и затратным исследованиям
— Начинающим трейдерам тяжело заниматься алгоритмической торговлей.
— Я думаю, что сумею разработать торгового робота, который будет генерировать сделки, повторение которых поможет начинающим трейдерам войти в рынок.
— Статистика по торговому роботу поможет начинающему трейдеру объективно оценить привлекательность инвестиционной идеи.
— Создав торгового робота с публичными сделками, мы дадим начинающим трейдерам прозрачность, ощущение контроля и уверенность в стабильном росте средств на инвестиционном счете.
Суть пивота больше в монетизации. Да, занимаюсь около 7 лет. Мотивация заключается в том, чтобы нагрузить свой мозг на 100% и реализовать весь его потенциал.
Ксения Кузнецова, возможно просто странные для меня формулировки, но все же:
* суть автоследования — не помощь в торговле, а скорее прямая инвестиция для подписчиков. При этом именно что для начинающего инвестора (не трейдера). К помощи начинающим алготрейдера можно, скорее, отнести ваши статьи на хабре или данные на вашем сайте.
* кмк у вас серьезный подход к делу, и у меня небольшой диссонанс, т.к. у автоследования есть некая аура околорынка. На смартлабе в разделе алго можно найти много обсуждений на эту тему, поэтому тема несколько спорная. Отсюда и изначальный вопрос.
Насчет околорынка. С одной стороны да, копитрейдинг — это околорынок, потому что автор зарабатывает на подписке, а не на собственной торговле. С другой стороны, идея торговать только собственный депозит ограничивает в возможной прибыли, и копитрейдинг показался мне самым простым выходом из этой ситуации.
Обсуждения на эту тему изучу. Если там совсем зашквар, то сделаем еще один пивот )
Ксения Кузнецова, это не зашквар, конечно) просто есть особенности.
Еще вспомнился колобочек, который начал с разработки AutoML платформы, потом пивотнулся на алгорисерч, а закончил запуском автоследования с тактикой мартингейла на малых суммах… Или еще не закончил, мб знает кто?
Хотя сама концепция коинтеграции очень проста, эконометрические методы, необходимые для работы с ней, существенно отличаются от классических эконометрических принципов. Именно поэтому вменяемые статистические тесты на коинтеграцию есть только в матлабе, да и то под патентами.
Раз:
The Engle-Granger method first constructs residuals (errors) based on the static regression.The residuals are tested for the presence of unit roots using ADF or a similar test. If the time series is cointegrated, then the residuals will be practically stationary
Два:
If two or more series are individually integrated (in the time series sense) but some linear combination of them has a lower order of integration, then the series are said to be cointegrated. A common example is where the individual series are first-order integrated ( I ( 1 ) {\displaystyle I(1)} {\displaystyle I(1)}) but some (cointegrating) vector of coefficients exists to form a stationary linear combination of them.
А разбирать что вы ни так поняли, в оригинальной статье, у меня нет столько времени.
Прямая конечно не годится, кусочно-линейная тоже, но меня вполне бы устроила модель «медленно и плавно меняющаяся составляющая» типа SMA, но без запаздывания, возможно аппроксимация типа loess или HP-фильтра. Странно, что человечество еще не составило такой дифур)
«Запаздывание» при поступающих данных online не возможно победить, так как точка смены параметров распределения, и когда мы сможем это достоверно определить, всегда будут идти с временным лагом. Определить точки смены тренда постфактум, имея все данные, более подъемная задача.