Состояния модели Маркова в графиках

06 августа 2016, 09:33
|
uralpro

Еще одна статья с ресурса www.talaikis.com по разработке простой стратегии на модели Маркова с использованием Python.

Модель скрытых состояний Маркова — это производительная, вероятностная модель, в которой последовательность наблюдаемых переменных генерируется некоторыми неизвестными (скрытыми) состояниями. Мы попытаемся найти такие неизвестные вероятностные функции для, скажем, S&P500. Все опишем кратко, без проверок на ошибки, без тестов вне выборки и т.д. Мы делаем это для того, чтобы минимизировать склонность к ненужному усложнению для начинающих. (Подробнее о модели Маркова см. на моем сайте — www.quantalgos.ru)

Что будем использовать:

библиотеку Python - hmmlearn.

1. Данные. Возьмем данные по свечам (OHLC), включающие объем, из нашей базы MongoDb :

data = read_mongo(dbase, symbl).pct_change().dropna()
X = data.as_matrix()
dates = data.index

2. Модель. Будем использовать гауссовскую модель НММ, хотя, вероятно, это не соответствует реальности (данные не подчиняются нормальному закону распределения), чтобы это компенсировать, зададим 8 скрытых состояний:

import pandas as pd
from hmmlearn.hmm import GaussianHMM

model = GaussianHMM(n_components=8, covariance_type="diag", n_iter=1000).fit(X)

# предсказание оптимальной последовательности по внутреннему скрытому состоянию
hidden_states = model.predict(X)

3. Скрытые состояния на графике показаны в заглавии статьи:

import matplotlib.pyplot as plt
import seaborn as sns; sns.set()

for i in range(model.n_components):
    idx = (hidden_states == i)
    plt.plot_date(dates[idx], data.CLOSE.cumsum()[idx], 'o', label="%dth hidden state" %i, lw=1)

plt.legend()
plt.grid(True)
plt.show()

4. Составим статистику по этим генерирующим процессам:

print "Среднее и его изменение по каждому скрытому состоянию"
for i in range(model.n_components):
    print "%dth hidden state" %i
    print "mean = ", model.means_[i]
    print "var = ", np.diag(model.covars_[i])
    #plt.plot(pd.DataFrame(np.diag(model.covars_[i]))[:-1], label=i)
    plt.plot(pd.DataFrame(model.means_[i])[:-1], label=i)

plt.legend()
plt.show()

Мы можем увидеть здесь наши паттерны. Наиболее интересный — очень стабильное положительное среднее.

5. Каждое состояние (фактор) в вероятно самом коротком в мире бэктесте:

for i in range(model.n_components):
    idx = (hidden_states == i)
    
    #быстрое тестирование каждого фактора
    df = data.CLOSE
    data['sig_ret%s'%i] = df.multiply(idx, axis=0)
    
    plt.plot(data['sig_ret%s'%i].cumsum())
    plt.show()

НММ0, скорее всего, фактор высокой волатильности:

НММ1, НММ3 очень редкие, в основном на медвежьих рыночных выбросах. НММ7 один из двух процессов волатильности, но относительно редкий.

НММ2 очень интересный, потому что начал работать в 2012 году:

НММ4, НММ5 — медвежьи процессы, ясно видимые на графиках средних (см. выше):

НММ6 — бычий процесс, также видимый на графике средних, как очень стабильное среднее:

6. Проверим, сможем ли мы торговать эти компоненты, покупать НММ7 и продавать НММ4 и 5, игнорируя другие состояния;

mts = data['sig_ret7'] - data['sig_ret4'] - data['sig_ret5']
plt.plot(mts.cumsum())
plt.show()

Мы проделали много работы, пока на этом закончим.

P.S. Более реалистичный пример на выборке «in-sample» с нормализованными данными, 2 состояния и 1 день задержки по сигналу. Сравнение со стратегией «купил и держи» (зеленая линия):

Другие статьи по алготрейдингу и торговым стратегиям смотрите на моем сайте — www.quantalgos.ru

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.

спецраздел:
торговые роботы

1.3К | ★19

20 комментариев

нифига не понял, но круто!

ДОСТАЛИ МЕНЯ-УХОЖУ

06 августа 2016, 12:05
Ответить

Да, такие математические подходы к рынку это космос. Посмотрел ваш сайт, сложно, интересно.

Friendly Deep Space

06 августа 2016, 12:16
Ответить

qlewer, спасибо. Особо сложного ничего нет, один раз разобраться и все. Сейчас в любом языке программирования есть готовые библиотеки, легко решающие задачи с марковскими цепями

uralpro

06 августа 2016, 15:01
Ответить

vhub, почему не марковский? в двух словах

Cristopher Robin

06 августа 2016, 12:31
Ответить

Cristopher Robin, главное, марковский процесс это процесс без памяти. У рынка память есть. Плюс традиционная проблема стационарности и curve fit. Короче, почесать свое математическое эго можно, а на практике — люди добрые, подайте на депозит

Vitty

06 августа 2016, 17:58
Ответить

Vitty, эксплуатируются не свойства марковского процесса, а отличия от него, насколько я понимаю, наличие памяти у реального рынка помагает на немзарабатывать

Cristopher Robin

06 августа 2016, 18:23
Ответить

а суммарный вывод в чем состоит? индекс не переиграть?

Ivanov Ivan

06 августа 2016, 12:45
Ответить

Ivanov Ivan, очень даже переиграть. И во много раз:)

uralpro

06 августа 2016, 15:00
Ответить

Суть то в чем? Вырастет или упадет?

Dr. Кризис

06 августа 2016, 13:59
Ответить

Dr. Кризис, с учетом имплицитной гетерескедастичности модели, учитывая скрытые параметры марковского процесса, рассматриваемом на гауссовом конечно аддитивном распределении в колмогоровской аксиоматике на борелевой сигма алгебре кольца действительных чисел, оно в конечном счете либо вырастет, либо упадет.

Vitty

06 августа 2016, 18:09
Ответить

vhub, не понял вашего утверждения. С помощью марковских моделей можно решить массу задач в трейдинге, в частности по оптимизации портфеля, что не менее важно, чем сами стратегии торговли. Можно делать и стратегии, если не останавливаться только на ценовом ряде

uralpro