Архитектура, при которой стратегия упаковывается в файл. Algo-only.

Придумал интересный подход. Мож кого натолкнет на интересные идеи какие-то.

Сейчас начал торговать ML модели. С практической стороны с моделями какая сложность – там есть процесс предобработки данных – генерация признаков в основном (если с точки зрения трейдинговых данных заходить), поэтому нельзя просто сохранить модель, в другом месте загрузить и она будет работать, надо сохранить, загрузить, предобработать исходные данные к тому виду, к которому приучена модель и только тогда она будет работать. К счастью тонна сопутствующих трудозатрат убирается такой классной штукой как пайплайн – сейчас моя модель это 2 пайплайна – один для предобработки данных, другой для предикта (сама модель). Т.е. я где-то что-то рисечу, дальше автоматика упаковывает в пайплайны (2 на модель, как сказал). Все, могу кинуть эти 2 файла в папку с моделями, откуда их забирает торгующий блок и, собственно, отторговывает. Красота. Всякие мета-данные – тикер там, время удержания позиции и прочие мета-логики упаковываю или в сам пайплайн или в название файла. Красота.

Но по сути, классические алгоритмы (обычные алго-стратегии) по факту можно так же упаковывать. Можно это делать по идее (хотя на практике ещё не пробовал – идея с пылу с жару только) даже с помощью той же библиотеки. Пайплайны как работают: на вход дата-фрейм (ну или дата-сет, если кто не знаком с пандасом), на выход дата-фрейм или вероятности или че хочешь. В этот контекст вполне можно вписать обычные логики стратегии, даешь на вход свечные (или какие используешь данные), в пайплайне зашиваешь логики стратегии, на выход сигнал, например, бинарно 0/1. Т.е. по факту пайплайн это код, это алгоритм, что для стратегии и нужно, собственно.

По идее, если унифицировать интерфейсы, то торгующий блок может не знать что в пайплайн упаковано – модель/алгоритм простой или что-то ещё, на вход идут данные, на выход предикт (например, бинарный). Все, состряпал стратегию, упаковываешь в пайплайн, кидаешь в папку, торгующий модуль на лету подхватывает, считывает мета-данные и торгует. Мета-данные инкапсулировать тоже очень удобно по-моему. Можно там настройки про риски зашивать в том числе, например, или что-то ещё. Торгующий блок может подгружая пайплайн считывать мета-данные и использовать их как ориентир, но при необходимости может их и не использовать. Например, получая модель первый раз давать ей «испытательный срок» месяц, гоняя с пониженными рисками, собирая стату, потом уже смотреть что там про риски говорит сам пайплайн и использовать эти данные уже, как вариант.

Обожаю автоматизацию.

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.

алгоритмическая торговля ML машинное обучение

Replikant_mih

Earth

297

5 542

с 12 января 2017

43 Комментария

CloseToAlgoTrading
09 сентября 2020, 13:12
По идее все так и должно быть, ваш торгующий модуль который обращается к какой либо стратегии, должен всегда обращаться к некоторому стандартному/общему интерфесу от блока стратегий. Как вы интерфейс опишите, это уже ваше дело, можете в джесон формате все там передавать.
И ему, торгующему модулю, должно быть совершенно по барабану, что там у вас происходит в модуле стратегий :). Пайплайны ли вы используете или функции одну за дргой вызываете.
Касательно МЛ, то тенсорфлов сделал tensorflow serving как раз именно для того что бы использовать модели в продакшене быстро и удобно. Однако там конечно не все так здорово и удобно )) без пол литра не разберешься.
0
Михаил
09 сентября 2020, 14:52
Я в MongoDB кладу вместо папочек:
— обученную модель
— метаданные описывающие процесс генерации признаков и модели
— перечень инструментов и диапазон дат на которых было произведено обучение
— метрику качества
— полное время на генерацию при знаков и обучение модели
0
Roman Ivanov
09 сентября 2020, 18:18
Чет как-то сумбурно. 1) Обычно пайплайн это не алгоритм, а последовательность обработки. Алгоритм — это частный случай узла графа пайплайна.
2) сделать абстрагирующий интерфейс которому на вход данные, а на выход сигнал — это лежит на поверхности. Вопрос только в какой форме подавать данные вместе с историей.

У меня так: алгоритм может сериализоваться/десериализоваться вместе со своим внутреннем состоянием. Ну то есть если ему положим надо 20 последних баров, то он сам должен внутри держать буфер. При таком подходе алгоритму надо на вход только очередной бар чтобы он его «усвоил» и выдал результат. Время от времени сериализованное состояние скидывается в БД. Если приложение рестартует, то восстанавливает состояние из БД и докидывает бары до последнего известного.
Не универсально, но под специфику моих алгоритмов подходит идеально.
0

Читайте на SMART-LAB:

USD/CAD: статистика и нефть вернули канадцу уверенность

Канадский доллар уверенно укрепился, оттолкнувшись от локального минимума. Росту валюты способствовало сочетание сразу нескольких фундаментальных факторов: резкое замедление инфляции в США,...

Tickmill

21.07.2026

Как быстро закроется дивидендный гэп в акциях Сбербанка

Бумаги Сбера торговались с дивидендами за 2025 г. до 17 июля. На следующий день обыкновенные акции Сбербанка открылись с дивидендным разрывом величиной в 11,6%. Рассмотрим возможные сроки...

БКС Мир инвестиций

21.07.2026

Ближайшие события. Как к ним подготовиться инвестору

Предлагаем инвесторам обратить внимание на важные события в России и мире, которые произойдут в ближайшие недели. Есть способы заработать на будущем, если подготовиться к нему заранее. Рынки...

Альфа-Инвестиции

21.07.2026

Включаем "Антикризис" на полную катушку! А вдруг?

Сегодня я был снова вынужден прервать свой отвратительный отпуск, чтобы заниматься делами своего инвестиционного портфеля и даже для того, чтобы записать еженедельную вечернюю программу...