Обучение с подкреплением. Торговая среда для агента.

Всем привет.

Продолжаем искать волшебную таблетку :). Так как самим думать не очень хочется, а технологии шагнули довольно далеко вперед и сделали возможным использование нейронных сетей совместно c алгоритмами обучения с подкреплением, решил я попробовать, что же может из этого получиться.

Я создал простенькую торговую среду, которая правда не содержит никаких реальных данных, а содержит всего лишь сгенерированны ряд по 20 значений.

Выглядят он так:

Все начинаеся с того, что агенту доступны певые 10 значений, и у нас есть всего 10 шагов, на которых мы должны получить максимальный результат.
Агенту так же доступны 4 действия: купить, продать, пропустить шаг и закрыть открытую позицию.

По большому счету, агент просто должен запомнить 10 точек и соответсвующие действия, дабы получить максимальную прибыль.

Далее, взяв простого DQN агента, и два разных варианта среды: одна содержит только один сгенрированный ряд, вторая содержит два:

Получился вот такой интересный результат:

Выглядит все довольно не плохо, и возможно имеет смысль построить более реальную среду, да и агента взять поумнее, обучить его в течении пары недель :), может что и выйдет.

Если уже кто пробовал, поделитесь опытом?

Ну и конечно, если кто то заинтерисовался, сделал я видюшку с некоторыми подробностями касательно разработки самой среды. Есть русские субтитры.

ну и в описании к видео имеется ссылка на github с кодом.

алготрейдинг reinforcement learning closetoalgotrading tensorflow

CloseToAlgotrading

CloseToAlgoTrading

не определен

116

814

с 11 февраля 2016

14 Комментариев

Volahub
07 сентября 2020, 20:06
баловство ведь
0
CloseToAlgoTrading
07 сентября 2020, 20:24
Куплю сигналы за $2000, это конечно очень спорное заявление :) да и надо ли роботу обыгрывать человека в данном случае тоже вопрос

0
day0markets.ru
08 сентября 2020, 10:19
Я учил. Писал среду сам под это дело. Оно умеет учиться, если вы скармливаете рабочие предикторы. Чисто на котировках — ничего толкового, во всяком случае у меня — не вышло. На предикторах, которые уже известно, что рабочие, агент смог что-то вытащить стратегию более менее стабильную. Но оптимизацией того же самого можно добиться в разы быстрее, при этом не нагревая воздух видеокартой. Ну может у вас и получится. Удачи.
0
CloseToAlgoTrading
08 сентября 2020, 12:19
day0markets.ru, согласен, чисто на числовых рядах будет ему сложно обучиться. Конечно если обучить на тренде и запускать на тренде, то все будет работать, но реальность более сложна. :)
Я думаю ему создать среду в виде игры, скармливать картинки с четко поставленными временными параметрами.
0

Читайте на SMART-LAB:

Нефть взлетела, но рубль не реагирует

Эскалация конфликта на Ближнем Востоке привела к росту нефтяных котировок на 8% после открытия торгов в понедельник. В лидеры Индекса МосБиржи вышли акции нефтяников, прибавившие более 4%. И...

Альфа-Инвестиции

18:21

Подводим итоги по вводу жилья с начала года

Друзья, мы продолжаем делиться результатами нашей работы и сегодня подводим итоги по вводу с начала года. 🔥 Поддерживаем высокий темп: за январь-февраль этого года мы передали клиентам 5 445...

Самолет

14:41

Софтлайн на Smart-Lab & Cbonds PRO Облигации 2.0. Коротко о главном

На конференции для профессионалов долгового рынка выступила IR-директор $SOFL Александра Мельникова. В панельной дискуссии представителей технологического сектора также принимали участие спикеры...