Всем привет.
Продолжаем искать волшебную таблетку :). Так как самим думать не очень хочется, а технологии шагнули довольно далеко вперед и сделали возможным использование нейронных сетей совместно c алгоритмами обучения с подкреплением, решил я попробовать, что же может из этого получиться.
Я создал простенькую торговую среду, которая правда не содержит никаких реальных данных, а содержит всего лишь сгенерированны ряд по 20 значений.
Выглядят он так:
Все начинаеся с того, что агенту доступны певые 10 значений, и у нас есть всего 10 шагов, на которых мы должны получить максимальный результат.
Агенту так же доступны 4 действия: купить, продать, пропустить шаг и закрыть открытую позицию.
По большому счету, агент просто должен запомнить 10 точек и соответсвующие действия, дабы получить максимальную прибыль.
Далее, взяв простого DQN агента, и два разных варианта среды: одна содержит только один сгенрированный ряд, вторая содержит два:
Получился вот такой интересный результат:
Выглядит все довольно не плохо, и возможно имеет смысль построить более реальную среду, да и агента взять поумнее, обучить его в течении пары недель :), может что и выйдет.
Если уже кто пробовал, поделитесь опытом?
Ну и конечно, если кто то заинтерисовался, сделал я видюшку с некоторыми подробностями касательно разработки самой среды. Есть русские субтитры.
ну и в описании к видео имеется ссылка на github с кодом.
Но с другой стороны, в игры то людей уже обыгрывают, машины ездят.
Думать конечно, агенты, прям не могут, но кто знает, вдруг смогут найти некоторую статистическую закономерность
Однако, возможно я не понимаю, что конкретно вы имеете ввиду :)
Что вы подразумеваете под четкими правилами? В играх их тоже может не быть
Так, а что рынок то, вы можете купить, вы можете продать, можете ничего не делать, можете хэджить. При малом капитале и большей ликвидности в бумаге, ваше действие вообще не заметно для рынка.
Ну и да… У меня тут скорее хобби :)
Я думаю ему создать среду в виде игры, скармливать картинки с четко поставленными временными параметрами.