
Учет комиссий, проскальзывания и риск-менеджмента
Отбор торговых сессий по критериям волатильности (импульсы ≥5% за 10 минут)
Дискретное пространство действий: LONG, SHORT, CLOSE, HOLD
Reward shaping для контроля поведения
Полные логи бэктеста и визуализации
Публикация сигналов в реальном времени (Telegram)
Доходность: +144.23%
Sharpe: 1.85, Sortino: 2.05
Прибыльных дней: 78.57%
Сделок: 112 (~2 в день), включая SL/TP
Среднесуточная доходность: +1.61%
Точность сигналов: LONG — 69.9%, SHORT — 68.4%




Dueling Double DQN (D3QN)
Prioritized Experience Replay (PER)
Подбор гиперпараметров с Optuna
Состояние включает рыночные данные, позицию, контекст и историю действий
Обычные RL-модели обучаются на непрерывных рыночных данных, где шум подавляет сигнал.
В проекте используется отбор только высокосигнальных сессий:
Триггер: движение цены ≥5% за 10 минут
Контраст: 90 минут спокойного рынка до импульса
Сессия: 150 минут (90 мин контекста + 60 мин торговли)
Формат: матрица 150×7 (OHLC, VWAP, объём, сделки)
📊 Разбиение:
Train [2020-01-14 — 2024-08-31): 24 104 сессии
Validation ([2024-09-01 — 2024-12-01): 1 377 сессии
Test [2024-12-01 — 2025-03-01): 3 400 сессий
Backtest [2025-03-01 — 2025-06-01): 3 186 сессий
Агент учится только на рыночных импульсах, а не на шуме.
Примеры данных для всех четырех подвыборок: Train, Validation, Test, Backtest:



Агент работает в режиме реального времени: каждую минуту сканирует рынок Binance Futures, формирует прогноз (LONG/SHORT) и публикует сигнал в Telegram с последующей верификацией.

⚠️ Важное примечание: агент работает в экспериментальном режиме. Все решения, принимаемые пользователями на основе информации из канала, осуществляются под их личную ответственность.
Проект является исследовательским и предоставляется бесплатно исключительно в образовательных целях.
💬 Если вам интересны детали архитектуры и примеры работы — приглашаю изучить полную статью на Хабре.
Код, датасеты и онлайн-работа агента доступны для всех: вы можете изучать реализацию, запускать проект на своём компьютере, воспроизводить эксперименты и совершенствовать собственные стратегии.
Этот проект задуман как полноценная исследовательская лаборатория, цель которой — вдохновить вас на более глубокое изучение обучения с подкреплением в алгоритмической торговле.
Если в этой фразе последние три слова заменить на точку, будет гораздо честнее.
>> цель которой — вдохновить вас на более глубокое изучение обучения с подкреплением в алгоритмической торговле
А в отношении себя какая цель проекта? Не всё делается ради денег, понятно, обычно любая цель она как правило с тебя начинается. Можно хотеть вдохновить людей но для чего, почему?