Блог им. empenoso
На прошедшей неделе в Москве состоялось мероприятие, посвящённое машинному обучению (Machine Learning) в трейдинге. Название мне показалось весьма злободневным: «ML в трейдинге: как выжить, если ты один, а против тебя — хедж-фонды с бесконечным бюджетом».
Я бы хотел побывать на нём лично, но из Перми ехать далековато (только Тимофею дарят по 150 тр чтобы поднять настроение) и поэтому я отдал билет другу. Так что отдельное спасибо Сергею Степаняну за то, что он приехал в Москву из Ярославля и фактически стал моими глазами и ушами — то, что вы читаете — это его наблюдение, мои размышления и немного здравого смысла.
Вообще моё текущее представление о ML в трейдинге на Московской бирже довольно прикладное. Смотришь за ценой: волатильность больше или меньше, скорость изменения цены быстрее или медленнее. И если за какой-то из этих показателей меняется, то продаешь или покупаешь. Так можно попасть в вероятность, но точно определить конечно же невозможно. Ну и приходится постоянно это дело подкручивать под изменяющиеся параметры рынка - играть в догонялки — рынок меняется и всегда вынужден его преследовать.
На этой встрече мне показалось очень здравой мысль, что современный алготрейдер в России — это один человек, который заменяет целую команду:
он ищет и чистит данные;
придумывает признаки;
строит модели;
тестирует гипотезы;
собирает стратегии;
считает риски;
и всё это выводит в продакшн.
Слайд из презентации
И это принципиальное отличие от фондов когда все роли разделены между людьми, а у тебя просто домашний компьютер с видеокартой чуть мощнее среднего и ИИ помощник.
Я уже не первый год пишу статьи на Смартлабе, а читаю уже очень давно, и кроме новостного шума сложно найти что-то содержательное по теме алго и ML, а по Deep Learning уж и подавно, потому что никто не рассказывает что реально работает, а все обсуждения идут на уровне намёков. В итоге каждый сам изобретает свой собственный велосипед и, конечно же, повторяет чужие ошибки. Просто не знает об этом.
На встрече был всего один доклад от Антона Абдулгалимова. Я очень извиняюсь перед ним, но упоминания компании где он работает не будет — из-за подобных вещей у меня блокировали аккаунт однажды — потому что заподозрили рекламу (которой не было).
На встрече проводили небольшой опрос и оказалось что люди в целом знакомы с тем, что такое ML, они экспериментируют, но прибыли не видят и только 30% имеют работающие стратегии которые запущены на реальных деньгах.
Иллюзия «предсказания цены»Вообще общепринятое мнение о ML — что ты скармливаешь нейронке график Сбера и она тебе говорит сколько он будет стоить завтра. Но в реальной жизни так не работает. Если просто натравить регрессию на цену, то на выходе получится мусор, а в высокочастотном трейдинге (HFT) ML вообще очень ограниченно используется, потому что там бьются за наносекунды и любая тяжёлая модель просто убивает систему задержками.
В своей практике я тоже уже пытался использовать ML как генератор сигналов (неудачно).
Зато ML отлично работает в более узких задачах:
Поиск фазы рынка (режима) — модель не говорит покупай, она говорит: «сейчас жесткий боковик, трендовые стратегии лучше выключить».
Фильтрация сигналов — какие сделки из вашей базовой стратегии брать, а какие — с высокой долей вероятности убыточны.
Исполнение — как зайти в позицию так, чтобы не размазать весь свой профит о проскальзывание и комиссию.
Микроструктура стакана — там, где человеческий глаз просто не успевает увидеть закономерности в потоке ордеров.
Но вернёмся к статистике: большинство застревает на этапе тестов. В трейдинге очень легко построить иллюзию что у тебя всё хорошо и Антон нашёл грабли на которые наступает большинство одиночек:
Garbage in = Garbage out. Данные — это 80% успеха. Если в ваших дневных свечах пропущен один день, или вы криво склеили фьючерсы, модель найдет там закономерность, которой в природе нет. Поиск и чистка данных забирают львиную долю времени.
Заглядывание в будущее. При обучении модель случайно подсматривает в завтрашний день из-за ошибки в разбиении выборки (кто копает глубоко — почитайте Маркуса де Прадо на эту тему). На истории вы миллиардер, в проде — получаете маржин-колл.
Forecast != PnL (Прогноз не равен прибыли). Вы создали модель, которая в 60% случаев угадывает направление цены. Бинго? Нет. Пока вы вставали в очередь в стакане, пока словили проскальзывание, а брокер и биржа списали комиссии — ваша математическая альфа ушла в минус по счету.
И тут многие начинают кивать на запад: мол, у них там вендоры альтернативных данных, команды квантов, хедж-фонды с бюджетами, а у нас что?
Но по факту, разрыв в значительной степени связан с инфраструктурой. Все остальное: поиск сигнала, переобучение моделей, нестационарность рынка — проблемы абсолютно одинаковые что на Уолл-Стрит, что в Перми (ну и в Москве).
Чтобы не тратить месяцы на разработку мертворожденной стратегии, Антон предложил отличный подход. Прежде чем открывать Python, прогоните свою идею через 5 вопросов:
Есть ли конкретная задача?
(Не «я хочу прикрутить нейронку, чтобы было», а «я хочу снизить издержки на исполнение заявки»).
Есть ли у вас честные данные?
(Чистые, без заглядывания в будущее и доступные в моменте торгов).
Можно ли это проверить?
(С учетом комиссий и задержек).
Превращается ли прогноз в действие?
(Понятен ли мост между тем, что выдала модель, и реальной сделкой/фильтром).
Есть ли экономический эффект?
(Стала ли система приносить больше денег после уплаты всех издержек).
Если хотя бы на один вопрос ответ «нет» — вы внедряете ML слишком рано.
Вместо итогаЗнаете, что мне понравилось больше всего на этой встрече (пусть и в пересказе)? То, к чему призывал Антон в конце.
ML не даёт контроля над рынком и не является магической кнопкой «бабло». Это сложный, капризный инструмент, который работает только там, где он реально нужен. Но главная проблема нашего рынка не в нехватке библиотек или вычислительных мощностей. Проблема в том, что мы сидим по своим углам.
Культура «никому ничего не рассказывать» приводит к тому, что все совершают одни и те же ошибки по кругу. То, что умерло на вашей проверке, ваша ошибка в коде или слитый на тестах депозит — это бесценный опыт, который гораздо важнее историй чужого успешного успеха.
Поэтому давайте общаться. Уважаемые алготрейдеры, кто балуется машинным обучением, как у вас успехи? На каком этапе пути застряли: тестируете гипотезы или уже пустили модель в бой на реальных деньгах?
Автор: Михаил Шардин
🔗 Моя онлайн‑визитка
31 марта 2026 г.
большую дисперсию прогноза ещё терпеть можно, но когда функция ещё и не гладкая по параметрам/вектору — это перебор
Rational_Capital, ну на самом деле «публичный алгоритм в интернетах» есть и много. Да вот например:
smart-lab.ru/blog/1216966.php
smart-lab.ru/blog/1278719.php
Хотя думаю это не те примеры про которые вы говорили
план — это ключевое.
относится не только к МЛ/ЛЛМ, а ко всем подходам, вплоть до гадания по звёздам
Хорошая попытка отмутить бесценные знания задаром, но нет:)
А теперь немного корректности. Заголовок у вас заведомо провокационный. Поскольку достаточно точный прогноз направления — не гарантия прибыли по определению, необходимы еще верные точки входа/выхода.
Бесценные знания лежат задаром на arxiv.org. Проблема кажется в том, что их никто не читает. Даже «Эксперты Московской биржи».